Drie nieuwe tools om lange video's in shorts te veranderen
Drie grote functies zijn net live — AI Viral Clips, AI Reframe en AI Dubbing. Samen dekken ze het deel van de workflow dat ondertitels alleen nooit konden bereiken.

Kevin Li

Als iemand me vroeg wat CaptionBolt doet, paste mijn antwoord in één zin: het zet snel ondertitels op je video. Dat klopt nog steeds. Maar de afgelopen weken hebben we drie nieuwe tools uitgebracht die veranderen wat het product kan doen voor iedereen die short-form content maakt.
Ik wil ze alle drie langs gaan — wat het doet, voor wie het is, en waar het in je workflow past. De drie:
- AI Viral Clips — zet een lange video erin, krijg een set publicatieklare shorts terug
- AI Reframe — verandert horizontaal materiaal in 9:16 met de spreker daadwerkelijk in beeld
- AI Dubbing — breidt een video uit naar een andere taal en behoudt daarbij de eigenschappen van de originele stem
Waarom alle drie tegelijk? Omdat het geen drie functies zijn. Het is één workflow.
Het meest voorkomende werk dat creators op dit moment doen, is een lange opname — een podcastaflevering, een interview, een tutorial, een streamreplay — omzetten naar clips die werken op TikTok, Reels en YouTube Shorts. Ondertitels horen daarbij. Verticaal herformatteren hoort daarbij. Een publiek bereiken dat jouw taal niet spreekt hoort daarbij. En de juiste momenten kiezen uit een uur opname is het deel dat het langst duurt — het deel dat geen ondertitel-tool alleen kan oplossen.
Dus hebben we onze versie van de hele workflow gebouwd.
AI Viral Clips
Je gooit een lange video erin. Je krijgt een set korte clips terug, elk gerangschikt op de waarschijnlijkheid dat ze presteren.
Dat is de versie van één regel. Zo voelt het in gebruik:
- Upload een podcast of interview van een uur.
- Wacht een paar minuten.
- Krijg tien verticale clips terug, klaar om te publiceren, elk met de ondertitels al ingebrand, elk gescoord op hookkracht, narratieve boog, energie en tempo.
- Loop er doorheen, standaard gesorteerd op score, en download wat je wilt.
- Begint een clip een tel te vroeg of loopt hij iets te lang door, dan sleep je de grenzen en render je alleen die opnieuw — geen heropbouw van de hele batch.
De score is geen magisch getal. Beweeg je muis over de badge van een clip en je ziet de uitsplitsing: hoe sterk de openingshook is, of het segment een volledige boog heeft, waar de emotionele pieken liggen, hoe informatiedicht het is, hoe het tempo voelt, of het onderwerp aansluit bij actuele trends. Soms zul je het oneens zijn — vaak is de juiste clip om te posten nummer 4, niet nummer 1. Maar de ranking geeft je een startpunt in plaats van zelf door de tijdlijn te moeten scrollen.
Een paar details waar we om geven:
Clips beginnen niet midden in een woord. Wanneer de AI een starttijd voorstelt die midden in een zin valt, halen we hem terug naar de dichtstbijzijnde natuurlijke pauze in de spraak. Je krijgt geen clips die openen met „—en toen zei hij" en de aanloop missen.
Elke clip wordt onafhankelijk gerenderd. Twee clips tegelijk gaan door de wachtrij, elk met zijn eigen ondertitels, eigen uitsnede, eigen voorvertoning. Render je er één opnieuw, dan blijven de andere staan. Pas je de grenzen van één clip aan, dan wordt alleen die opnieuw gebouwd.
De hele flow zit erin. Ondertitels, verticale reframe en de gerangschikte clips zelf komen allemaal uit één upload. Je kiest geen clips ergens, haalt ze ergens anders door een ondertitel-stap en herformatteert ze in een derde tool. Eén upload, publicatieklare shorts terug.
AI Reframe
De goedkope versie van „auto-reframe" is een gezicht detecteren en er een verticale doos omheen knippen. We hebben dat in het begin geprobeerd. Het is niet genoeg.
Het loopt vast bij interviews met twee mensen — de uitsnede schiet op een ongemakkelijke manier heen en weer tussen de sprekers. Het loopt vast bij tutorials waar de camera beweegt of waar de spreker uit beeld stapt. Het loopt vast bij groepsopnames waar er geen enkel onderwerp is om te volgen.
Dus doet Reframe iets zorgvuldigers. Voor elk segment van je video kiest het één van drie indelingen op basis van wat er werkelijk op het scherm gebeurt:
- Volgende uitsnede (Tracking crop) — als er één persoon in beeld is, of als één persoon duidelijk de actieve spreker is, volgt de uitsnede die persoon. De shotgrootte verschuift met het ritme van de spraak: ruimer als context wordt opgebouwd, strakker als een punt landt, verder weg bij grote onthullingen. Het voelt dichter bij een montage dan bij een simpele resize.
- Splitscreen (Split-screen) — als er gedurende een segment twee mensen samen in beeld zijn, krijg je een verticale stapel: één gezicht boven, één gezicht onder, elk onafhankelijk gevolgd. We bepalen één keer voor de hele video wie er bovenin staat en houden dat aan, zodat je niet boven en onder ziet wisselen elke keer dat het gesprek heen en weer gaat.
- Vervaagde opvulling (Blur-pad) — als er geen duidelijk onderwerp is (groepsopnames, B-roll, pure beelden), doen we niet alsof. Het originele frame blijft in zijn oorspronkelijke verhouding, en de rest van het canvas wordt gevuld met een zacht vervaagde kopie van datzelfde shot. Het oogt bedoeld in plaats van slecht uitgesneden.
De beslissing wordt automatisch genomen, maar het is geen black box. De resultatenpagina toont een tijdlijnstrip waarin elk segment is ingekleurd op basis van de gekozen indeling. Je scrolt erdoor en ziet precies wat waar is besloten. Voelt iets niet goed, dan zie je waarom — voordat je exporteert.
We exporteren ondertitelbestanden (SRT, VTT) naast de gerenderde MP4. Monteer je in Premiere, DaVinci Resolve of Final Cut, dan kun je alleen de ondertitels in je bestaande project trekken — wij hoeven aan onze kant niet de hele video opnieuw te renderen.
AI Dubbing
De kortste sectie, omdat de functie aan de oppervlakte simpel is — maar volgens mij het meest onderschat.
Je uploadt een video. We vertalen wat er gezegd wordt naar de doeltaal, genereren een nagesynchroniseerde audiotrack in een stem die past bij je spreker en lijnen de nieuwe audio uit op het originele beeld. Standaard behoudt de nieuwe track de eigenschappen van de originele stem in de nieuwe taal, zodat de nagesynchroniseerde versie klinkt als die persoon, niet als een algemene voice-over. Je kunt ook kiezen uit een set kant-en-klare stemmen als je dat liever hebt.
Op dit moment leveren we tien doeltalen: Engels, Chinees, Japans, Koreaans, Spaans, Frans, Duits, Italiaans, Portugees, Russisch. We kozen deze op basis van de markten waar short-form distributie echt groeit — niet alleen waar het publiek zit, maar waar makers in die talen daadwerkelijk publiceren en views halen. We voegen er meer toe zodra we zeker zijn van de stemkwaliteit.
Voor wie dit is: voor iedereen die al views krijgt in één taal en wil testen of dezelfde content werkt in een andere. De kosten van het proberen — zowel in tijd als in geld — waren vroeger hoog genoeg dat de meeste onafhankelijke makers er niet aan begonnen. Hiermee is het antwoord op „zou mijn podcast aanslaan in het Spaans?" nog maar één upload weg.
Wat nog ruw is
In de geest van elke vorige post op deze blog — dit is wat nog niet goed is:
- Viral Clips werkt het best op gespreksachtige content — podcasts, interviews, talk-formats. Pure tutorials met schermopname of veel graphics halen minder uit de ranking, omdat het model leest wat er wordt gezegd, niet wat er te zien is. We werken eraan.
- Reframe is nog niet stevig getest op elk soort materiaal. Podiumtalks met cutaways naar het publiek, gameclips met face-cam in de hoek, reactievideo's met picture-in-picture — we hebben nog niet genoeg echte data over hoe de indelingsbeslissingen zich daar houden. Past jouw materiaal in deze hoek en voelt het resultaat raar, stuur het naar ons.
- Dubbing dekt tien talen, geen vijftig. We kozen voor accuraat boven breed. We blijven toevoegen, maar alleen als we zeker zijn van de stemkwaliteit.
- Lange video's kosten echte tijd. Een podcast van twee uur duurt langer dan een clip van twee minuten. Er wordt echt een video geanalyseerd, gesegmenteerd en gerenderd. We hebben geoptimaliseerd waar dat kon; we blijven optimaliseren.
Probeer ze
Alle drie staan live in het dashboard. Viral Clips en Reframe zitten in elk betaald plan — geen losse add-on per functie. Dubbing komt met tien gratis minuten bij aanmelding, zodat je het op een echte video kunt proberen voordat je beslist.
Heb je CaptionBolt alleen voor ondertitels gebruikt, dan zit de rest van de workflow nu in dezelfde tool, op hetzelfde plan. Van ruw materiaal naar een publicatieklare short — dat is wat we makkelijker proberen te maken.
Ondertitels blijven de voordeur. Ze zijn alleen niet meer het hele huis.


