AI- billeddannelsesgenerator

Kommercielt brug OK 380+ modeller Intet vandmærke Ingen tilmelding nødvendig
Model:
+ GPT-5, Claude, Gemini
Brænd viral TikTok-stil billedtekster ind i din video ~ stor fed tekst med ord-for-ord fremhæve animation (ASS karaoke timing). Foretrækker almindelig SRT / VTT sidevogn filer? Brug den Undertekstværktøji stedet for denne ene er stil-først og altid brænder i.

Træk en video her eller klik for at uploade

MP4, MOV, WebM op til 200MB! 99 sprog understøttes via Whisper

Word-by-word-fremhævningsfarve (karaoke-effekt).
Token estimat for dit klip
Upload en video for at se de nøjagtige omkostninger for dit klip.

Hvor virale billedtekster tjene deres holde

TikTok / Reels / Shorts

Kort-form færdiggørelse sats springer 30-40% med ord-for-ord billedtekster. TikTok Neon forudindstillede er den ene de øverste skabere alle bruge.

Virusklip fra YouTube

MrBeast-stil fed-tekst overlejringer på reaktion / kommentarer optagelser. YouTube Lowertredje preset med en gennemsigtig boks.

Podcast clips til sociale

Lyd-først shows re-clipped for IG Reels / TikTok. Podcast preset holder billedtekster læsbare over talking-head ramme.

4- trins how- to

  1. Upload din video. Vi trækker lyd, kører Whisper STT, og læse timing for hvert talt segment.
  2. Vælg en stil forudindstillet TikTok Neon er det sikre virale valg. Skrifttype / fremhæve farve / position tilsidesætte de forudindstillede standardindstillinger.
  3. Vi opbygger en ASS undertekst fil med ord-for-ord karaoke timing (effekten, hvor ord ændrer farve, som de tales).
  4. ffmpeg brænder billedteksterne ind i videoen. Behandling tager 30-90 sekunder at lukke fanebladet; vi e-mailer dig, når det er gjort.

vs. CapCut, Submagic, Opus Clip, Captions.AI

CapCut auto-captions er gratis og god, men du har brug for CapCut editor installeret, og du kan ikke batch dem. Submagic er $20/mo for ubegrænset. Opus Clip er $ 30/mo for lang-form → kort-form med auto-captions bundtet. Captions.AI (App Store) er $ 10/mo. Dette værktøj kører Whisper store-v3 + en ffmpeg ASS karaoke brænde-in • de samme to primitive alle de betalte værktøjer bruger • inde i din token pool. For one-offs og batch social eksport, det er den hurtigste sti.

Billedtekster vs undertekster Hvad er forskellen?

Undertekster (se /video/undertekst /) er et hjælpeprogram: SRT / VTT sidevogn filer seerens spiller kan skifte tænd/sluk, designet til tilgængelighed og upload til YouTube Studio. Billedtekster (dette værktøj) er en stil: stor fed tekst brændt ind i hver ramme med karaoke animation, designet til at tjene færdiggørelse sats på TikTok / Reels / Shorts hvor 85% af seerne holder lyden slukket. Brug undertekst til YouTube CCs; brug billedtekst til viral kortform.

Hvornår IKKE til billedtekst

  • Videoer, der allerede har brændt-i billedtekster! teksten vil fordoble op og se brudt.
  • Lang-form YouTube uploads Brug sidevognen SRT fra /video/undertekst / i stedet, så seerne kan skifte CC'er.
  • Videoer med nul dialog der er intet at billedtekst. Musik kun klip bør tilføje tekst overlejringer manuelt.
Avancerede tilvalg
Resultat
Tokens er ved at løbe tør. Få flere tokens
Vil du have bedre resultater? Premiummodeller (GPT-5ClaudeGemini) giver en højere kvalitet. Vis planer

❤️ Love this tool? Share it!

Tilmeld dig for at få et henvisningslink og optjene 25.000 tokens pr. ven.

Vil du have mere? Gratis tilmelding til 30K tokens/dag + 10K bonus
Tilmeld dig gratis

Behandling af din anmodning...

Brænd virale TikTok-stil billedtekster i enhver video ~ word-by-word karaoke highlight, 7 stil presets, 8 skrifttyper, 99-sprog Whisper STT. Altid brænde-in.

Hvordan man bruger AI- billeddannelsesgenerator

1
Indtast dit input

Skriv tekst, uploade en fil eller beskrive, hvad du vil have. Ingen konto er nødvendig.

2
Klik på generere

Vores AI behandler din anmodning på få sekunder ved hjælp af de bedste open source-modeller.

3
Download & del

Download, kopier eller del dit resultat. Gratis til personlig og kommerciel brug.

Brug dette værktøj via API

Automatiser dette værktøj fra din egen kode. OpenAI- kompatible REST endpoint, Bearer-token auth, ingen ekstra SDK kræves. Token omkostninger matcher webgrænsefladen.

curl -X POST https://api.free.ai/v1/video/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"prompt": "A cat playing piano", "duration": 4}'

AI- billeddannelsesgenerator — FAQ

Brænder viral- stil billedtekster i enhver video med ord-for-ord karaoke-timing animation. Forskellige fra /video/undertekst /: undertekster udgange SRT / VTT sidevognsfiler, som spillerne skiftes til/fra. Billedtekst er altid brænde-in, stil-først, og tunet til TikTok / Reels / Shorts, hvor billedtekster skal kodes ind i hver ramme.

Fire trin: (1) ekstrakt mono 16kHz lyd fra din video, (2) transskribere med Whisper large-v3 for 99-sprogs ord timing, (3) bygge en ASS undertekst fil med ord-niveau \ kf karaoke timing tags, (4) ffmpeg brænder ASS ind i hver ramme ved hjælp af libass for ren anti-aliased tekst.

50 tokens per sekund (2.000-token minimum). En 30-sekunders klip er ~ 2.000 tokens (gulvet sparker i); en 60-sekunders klip er ~ 3.000; en 3-minutters klip er ~9.000. STT drev de fleste af omkostningerne; indbrænding tilføjer omkring 25% på toppen.

Syv: TikTok Neon (gul Montserrat, ord-for-ord-fremhævning), YouTube Lowertredjedel (hvid Roboto i en gennemsigtig kasse), Meme (hvid slag med en sort omrids), Podcast (Poppins i en mørk afrundet kasse), Keynote (Arial Black i toppen), Cinematic (italic Oswald i bunden), og TED (venstre allianceret Roboto).

Ja. Font dropdown tilsidesætter forudindstillingen med Impact, Montserrat, Bebas Neue, ARIAL Black, Oswald, Poppins, Anton, eller Roboto. Højdepunktet Farvevælger styrer ord-for-ord højdepunkt (enhver hex). Position lader dig tilsidesætte top / center / bund uanset forudindstillede.

Ja! 99 sprog via Whisper. Auto-detect virker på 99% af klip. Du kan tvinge et sprog, hvis Whisper mis-detects (almindelig på korte klip under 5 sekunder eller blandet-sprog lyd).

Nej. Hvis der ikke er nogen talt dialog, Whisper returnerer ingen segmenter, og vi overfladen en klar "Ingen tale opdaget" fejl, så du ikke brænde tokens på et umuligt job.

CapCut er gratis, fungerer offline efter installationen, og har store auto-captions, hvis CapCut allerede er din editor, bruge det der. AI- billeddannelsesgenerator springer installationen og giver dig batch-venlige browser adgang. Den underliggende Whisper + libass kæde er den samme primitive.

Submagic er $20/mo for ubegrænset billedtekster med snesevis af stil packs. Opus Clip er $ 30/mo med viral lang-form-til-kort AI klipning bundtet. Billedtekster.AI er $ 10/mo på mobil. Alle tre bruge Whisper nedenunder; deres reelle værdi er stil bibliotek og klip-detektion. For one-offs og mindre mængder AI- billeddannelsesgenerator er gratis inde i din token pool.

Whisper giver segment-level tidsstempler Vi jævnt distribuere segment varighed på tværs af sine ord til at udlede per-ord timing. På hurtig-tale segmenter estimatet kan flyde med ~ 0.1 sekunder. For frame-præcis timing, bruge den downloadbare.ass fil og redigere i Agisub.

Ja. Efter eksport, både den billedteksterede MP4 og den rå.ass-fil er downloades redigere.ass i Agisub, hvis du ønsker pixel-perfekt ord timing, derefter re-brænde lokalt med ffmpeg -vf undertekster=file.ass.

Ja. POST multipart til /v1/video/caption/ med file ~, style~ (tikok-neon / youtube-lower / meme / podcast / keynote / cinetic / ted), valgfri skrifttype, hippielys_color=SecS. Snippets at /api/.

Gratis tilmelding til 30.000 tokens

Opret gratis konto

Ingen kreditkort påkrævet

Hvordan vil du vurdere dette værktøj?

Love this tool? Share it!