Generatore di didascalie IA

Uso commerciale OK 380+ modelli Nessuna filigrana Nessuna registrazione necessaria
Modello:
+ GPT-5, Claude, Gemini
Masterizzare virale TikTok-stile didascalie nel tuo video testo grande grassetto con animazione word-by-word highlight (ASS karaoke timing). Preferire file SRT / VTT sidecar semplice? Utilizzare il strumento sottotitoloInvece questo è stile-prima e brucia sempre dentro.

Trascinare un video qui o fare clic per caricare

MP4, MOV, WebM fino a 200MB 99 lingue supportate da Whisper

Colore evidenziazione parola per parola (effetto karaoke).
Caricare un video per vedere il costo esatto del clip.

Dove le didascalie virali guadagnano la loro tenuta

TikTok / Rulli / Pantaloncini

Il tasso di completamento della forma corta salta 30-40% con le didascalie parola per parola. Il preset di TikTok Neon è quello che i creatori top tutti usano.

Clip virali di YouTube

MrBeast-style audace-text overlays on reaction / commentary footage. YouTube Lowerthird preset with a translucent box.

Clip podcast per social

Audio-first mostra ri-clipped per IG Reels / TikTok. Preimpostato podcast mantiene le didascalie leggibili sopra la cornice della testa parlante.

Come procedere in 4 fasi

  1. Carica il tuo video. Tiriamo l'audio, eseguiamo Whisper STT e leggiamo i tempi per ogni segmento parlato.
  2. Scegliere un preset di stile TikTok Neon è la scelta virale sicura. Font / highlight colore / posizione sovrascrivere le predefinite.
  3. Costruiamo un file di sottotitoli ASS con word-by-word karaoke tempo (l'effetto in cui le parole cambiano colore come si parla).
  4. ffmpeg masterizza le didascalie nel video. L'elaborazione richiede 30-90 secondi. Chiudi la scheda; ti email quando hai finito.

vs. CapCut, Submagic, Opus Clip, Didascalie.AI

Le auto-didascalie di CapCut sono gratuite e buone, ma è necessario l'editor CapCut installato e non è possibile lottizzarle. Submagic è di $20/mo per illimitato. Opus Clip è di $30/mo per long-form → breve-forma con auto-didascalie in bundle. Didascalie.AI (App Store) è di $10/mo. Questo strumento funziona Whisper large-v3 + un karaoke di ffmpeg ASS burn-in • gli stessi due primitivi tutti gli strumenti a pagamento usano l'App Store all'interno del token pool. Per le esportazioni sociali mono-off e batch, è il percorso più veloce.

Didascalie contro sottotitoli Qual è la differenza?

I sottotitoli (vedi /video/subtitle/) sono un'utility: i file sidecar SRT/VTT del giocatore del visualizzatore possono attivare/disattivare, progettato per l'accessibilità e il caricamento su YouTube Studio. Le didascalie (questo strumento) sono uno stile: testo in grassetto grande masterizzato in ogni fotogramma con animazione karaoke, progettato per guadagnare il tasso di completamento su TikTok / Reels / Shorts dove 85% degli spettatori mantengono il suono spento.

Quando NON alla didascalia

  • Video che hanno già masterizzato-in didascalie Il testo si raddoppierà e guardare rotto.
  • Caricamenti YouTube a forma lunga Hoppenstedt usa il sidecar SRT da /video/subtitle/ invece in modo che gli spettatori possano attivare CC.
  • Video con zero dialogue Non c'è niente da didascalie. Solo clip musicali dovrebbero aggiungere le sovrapposizioni di testo manualmente.
Opzioni avanzate
Risultato
I token sono bassi. Ottenere più token
Vuoi risultati migliori? Modelli premium (GPT-5, Claude, Gemini) forniscono una qualità superiore. Visualizza Piani

❤️ Love this tool? Share it!

Registrati per ottenere un link di referral e guadagnare 25.000 gettoni per amico.

Ne vuoi ancora? Iscriviti gratis per 30K gettoni al giorno + 10K bonus
Iscriviti gratis

Elaborare la tua richiesta...

Aggiungi automaticamente le didascalie ai video con IA.

Come usare Generatore di didascalie IA

1
Inserisci il tuo input

Digitare testo, caricare un file, o descrivere ciò che si desidera. Nessun account necessario.

2
Fare clic su genera

Il nostro IA elabora la tua richiesta in pochi secondi utilizzando i migliori modelli open-source.

3
Scarica e condividi

Scaricare, copiare o condividere il risultato. Gratis per uso personale e commerciale.

Utilizzare questo strumento tramite API

Automatizza questo strumento dal tuo codice. Endpoint REST compatibile con OpenAI, auth Bearer-token, nessun SDK aggiuntivo richiesto. I costi Token corrispondono all'interfaccia web.

curl -X POST https://api.free.ai/v1/video/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"prompt": "A cat playing piano", "duration": 4}'

Generatore di didascalie IA — FAQ

Masterizza didascalie in stile virale in qualsiasi video con animazione karaoke-timing word-by-word. Diverso da /video/sottotitolo/: uscite sottotitoli SRT/VTT file sidecar che i giocatori commutano on/off. La didascalia è sempre burn-in, style-first, e sintonizzata per TikTok / Rulli / Shorts dove le didascalie devono essere codificate in ogni fotogramma.

Quattro passi: (1) estrarre audio mono 16kHz dal video, (2) trascrivere con Whisper large-v3 per 99-lingua word timing, (3) costruire un file sottotitolo ASS con word-level \kf karaoke timing tags, (4) ffmpeg masterizza l'ASS in ogni frame usando libass per pulire il testo anti-aliased.

50 gettoni al secondo (minimo 2.000 token). Una clip di 30 secondi è ~2.000 gettoni (il pavimento entra in azione); una clip di 60 secondi è ~3.000; una clip di 3 minuti è ~9.000. STT guida la maggior parte del costo; il burn-in aggiunge circa il 25% in cima.

Sette: TikTok Neon (montserrat giallo, word-by-word highlight), YouTube Lowerthird (roboto bianco in una scatola traslucida), Meme (impatto bianco con un contorno nero), Podcast (poppins in una scatola arrotondata scura), Keynote (nero ariale in alto), Cinematic (oswald italiano in basso), e TED (roboto allineato a sinistra).

Sì. Il Font a discesa sovrascrive il preset con Impact, Montserrat, Bebas Neue, Arial Black, Oswald, Poppins, Anton, o Roboto. L'Evidenziatore Colore controlla l'evidenziatore parola per parola (qualsiasi esadecimale). La posizione consente di sovrascrivere top / centro / fondo indipendentemente dal preset.

Sì, 99 lingue tramite Whisper. L'auto-rilevamento funziona al 99% delle clip. Puoi forzare una lingua se Whisper rileva in modo errato (comune su brevi clip in meno di 5 secondi o audio in lingua mista).

No. Se non c'è alcun dialogo parlato, Whisper non restituisce segmenti e noi emergiamo un chiaro errore "Nessun discorso rilevato" in modo da non bruciare gettoni su un lavoro impossibile.

CapCut è gratuito, funziona offline dopo l'installazione, e ha grandi auto-didascalie se CapCut è già il vostro editor, usarlo lì. Generatore di didascalie IA salta l'installazione e ti dà accesso browser batch-friendly. La catena sottostante Whisper + libass è la stessa primitiva.

Submagic è $20/mo per la didascalia illimitata con dozzine di pacchetti di stile. Opus Clip è $30/mo con clipping IA virale lungo-forma-a-corta in bundle. Didascalie.AI è $10/mo sul cellulare. Tutti e tre utilizzare Whisper sotto; il loro valore reale è la libreria stile e clip-detection. Per one-off e volumi più piccoli Generatore di didascalie IA è gratuito all'interno del token pool.

Whisper dà i timestamp a livello di segmento (in modo uniforme) distribuiamo la durata del segmento attraverso le sue parole per ricavare i tempi per parola. Su segmenti veloci la stima può derivarsi di ~0.1 secondi. Per i tempi frame-accurate, utilizzare il file.ass scaricabile e modificare in Aegisub.

Sì. Dopo l'esportazione, sia il titolo MP4 che il file.ass grezzo sono scaricabili edit il.ass in Aegisub se si desidera pixel-perfect word timing, quindi ri-bruciare localmente con ffmpeg -vf sottotitoli=file.ass.

Sì. POST multipart to /v1/video/caption/ with Hoppenstedt, Hoppenstedt style (tiktok-neon / youtube-lower / meme / podcast / keynote / cinematic / ted), optional Hoppenstedtfont, Hoppenstedt, Hoppenstedt, Hoppenstedt. Pre-volo: GET /v1/video/caption-quote/?durance=SECS. Snippets at /api/.

Iscriviti gratis per 30.000 gettoni

Crea account libero

Nessuna carta di credito richiesta

Come valuteresti questo strumento?

Love this tool? Share it!