Posso ottenere sottotitoli SRT per il mio video podcast?

Sì Scegli SRT o WebVTT come formato di output. Le etichette dei diffusori sono incluse in linea (SRT) o come dei diffusori (VTT) che la maggior parte dei lettori moderni rende correttamente.

Discorso al testo Trascrizione dal vivo Trascrizione di YouTube Trascrizione riunione Trascrizione zoom Audio al testo Video a testo Trascrizione telefonata Di più →

Trascrizione in podcast

Uso commerciale OK 380+ modelli Nessuna filigrana Nessuna registrazione necessaria

Carica un episodio di podcast e ottieni una trascrizione pulita con i marcatori del capitolo rilevati automaticamente dalle lacune del silenzio. File a forma lunga fino a 2GB, 99 lingue, precisione Whisper-large-v3. Esporta come SRT/VTT per il tuo podcast video, semplice TXT per le note di visualizzazione, o JSON per la modifica nei flussi di lavoro in stile Descript.

Trascinare e rilasciare l'episodio podcast, o fare clic per navigare

MP3, WAV, M4A, OGG, MP4 Episodi a lunga forma fino a 2GB

Lingua

Motore

Formato di output

Etichetta gli altoparlanti (ospite/ospite) — etichetta che sta parlando quando (+50% gettoni)

Numero di oratori:

Marcatori automatico dei capitoli — divari di silenzio >2s

I marcatori del capitolo sono client-side calcolati dalle lacune del segmento e collegati alla trascrizione. Incollarli in YouTube o Spotify le descrizioni come-è.

Costruito per podcasters + editor di spettacoli

Mostra le note in una sola incolla

Carica l'episodio, scarica le etichette TXT. Speaker in linea, timestamp di capitolo pronti per la tua descrizione Spotify/YouTube, post sul blog scritto in 10 minuti invece di 4 ore.

Sottotitoli podcast video

Esporta SRT o WebVTT con etichette di altoparlanti. Rilascia direttamente in Premiere, Final Cut, o DaVinci Resolve ® o carica insieme al tuo video YouTube per didascalie pulite.

Modifica dell'episodio basato sul testo

L'esportazione di JSON ti dà ogni parola con il timestamp start/end. Connetti in Descript, Reaper, o un flusso di lavoro personalizzato Modifica evidenziando il testo invece di pulire.

Come funziona la trascrizione del podcast

Trascinare l'episodio nella zona di caduta Hoppenstedt MP3, WAV, M4A, MP4, fino a 2GB.
Lasciare le etichette degli altoparlanti e i marcatori dei capitoli attivi (sono i valori predefiniti). Scegli il formato di uscita.
Controlliamo la durata + prezzo in su prima di spendere qualsiasi gettoni. Clicca Trascrivi.
Scarica TXT, SRT, VTT o JSON. I marcatori del capitolo vengono spediti insieme, pronti per essere incollati.

Free.ai trascrizione podcast vs Descript, Riverside, Otter

Caratteristica	Free.ai	Descript	Riverside	Otter.ai
Prezzo	Pay-per-use ($0.003/min)	$15-30/mo	$19/mo	$16.99/mo
Dimensione massima del file	2 GB	5 GB	Tied to record session	500 MB (varies)
Diarizzazione degli altoparlanti
Marcatori automatico dei capitoli	(basato sul silenzio)	Manual	—	Paid tier
Esportazione SRT/VTT				Paid
Lingue	99	22	100+	English-focused
API pubbliche		—	—	Limited

I prezzi dei concorrenti riflettono i livelli elencati pubblicamente nel 2026. Controllare ogni fornitore per i piani attuali.

Trascrivere i podcast in testo con IA gratuitamente.

Come usare Trascrizione in podcast

Inserisci il tuo input

Digitare testo, caricare un file, o descrivere ciò che si desidera. Nessun account necessario.

Fare clic su genera

Il nostro IA elabora la tua richiesta in pochi secondi utilizzando i migliori modelli open-source.

Scarica e condividi

Scaricare, copiare o condividere il risultato. Gratis per uso personale e commerciale.

Utilizzare questo strumento tramite API

Automatizza questo strumento dal tuo codice. Endpoint REST compatibile con OpenAI, auth Bearer-token, nessun SDK aggiuntivo richiesto. I costi Token corrispondono all'interfaccia web.

Documentazione API Ottieni la chiave API

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

Strumenti IA gratuiti correlati

Discorso al testo

Trascrizione dal vivo

Trascrizione di YouTube

Trascrizione riunione

Trascrizione zoom

Audio al testo

Video a testo

Trascrizione telefonata

Trascrizione in podcast — FAQ

Trascrizione in podcast podcast predefinisce la diarizzazione degli altoparlanti e i marcatori dei capitoli (silence-gap detection >2s) e supporta file di forma lunga fino a 2GB. I formati di output includono SRT + VTT per le clip video show-notes, TXT per i post del blog e JSON strutturato con timestamp per-turn + etichette degli altoparlanti per modificare i flussi di lavoro in stile Descript.

Fino a 2 GB per file circa un podcast audio di 14 ore a 128 kbps MP3. I file lunghi sono accovacciati lato server per la resilienza; si ottiene una sola trascrizione unito indietro.

Sì. La diarizzazione degli altoparlanti è attiva per impostazione predefinita. Rilevamo 2-10 voci distinte tramite le inserzioni vocali ECAPA, le etichettamo Speaker 1 / 2 /... e applichiamo le etichette ad ogni segmento. Puoi rinominarle nella vista dei risultati.

Spacchi di silenzio più lunghi di 2 secondi I podcasters di pause naturali usano fra i segmenti. Ogni capitolo ottiene un timestamp che potete incollare direttamente nelle vostre note-show con un blocco "Capitolos:" per YouTube + Spotify.

Descript addebita $15-$30 al mese per 10 ore di trascrizione, legato al loro editor. Noi addebitare per uso a ~500 gettoni/min su Whisper ($5 = 200K gettoni = ~400 minuti), nessun abbonamento, semplice esportazione è possibile incollare ovunque.

Riverside è uno studio di registrazione che trascrive gratuitamente le tue sessioni all'interno della loro app, ma solo dopo aver registrato con loro. Trascriviamo qualsiasi MP3/WAV/MP4 indipendentemente da dove è stato registrato.

Caps lontra a 300 minuti al mese sul livello libero ed è focalizzato sull'inglese. Supportiamo 99 lingue con la stessa precisione Whisper-large-v3 senza un limite mensile.

Sì Scegli SRT o WebVTT come formato di output. Le etichette dei diffusori sono incluse in linea (SRT) o come <v Tag N> dei diffusori (VTT) che la maggior parte dei lettori moderni rende correttamente.

Whisper-large-v3 gestisce letti musicali e riverbero leggero bene (tipico word-error rate 3-7%). Musica molto forte o sovrapposizioni pesanti degrada l'accuratezza... prendere in considerazione l'esecuzione /musica / vocal-remover / prima su una copia, o dividere il freddo si apre.

Whisper gestisce i nomi più comuni, ma il gergo altamente brand-specific può aver bisogno di un post-edit pass. Un episodio di ~30 minuti ha tipicamente 5-10 correzioni di marca / nome da applicare manualmente.

Caricali uno alla volta qui, o usa la nostra funzione /batch/ una volta registrato per fare la coda in una stagione. L'API di /api/ accetta anche POST /v1/stt/ per il batching programmatico.

No. I file caricati vengono cancellati dopo la trascrizione completa. La tua trascrizione si trova nella tua /account/ cronologia per il download se registrato; gli utenti anonimi ricevono un link di condivisione 24 ore.

Iscriviti gratis per 30.000 gettoni

Crea account libero

Nessuna carta di credito richiesta

Come valuteresti questo strumento?

Trascrizione in podcast

Costruito per podcasters + editor di spettacoli

Mostra le note in una sola incolla

Sottotitoli podcast video

Modifica dell'episodio basato sul testo

Come funziona la trascrizione del podcast

Free.ai trascrizione podcast vs Descript, Riverside, Otter

Risultato

Come usare Trascrizione in podcast

Inserisci il tuo input

Fare clic su genera

Scarica e condividi

Utilizzare questo strumento tramite API

Strumenti IA gratuiti correlati

Trascrizione in podcast — FAQ

In che modo la trascrizione del podcast differisce dallo strumento generico?

Qual è il podcast più lungo che puoi trascrivere?

Etichetta automaticamente gli altoparlanti?

Su cosa si basano i marcatori dei capitoli?

Come si confronta questo con Descript?

Come ci si confronta con Riverside?

Come si confronta questo con Otter.ai?

Posso ottenere sottotitoli SRT per il mio video podcast?

Che precisione devo aspettarmi sui podcast con letti musicali?

Riconosce i termini e i nomi degli ospiti?

Posso elaborare più episodi contemporaneamente?

Il mio audio verrà memorizzato dopo la trascrizione?

Ottieni 10.000 Token gratuiti

Aspetta. Ottieni 10K Token gratis!

Ne vuoi ancora?