Trascrizzioni di podcast

Usu commerciale OK 380+ mudelli Nessuna filigrana Nudda iscrizioni necessaria
Modellu:
+ GPT-5, Claude, Gemini
Carica un episodiu di podcast è ottieni una trascrizzioni pulita, etichettata da l'oratore cù marcatori di capitulu rilevati automaticamente da i spazii di silenziu. Fichieri di forma longa finu à 2GB, 99 lingue, accuratezza Whisper-large-v3. Esportà cum'è SRT/VTT per u vostru podcast video, TXT simplice per e note di mostra, o JSON per l'edizione in flussi di travagliu in stile Descript.

Trascina e lasci u vostru episodiu di podcast, o cliccate pi sfogliari

MP3, WAV, M4A, OGG, MP4 — episodi di forma longa finu à 2GB

I marcaturi di capitulu sò calcolati da u latu clientu a partiri di i spazii tra i segmenti è attaccati a la trascrizzioni. Incollalli in descrizzioni di YouTube o Spotify comu sunnu.
Stima di token pi stu clip
Podcast transcript
Capituli rilevati automaticamenti

Trascrivennu u vostru podcast...

L'episodi lunghi pigghianu assai minuti. Potete chiudiri sta linguetta si l'opzioni "inviari un email quandu finitu" è spuntata.

Creatu pi podcasters + editori di spettaculi

Mostrari li note in una sola copia

Carica l'episodiu, scaricà u TXT. Etichette di altoparlanti in linea, timestamps di capitulu pronti per a vostra descrizione Spotify / YouTube, post di blog scritti in 10 minuti invece di 4 ore.

Sottotitoli di podcast video

Esporta SRT o WebVTT cù etichette di parlanti. Trasferisci direttamente in Premiere, Final Cut o DaVinci Resolve — o carica incù u vostru video YouTube per dittitulari puliti.

Edizzioni di episodi basata supra lu testu

L'esportazione JSON vi dà ogni parola cù marcatori di tempu di iniziu / fine. Pipe in Descript, Reaper, o un flussu di travagliu persunalizatu - edite evidenziendu u testu invece di scrubbing.

Cume a trascrizzioni di podcast funziona

  1. Trascinate u vostru episodiu nantu à a zona di rilasciu - MP3, WAV, M4A, MP4, finu à 2GB.
  2. Lascia attivati l'etichetti di l'altoparlanti e i marcaturi di capitulu (sunu i valori predefiniti). Sceglite u vostru furmatu di output.
  3. Cuntrollemu a durata + u prezzu prima di spende i gettoni. Cliccate Trascrive.
  4. Scaricate TXT, SRT, VTT o JSON etichettati da l'oratori. I marcatori di capitulu sò spediti a la manu, pronti à incollà.

Free.ai podcast trascrizione vs Descript, Riverside, Otter

Carattiristichi Free.ai Descript Riverside Otter.ai
PrezzuPay-per-use ($0.003/min)$15-30/mo$19/mo$16.99/mo
Dimensioni massima di u file2 GB5 GBTied to record session500 MB (varies)
Diarization di l'altoparlante
Marcatori di capitulu automatici (basatu supra lu silenziu)ManualPaid tier
Esportazione SRT/VTTPaid
Lingue9922100+English-focused
API pùbblicuLimited
I prezzi di i cuncurrenti riflettenu i livelli elencati in u 2026. Controllà ogni fornitore per i piani attuali.
Opzioni avanzate
Risurtatu
Tokens scarsi. Più token
Volete risultati megghiu? Modelli Premium (GPT-5, Claude, Gemini) offrenu una qualità cchiù àuta. Visualizza i piani

❤️ Amuri Free.ai? Dì i vostri amichi!

Iscriviti per ottene un ligame di rifirimentu è guadagnà 25.000 gettoni per amicu.

Volete di più? Iscriviti gratuitamente per 30K tokens/day + 10K bonus
Iscriviti

Elaborazione di a vostra richiesta...

Trascrivi podcasts in testu cù AI gratuitamente. Etichette di parlanti, marcatori di capitulu, esportazione SRT.

Comu usari Trascrizzioni di podcast

1
Inserisci u vostru input

Scrivi un testu, carica un figghiu o discrivi chiddu ca vogghiu. Nudda cuntu necessariu.

2
Clicca pi generari

A nostra IA processa a vostra dumanda in uni pochi di seconde usannu i migliori mudelli open-source.

3
Scarica e cunnividi

Scarica, copia o sparte u vostru risultatu. Libru per usu persunale è cummerciale.

Usa stu strumentu via API

Automate stu strumentu da u vostru propiu codice. OpenAI-compatible REST endpoint, Bearer-token auth, no extra SDK richiestu. Token costi currisponde à l'interfaccia web.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

Trascrizzioni di podcast — FAQ

U strumentu podcast hè predefinitu per a diarizazione di l'altoparlanti è i marcatori di capitulu (rilevazione di silenziu-gap> 2s), è supporta i fugliali di forma longa finu à 2GB. I formati di output includi SRT + VTT per i clip video di mostra-note, TXT simplice per i post di blog, è JSON strutturatu cù timestamps per-turn + etichette di l'altoparlanti per l'edizione in flussi di travagliu in stile Descript.

Finu à 2GB per file — circa un podcast audio di 14 ore à 128 kbps MP3. I file lunghi sò spartuti da u latu di u servitore per a resilienza; ottenete una singula trascrizione unita.

Sì. A diarizazione di l'altoparlanti è attivata pi default. Rilevemu 2-10 voci distinte ntramiti l'incorporazioni di voci ECAPA, li etichettamu Altoparlante 1 / 2 /... e applichemu l'etichette a ogni segmentu. Li pò rinuminari ntâ vista di risultati.

Ogni capitulu hà un timestamp chì pudete incollà direttamente in i vostri show-notes cù un bloccu "Chapters:" per YouTube + Spotify.

Descript carica $ 15- $ 30 al mese per 10 ore di trascrizione, legatu à u so editore.Facciamu pagà per l'usu à ~ 500 tokens / min in Whisper ($ 5 = 200K tokens = ~ 400 minuti), senza abbonamentu, esportazione semplice chì pudete incollà ovunque.

Riverside hè un studio di registrazione chì trasscrivi e vostre sessioni gratuitamente in a so app, ma solu dopu à a registrazione cù elli. Trascrivemu qualsiasi MP3 / WAV / MP4 indipendentemente da induve hè statu registratu.

Otter hè limitatu à 300 minuti/mese in u livellu gratuitu è hè focalizatu in inglese.Supportemu 99 lingue à a stessa precisione di Whisper-large-v3 senza limitu mensili - paghi per minutu trascrittu.

Sì — sceglite SRT o WebVTT comu furmatu di uscita. L'etichetti di l'altoparlanti sunnu inclusi in linea (SRT) o comu tag <v Speaker N> (VTT) ca la maggiuranza di li lettori muderni riprisentanu currettamente.

Whisper-large-v3 gestisci bè i letti musicali è u riverberu liggieru (tipicamenti u tassu di erruri di parolla hè 3-7%). A musica assai forti o a sovrapposizione pesante degradi a precisione - cunzidira di eseguisce /music/vocal-remover/ prima di una copia, o di sparte i vostri cold opens.

Whisper gestisci i nomi cchiù cumuni, ma u jargonu altamente specificu di marca pò avè bisognu di un passaghju di post-edizione. Un episodiu di ~ 30 minuti hà tipicamente 5-10 marca / nomi correzioni da applicà manualmente.

Caricateli unu à una quistu, o usate a nostra funzioni /batch/ una vota accoppiati pi mette in coda na staggiuni. L'API a /api/ accitta puru POST /v1/stt/ pi lu batch programmaticu.

No. I fugliali caricati sunnu canciati dopu a fini di a trascrizzioni. A vostra trascrizzioni si trova ntâ storia di /account/ pi scaricari si avete fattu u login; l'utenti anònimi cci dannu un ligame di cunnizzioni di 24 ore.

Iscriviti gratuitamenti pi 30.000 tokens

Crea un contu

Nessuna carta di creditu richiesta

Comu valutate stu strumentu?

Amuri Free.ai? Dì i vostri amichi!