Trascrizione in podcast

Uso commerciale OK 380+ modelli Nessuna filigrana Nessuna registrazione necessaria
Modello:
+ GPT-5, Claude, Gemini
Carica un episodio di podcast e ottieni una trascrizione pulita con i marcatori del capitolo rilevati automaticamente dalle lacune del silenzio. File a forma lunga fino a 2GB, 99 lingue, precisione Whisper-large-v3. Esporta come SRT/VTT per il tuo podcast video, semplice TXT per le note di visualizzazione, o JSON per la modifica nei flussi di lavoro in stile Descript.

Trascinare e rilasciare l'episodio podcast, o fare clic per navigare

MP3, WAV, M4A, OGG, MP4 Episodi a lunga forma fino a 2GB

I marcatori del capitolo sono client-side calcolati dalle lacune del segmento e collegati alla trascrizione. Incollarli in YouTube o Spotify le descrizioni come-è.
Stima token per questa clip
Trascrizione podcast
Capitoli rilevati automaticamente

Trascrivendo il tuo podcast...

Gli episodi lunghi richiedono diversi minuti. Puoi chiudere questa scheda se email-quando-done è selezionata.

Costruito per podcasters + editor di spettacoli

Mostra le note in una sola incolla

Carica l'episodio, scarica le etichette TXT. Speaker in linea, timestamp di capitolo pronti per la tua descrizione Spotify/YouTube, post sul blog scritto in 10 minuti invece di 4 ore.

Sottotitoli podcast video

Esporta SRT o WebVTT con etichette di altoparlanti. Rilascia direttamente in Premiere, Final Cut, o DaVinci Resolve ® o carica insieme al tuo video YouTube per didascalie pulite.

Modifica dell'episodio basato sul testo

L'esportazione di JSON ti dà ogni parola con il timestamp start/end. Connetti in Descript, Reaper, o un flusso di lavoro personalizzato Modifica evidenziando il testo invece di pulire.

Come funziona la trascrizione del podcast

  1. Trascinare l'episodio nella zona di caduta Hoppenstedt MP3, WAV, M4A, MP4, fino a 2GB.
  2. Lasciare le etichette degli altoparlanti e i marcatori dei capitoli attivi (sono i valori predefiniti). Scegli il formato di uscita.
  3. Controlliamo la durata + prezzo in su prima di spendere qualsiasi gettoni. Clicca Trascrivi.
  4. Scarica TXT, SRT, VTT o JSON. I marcatori del capitolo vengono spediti insieme, pronti per essere incollati.

Free.ai trascrizione podcast vs Descript, Riverside, Otter

Caratteristica Free.ai Descript Riverside Otter.ai
PrezzoPay-per-use ($0.003/min)$15-30/mo$19/mo$16.99/mo
Dimensione massima del file2 GB5 GBTied to record session500 MB (varies)
Diarizzazione degli altoparlanti
Marcatori automatico dei capitoli (basato sul silenzio)ManualPaid tier
Esportazione SRT/VTTPaid
Lingue9922100+English-focused
API pubblicheLimited
I prezzi dei concorrenti riflettono i livelli elencati pubblicamente nel 2026. Controllare ogni fornitore per i piani attuali.
Opzioni avanzate
Risultato
I token sono bassi. Ottenere più token
Vuoi risultati migliori? Modelli premium (GPT-5, Claude, Gemini) forniscono una qualità superiore. Visualizza Piani

❤️ Love this tool? Share it!

Registrati per ottenere un link di referral e guadagnare 25.000 gettoni per amico.

Ne vuoi ancora? Iscriviti gratis per 30K gettoni al giorno + 10K bonus
Iscriviti gratis

Elaborare la tua richiesta...

Trascrivere i podcast in testo con IA gratuitamente.

Come usare Trascrizione in podcast

1
Inserisci il tuo input

Digitare testo, caricare un file, o descrivere ciò che si desidera. Nessun account necessario.

2
Fare clic su genera

Il nostro IA elabora la tua richiesta in pochi secondi utilizzando i migliori modelli open-source.

3
Scarica e condividi

Scaricare, copiare o condividere il risultato. Gratis per uso personale e commerciale.

Utilizzare questo strumento tramite API

Automatizza questo strumento dal tuo codice. Endpoint REST compatibile con OpenAI, auth Bearer-token, nessun SDK aggiuntivo richiesto. I costi Token corrispondono all'interfaccia web.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

Trascrizione in podcast — FAQ

Trascrizione in podcast podcast predefinisce la diarizzazione degli altoparlanti e i marcatori dei capitoli (silence-gap detection >2s) e supporta file di forma lunga fino a 2GB. I formati di output includono SRT + VTT per le clip video show-notes, TXT per i post del blog e JSON strutturato con timestamp per-turn + etichette degli altoparlanti per modificare i flussi di lavoro in stile Descript.

Fino a 2 GB per file circa un podcast audio di 14 ore a 128 kbps MP3. I file lunghi sono accovacciati lato server per la resilienza; si ottiene una sola trascrizione unito indietro.

Sì. La diarizzazione degli altoparlanti è attiva per impostazione predefinita. Rilevamo 2-10 voci distinte tramite le inserzioni vocali ECAPA, le etichettamo Speaker 1 / 2 /... e applichiamo le etichette ad ogni segmento. Puoi rinominarle nella vista dei risultati.

Spacchi di silenzio più lunghi di 2 secondi I podcasters di pause naturali usano fra i segmenti. Ogni capitolo ottiene un timestamp che potete incollare direttamente nelle vostre note-show con un blocco "Capitolos:" per YouTube + Spotify.

Descript addebita $15-$30 al mese per 10 ore di trascrizione, legato al loro editor. Noi addebitare per uso a ~500 gettoni/min su Whisper ($5 = 200K gettoni = ~400 minuti), nessun abbonamento, semplice esportazione è possibile incollare ovunque.

Riverside è uno studio di registrazione che trascrive gratuitamente le tue sessioni all'interno della loro app, ma solo dopo aver registrato con loro. Trascriviamo qualsiasi MP3/WAV/MP4 indipendentemente da dove è stato registrato.

Caps lontra a 300 minuti al mese sul livello libero ed è focalizzato sull'inglese. Supportiamo 99 lingue con la stessa precisione Whisper-large-v3 senza un limite mensile.

Sì Scegli SRT o WebVTT come formato di output. Le etichette dei diffusori sono incluse in linea (SRT) o come <v Tag N> dei diffusori (VTT) che la maggior parte dei lettori moderni rende correttamente.

Whisper-large-v3 gestisce letti musicali e riverbero leggero bene (tipico word-error rate 3-7%). Musica molto forte o sovrapposizioni pesanti degrada l'accuratezza... prendere in considerazione l'esecuzione /musica / vocal-remover / prima su una copia, o dividere il freddo si apre.

Whisper gestisce i nomi più comuni, ma il gergo altamente brand-specific può aver bisogno di un post-edit pass. Un episodio di ~30 minuti ha tipicamente 5-10 correzioni di marca / nome da applicare manualmente.

Caricali uno alla volta qui, o usa la nostra funzione /batch/ una volta registrato per fare la coda in una stagione. L'API di /api/ accetta anche POST /v1/stt/ per il batching programmatico.

No. I file caricati vengono cancellati dopo la trascrizione completa. La tua trascrizione si trova nella tua /account/ cronologia per il download se registrato; gli utenti anonimi ricevono un link di condivisione 24 ore.

Iscriviti gratis per 30.000 gettoni

Crea account libero

Nessuna carta di credito richiesta

Come valuteresti questo strumento?

Love this tool? Share it!