Speech to Text

Uso commerciale OK 380+ modelli Nessuna filigrana Nessuna registrazione necessaria

Caricare un file audio o video o incollare un URL e ottenere una trascrizione pulita con timestamps. Speaker diarization, SRT/VTT esportazione sottotitolo, 100+ lingue con auto-rilevamento. Scale di costo esattamente con lunghezza clip. Powered by Whisper large-v3 e Parakeet (auto-hosted), più premium Wizper e ElevenLabs STT.

Trascinare e rilasciare audio / video, o fare clic per navigare

MP3, WAV, MP4, WebM, M4A fino a 500MB

Lingua

Motore Whisper large-v3 99 lingue, precisione best-in-class.

Formato di output

Rilevamento diffusori — etichetta che sta parlando quando (+50% gettoni)

Numero di oratori

YouTube, Instagram, TikTok, Spotify e oltre 1.300 piattaforme

Motore

Formato di output

Rilevamento diffusori — +50%

Il costo di trascrizione dell'URL si basa sulla durata effettiva del clip che citiamo dopo il download. Aspettatevi ~500 gettoni/minuto su Whisper.

Trascrizione in tempo reale con il microfono

Ciò che la gente trascrive con Free.ai

Interviste + podcast

Etichette di diarizzazione ogni altoparlante. Esporta SRT direttamente nel tuo editor video, o testo semplice per una scrittura di articoli.

Didascalie automatiche + sottotitoli

Caricare un upload YouTube o TikTok, scegliere SRT o WebVTT, e masterizzare i sottotitoli con /video/subtitle/.

Note di riunione

Upload a Zoom/Teams recording — get transcript + speaker labels. Pair with /write/summarize/ for bullet-point minutes.

Lezioni frontali + lezioni

Trascrivere una lezione di 90 minuti, quindi utilizzare /study/flashcards/ o /write/summarize/ per trasformarlo in materiale di studio.

Audio in lingua straniera

Whisper rileva automaticamente 99 lingue. Trascrivere nell'originale, quindi inviare il testo attraverso /translate/ per saltare le lingue.

Legale + medico

Orari, etichette di altoparlanti, JSON esportare con ogni parola di inizio/fine tempo Cronologia accurato corte-reporter o clinica-note preparazione.

Come Free.ai trascrizione confronta

Cosa ottieni?	Free.ai	Otter.ai	Descript	Rev.com
Uso giornaliero gratuito	5K+ tokens/day	300 minutes/mo	1 hr/month	—
Motore	Whisper large-v3, Parakeet	Proprietary	Proprietary	Human + AI
Lingue	99	English-focused	22	30+
Diarizzazione degli altoparlanti
Esportazione SRT / VTT		Paid	Paid
API pubbliche		Limited	Limited
Live streaming STT	(gratuito)	Paid	—	—
Iscrizione richiesta	No.	Yes	Yes	Yes

Le cifre dei concorrenti riflettono i livelli liberi elencati pubblicamente a partire dal 2026. Controllare ogni fornitore per i piani attuali.

Best free speech to text tool. Upload MP3, WAV, MP4 or record live. Auto-detect language. Speaker diarization. No sign up required.

Come usare Speech to Text

Inserisci il tuo input

Digitare testo, caricare un file, o descrivere ciò che si desidera. Nessun account necessario.

Fare clic su genera

Il nostro IA elabora la tua richiesta in pochi secondi utilizzando i migliori modelli open-source.

Scarica e condividi

Scaricare, copiare o condividere il risultato. Gratis per uso personale e commerciale.

Utilizzare questo strumento tramite API

Automatizza questo strumento dal tuo codice. Endpoint REST compatibile con OpenAI, auth Bearer-token, nessun SDK aggiuntivo richiesto. I costi Token corrispondono all'interfaccia web.

Documentazione API Ottieni la chiave API

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

Speech to Text — FAQ

Free.ai offre Whisper-powered discorso a testo con eccellente precisione, 99 lingue, esportazione sottotitoli, rilevamento altoparlanti, e live mic cattura completamente libero.

Caricare un file audio o video (MP3, WAV, MP4, M4A), fare clic su Trascrivi, e ottenere un discorso accurato al testo in pochi secondi. O registrare in diretta dal microfono.

Sì. Incolla qualsiasi URL di YouTube nella scheda URL e Speech To Text discorso a testo estrae l'audio e lo converte. Funziona con piattaforme Instagram, TikTok, Spotify e 1.300+.

Sì. Rilevamento automatico o selezione da 99 lingue. Il nostro discorso al testo gestisce accenti, rumore di fondo, e audio di lingua mista bene.

Sì. Selezionare più file audio in una volta ciascuno viene inviato attraverso il discorso al testo con il monitoraggio dei progressi e i risultati sono scaricabili separatamente o combinati.

Sì. Il discorso a testo API a /api/ è compatibile con OpenAI. Caricare programmaticamente audio e ricevere JSON con la trascrizione, lingua e timestamp.

Sì. Toggle Speaker Detection prima di caricare e l'output del discorso al testo è etichettato per speaker (Speaker 1, Speaker 2...). Aggiunge il 50% al costo token.

Speech to text accetta file fino a 500MB per upload. Per i contenuti multi-ora, dividere l'audio in parti prima.

Molto preciso per l'audio chiaro di solito 95% + precisione di parola in inglese con il nostro Whisper grande-v3 backend. La qualità dipende dalla chiarezza audio, accento e rumore di fondo.

Sì. La trascrizione è completamente modificabile in-place. Correggi errori, riformat e copia/download come TXT, SRT o VTT.

Sì. L'audio viene elaborato sulle nostre GPU e cancellato dopo il discorso al testo completo. Nulla viene memorizzato a lungo termine, condiviso, o utilizzato per l'addestramento.

Sì. Caricare un file audio o video in /chat/ e chiedere all'IA di trascriverlo ® combina discorso a testo con domande di follow-up e sintesi in un flusso di lavoro.

Iscriviti gratis per 30.000 gettoni

Crea account libero

Nessuna carta di credito richiesta

Come valuteresti questo strumento?

Speech to Text

Ciò che la gente trascrive con Free.ai

Interviste + podcast

Didascalie automatiche + sottotitoli

Note di riunione

Lezioni frontali + lezioni

Audio in lingua straniera

Legale + medico

Come Free.ai trascrizione confronta

Risultato

Come usare Speech to Text

Inserisci il tuo input

Fare clic su genera

Scarica e condividi

Utilizzare questo strumento tramite API

Speech to Text — FAQ

Qual è il miglior strumento di libertà di parola per il testo?

Come faccio a convertire il discorso in testo online?

Può parlare al testo gestire i video di YouTube?

Il discorso al testo funziona in altre lingue?

Posso caricare più file per parlare al testo?

C'è un discorso per SMS API?

Il discorso al testo supporta le etichette degli altoparlanti?

Che dimensione del file audio accetta l'ascolto del testo?

Quanto è preciso l'output del discorso al testo?

Posso modificare il discorso alla trascrizione del testo?

Il discorso al testo è privato e sicuro?

Posso usare il discorso al testo in IA Chat?

Ottieni 10.000 Token gratuiti

Aspetta. Ottieni 10K Token gratis!

Ne vuoi ancora?