Speech to Text

Uso commerciale OK 380+ modelli Nessuna filigrana Nessuna registrazione necessaria
Modello:
+ GPT-5, Claude, Gemini
Caricare un file audio o video o incollare un URL e ottenere una trascrizione pulita con timestamps. Speaker diarization, SRT/VTT esportazione sottotitolo, 100+ lingue con auto-rilevamento. Scale di costo esattamente con lunghezza clip. Powered by Whisper large-v3 e Parakeet (auto-hosted), più premium Wizper e ElevenLabs STT.

Trascinare e rilasciare audio / video, o fare clic per navigare

MP3, WAV, MP4, WebM, M4A fino a 500MB

Whisper large-v3 99 lingue, precisione best-in-class.
Stima token per questa clip
Iscriviti gratis Token 10K Acquista gettoni
YouTube, Instagram, TikTok, Spotify e oltre 1.300 piattaforme
Il costo di trascrizione dell'URL si basa sulla durata effettiva del clip che citiamo dopo il download. Aspettatevi ~500 gettoni/minuto su Whisper.
Registrazione: 0:00

Trascrizione in tempo reale con il microfono

Trascrizione

Trascrivere l'audio...

Questo potrebbe richiedere un momento per file più lunghi.

Ciò che la gente trascrive con Free.ai

Interviews + podcasts

Etichette di diarizzazione ogni altoparlante. Esporta SRT direttamente nel tuo editor video, o testo semplice per una scrittura di articoli.

Auto captions + subtitles

Caricare un upload YouTube o TikTok, scegliere SRT o WebVTT, e masterizzare i sottotitoli con /video/subtitle/.

Note di riunione

Upload a Zoom/Teams recording — get transcript + speaker labels. Pair with /write/summarize/ for bullet-point minutes.

Lectures + lessons

Trascrivere una lezione di 90 minuti, quindi utilizzare /study/flashcards/ o /write/summarize/ per trasformarlo in materiale di studio.

Audio in lingua straniera

Whisper rileva automaticamente 99 lingue. Trascrivere nell'originale, quindi inviare il testo attraverso /translate/ per saltare le lingue.

Legal + medical

Orari, etichette di altoparlanti, JSON esportare con ogni parola di inizio/fine tempo Cronologia accurato corte-reporter o clinica-note preparazione.

Come Free.ai trascrizione confronta

Cosa ottieni? Free.ai Otter.ai Descript Rev.com
Uso giornaliero gratuito5K+ tokens/day300 minutes/mo1 hr/month
MotoreWhisper large-v3, ParakeetProprietaryProprietaryHuman + AI
Lingue99English-focused2230+
Diarizzazione degli altoparlanti
Esportazione SRT / VTTPaidPaid
API pubblicheLimitedLimited
Live streaming STT (gratuito) Paid
Iscrizione richiestaNo.YesYesYes
Le cifre dei concorrenti riflettono i livelli liberi elencati pubblicamente a partire dal 2026. Controllare ogni fornitore per i piani attuali.
Opzioni avanzate
Risultato
I token sono bassi. Get More Tokens
Want better results? Modelli premium (GPT-5, Claude, Gemini) deliver higher quality. View Plans

❤️ Love this tool? Share it!

Registrati per ottenere un link di referral e guadagnare 25.000 gettoni per amico.

Ne vuoi ancora? Iscriviti gratis per 5K gettoni al giorno + 10K bonus
Iscriviti gratis

Elaborare la tua richiesta...

Best free speech to text tool. Upload MP3, WAV, MP4 or record live. Auto-detect language. Speaker diarization. No sign up required.

Come usare Speech to Text

1
Inserisci il tuo input

Digitare testo, caricare un file, o descrivere ciò che si desidera. Nessun account necessario.

2
Fare clic su genera

Il nostro AI elabora la tua richiesta in pochi secondi utilizzando i migliori modelli open-source.

3
Scarica e condividi

Scaricare, copiare o condividere il risultato. Gratis per uso personale e commerciale.

Utilizzare questo strumento tramite API

Automatizza questo strumento dal tuo codice. Endpoint REST compatibile con OpenAI, auth Bearer-token, nessun SDK aggiuntivo richiesto. I costi Token corrispondono all'interfaccia web.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

Speech to Text — FAQ

Free.ai offre Whisper-powered discorso a testo con eccellente precisione, 99 lingue, esportazione sottotitoli, rilevamento altoparlanti, e live mic cattura completamente libero.

Caricare un file audio o video (MP3, WAV, MP4, M4A), fare clic su Trascrivi, e ottenere un discorso accurato al testo in pochi secondi. O registrare in diretta dal microfono.

Sì. Incolla qualsiasi URL di YouTube nella scheda URL e Speech To Text discorso a testo estrae l'audio e lo converte. Funziona con piattaforme Instagram, TikTok, Spotify e 1.300+.

Sì. Rilevamento automatico o selezione da 99 lingue. Il nostro discorso al testo gestisce accenti, rumore di fondo, e audio di lingua mista bene.

Sì. Selezionare più file audio in una volta ciascuno viene inviato attraverso il discorso al testo con il monitoraggio dei progressi e i risultati sono scaricabili separatamente o combinati.

Sì. Il discorso a testo API a /api/ è compatibile con OpenAI. Caricare programmaticamente audio e ricevere JSON con la trascrizione, lingua e timestamp.

Sì. Toggle Speaker Detection prima di caricare e l'output del discorso al testo è etichettato per speaker (Speaker 1, Speaker 2...). Aggiunge il 50% al costo token.

Speech to text accetta file fino a 500MB per upload. Per i contenuti multi-ora, dividere l'audio in parti prima.

Molto preciso per l'audio chiaro di solito 95% + precisione di parola in inglese con il nostro Whisper grande-v3 backend. La qualità dipende dalla chiarezza audio, accento e rumore di fondo.

Sì. La trascrizione è completamente modificabile in-place. Correggi errori, riformat e copia/download come TXT, SRT o VTT.

Sì. L'audio viene elaborato sulle nostre GPU e cancellato dopo il discorso al testo completo. Nulla viene memorizzato a lungo termine, condiviso, o utilizzato per l'addestramento.

Sì. Caricare un file audio o video in /chat/ e chiedere all'AI di trascriverlo ® combina discorso a testo con domande di follow-up e sintesi in un flusso di lavoro.

Iscriviti gratis per 10.000 gettoni

Crea account libero

Nessuna carta di credito richiesta

Come valuteresti questo strumento?

Love this tool? Share it!