STT Online

Uso commerciale OK 380+ modelli Nessuna filigrana Nessuna registrazione necessaria
Modello:
+ GPT-5, Claude, Gemini
Caricare un file audio o video o incollare un URL e ottenere una trascrizione pulita con timestamps. Speaker diarization, SRT/VTT esportazione sottotitolo, 100+ lingue con auto-rilevamento. Scale di costo esattamente con lunghezza clip. Powered by Whisper large-v3 e Parakeet (auto-hosted), più premium Wizper e ElevenLabs STT.

Trascinare e rilasciare audio / video, o fare clic per navigare

MP3, WAV, MP4, WebM, M4A fino a 500MB

Whisper large-v3 99 lingue, precisione best-in-class.
Stima token per questa clip
Iscriviti gratis Token 10K Acquista gettoni
YouTube, Instagram, TikTok, Spotify e oltre 1.300 piattaforme
Il costo di trascrizione dell'URL si basa sulla durata effettiva del clip che citiamo dopo il download. Aspettatevi ~500 gettoni/minuto su Whisper.
Registrazione: 0:00

Trascrizione in tempo reale con il microfono

Trascrizione

Trascrivere l'audio...

Questo potrebbe richiedere un momento per file più lunghi.

Ciò che la gente trascrive con Free.ai

Interviews + podcasts

Etichette di diarizzazione ogni altoparlante. Esporta SRT direttamente nel tuo editor video, o testo semplice per una scrittura di articoli.

Auto captions + subtitles

Caricare un upload YouTube o TikTok, scegliere SRT o WebVTT, e masterizzare i sottotitoli con /video/subtitle/.

Note di riunione

Upload a Zoom/Teams recording — get transcript + speaker labels. Pair with /write/summarize/ for bullet-point minutes.

Lectures + lessons

Trascrivere una lezione di 90 minuti, quindi utilizzare /study/flashcards/ o /write/summarize/ per trasformarlo in materiale di studio.

Audio in lingua straniera

Whisper rileva automaticamente 99 lingue. Trascrivere nell'originale, quindi inviare il testo attraverso /translate/ per saltare le lingue.

Legal + medical

Orari, etichette di altoparlanti, JSON esportare con ogni parola di inizio/fine tempo Cronologia accurato corte-reporter o clinica-note preparazione.

Come Free.ai trascrizione confronta

Cosa ottieni? Free.ai Otter.ai Descript Rev.com
Uso giornaliero gratuito5K+ tokens/day300 minutes/mo1 hr/month
MotoreWhisper large-v3, ParakeetProprietaryProprietaryHuman + AI
Lingue99English-focused2230+
Diarizzazione degli altoparlanti
Esportazione SRT / VTTPaidPaid
API pubblicheLimitedLimited
Live streaming STT (gratuito) Paid
Iscrizione richiestaNo.YesYesYes
Le cifre dei concorrenti riflettono i livelli liberi elencati pubblicamente a partire dal 2026. Controllare ogni fornitore per i piani attuali.
Opzioni avanzate
Risultato
I token sono bassi. Get More Tokens
Want better results? Modelli premium (GPT-5, Claude, Gemini) deliver higher quality. View Plans

❤️ Love this tool? Share it!

Registrati per ottenere un link di referral e guadagnare 25.000 gettoni per amico.

Ne vuoi ancora? Iscriviti gratis per 5K gettoni al giorno + 10K bonus
Iscriviti gratis

Elaborare la tua richiesta...

Free STT tool powered by Whisper large-v3. Upload audio/video, get accurate speech recognition. Export SRT, VTT, TXT. 99 languages.

Come usare STT Online

1
Inserisci il tuo input

Digitare testo, caricare un file, o descrivere ciò che si desidera. Nessun account necessario.

2
Fare clic su genera

Il nostro AI elabora la tua richiesta in pochi secondi utilizzando i migliori modelli open-source.

3
Scarica e condividi

Scaricare, copiare o condividere il risultato. Gratis per uso personale e commerciale.

Utilizzare questo strumento tramite API

Automatizza questo strumento dal tuo codice. Endpoint REST compatibile con OpenAI, auth Bearer-token, nessun SDK aggiuntivo richiesto. I costi Token corrispondono all'interfaccia web.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

STT Online — FAQ

STT (Speech-to-Text) converte l'audio parlato in testo scritto usando AI. Free.ai runs Whisper large-v3 και il più preciso modello di riconoscimento vocale open-source και sulle nostre GPU.

Sì. Caricare file audio fino a 500MB. STT costa ~500 gettoni al minuto di audio. Ottieni 2.500 [55]5.000 gettoni gratuiti al giorno più file al giorno gratuitamente.

STT accetta MP3, WAV, MP4, WebM, M4A, OGG, FLAC praticamente qualsiasi formato audio o video fino a 500MB per ogni upload.

Sì. I risultati STT esportano come TXT, SRT (sottotitoli) o VTT (didascalie web). Perfetto per sottotitoli e didascalie video di YouTube.

Il nostro STT utilizza Whisper large-v3 di solito 95% + precisione delle parole per l'inglese chiaro e di ottima qualità in 99 lingue. Rumore di sfondo e accenti pesanti minore precisione.

Sì. Abilita la diarizzazione degli altoparlanti nelle opzioni STT e nei segmenti di etichette AI come Speaker 1, Speaker 2, ecc. Costa il 50% in più di gettoni.

Sì. L'API STT è compatibile con OpenAI POST audio a /v1/audio/trascrizioni e riceve JSON. Funziona da qualsiasi lingua in grado di inviare richieste HTTP.

Sì. La scheda Live cattura il microfono e lo trasmette attraverso STT in tempo reale con latenza minima.

Sì. Incolla un YouTube, TikTok, Instagram, Spotify o Vimeo URL e STT estrae l'audio e lo trascrive. Sono supportate oltre 1.300 piattaforme.

Veloce un clip di 1 minuto finisce in pochi secondi, una registrazione di 30 minuti in circa un minuto, un file di 1 ora in circa 2 minuti. Whisper gira sul nostro cluster GPU.

Sì. L'audio viene elaborato sulle nostre GPU ed eliminato dopo che STT ha completato. Non viene mai memorizzato a lungo termine, mai condiviso e mai utilizzato per l'allenamento dei modelli.

Whisper large-v3 è il modello Whisper più grande e preciso (1.55B parametri). Lo organizziamo su GPU A100 per velocità e privacy.

Iscriviti gratis per 10.000 gettoni

Crea account libero

Nessuna carta di credito richiesta

Come valuteresti questo strumento?

Love this tool? Share it!