Speech to Text

Kereskedelmi felhasználás OK 380+ modellek Nincs vízjel. Nincs szükség regisztrációra.
Minta:
+ GPT-5, Claude, Gemini
Töltsön fel egy audio vagy videó fájlt, vagy illesszen be egy URL-t, és kapjon egy tiszta átiratot időbélyegekkel. Hangszóró diarization, SRT/VTT felirat export, 100+ nyelvek auto-detect. Költség skálák pontosan a klip hossza. Powered by Whisper large-v3 és Parakeet (önálló), plusz prémium Wizper és ElevenLabs STT.

Húzza és ejti audio/videó, vagy kattintson a böngészésre

MP3, WAV, MP4, WebM, M4A maximum 500MB

Whisper large-v3 99 nyelv, legjobb osztálybeli pontosság.
Token becslés erre a klipre
YouTube, Instagram, TikTok, Spotify és 1300+ platformok
URL átírási költség alapján a klip tényleges időtartama • idézünk letöltés után. Várható ~500 token / perc Whisper.
Felvétel: 0:00

Valós idejű átírás mikrofonnal

Transcript

A hangod átírása...

Ez eltarthat egy pillanatig, amíg hosszabbak lesznek az akták.

Mit írnak át az emberek Free.ai-rel?

Interviews + podcasts

Diarization címkék minden hangszóró. Export SRT egyenesen a videó szerkesztő, vagy egyszerű szöveg egy cikk írás.

Auto captions + subtitles

Töltsön fel egy YouTube-ot vagy TikTok-ot, vegye fel az SRT-t vagy a WebVTT-t, és égesse el a feliratot a /video/subtitle/-al.

Az ülésnaplók

Upload a Zoom/Teams recording — get transcript + speaker labels. Pair with /write/summarize/ for bullet-point minutes.

Lectures + lessons

Írj át egy 90 perces előadást, majd használd a /study/flashcards/ vagy /write/summarize/-t, hogy tanulmányi anyaggá alakítsd.

Idegen nyelvű audio

Whisper automatikusan detektálja 99 nyelven. Írja át az eredetit, majd küldje el a szöveget /fordítás / ugrás nyelvek.

Legal + medical

Időbélyegek, hangszóró címkék, JSON export minden szó start/end time, pontos bírósági riporter vagy klinikai megjegyzés előkészítő.

Hogyan hasonlítja össze a Free.ai transzkripciót?

Mit kapsz? Free.ai Otter.ai Descript Rev.com
Ingyenes napi használat5K+ tokens/day300 minutes/mo1 hr/month
MotorWhisper large-v3, ParakeetProprietaryProprietaryHuman + AI
Nyelvek99English-focused2230+
Hangszóró-diarizáció
SRT / VTT exportPaidPaid
Nyilvános APILimitedLimited
Élő streaming STT (szabad) Paid
Feliratkozás szükségesNem.YesYesYes
A versenyzők adatai 2026-tól a nyilvánosan jegyzett szabad szintet tükrözik. Ellenőrizze az egyes szolgáltatók aktuális terveit.
Fejlett opciók
Eredmény
Elfogyott a zseton. Get More Tokens
Want better results? Prémiummodellek (GPT-5, Claude, Gemini) deliver higher quality. View Plans

A kérésed feldolgozása...

Best free speech to text tool. Upload MP3, WAV, MP4 or record live. Auto-detect language. Speaker diarization. No sign up required.

Hogyan kell alkalmazni? Speech to Text

1
Adja meg a bemenetet

Írd be a szöveget, tölts fel egy fájlt, vagy írd le, hogy mit szeretnél. Nincs szükség fiókra.

2
Kattintson a generálás gombra

A MI másodperceken belül feldolgozza kérését a legjobb nyílt forráskódú modellek segítségével.

3
Letöltés és megosztás

Töltse le, másolja le vagy ossza meg az eredményt. Ingyenes személyes és kereskedelmi használatra.

Használja ezt az eszközt az API-n keresztül

Automatizálja ezt az eszközt a saját kódjából. OpenAI-kompatibilis REST végpont, Beaver-token auth, nincs szükség extra SDK-ra. Token költségek megfelelnek a webes felületnek.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

Speech to Text — FAQ

Free.ai kínál Whisper-meghajtású beszéd szöveg kiváló pontossággal, 99 nyelven, felirat export, hangszóró detektálás, és élő mikrofon elfogása teljesen ingyenes.

Töltsön fel egy audio vagy video fájlt (MP3, WAV, MP4, M4A), kattintson a Transcribe gombra, és kap pontos beszéd szöveg másodpercek alatt. Vagy vegye fel élőben a mikrofon.

Igen. A YouTube bármely URL-címének beillesztése az URL fülbe és a szöveges eszköz beszédének kivonata az audiót, és átalakítja azt. Instagram, TikTok, Spotify és 1300+ platformokkal működik.

Igen. Auto-detect vagy válasszon 99 nyelven. A beszédünk a szöveghez akcentussal, háttérzajjal és vegyes nyelvű audióval foglalkozik.

Igen. Válassza ki a több audio fájlt egyszerre, minden elküldjük beszéden keresztül a szöveg a haladás nyomon követés és az eredmények letölthető külön vagy kombinált.

Igen. Az API szövegének beszéde az /api/ oldalon OpenAI-kompatibilis. Audio programmatically feltöltése és JSON fogadása az átirattal, nyelvvel és időbélyegekkel.

Igen. Feltöltés előtt a hangszóró detektálását és a szövegkimenetet hangszórónként (Speaker 1, Speaker 2...) címkézik.

A szöveges beszéd legfeljebb 500MB fájlt fogad feltöltésenként. Több órás tartalmak esetén először az audiót osszuk darabokra.

Nagyon pontos a tiszta audio - jellemzően 95%-os szópontosság angol nyelven a Whisper large-v3 backend. Minőség függ az audio tisztaság, akcentus, és háttérzaj.

Igen. Az átirat teljesen szerkeszthető a helyén. Javítsa a hibákat, reformat, és másolja/letöltés TXT, SRT, vagy VTT.

Igen. Az audiót saját GPU-n dolgozzuk fel, és a beszéd után töröljük a szöveg befejezésére. Semmit sem tárolunk hosszú távú, megosztott vagy edzésre.

Igen. Töltsön fel egy hang- vagy videofájlt a /chat/- ben, és kérje meg az MI- t, hogy írja át a szöveget a szöveghez követő kérdésekkel és összegzéssel egy munkafolyamatban.

Jelentkezz ingyen 10.000 zsetonért.

Ingyenes fiók létrehozása

Nincs szükség hitelkártyára

Hogyan értékelné ezt az eszközt?

Love this tool? Share it!