Speech to Text

Kereskedelmi felhasználás OK 380+ modellek Nincs vízjel. Nincs szükség regisztrációra.

Töltsön fel egy audio vagy videó fájlt, vagy illesszen be egy URL-t, és kapjon egy tiszta átiratot időbélyegekkel. Hangszóró diarization, SRT/VTT felirat export, 100+ nyelvek auto-detect. Költség skálák pontosan a klip hossza. Powered by Whisper large-v3 és Parakeet (önálló), plusz prémium Wizper és ElevenLabs STT.

Húzza és ejti audio/videó, vagy kattintson a böngészésre

MP3, WAV, MP4, WebM, M4A maximum 500MB

Nyelv

Motor Whisper large-v3 99 nyelv, legjobb osztálybeli pontosság.

Kimeneti formátum

Hangszórófelismerés — label who's speaking when (+50% tokens)

A felszólalók száma

YouTube, Instagram, TikTok, Spotify és 1300+ platformok

Motor

Kimeneti formátum

Hangszórófelismerés — +50%

URL átírási költség alapján a klip tényleges időtartama • idézünk letöltés után. Várható ~500 token / perc Whisper.

Valós idejű átírás mikrofonnal

Mit írnak át az emberek Free.ai-rel?

Interjúk + podcastok

Diarization címkék minden hangszóró. Export SRT egyenesen a videó szerkesztő, vagy egyszerű szöveg egy cikk írás.

Automatikus feliratok + feliratok

Töltsön fel egy YouTube-ot vagy TikTok-ot, vegye fel az SRT-t vagy a WebVTT-t, és égesse el a feliratot a /video/subtitle/-al.

Az ülésnaplók

Upload a Zoom/Teams recording — get transcript + speaker labels. Pair with /write/summarize/ for bullet-point minutes.

Előadások + leckék

Írj át egy 90 perces előadást, majd használd a /study/flashcards/ vagy /write/summarize/-t, hogy tanulmányi anyaggá alakítsd.

Idegen nyelvű audio

Whisper automatikusan detektálja 99 nyelven. Írja át az eredetit, majd küldje el a szöveget /fordítás / ugrás nyelvek.

Jogi + orvosi

Időbélyegek, hangszóró címkék, JSON export minden szó start/end time, pontos bírósági riporter vagy klinikai megjegyzés előkészítő.

Hogyan hasonlítja össze a Free.ai transzkripciót?

Mit kapsz?	Free.ai	Otter.ai	Descript	Rev.com
Ingyenes napi használat	5K+ tokens/day	300 minutes/mo	1 hr/month	—
Motor	Whisper large-v3, Parakeet	Proprietary	Proprietary	Human + AI
Nyelvek	99	English-focused	22	30+
Hangszóró-diarizáció
SRT / VTT export		Paid	Paid
Nyilvános API		Limited	Limited
Élő streaming STT	(szabad)	Paid	—	—
Feliratkozás szükséges	Nem.	Yes	Yes	Yes

A versenyzők adatai 2026-tól a nyilvánosan jegyzett szabad szintet tükrözik. Ellenőrizze az egyes szolgáltatók aktuális terveit.

Best free speech to text tool. Upload MP3, WAV, MP4 or record live. Auto-detect language. Speaker diarization. No sign up required.

Hogyan kell alkalmazni? Speech to Text

Adja meg a bemenetet

Írd be a szöveget, tölts fel egy fájlt, vagy írd le, hogy mit szeretnél. Nincs szükség fiókra.

Kattintson a generálás gombra

A MI másodperceken belül feldolgozza kérését a legjobb nyílt forráskódú modellek segítségével.

Letöltés és megosztás

Töltse le, másolja le vagy ossza meg az eredményt. Ingyenes személyes és kereskedelmi használatra.

Használja ezt az eszközt az API-n keresztül

Automatizálja ezt az eszközt a saját kódjából. OpenAI-kompatibilis REST végpont, Beaver-token auth, nincs szükség extra SDK-ra. Token költségek megfelelnek a webes felületnek.

API dokumentáció Szerezd meg az API kulcsot

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

Speech to Text — FAQ

Free.ai kínál Whisper-meghajtású beszéd szöveg kiváló pontossággal, 99 nyelven, felirat export, hangszóró detektálás, és élő mikrofon elfogása teljesen ingyenes.

Töltsön fel egy audio vagy video fájlt (MP3, WAV, MP4, M4A), kattintson a Transcribe gombra, és kap pontos beszéd szöveg másodpercek alatt. Vagy vegye fel élőben a mikrofon.

Igen. A YouTube bármely URL-címének beillesztése az URL fülbe és a szöveges eszköz beszédének kivonata az audiót, és átalakítja azt. Instagram, TikTok, Spotify és 1300+ platformokkal működik.

Igen. Auto-detect vagy válasszon 99 nyelven. A beszédünk a szöveghez akcentussal, háttérzajjal és vegyes nyelvű audióval foglalkozik.

Igen. Válassza ki a több audio fájlt egyszerre, minden elküldjük beszéden keresztül a szöveg a haladás nyomon követés és az eredmények letölthető külön vagy kombinált.

Igen. Az API szövegének beszéde az /api/ oldalon OpenAI-kompatibilis. Audio programmatically feltöltése és JSON fogadása az átirattal, nyelvvel és időbélyegekkel.

Igen. Feltöltés előtt a hangszóró detektálását és a szövegkimenetet hangszórónként (Speaker 1, Speaker 2...) címkézik.

A szöveges beszéd legfeljebb 500MB fájlt fogad feltöltésenként. Több órás tartalmak esetén először az audiót osszuk darabokra.

Nagyon pontos a tiszta audio - jellemzően 95%-os szópontosság angol nyelven a Whisper large-v3 backend. Minőség függ az audio tisztaság, akcentus, és háttérzaj.

Igen. Az átirat teljesen szerkeszthető a helyén. Javítsa a hibákat, reformat, és másolja/letöltés TXT, SRT, vagy VTT.

Igen. Az audiót saját GPU-n dolgozzuk fel, és a beszéd után töröljük a szöveg befejezésére. Semmit sem tárolunk hosszú távú, megosztott vagy edzésre.

Igen. Töltsön fel egy hang- vagy videofájlt a /chat/- ben, és kérje meg az MI- t, hogy írja át a szöveget a szöveghez követő kérdésekkel és összegzéssel egy munkafolyamatban.

Jelentkezz ingyen 30.000 zsetonért.

Ingyenes fiók létrehozása

Nincs szükség hitelkártyára

Hogyan értékelné ezt az eszközt?

Speech to Text

Mit írnak át az emberek Free.ai-rel?

Interjúk + podcastok

Automatikus feliratok + feliratok

Az ülésnaplók

Előadások + leckék

Idegen nyelvű audio

Jogi + orvosi

Hogyan hasonlítja össze a Free.ai transzkripciót?

Eredmény

Hogyan kell alkalmazni? Speech to Text

Adja meg a bemenetet

Kattintson a generálás gombra

Letöltés és megosztás

Használja ezt az eszközt az API-n keresztül

Speech to Text — FAQ

Mi a legjobb szólásszabadság a szöveges eszközben?

Hogyan alakíthatom át a beszédet az online szövegre?

Beszélhet-e SMS-ben a YouTube videókkal?

A szöveges beszéd más nyelveken is működik?

Feltölthetek több fájlt beszédről szövegre?

Van beszéd az API-nak?

Támogatja-e a szöveges beszéd a szónoki címkéket?

Milyen hangfájl méretű szöveget fogad el a szöveg?

Mennyire pontos a szöveges előadás?

Megszerkeszthetem a szöveget szöveg átiratra?

A beszéd bizalmas és biztonságos?

Beszédet használhatok, hogy SMS-t írjak az Al Chatben?

Szerezz 10 000 ingyen zsetont!

Várj, kapsz 10K ingyen zsetont!

Kérsz még?