ElevenLabs STT

Free.ai · stt · ~500 žetoni po minute

Bacite zvučnu ili video datoteku, ili zalijepite URL ispod

~500 žetoni po minute
Besplatno radi na našim GPU-ovima. Nadogradnja za ElevenLabs STT →

ElevenLabs STT is a model govor-u-tekst. Putovanje kroz vanjske modele — ~500 tokeni po minuti (50% označavanje iznad troškova prijevoda).

Koristi preko API-ja

OpenAI-compatible REST API. Generate a key and call this model in seconds.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/elevenlabs/speech-to-text","audio_url":"https://..."}'
API dokumentacija Dobavi API ključ

Česta pitanja

ElevenLabs STT transcribes spoken audio into text. Upload an MP3, WAV, M4A, or video file and ElevenLabs STT returns the full transcript plus optional SRT/VTT subtitles with timestamps.

ElevenLabs STT rukovodi desetinama jezika — Whisper- obiteljski modeli pokrivaju 90+, Parakeet pokriva ~25, drugi variraju. Odaberite "autodetekciju" ili navedite jezik za najveću preciznost.

Brzina riječi-grebotina je 5-10% na čistom engleskom audio, 10-20% na bučnom ili naglaskom audio. Velike varijante iste arhitekture smisleno bolje na tvrde slučajeve — odaberite veći kada je zvuk grub.

Da — svaki segment uključuje start/kraj vremenskih oznaka. Izvezi kao SRT ili VTT i vremensku mapu ravno na vaš video.

ElevenLabs STT je premium transkription motor. Oko ~500–1,500 žetona po minuti zvuka. $1 = 750.000 žetona.

MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) — izvlačimo zvuk. Max 500 MB po slanju. Duže datoteke? Split s /audio/cut/ ili koristiti /v1/stt/batch /.

Dijarizacija zvučnika je odvojena propusnica — uključi "diarise" na /transcribec /. ElevenLabs STT rukovodi transkripcijom; dijarizacijska oznaka svaki segment sa zvučnikom 1 / Zvučnik 2 / itd.

Da — /batch / prihvaća mapu zvučnih datoteka. Svaki transkripti sleti u /account /?tab=history s originalnim imenom datoteke. Za očuvanje mape-tree koristite API.

Da — POST svoj zvuk na /v1/st/transcribe/ s modelom="ElevenLabs STT". Vraća JSON s tekstom + segmenti + vremenske oznake na razini riječi. /api/ ima punu referencu.

Samostalni modeli čuvaju zvuk na našim GPU-ovima; premium prolazi s DPA-om. Audio se briše nakon dio-prozora (24h anon, 7d potpisivanje). Ne treniramo na Vašim ulazima.

Da — Free.ai dodjeljuje komercijalnu upotrebu transkripta. Potrebna su vam prava na zvuk koji ste upisali (vas vlastiti snimanje, licencirani materijal, ili sadržaj s pristankom).

Faktor u realnom vremenu je približno 0,05–0,2× — 60-minutni transkripti podcasta u 3–12 minuta. Premium modeli često završavaju brže. Koristite gumb reda da zatvorite karticu.

Like this tool? Share it!

Ocijeni ovu stranicu