ElevenLabs STT

Free.ai · stt · ~500 žetoni po minute

Pošalji zvuk

Bacite zvučnu ili video datoteku, ili zalijepite URL ispod

~500 žetoni po minute

Besplatno radi na našim GPU-ovima. Nadogradnja za ElevenLabs STT →

ElevenLabs STT is a model govor-u-tekst. Putovanje kroz vanjske modele — ~500 tokeni po minuti (50% označavanje iznad troškova prijevoda).

Koristi preko API-ja

OpenAI-compatible REST API. Generate a key and call this model in seconds.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/elevenlabs/speech-to-text","audio_url":"https://..."}'

API dokumentacija Dobavi API ključ

Similar models

Fal Speech-to-Text

Wizper (Whisper v3)

Browse all models →

Česta pitanja

ElevenLabs STT transcribes spoken audio into text. Upload an MP3, WAV, M4A, or video file and ElevenLabs STT returns the full transcript plus optional SRT/VTT subtitles with timestamps.

ElevenLabs STT rukovodi desetinama jezika — Whisper- obiteljski modeli pokrivaju 90+, Parakeet pokriva ~25, drugi variraju. Odaberite "autodetekciju" ili navedite jezik za najveću preciznost.

Brzina riječi-grebotina je 5-10% na čistom engleskom audio, 10-20% na bučnom ili naglaskom audio. Velike varijante iste arhitekture smisleno bolje na tvrde slučajeve — odaberite veći kada je zvuk grub.

Da — svaki segment uključuje start/kraj vremenskih oznaka. Izvezi kao SRT ili VTT i vremensku mapu ravno na vaš video.

ElevenLabs STT je premium transkription motor. Oko ~500–1,500 žetona po minuti zvuka. $1 = 750.000 žetona.

MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) — izvlačimo zvuk. Max 500 MB po slanju. Duže datoteke? Split s /audio/cut/ ili koristiti /v1/stt/batch /.

Dijarizacija zvučnika je odvojena propusnica — uključi "diarise" na /transcribec /. ElevenLabs STT rukovodi transkripcijom; dijarizacijska oznaka svaki segment sa zvučnikom 1 / Zvučnik 2 / itd.

Da — /batch / prihvaća mapu zvučnih datoteka. Svaki transkripti sleti u /account /?tab=history s originalnim imenom datoteke. Za očuvanje mape-tree koristite API.

Da — POST svoj zvuk na /v1/st/transcribe/ s modelom="ElevenLabs STT". Vraća JSON s tekstom + segmenti + vremenske oznake na razini riječi. /api/ ima punu referencu.

Samostalni modeli čuvaju zvuk na našim GPU-ovima; premium prolazi s DPA-om. Audio se briše nakon dio-prozora (24h anon, 7d potpisivanje). Ne treniramo na Vašim ulazima.

Da — Free.ai dodjeljuje komercijalnu upotrebu transkripta. Potrebna su vam prava na zvuk koji ste upisali (vas vlastiti snimanje, licencirani materijal, ili sadržaj s pristankom).

Faktor u realnom vremenu je približno 0,05–0,2× — 60-minutni transkripti podcasta u 3–12 minuta. Premium modeli često završavaju brže. Koristite gumb reda da zatvorite karticu.

ElevenLabs STT

Koristi preko API-ja

Similar models

Česta pitanja

What does ElevenLabs STT do?

How many languages does ElevenLabs STT support?

Koliko je ElevenLabs STT?

Does ElevenLabs STT include timestamps?

Koliko ElevenLabs STT košta po minuti?

Koje zvučne formate mogu poslati na ElevenLabs STT?

Can ElevenLabs STT identify different speakers?

Mogu li se složiti s ElevenLabs STT?

Is there an API for ElevenLabs STT?

Što je sa privatnošću kada se upišem s ElevenLabs STT?

Is ElevenLabs STT output safe for commercial use?

How long does ElevenLabs STT take?

Nabavite 10.000 besplatnih tokena

Čekajte, dobiti 10K besplatnih tokena!

Hoćeš još?