ElevenLabs STT
Free.ai
·
stt
·
~500 žetony na žetony minute
ElevenLabs STT je a {categorie}. Převedené externími modely ~500 tokens za minutu (50% markup oproti protilehlým nákladům).
Použití přes API
OpenAI kompatibilní REST API. Generovat klíč a zavolat tento model v sekundách.
curl -X POST https://api.free.ai/v1/stt/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/elevenlabs/speech-to-text","audio_url":"https://..."}'
Dokumentace API
Získat API klíč
Často kladené otázky
ElevenLabs STT transcribes speed audio into text. Nahrajte MP3, WAV, M4A nebo video soubor a ElevenLabs STT vrátí celý přepis plus volitelné titulky SRT/VTT s časovými známkami.
ElevenLabs STT handles tucty jazyků Whisper- family models cover 90+, Parakeet covers ~25, ostatní se liší. Vyberte "auto-detect" nebo zadejte jazyk pro nejvyšší přesnost.
Word-error rate je 5,6%10% na čistý anglický zvuk, 10,5% na hlučný nebo akcentovaný zvuk. Velké varianty stejné architektury dělat smysluplně lepší v těžkých případech, zvolte větší, když je zvuk hrubý.
Ano, každý segment obsahuje spouštěcí/koncové časové značky. Exportujte jako SRT nebo VTT a časy mapujte přímo na vaše video.
ElevenLabs STT is a premium transcription engine. About ~500 26.01.500 žetonů za minutu zvuku. $1 = 750.000 žetonů.
MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) Extrahujeme zvuk. Max 500 MB na nahrát. Delší soubory? Split s /audio/cut/ nebo použít /v1/stt/batch/.
Diarizace reproduktoru je samostatný průsmyk "diarize" na /transscribe/. ElevenLabs STT zvládá přepis; diarizační etikety každý segment s reproduktorem 1 / Reproduktor 2 / atd.
Ano, /batch/ přijímá složku zvukových souborů. Každý přepis v /účet/?tab=historie s původním názvem souboru. Pro uchování adresáře-strom použijte API.
Ano POST your audio to /v1/stt/transcribe/ with model="ElevenLabs STT."Vrací JSON s textem + segmenty + word-level timeramps. /api/ has the full reference.
Self-hosted modely udržovat zvuk na našich GPU; prémiový průchod s DPA. Audio je smazán po share-window (24h anon, 7d signed-in). Netrénujeme na vašich vstupech.
Ano Free.ai poskytuje komerční využití přepisů. Potřebujete práva na audio, které jste nahráli (vlastní záznam, licencovaný materiál, nebo obsah se souhlasem).
Real-time faktor je zhruba 0.05.2× A 60-minutový podcast trancribes za 3 26.12 minut. Premium modely často končí rychleji. Pomocí tlačítka fronty zavřít kartu.