ElevenLabs STT

Free.ai · stt · ~500 žetony na žetony minute

Nahrát zvuk

Spusťte audio nebo video soubor, nebo vložte URL níže

~500 žetony na žetony minute

Běží zdarma na našich GPU. Upgrade pro ElevenLabs STT →

ElevenLabs STT je a {categorie}. Převedené externími modely ~500 tokens za minutu (50% markup oproti protilehlým nákladům).

Použití přes API

OpenAI kompatibilní REST API. Generovat klíč a zavolat tento model v sekundách.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/elevenlabs/speech-to-text","audio_url":"https://..."}'

Dokumentace API Získat API klíč

Podobné modely

Fal Speech-to-Text

Wizper (Whisper v3)

Procházet všechny modely →

Často kladené otázky

ElevenLabs STT transcribes speed audio into text. Nahrajte MP3, WAV, M4A nebo video soubor a ElevenLabs STT vrátí celý přepis plus volitelné titulky SRT/VTT s časovými známkami.

ElevenLabs STT handles tucty jazyků Whisper- family models cover 90+, Parakeet covers ~25, ostatní se liší. Vyberte "auto-detect" nebo zadejte jazyk pro nejvyšší přesnost.

Word-error rate je 5,6%10% na čistý anglický zvuk, 10,5% na hlučný nebo akcentovaný zvuk. Velké varianty stejné architektury dělat smysluplně lepší v těžkých případech, zvolte větší, když je zvuk hrubý.

Ano, každý segment obsahuje spouštěcí/koncové časové značky. Exportujte jako SRT nebo VTT a časy mapujte přímo na vaše video.

ElevenLabs STT is a premium transcription engine. About ~500 26.01.500 žetonů za minutu zvuku. $1 = 750.000 žetonů.

MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) Extrahujeme zvuk. Max 500 MB na nahrát. Delší soubory? Split s /audio/cut/ nebo použít /v1/stt/batch/.

Diarizace reproduktoru je samostatný průsmyk "diarize" na /transscribe/. ElevenLabs STT zvládá přepis; diarizační etikety každý segment s reproduktorem 1 / Reproduktor 2 / atd.

Ano, /batch/ přijímá složku zvukových souborů. Každý přepis v /účet/?tab=historie s původním názvem souboru. Pro uchování adresáře-strom použijte API.

Ano POST your audio to /v1/stt/transcribe/ with model="ElevenLabs STT."Vrací JSON s textem + segmenty + word-level timeramps. /api/ has the full reference.

Self-hosted modely udržovat zvuk na našich GPU; prémiový průchod s DPA. Audio je smazán po share-window (24h anon, 7d signed-in). Netrénujeme na vašich vstupech.

Ano Free.ai poskytuje komerční využití přepisů. Potřebujete práva na audio, které jste nahráli (vlastní záznam, licencovaný materiál, nebo obsah se souhlasem).

Real-time faktor je zhruba 0.05.2× A 60-minutový podcast trancribes za 3 26.12 minut. Premium modely často končí rychleji. Pomocí tlačítka fronty zavřít kartu.

ElevenLabs STT

Použití přes API

Podobné modely

Často kladené otázky

Co dělá ElevenLabs STT?

Kolik jazyků podporuje ElevenLabs STT?

Jak přesná je ElevenLabs STT?

Zahrnuje ElevenLabs STT časové značky?

Kolik stojí ElevenLabs STT za minutu?

Jaké formáty zvuku mohu nahrát do ElevenLabs STT?

Může ElevenLabs STT identifikovat různé reproduktory?

Můžu vložit transcribe s ElevenLabs STT?

Existuje API pro ElevenLabs STT?

A co soukromí, když přepíšu s ElevenLabs STT?

Je ElevenLabs STT výstup bezpečný pro komerční použití?

Jak dlouho trvá ElevenLabs STT?

Získejte 10 000 svobodných žetonů

Počkej, získej 10K zdarma žetony!

Chceš víc?