ElevenLabs STT

Free.ai · stt · ~500 žetony na žetony minute

Spusťte audio nebo video soubor, nebo vložte URL níže

~500 žetony na žetony minute
Běží zdarma na našich GPU. Upgrade pro ElevenLabs STT →

ElevenLabs STT je a {categorie}. Převedené externími modely ~500 tokens za minutu (50% markup oproti protilehlým nákladům).

Použití přes API

OpenAI kompatibilní REST API. Generovat klíč a zavolat tento model v sekundách.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/elevenlabs/speech-to-text","audio_url":"https://..."}'
Dokumentace API Získat API klíč

Často kladené otázky

ElevenLabs STT transcribes speed audio into text. Nahrajte MP3, WAV, M4A nebo video soubor a ElevenLabs STT vrátí celý přepis plus volitelné titulky SRT/VTT s časovými známkami.

ElevenLabs STT handles tucty jazyků Whisper- family models cover 90+, Parakeet covers ~25, ostatní se liší. Vyberte "auto-detect" nebo zadejte jazyk pro nejvyšší přesnost.

Word-error rate je 5,6%10% na čistý anglický zvuk, 10,5% na hlučný nebo akcentovaný zvuk. Velké varianty stejné architektury dělat smysluplně lepší v těžkých případech, zvolte větší, když je zvuk hrubý.

Ano, každý segment obsahuje spouštěcí/koncové časové značky. Exportujte jako SRT nebo VTT a časy mapujte přímo na vaše video.

ElevenLabs STT is a premium transcription engine. About ~500 26.01.500 žetonů za minutu zvuku. $1 = 750.000 žetonů.

MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) Extrahujeme zvuk. Max 500 MB na nahrát. Delší soubory? Split s /audio/cut/ nebo použít /v1/stt/batch/.

Diarizace reproduktoru je samostatný průsmyk "diarize" na /transscribe/. ElevenLabs STT zvládá přepis; diarizační etikety každý segment s reproduktorem 1 / Reproduktor 2 / atd.

Ano, /batch/ přijímá složku zvukových souborů. Každý přepis v /účet/?tab=historie s původním názvem souboru. Pro uchování adresáře-strom použijte API.

Ano POST your audio to /v1/stt/transcribe/ with model="ElevenLabs STT."Vrací JSON s textem + segmenty + word-level timeramps. /api/ has the full reference.

Self-hosted modely udržovat zvuk na našich GPU; prémiový průchod s DPA. Audio je smazán po share-window (24h anon, 7d signed-in). Netrénujeme na vašich vstupech.

Ano Free.ai poskytuje komerční využití přepisů. Potřebujete práva na audio, které jste nahráli (vlastní záznam, licencovaný materiál, nebo obsah se souhlasem).

Real-time faktor je zhruba 0.05.2× A 60-minutový podcast trancribes za 3 26.12 minut. Premium modely často končí rychleji. Pomocí tlačítka fronty zavřít kartu.

Love this tool? Share it!

Hodnotit tuto stránku