ElevenLabs STT

Free.ai · stt · ~500 Token pro minute

Audio erofladen

Audio- oder Videodatei zéien oder URL ënnendrënner setzen

~500 Token pro minute

Runs free on our GPUs. Upgrade for ElevenLabs STT →

D'Fréijoer ass d'Joer vum 5. bis den 15. D'Spill ass op 3D-Grafiken baséiert, déi mat 50% (oder 100% wann et méi wéi 500 Säiten sinn) eropgeluede kënne ginn.

Iwwer API benotzen

OpenAI-compatible REST API. Generate a key and call this model in seconds.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/elevenlabs/speech-to-text","audio_url":"https://..."}'

Dokumentatioun API Schlëssel

Similar models

Fal Speech-to-Text

Wizper (Whisper v3)

Browse all models →

Häufig gestallte Froen

ElevenLabs STT transkribéiert gesot Audio an Text. Laden eng MP3, WAV, M4A oder Videodatei erop an ElevenLabs STT gëtt déi vollstänneg Transkriptioun plus optional SRT/VTT Ënnertitelen mat Zäitstempelen zréck.

ElevenLabs STT behandelt Dutzende vu Sproochen — Whisper-Famill Modeller decken 90+, Parakeet deckt ~25, aner variéieren. Wielt "Auto-detect" oder spezifizéiert d'Sprooch fir déi héchst Genauegkeet.

D'Stëmme vun de 5000 bis 10.000 Leit, déi an der éischter Hallschent vum Joer 2016 an der Stad Lëtzebuerg gehalen goufen, waren op d'mannst 100 % korrekt, an d'Stëmme vun de 5000 bis 10.000 Leit, déi an der zweeter Hallschent vum Joer 2016 an der Stad Lëtzebuerg gehalen goufen, waren op d'mannst 100 % korrekt.

Ja — all Segment enthält Start-/Ennzäitstempelen. Exportéiert als SRT oder VTT an d'Zäit gëtt direkt op Äre Video gesat.

D'Spill ass eng 3D-Spill, déi op engem 1:1-Grafik-Modell vun 1:100.000 baséiert.

MP3, WAV, M4A, FLAC, OGG, plus Video (MP4, MOV, WebM) — mir extrahéieren den Audio. Max 500 MB pro Upload. Länger Dateien? Split mat /audio/cut/ oder benotzt /v1/stt/batch/.

D'Sprooch ass eng vun de wichtegsten a wichtegsten Aspekter vun der Literatur, an d'Literatur ass eng vun de wichtegsten Aspekter vun der Gesellschaft. /i/ gëtt als /i/ fonnt.

Ja — /batch/ akzeptéiert en Ordner mat Audiodateien. All Transkriptioun fält an /account/?tab=history mat dem urspréngleche Dateinamen. Fir d'Erhale vum Ordnerbaum benotzt d'API.

D'Sprooch ass eng vun de gréisste Sproochen op der Welt. /tʃ/ gëtt als /tʃ/ ausgeschwat, /tʃ/ gëtt als /tʃ/ ausgeschwat, /tʃ/ gëtt als /tʃ/ ausgeschwat, /tʃ/ gëtt als /tʃ/ ausgeschwat.

Self-hosted Modeller halen Audio op eise GPUen; Premium passéieren duerch mat engem DPA. Audio gëtt no dem Share-Fenster geléist (24h anon, 7d angemeldet). Mir trainéieren net op Är Inputen.

Ja — Free.ai erlaabt eng kommerziell Benotzung vun Transkriptiounen. Dir braucht d'Recht op den Audio deen Dir erofgelueden hutt (Äert eege Material, lizenzéiert Material oder Inhalt mat Zoustëmmung).

Echtzäitfaktor ass ongeféier 0,05-0,2× — e 60-Minuten-Podcast gëtt an 3-12 Minutten transkritéiert. Premium Modeller sinn dacks méi séier fäerdeg. Benotzt d'Knäppchen "Queue" fir den Tab ze schließen.

ElevenLabs STT

Iwwer API benotzen

Similar models

Häufig gestallte Froen

Wat mécht ElevenLabs STT?

Wéi vill Sproochen ënnerstëtzt ElevenLabs STT?

Wéi ass d'Genauegkeet vun ElevenLabs STT?

Ass ElevenLabs STT mat Zäitstempelen ausgestatt?

Wéi vill kascht ElevenLabs STT pro Minutt?

Wat fir Audioformater kann ech op ElevenLabs STT eroflueden?

Kann ElevenLabs STT verschidde Sproochen identifizéieren?

Kann ech mat ElevenLabs STT eng Batch-Transkriptioun maachen?

Et gëtt eng API fir ElevenLabs STT?

Wat ass mat der Privatsphär wann ech mat ElevenLabs STT transkribieren?

Ass d'Ausgab vun ElevenLabs STT fir kommerziell Notzung sécher?

Wéi laang dauert et fir ElevenLabs STT ze maachen?

10.000 Leit waren dobäi.

Et gëtt 10.000 Aarten.

Méi wëllen?