ElevenLabs STT
Free.ai
·
stt
·
~500 tokens għal kull minute
ElevenLabs STT huwa a mudell minn diskors għal test. Immaniġġjat permezz ta’ mudelli esterni — ~500 tokens kull minuta (50% markup fuq l-ispiża upstream).
Użu permezz tal-API
OpenAI-compatible REST API. Generate a key and call this model in seconds.
curl -X POST https://api.free.ai/v1/stt/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/elevenlabs/speech-to-text","audio_url":"https://..."}'
Dokumentazzjoni tal-API
Ikseb il-Kwalità API
Mistoqsijiet li jsiru ta’ spiss
ElevenLabs STT jittraskrivi l-awdjo mitkellem f’test.Upload MP3, WAV, M4A, jew vidjo fajl u ElevenLabs STT jirritorna t-traskrizzjoni sħiħa flimkien ma’ sottotitli SRT/VTT mhux obbligatorji b’timestamps.
ElevenLabs STT jimmaniġġja għexieren ta' lingwi — Whisper-il-familja ta' mudelli tkopri 90%, Parakeet tkopri ~25, oħrajn ivarjaw.
Ir-rata ta' żball tal-kelma hija 5-10% fuq awdjo Ingliż nadif, 10-20% fuq awdjo storbjuż jew aċċent.Varjanti kbar tal-istess arkitettura jagħmlu b'mod sinifikanti aħjar fuq każijiet iebsa - agħżel akbar meta l-awdjo huwa mhux maħdum.
Iva — kull segment jinkludi timbri tal-ħin tal-bidu/tmiem. Esportazzjoni bħala SRT jew VTT u l-ħinijiet mappa dritt fuq il-vidjo tiegħek.
ElevenLabs STT huwa magna tat-traskrizzjoni premium. Madwar ~ 500-1,500 tokens kull minuta ta' awdjo. $ 1 = 750,000 tokens.
MP3, WAV, M4A, FLAC, OGG, kif ukoll vidjo (MP4, MOV, WebM) — aħna estratt l-awdjo. Max 500 MB għal kull upload. fajls itwal? maqsuma ma / awdjo / maqtugħa / jew jużaw / v1 / stt / batch /.
Id-dijarizzazzjoni tal-kelliem hija pass separat — toggle "diarize" fuq /transcribe/. ElevenLabs STT jimmaniġġja t-traskrizzjoni; id-dijarizzazzjoni tittikketta kull segment b'Speaker 1 / Speaker 2 / eċċ.
Iva — /batch/ jaċċetta folder ta' fajls awdjo. Kull traskrizzjoni tinżel f'/account/?tab=history bl-isem tal-fajl oriġinali. Għall-preservazzjoni tas-siġra tal-folders uża l-API.
Iva — POST l-awdjo tiegħek għal /v1/stt/transcribe/ b'model="ElevenLabs STT". Jirritorna JSON b'test + segmenti + timestamps fil-livell tal-kelma. /api/ għandu r-referenza sħiħa.
Mudelli awto-ospitati jżommu l-awdjo fuq il-GPUs tagħna; premium jgħaddu minn DPA. L-awdjo jitħassar wara t-tieqa tal-qsim (24 siegħa anon, 7d iffirmat).
Iva — Free.ai jagħti użu kummerċjali tat-transkrizzjonijiet.Jeħtieġlek drittijiet għall-awdjo li ttella' (ir-reġistrazzjoni tiegħek stess, materjal liċenzjat, jew kontenut bil-kunsens).
Il-fattur tal-ħin reali huwa bejn wieħed u ieħor 0.05–0.2× — podcast ta’ 60 minuta jittraskrivi fi 3–12-il minuta. Mudelli premium spiss jispiċċaw aktar malajr.