ElevenLabs STT

Free.ai · stt · ~500 ٽوڪنز minute

آڊيو يا وڊيو فائل ھيٺ لاھو، يا URL کي چٽيو

~500 ٽوڪنز minute
اسان جي GPUs تي مفت هلندو آهي. جي لاءِ اپگريڊ ڪريو ElevenLabs STT →

ElevenLabs STT a ڳالھائڻ- کان- متن ماڊل آهي. خارجي ماڊلز ذريعي روٽ ڪيو ويو - ~ 500 ٽوڪنز في منٽ (50% مارڪ اپ مٿي ڪٽڻ جي قيمت).

API ذريعي استعمال ڪريو

OpenAI-compatible REST API. Generate a key and call this model in seconds.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/elevenlabs/speech-to-text","audio_url":"https://..."}'
API دستاویز API ڪوڊ حاصل ڪريو

گھڻا پڇيل سوال

ElevenLabs STT ڳالهائيندڙ آڊيو کي متن ۾ تبديل ڪري ٿو. MP3, WAV, M4A, يا وڊيو فائل اپ لوڊ ڪريو ۽ ElevenLabs STT مڪمل ترانسڪريپٽ ۽ اختياري SRT/VTT عنوانن کي وقت جي نشان سان موٽائي ٿو.

ElevenLabs STT ڪيتريون ئي ٻوليون هلائي ٿو — Whisper-family ماڊل 90+ کي ڍڪي ٿو، Parakeet ~25 کي ڍڪي ٿو، ٻيا مختلف آهن. "خودڪار ڳولا" چونڊيو يا اعليٰ دقت لاءِ ٻولي بيان ڪريو.

لفظ-خطر جي شرح 5-10% صاف انگريزي آڊيو تي، 10-20% شور يا ڌيان آڊيو تي آهي. هڪ ئي آرڪيٽيڪچر جا وڏا قسم سخت ڪيسن تي بهتر ڪم ڪن ٿا - وڏي چونڊيو جڏهن آڊيو سخت آهي.

ھائو - هر حصي ۾ شروع/آخر وقت شامل آھي. SRT يا VTT طور برآمد ڪريو ۽ وقتن جي نقشي کي سڌو سنئون پنھنجي وڊيو تي.

ElevenLabs STT هڪ پريميئم ٽرانسڪرپشن انجن آهي. تقريبن ~500-1,500 ٽوڪنز هر منٽ جي آڊيو. $1 = 750,000 ٽوڪنز.

MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) — اسان آڊيو کي ڪڍون ٿا. Max 500 MB per upload. ڊگهيون فائلون؟ /audio/cut/ سان ورهايو يا /v1/stt/batch/ استعمال ڪريو.

اسپيڪر جي ڊيائريزيشن هڪ الڳ پاس آهي - "diarize" کي /transcribe/ تي تبديل ڪريو. ElevenLabs STT ڊائريزيشن کي هلائيندو آهي؛ ڊيائريزيشن هر حصي کي اسپيڪر 1 / اسپيڪر 2 / وغيره سان ليٽيڪ ڪندو آهي.

ھائو — /batch/ آڊيو فائلن جي هڪ ڊرائيو قبول ڪري ٿو. هر ترنسڪريٽ /account/?tab=history ۾ اصل فائل نالي سان لھي ٿي. ڊرائيو-وڻ جي سنڀال لاءِ API استعمال ڪريو.

ھائو — پنھنجي آڊيو کي /v1/stt/transcribe/ ڏانهن POST ڪريو ماڊل="ElevenLabs STT" سان. JSON کي متن + حصن + لفظ-مستوي واري وقت جي نشان سان موٽائي ٿو. /api/ ۾ مڪمل حوالو آھي.

پاڻ مھماندار ماڊل اسان جي GPUs تي آڊيو رکي ٿو؛ پريميئم DPA سان گذري ٿو. آڊيو حصيداري-وينڊوز کان پوءِ حذف ڪيو ويندو آهي (24h انون، 7d لاگ ان). اسان توهان جي انپٽ تي تربيت نه ڪندا آهيون.

ھائو — Free.ai ترانسڪريپشن جو تجارتي استعمال ڏئي ٿو. اوھان کي اوھان جي اپ لوڊ ڪيل آڊيو (پاڻ جي رڪارڊنگ، لائسنس ٿيل مواد، يا رضامندي سان مواد) جا حق گهرجن.

ريئل ٽائيم فڪٽر تقريبن 0.05-0.2× آهي — 60 منٽن جو پوڊ ڪاسٽ 3-12 منٽن ۾ ترنسڪريپٽ ٿئي ٿو. پريميئم ماڊل اڪثر جلدي ختم ٿيندا آهن. ٽيب بند ڪرڻ لاءِ انتظار بٽڻ استعمال ڪريو.

Free.ai کي پيارو آهي؟ پنھنجن دوستن کي چئو!

ھن صفحي کي تصنيف ڪريو