ElevenLabs STT

Free.ai · stt · ~500 ٽوڪنز minute

آڊيو اپ لوڊ ڪريو

آڊيو يا وڊيو فائل ھيٺ لاھو، يا URL کي چٽيو

~500 ٽوڪنز minute

اسان جي GPUs تي مفت هلندو آهي. جي لاءِ اپگريڊ ڪريو ElevenLabs STT →

ElevenLabs STT a ڳالھائڻ- کان- متن ماڊل آهي. خارجي ماڊلز ذريعي روٽ ڪيو ويو - ~ 500 ٽوڪنز في منٽ (50% مارڪ اپ مٿي ڪٽڻ جي قيمت).

API ذريعي استعمال ڪريو

OpenAI-compatible REST API. Generate a key and call this model in seconds.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/elevenlabs/speech-to-text","audio_url":"https://..."}'

API دستاویز API ڪوڊ حاصل ڪريو

Similar models

Fal Speech-to-Text

Wizper (Whisper v3)

Browse all models →

گھڻا پڇيل سوال

ElevenLabs STT ڳالهائيندڙ آڊيو کي متن ۾ تبديل ڪري ٿو. MP3, WAV, M4A, يا وڊيو فائل اپ لوڊ ڪريو ۽ ElevenLabs STT مڪمل ترانسڪريپٽ ۽ اختياري SRT/VTT عنوانن کي وقت جي نشان سان موٽائي ٿو.

ElevenLabs STT ڪيتريون ئي ٻوليون هلائي ٿو — Whisper-family ماڊل 90+ کي ڍڪي ٿو، Parakeet ~25 کي ڍڪي ٿو، ٻيا مختلف آهن. "خودڪار ڳولا" چونڊيو يا اعليٰ دقت لاءِ ٻولي بيان ڪريو.

لفظ-خطر جي شرح 5-10% صاف انگريزي آڊيو تي، 10-20% شور يا ڌيان آڊيو تي آهي. هڪ ئي آرڪيٽيڪچر جا وڏا قسم سخت ڪيسن تي بهتر ڪم ڪن ٿا - وڏي چونڊيو جڏهن آڊيو سخت آهي.

ھائو - هر حصي ۾ شروع/آخر وقت شامل آھي. SRT يا VTT طور برآمد ڪريو ۽ وقتن جي نقشي کي سڌو سنئون پنھنجي وڊيو تي.

ElevenLabs STT هڪ پريميئم ٽرانسڪرپشن انجن آهي. تقريبن ~500-1,500 ٽوڪنز هر منٽ جي آڊيو. $1 = 750,000 ٽوڪنز.

MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) — اسان آڊيو کي ڪڍون ٿا. Max 500 MB per upload. ڊگهيون فائلون؟ /audio/cut/ سان ورهايو يا /v1/stt/batch/ استعمال ڪريو.

اسپيڪر جي ڊيائريزيشن هڪ الڳ پاس آهي - "diarize" کي /transcribe/ تي تبديل ڪريو. ElevenLabs STT ڊائريزيشن کي هلائيندو آهي؛ ڊيائريزيشن هر حصي کي اسپيڪر 1 / اسپيڪر 2 / وغيره سان ليٽيڪ ڪندو آهي.

ھائو — /batch/ آڊيو فائلن جي هڪ ڊرائيو قبول ڪري ٿو. هر ترنسڪريٽ /account/?tab=history ۾ اصل فائل نالي سان لھي ٿي. ڊرائيو-وڻ جي سنڀال لاءِ API استعمال ڪريو.

ھائو — پنھنجي آڊيو کي /v1/stt/transcribe/ ڏانهن POST ڪريو ماڊل="ElevenLabs STT" سان. JSON کي متن + حصن + لفظ-مستوي واري وقت جي نشان سان موٽائي ٿو. /api/ ۾ مڪمل حوالو آھي.

پاڻ مھماندار ماڊل اسان جي GPUs تي آڊيو رکي ٿو؛ پريميئم DPA سان گذري ٿو. آڊيو حصيداري-وينڊوز کان پوءِ حذف ڪيو ويندو آهي (24h انون، 7d لاگ ان). اسان توهان جي انپٽ تي تربيت نه ڪندا آهيون.

ھائو — Free.ai ترانسڪريپشن جو تجارتي استعمال ڏئي ٿو. اوھان کي اوھان جي اپ لوڊ ڪيل آڊيو (پاڻ جي رڪارڊنگ، لائسنس ٿيل مواد، يا رضامندي سان مواد) جا حق گهرجن.

ريئل ٽائيم فڪٽر تقريبن 0.05-0.2× آهي — 60 منٽن جو پوڊ ڪاسٽ 3-12 منٽن ۾ ترنسڪريپٽ ٿئي ٿو. پريميئم ماڊل اڪثر جلدي ختم ٿيندا آهن. ٽيب بند ڪرڻ لاءِ انتظار بٽڻ استعمال ڪريو.

ElevenLabs STT

API ذريعي استعمال ڪريو

Similar models

گھڻا پڇيل سوال

ElevenLabs STT ڇا ڪندو آھي؟

ڪيتريون ٻوليون ElevenLabs STT سپورٽ ڪري ٿو؟

ElevenLabs STT ڪيترو صحيح آھي؟

ElevenLabs STT ۾ وقت جون نشانيون شامل آھن؟

ElevenLabs STT جي قيمت ڪهڙي آھي؟

ڪھڙيون آڊيو فارميٽس آءٌ ElevenLabs STT تي اپ لوڊ ڪري سگهان ٿو؟

ElevenLabs STT مختلف ڳالهائيندڙن کي سڃاڻي سگھي ٿو؟

ElevenLabs STT سان ٽرانسڪرپٽ ڪري سگهان ٿو؟

ElevenLabs STT لاءِ ڪو API موجود آهي؟

ڇا ذاتي زندگي جي باري ۾ جڏهن مون سان ElevenLabs STT سان نقل ڪريان؟

ElevenLabs STT آؤٽپوٽ تجارتي استعمال لاءِ محفوظ آهي؟

ElevenLabs STT ڪيترو وقت وٺندو آھي؟

10,000 مفت ٽوڪنز حاصل ڪريو

انتظار ڪريو - 10K مفت ٽوڪنز حاصل ڪريو!

وڌيڪ گھرو ٿا؟