faster-whisper large-v3

Free.ai (self-hosted) · stt · ~500 ٽوڪنز minute

آڊيو يا وڊيو فائل ھيٺ لاھو، يا URL کي چٽيو

~500 ٽوڪنز minute

faster-whisper large-v3 a ڳالھائڻ- کان- متن ماڊل جي ٺهيل OpenAI / SYSTRAN. Accurate transcription تي تمام مضبوط. Free.ai GPUs تي پاڻمرادو ميزبان - توهان جي روزاني ٽوڪين پول (500 ٽوڪين في منٽ) جي خلاف مفت هلندو آهي. MIT تحت جاري ڪيو ويو — Free.ai تي تجارتي استعمال جي اجازت.

API ذريعي استعمال ڪريو

OpenAI-compatible REST API. هڪ ڪَچ پيدا ڪريو ۽ ھن ماڊل کي سيڪنڊن ۾ سڏيو.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"faster-whisper-large-v3","audio_url":"https://..."}'
API دستاویز API ڪوڊ حاصل ڪريو

گھڻا پڇيل سوال

faster-whisper large-v3 ڳالهائيندڙ آڊيو کي متن ۾ تبديل ڪري ٿو. MP3, WAV, M4A, يا وڊيو فائل اپ لوڊ ڪريو ۽ faster-whisper large-v3 مڪمل ترانسڪريپٽ ۽ اختياري SRT/VTT عنوانن کي وقت جي نشان سان موٽائي ٿو.

faster-whisper large-v3 ڪيتريون ئي ٻوليون هلائي ٿو — Whisper-family ماڊل 90+ کي ڍڪي ٿو، Parakeet ~25 کي ڍڪي ٿو، ٻيا مختلف آهن. "خودڪار ڳولا" چونڊيو يا اعليٰ دقت لاءِ ٻولي بيان ڪريو.

لفظ-خطر جي شرح 5-10% صاف انگريزي آڊيو تي، 10-20% شور يا ڌيان آڊيو تي آهي. هڪ ئي آرڪيٽيڪچر جا وڏا قسم سخت ڪيسن تي بهتر ڪم ڪن ٿا - وڏي چونڊيو جڏهن آڊيو سخت آهي.

ھائو - هر حصي ۾ شروع/آخر وقت شامل آھي. SRT يا VTT طور برآمد ڪريو ۽ وقتن جي نقشي کي سڌو سنئون پنھنجي وڊيو تي.

faster-whisper large-v3 پنهنجي روزاني مفت پول جي خلاف پنهنجي پاڻ تي GPUs تي هلندو آهي؛ $5 → 200,000 ادا ڪيل ٽوڪنز ان کان پوءِ. تقريبن ~500 ٽوڪنز في منٽ.

MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) — اسان آڊيو کي ڪڍون ٿا. Max 500 MB per upload. ڊگهيون فائلون؟ /audio/cut/ سان ورهايو يا /v1/stt/batch/ استعمال ڪريو.

اسپيڪر جي ڊيائريزيشن هڪ الڳ پاس آهي - "diarize" کي /transcribe/ تي تبديل ڪريو. faster-whisper large-v3 ڊائريزيشن کي هلائيندو آهي؛ ڊيائريزيشن هر حصي کي اسپيڪر 1 / اسپيڪر 2 / وغيره سان ليٽيڪ ڪندو آهي.

ھائو — /batch/ آڊيو فائلن جي هڪ ڊرائيو قبول ڪري ٿو. هر ترنسڪريٽ /account/?tab=history ۾ اصل فائل نالي سان لھي ٿي. ڊرائيو-وڻ جي سنڀال لاءِ API استعمال ڪريو.

ھائو — پنھنجي آڊيو کي /v1/stt/transcribe/ ڏانهن POST ڪريو ماڊل="faster-whisper large-v3" سان. JSON کي متن + حصن + لفظ-مستوي واري وقت جي نشان سان موٽائي ٿو. /api/ ۾ مڪمل حوالو آھي.

پاڻ مھماندار ماڊل اسان جي GPUs تي آڊيو رکي ٿو؛ پريميئم DPA سان گذري ٿو. آڊيو حصيداري-وينڊوز کان پوءِ حذف ڪيو ويندو آهي (24h انون، 7d لاگ ان). اسان توهان جي انپٽ تي تربيت نه ڪندا آهيون.

ھائو — Free.ai ترانسڪريپشن جو تجارتي استعمال ڏئي ٿو. اوھان کي اوھان جي اپ لوڊ ڪيل آڊيو (پاڻ جي رڪارڊنگ، لائسنس ٿيل مواد، يا رضامندي سان مواد) جا حق گهرجن.

ريئل ٽائيم فڪٽر تقريبن 0.05-0.2× آهي — 60 منٽن جو پوڊ ڪاسٽ 3-12 منٽن ۾ ترنسڪريپٽ ٿئي ٿو. پريميئم ماڊل اڪثر جلدي ختم ٿيندا آهن. ٽيب بند ڪرڻ لاءِ انتظار بٽڻ استعمال ڪريو.

Free.ai کي پيارو آهي؟ پنھنجن دوستن کي چئو!

ھن صفحي کي تصنيف ڪريو