faster-whisper large-v3

Free.ai (self-hosted) · stt · ~500 ٽوڪنز minute

آڊيو اپ لوڊ ڪريو

آڊيو يا وڊيو فائل ھيٺ لاھو، يا URL کي چٽيو

~500 ٽوڪنز minute

faster-whisper large-v3 a ڳالھائڻ- کان- متن ماڊل جي ٺهيل OpenAI / SYSTRAN. Accurate transcription تي تمام مضبوط. Free.ai GPUs تي پاڻمرادو ميزبان - توهان جي روزاني ٽوڪين پول (500 ٽوڪين في منٽ) جي خلاف مفت هلندو آهي. MIT تحت جاري ڪيو ويو — Free.ai تي تجارتي استعمال جي اجازت.

API ذريعي استعمال ڪريو

OpenAI-compatible REST API. هڪ ڪَچ پيدا ڪريو ۽ ھن ماڊل کي سيڪنڊن ۾ سڏيو.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"faster-whisper-large-v3","audio_url":"https://..."}'

API دستاویز API ڪوڊ حاصل ڪريو

اھڙا ماڊل

ElevenLabs STT

Fal Speech-to-Text

Wizper (Whisper v3)

سڀني ماڊلن جو برائوزنگ →

گھڻا پڇيل سوال

faster-whisper large-v3 ڳالهائيندڙ آڊيو کي متن ۾ تبديل ڪري ٿو. MP3, WAV, M4A, يا وڊيو فائل اپ لوڊ ڪريو ۽ faster-whisper large-v3 مڪمل ترانسڪريپٽ ۽ اختياري SRT/VTT عنوانن کي وقت جي نشان سان موٽائي ٿو.

faster-whisper large-v3 ڪيتريون ئي ٻوليون هلائي ٿو — Whisper-family ماڊل 90+ کي ڍڪي ٿو، Parakeet ~25 کي ڍڪي ٿو، ٻيا مختلف آهن. "خودڪار ڳولا" چونڊيو يا اعليٰ دقت لاءِ ٻولي بيان ڪريو.

لفظ-خطر جي شرح 5-10% صاف انگريزي آڊيو تي، 10-20% شور يا ڌيان آڊيو تي آهي. هڪ ئي آرڪيٽيڪچر جا وڏا قسم سخت ڪيسن تي بهتر ڪم ڪن ٿا - وڏي چونڊيو جڏهن آڊيو سخت آهي.

ھائو - هر حصي ۾ شروع/آخر وقت شامل آھي. SRT يا VTT طور برآمد ڪريو ۽ وقتن جي نقشي کي سڌو سنئون پنھنجي وڊيو تي.

faster-whisper large-v3 پنهنجي روزاني مفت پول جي خلاف پنهنجي پاڻ تي GPUs تي هلندو آهي؛ $5 → 200,000 ادا ڪيل ٽوڪنز ان کان پوءِ. تقريبن ~500 ٽوڪنز في منٽ.

MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) — اسان آڊيو کي ڪڍون ٿا. Max 500 MB per upload. ڊگهيون فائلون؟ /audio/cut/ سان ورهايو يا /v1/stt/batch/ استعمال ڪريو.

اسپيڪر جي ڊيائريزيشن هڪ الڳ پاس آهي - "diarize" کي /transcribe/ تي تبديل ڪريو. faster-whisper large-v3 ڊائريزيشن کي هلائيندو آهي؛ ڊيائريزيشن هر حصي کي اسپيڪر 1 / اسپيڪر 2 / وغيره سان ليٽيڪ ڪندو آهي.

ھائو — /batch/ آڊيو فائلن جي هڪ ڊرائيو قبول ڪري ٿو. هر ترنسڪريٽ /account/?tab=history ۾ اصل فائل نالي سان لھي ٿي. ڊرائيو-وڻ جي سنڀال لاءِ API استعمال ڪريو.

ھائو — پنھنجي آڊيو کي /v1/stt/transcribe/ ڏانهن POST ڪريو ماڊل="faster-whisper large-v3" سان. JSON کي متن + حصن + لفظ-مستوي واري وقت جي نشان سان موٽائي ٿو. /api/ ۾ مڪمل حوالو آھي.

پاڻ مھماندار ماڊل اسان جي GPUs تي آڊيو رکي ٿو؛ پريميئم DPA سان گذري ٿو. آڊيو حصيداري-وينڊوز کان پوءِ حذف ڪيو ويندو آهي (24h انون، 7d لاگ ان). اسان توهان جي انپٽ تي تربيت نه ڪندا آهيون.

ھائو — Free.ai ترانسڪريپشن جو تجارتي استعمال ڏئي ٿو. اوھان کي اوھان جي اپ لوڊ ڪيل آڊيو (پاڻ جي رڪارڊنگ، لائسنس ٿيل مواد، يا رضامندي سان مواد) جا حق گهرجن.

ريئل ٽائيم فڪٽر تقريبن 0.05-0.2× آهي — 60 منٽن جو پوڊ ڪاسٽ 3-12 منٽن ۾ ترنسڪريپٽ ٿئي ٿو. پريميئم ماڊل اڪثر جلدي ختم ٿيندا آهن. ٽيب بند ڪرڻ لاءِ انتظار بٽڻ استعمال ڪريو.

faster-whisper large-v3

API ذريعي استعمال ڪريو

اھڙا ماڊل

گھڻا پڇيل سوال

faster-whisper large-v3 ڇا ڪندو آھي؟

ڪيتريون ٻوليون faster-whisper large-v3 سپورٽ ڪري ٿو؟

faster-whisper large-v3 ڪيترو صحيح آھي؟

faster-whisper large-v3 ۾ وقت جون نشانيون شامل آھن؟

faster-whisper large-v3 جي قيمت ڪهڙي آھي؟

ڪھڙيون آڊيو فارميٽس آءٌ faster-whisper large-v3 تي اپ لوڊ ڪري سگهان ٿو؟

faster-whisper large-v3 مختلف ڳالهائيندڙن کي سڃاڻي سگھي ٿو؟

faster-whisper large-v3 سان ٽرانسڪرپٽ ڪري سگهان ٿو؟

faster-whisper large-v3 لاءِ ڪو API موجود آهي؟

ڇا ذاتي زندگي جي باري ۾ جڏهن مون سان faster-whisper large-v3 سان نقل ڪريان؟

faster-whisper large-v3 آؤٽپوٽ تجارتي استعمال لاءِ محفوظ آهي؟

faster-whisper large-v3 ڪيترو وقت وٺندو آھي؟

10,000 مفت ٽوڪنز حاصل ڪريو

انتظار ڪريو - 10K مفت ٽوڪنز حاصل ڪريو!

وڌيڪ گھرو ٿا؟