پولش مفت لکڻيون

پولش آڊيو ۽ وڊيو کي AI سان متن ۾ تبديل ڪريو. تيز، درست ۽ مفت.

ڪيئن ڪم ڪري ٿو

  1. ھتي وڃو Free.ai ترانسڪريپٽر
  2. پولش آڊيو يا وڊيو فائل اپ لوڊ ڪريو
  3. اسان جو AI پولش پاڻمرادو ڳولي ٿو ۽ ان کي نقل ڪري ٿو
  4. پنھنجي ترانسڪريٽ کي متن يا SRT سبٽيڪل طور ڊائون لوڊ ڪريو

پولش لکڻ جي خاصيتون

  • faster-whisper طرفان هلايو ويو (MIT لائسنس ٿيل)
  • پولش ٻوليءَ جو خودڪار اندازو
  • MP3، WAV، MP4، M4A، FLAC ۽ وڌيڪ کي سپورٽ ڪري ٿو
  • وقت جون نشانيون ۽ سبٽيٽل برآمد (SRT)
  • ڪابه فائل سائيز جي حد
  • پرائيويٽ ۽ محفوظ -- فائل پروسيس ڪرڻ کانپوءِ حذف ڪيو ويندو

ٻولي جون تفصيلون

ٻوليپولش
ISO ڪوڊpl
AI ماڊلتيز آواز
قيمتمفت

وڌيڪ ٻوليون

سڀ ٻوليون ڏسو

سوال

Whisper large-v3-turbo پولش تي پنهنجي مٿئين دقت واري طبقي ۾ اچي ٿو - معياري بينچ مارڪ تي 7% لفظ جي غلطي جي شرح هيٺ. عمل ۾ ان جو مطلب صاف اسٽوڊيو آڊيو واپس اچي ٿو-تمام-تمام، ۽ گفتگو آڊيو گهٽ ۾ گهٽ صاف ڪرڻ سان استعمال ڪري سگهجي ٿو.(Tier A, under 7% word error rate on benchmark sets - اسان مارڪيٽنگ دعوائن جي بدران سچا WER tiers شايع ڪندا آهيون.)

ها — پولش ترانسڪريشن پهرين توهان جي روزاني مفت ٽوڪين جي پول مان نڪتل آهي. آڊيو جي قيمت تقريبن 50 ٽوڪين جي هر منٽ ۾ آهي، تنهنڪري نامعلوم روزاني پول روزانو آڊيو جي ڪجهه ڪلاڪن کي coverڪي ٿو. داخل ٿيل اڪائونٽس کي وڏي پول ۽ 10,000 رجسٽريشن ٽوڪين حاصل ٿئي ٿو. ان کان پوءِ، $1 750,000 ٽوڪين خريد ڪري ٿو (~250 ڪلاڪ آڊيو).

پولش ترانسڪريپٽ معياري UTF-8 ۾ واپس ڪيا ويندا آهن، ٻوليءَ جي عام ليکڪيءَ سان.

MP3، WAV، M4A، FLAC، OGG، OPUS، ۽ WEBM سڌو سنئون قبول ڪيا ويندا آھن. وڊيو (MP4، MOV، MKV) لاءِ اسان ويسپر کي موڪلڻ کان اڳ آڊيو ٽريڪ کي سرور-ساٿ مان ڪڍندا آھيون - توھان کي پاڻ کي ڪابه شيءِ تبديل ڪرڻ جي ضرورت نه آھي. ھڪ ئي پائپ لائن جڏھن ته مرڪزي ٻولي، بشمول پولش.

نامعلوم اپ لوڊ جي حد تقريبن 500 MB في فائل آهي. داخل ٿيل اڪائونٽ 2 GB تائين وڃن ٿا. ڊگھائي سخت حد نه آهي - ڊگھيون فائلون پاڻمرادو ٽڪرا ٿي وينديون آهن (30 سيڪنڊن جون ونڊوز گڏيل) ۽ مسلسل وقت جي نشانين سان هڪڙي ترانسڪريٽ ۾ گڏجي وينديون آهن. ڪيترن ڪلاڪن جي پولش رڪارڊنگ (پوڊڪاست، مڪمل محاضرا، گڏجاڻيون) سٺي ڪم ڪنديون آهن.

ھائو - هر پولش ترانسڪريٽ لاءِ ڳالهائيندڙ جي ڊيٽابيس جي ڊفالٽ طور تي فعال آهي. نڪتو segmented آهي جيئن ڳالهائيندڙ 1 / ڳالهائيندڙ 2 / ڳالهائيندڙ 3 timestamps سان، تنھنڪري مداخلت، پينل بحث، ۽ ملٽي پارٽي ڪانفرنسون واپس لبل ٿيل اچن ٿيون. ڊيٽابيس هڪ الڳ ماڊل تي هلندو آھي ۽ اسان جي سڀني ٻولين ۾ ھڪ جھڙو ڪم ڪندو آھي.

ها — يوٽيوب لاءِ URL کي /transcribe/youtube/ ۾ پيسٽ ڪريو يا پوڊ ڪاسٽ فيڊ (ايپل، اسپوٽيفي، RSS) لاءِ /transcribe/podcast/. اسان آڊيو ڊائون لوڊ ڪيو، ان کي ويسپير سان language=pl ذريعي هلايو، ۽ وقت جي نشانن ۽ اسپيڪر جي ليبل سان ترانسڪريٽ واپس ڪيو. عام پولش مواد: پولش ۾ ليڪچر، مصاحبا، آواز جون نوٽس، ۽ يوٽيوب مواد سڀ ڪم ڪري ٿو - URL کي /transcribe/youtube/ ۾ پيسٽ ڪريو يا فائل کي سڌو سنئون اپ لوڊ ڪريو.

ويسپر جي قيمت تقريبن 50 ٽوڪنز في منٽ آهي، تنهنڪري هڪ ڪلاڪ جي رڪارڊنگ ~3,000 ٽوڪنز آهي. $1 750,000 ٽوڪنز خريد ڪري ٿو، جيڪو تقريبن 250 ڪلاڪ جي اوڊيو جي ڪمائي آهي. اڪثر صارفين ڪڏهن به ڪجهه نه خرچ ڪيو آهي - مفت روزاني پول مختصر ڪلپس، آواز جون نوٽس ۽ هڪ دفعي پوڊ ڪاسٽن کي coverڪي ٿو.

ھائو — ٻنهي حصي-مستوي (هر ~10-30 سيڪنڊن ۾) ۽ لفظ-مستوي وقت جو نشان موجود آھن. لفظ-مستوي VTT/SRT سبٽائٽل جي برآمد لاءِ اڻلڀ آھي تنھنڪري عنوان لائين-ب-لائين سنڀاليا ويندا آھن. API تي درخواست جي جسم ۾ timestamps="word" مقرر ڪريو. پولش ترانسڪريپٽ معياري UTF-8 ۾ واپس ڪيا ويندا آهن، ٻوليءَ جي عام ليکڪيءَ سان.

ھائو. پوسٽ آڊيو (multipart/form-data، ميدان جو نالو "file") کي /v1/transcribe/ سان language=pl — يا ونڊوز کي پاڻمرادو ڳولڻ جي اجازت ڏيڻ لاءِ ٻوليءَ جي پيرا ميٽر کي ڇڏي ڏيو. JSON کي ترانسڪريپٽ، حصن، وقت جي نشانين ۽ اسپيڪر جي ٽيگ سان موٽائي ٿو. مڪمل حوالو ۽ SDK جي ٽڪرا /api/ تي.

ها — جڏهن ترجمو مڪمل ٿئي، ترجمو ڪلڪ ڪريو يا متن /translate/ ۾ پيسٽ ڪريو. پولش اسان جي مدد ڪيل سڀني ٻولين سان گڏجي ڪم ڪري ٿو (200+). گڏجاڻي جي منٽن لاءِ ترجمو /summarize/ ذريعي پيپ ڪريو؛ ڊبلنگ لاءِ ان کي /voice/tts/ ڏانهن موڪليو ته جيئن مقصد جي ٻولي ۾ آڊيو رڪارڊ ڪيو وڃي.

ويسپر کي 680K ڪلاڪن جي آواز جي حقيقي دنيا جي آواز تي تربيت ڏني وئي آهي، تنھنڪري پولش ترميم پس منظر جي آواز، موسيقي جي بستر ۽ فون جي معيار جي رڪارڊنگ لاءِ مضبوط آھي. سخت ڪٽڻ يا ڪيترائي مٿاهين اسپيڪر اڃا تائين دقت کي نقصان پهچائيندا.جيڪڏهن ڪو نقل استعمال کان ٻاهر اچي ٿو ته contact@free.ai کي اي ميل ڪريو — اسان ٽوڪنز واپس ڪنداسين ۽ ڏسنداسين ته ڇا ٻيو انجنيئر توهان جي آڊيو کي بهتر سنڀاليندو.

Free.ai کي پيارو آهي؟ پنھنجن دوستن کي چئو!

ھن صفحي کي تصنيف ڪريو