Question 1

پولش لاءِ ويسپرن جي نقل ڪهڙي حد تائين صحيح آهي؟

Accepted Answer

Whisper large-v3-turbo پولش تي پنهنجي مٿئين دقت واري طبقي ۾ اچي ٿو - معياري بينچ مارڪ تي 7% لفظ جي غلطي جي شرح هيٺ. عمل ۾ ان جو مطلب صاف اسٽوڊيو آڊيو واپس اچي ٿو-تمام-تمام، ۽ گفتگو آڊيو گهٽ ۾ گهٽ صاف ڪرڻ سان استعمال ڪري سگهجي ٿو.(Tier A, under 7% word error rate on benchmark sets - اسان مارڪيٽنگ دعوائن جي بدران سچا WER tiers شايع ڪندا آهيون.)

Question 2

پولش آڊيو-ٽئڪسٽ ترنسڪريشن مفت آهي؟

Accepted Answer

ها — پولش ترانسڪريشن پهرين توهان جي روزاني مفت ٽوڪين جي پول مان نڪتل آهي. آڊيو جي قيمت تقريبن 50 ٽوڪين جي هر منٽ ۾ آهي، تنهنڪري نامعلوم روزاني پول روزانو آڊيو جي ڪجهه ڪلاڪن کي coverڪي ٿو. داخل ٿيل اڪائونٽس کي وڏي پول ۽ 10,000 رجسٽريشن ٽوڪين حاصل ٿئي ٿو. ان کان پوءِ، $1 750,000 ٽوڪين خريد ڪري ٿو (~250 ڪلاڪ آڊيو).

Question 3

پولش جي ترانسڪريپٽ ڪھڙي اسڪرپٽ ۽ ڇا جي ليکڪيءَ استعمال ڪئي آھي؟

Accepted Answer

پولش ترانسڪريپٽ معياري UTF-8 ۾ واپس ڪيا ويندا آهن، ٻوليءَ جي عام ليکڪيءَ سان.

Question 4

پولش جي ترسيل لاءِ ڪهڙا آڊيو فارميٽ مددگار آھن؟

Accepted Answer

MP3، WAV، M4A، FLAC، OGG، OPUS، ۽ WEBM سڌو سنئون قبول ڪيا ويندا آھن. وڊيو (MP4، MOV، MKV) لاءِ اسان ويسپر کي موڪلڻ کان اڳ آڊيو ٽريڪ کي سرور-ساٿ مان ڪڍندا آھيون - توھان کي پاڻ کي ڪابه شيءِ تبديل ڪرڻ جي ضرورت نه آھي. ھڪ ئي پائپ لائن جڏھن ته مرڪزي ٻولي، بشمول پولش.

Question 5

پولش آڊيو فائل ڪيتري ڊگهي ٿي سگهي ٿي؟

Accepted Answer

نامعلوم اپ لوڊ جي حد تقريبن 500 MB في فائل آهي. داخل ٿيل اڪائونٽ 2 GB تائين وڃن ٿا. ڊگھائي سخت حد نه آهي - ڊگھيون فائلون پاڻمرادو ٽڪرا ٿي وينديون آهن (30 سيڪنڊن جون ونڊوز گڏيل) ۽ مسلسل وقت جي نشانين سان هڪڙي ترانسڪريٽ ۾ گڏجي وينديون آهن. ڪيترن ڪلاڪن جي پولش رڪارڊنگ (پوڊڪاست، مڪمل محاضرا، گڏجاڻيون) سٺي ڪم ڪنديون آهن.

Question 6

پولش ترانسڪريپٽ مختلف ڳالهائيندڙن کي سڃاڻپ ڪري ٿو ڇا؟

Accepted Answer

ھائو - هر پولش ترانسڪريٽ لاءِ ڳالهائيندڙ جي ڊيٽابيس جي ڊفالٽ طور تي فعال آهي. نڪتو segmented آهي جيئن ڳالهائيندڙ 1 / ڳالهائيندڙ 2 / ڳالهائيندڙ 3 timestamps سان، تنھنڪري مداخلت، پينل بحث، ۽ ملٽي پارٽي ڪانفرنسون واپس لبل ٿيل اچن ٿيون. ڊيٽابيس هڪ الڳ ماڊل تي هلندو آھي ۽ اسان جي سڀني ٻولين ۾ ھڪ جھڙو ڪم ڪندو آھي.

Question 7

پولش يوٽيوب وڊيو يا پوڊ ڪاسٽ کي مان نقل ڪري سگهان ٿو؟

Accepted Answer

ها — يوٽيوب لاءِ URL کي /transcribe/youtube/ ۾ پيسٽ ڪريو يا پوڊ ڪاسٽ فيڊ (ايپل، اسپوٽيفي، RSS) لاءِ /transcribe/podcast/. اسان آڊيو ڊائون لوڊ ڪيو، ان کي ويسپير سان language=pl ذريعي هلايو، ۽ وقت جي نشانن ۽ اسپيڪر جي ليبل سان ترانسڪريٽ واپس ڪيو. عام پولش مواد: پولش ۾ ليڪچر، مصاحبا، آواز جون نوٽس، ۽ يوٽيوب مواد سڀ ڪم ڪري ٿو - URL کي /transcribe/youtube/ ۾ پيسٽ ڪريو يا فائل کي سڌو سنئون اپ لوڊ ڪريو.

Question 8

پولش آڊيو جو هڪ ڪلاڪ ٽوڪنز ۾ ڪيترو خرچ ٿيندو؟

Accepted Answer

ويسپر جي قيمت تقريبن 50 ٽوڪنز في منٽ آهي، تنهنڪري هڪ ڪلاڪ جي رڪارڊنگ ~3,000 ٽوڪنز آهي. $1 750,000 ٽوڪنز خريد ڪري ٿو، جيڪو تقريبن 250 ڪلاڪ جي اوڊيو جي ڪمائي آهي. اڪثر صارفين ڪڏهن به ڪجهه نه خرچ ڪيو آهي - مفت روزاني پول مختصر ڪلپس، آواز جون نوٽس ۽ هڪ دفعي پوڊ ڪاسٽن کي coverڪي ٿو.

Question 9

پولش آڊيو لاءِ لفظ جي سطح تي وقت جي نشانين کي حاصل ڪري سگهان ٿو؟

Accepted Answer

ھائو — ٻنهي حصي-مستوي (هر ~10-30 سيڪنڊن ۾) ۽ لفظ-مستوي وقت جو نشان موجود آھن. لفظ-مستوي VTT/SRT سبٽائٽل جي برآمد لاءِ اڻلڀ آھي تنھنڪري عنوان لائين-ب-لائين سنڀاليا ويندا آھن. API تي درخواست جي جسم ۾ timestamps="word" مقرر ڪريو. پولش ترانسڪريپٽ معياري UTF-8 ۾ واپس ڪيا ويندا آهن، ٻوليءَ جي عام ليکڪيءَ سان.

Question 10

پولش جي ترڪيب لاءِ ڪو API موجود آهي؟

Accepted Answer

ھائو. پوسٽ آڊيو (multipart/form-data، ميدان جو نالو "file") کي /v1/transcribe/ سان language=pl — يا ونڊوز کي پاڻمرادو ڳولڻ جي اجازت ڏيڻ لاءِ  ٻوليءَ جي پيرا ميٽر کي ڇڏي ڏيو. JSON کي ترانسڪريپٽ، حصن، وقت جي نشانين ۽ اسپيڪر جي ٽيگ سان موٽائي ٿو. مڪمل حوالو ۽ SDK جي ٽڪرا /api/ تي.

Question 11

پولش جي ترجمي کي ٻي ٻولي ۾ ترجمو ڪري سگهان ٿو؟

Accepted Answer

ها — جڏهن ترجمو مڪمل ٿئي، ترجمو ڪلڪ ڪريو يا متن /translate/ ۾ پيسٽ ڪريو. پولش اسان جي مدد ڪيل سڀني ٻولين سان گڏجي ڪم ڪري ٿو (200+). گڏجاڻي جي منٽن لاءِ ترجمو /summarize/ ذريعي پيپ ڪريو؛ ڊبلنگ لاءِ ان کي /voice/tts/ ڏانهن موڪليو ته جيئن مقصد جي ٻولي ۾ آڊيو رڪارڊ ڪيو وڃي.

Question 12

ڇا ٿيندو جيڪڏھن پولش آڊيو شور وارو يا گهٽ معيار وارو آھي؟

Accepted Answer

ويسپر کي 680K ڪلاڪن جي آواز جي حقيقي دنيا جي آواز تي تربيت ڏني وئي آهي، تنھنڪري پولش ترميم پس منظر جي آواز، موسيقي جي بستر ۽ فون جي معيار جي رڪارڊنگ لاءِ مضبوط آھي. سخت ڪٽڻ يا ڪيترائي مٿاهين اسپيڪر اڃا تائين دقت کي نقصان پهچائيندا.جيڪڏهن ڪو نقل استعمال کان ٻاهر اچي ٿو ته contact@free.ai کي اي ميل ڪريو — اسان ٽوڪنز واپس ڪنداسين ۽ ڏسنداسين ته ڇا ٻيو انجنيئر توهان جي آڊيو کي بهتر سنڀاليندو.

پولش مفت لکڻيون

ڪيئن ڪم ڪري ٿو

پولش لکڻ جي خاصيتون

ٻولي جون تفصيلون

وڌيڪ ٻوليون

سوال

ٻولي	پولش
ISO ڪوڊ	`pl`
AI ماڊل	تيز آواز
قيمت	مفت