Question 1

ما مدى دقة النسخة المسجلة بواسطة Whisper لـ الأوردية؟

Accepted Answer

الأوردية هي لغة متوسطة الموارد لـ Whisper — تقع لغة large-v3-turbo في نطاق معدل أخطاء الكلمات 15-25%. وجوهر النص موثوق به؛ لذا كن على استعداد لأخطاء الكيانات المسماة، وأخطاء أحيانية في تبديل الرموز، وأخطاء في النطق القصير.(الطبقة C، 15-25% word error rate على مجموعات المعايير - ننشر مستويات قيمة السوق الحقيقية بدلا من ادعاءات التسويق.)

Question 2

هل الأوردية يقوم بتحويل النصوص الصوتية إلى نصوص مجانية؟

Accepted Answer

نعم — الأوردية يستمد النص من مجمع الرموز اليومي المجاني أولاً. تكلفة الصوت حوالي 50 رموز في الدقيقة، لذا فإن المجمع اليومي المجهول يغطى بضع ساعات من الصوت في اليوم. الحسابات المسجلة تحصل على مجمع أكبر بالإضافة إلى 10000 رموز التسجيل. بعد ذلك، يشتري $1 750000 رموز (~250 ساعة من الصوت).

Question 3

ما هي النصوص وطريقة التهجئة التي يستخدمها النص المستنسخ الأوردية؟

Accepted Answer

تُسترجع النصوص المستنسخة من الأوردية في نصها الأصلي من اليمين إلى اليسار وتُعرض بشكل صحيح في أي متصفح يدعم النص من اليمين إلى اليسار (المتصفحات، وورد، وملفات غوغل).

Question 4

ما هي الصيغ الصوتية التي تدعمها الأوردية؟

Accepted Answer

MP3, WAV, M4A, FLAC, OGG, OPUS, and WEBM مقبولة مباشرة. بالنسبة للفيديو (MP4, MOV, MKV) نقوم باستخراج المسار الصوتي من جانب الخادم قبل إرساله إلى Whisper — لا تحتاج إلى تحويل أي شيء بنفسك. نفس الأنبوب بغض النظر عن لغة المصدر، بما في ذلك الأوردية.

Question 5

كم يمكن أن يكون طول ملف صوت الأوردية؟

Accepted Answer

لا يوجد حد زمني صارم للمدة - الملفات الطويلة يتم تقطيعها تلقائيا (نافذة 30 ثانية مع التداخل) ويتم دمجها في نسخة واحدة مع ختم زمني مستمر. التسجيلات المتعددة الساعات الأوردية (البودكاست، المحاضرات الكاملة، الاجتماعات) تعمل بشكل جيد.

Question 6

هل يحدد النص المستنسخ الأوردية هوية متكلمين مختلفين؟

Accepted Answer

نعم - تفعيل تسجيل المتحدثين في السجلات بصورة افتراضية لكل نسخة من الأوردية. ويقسم المخرج إلى المتحدث 1 / المتحدث 2 / المتحدث 3 مع علامات زمنية، وبالتالي فإن المقابلات، ومناقشات الأفرقة، والاجتماعات المتعددة الأطراف تعود مع علامات. ويجري تسجيل المتحدثين في السجلات على نموذج منفصل ويعمل بنفس الطريقة عبر جميع اللغات التي ندعمها.

Question 7

هل يمكنني نسخ فيديو يوتيوب أو بث صوتي من الأوردية؟

Accepted Answer

نعم - لصق العنوان في /transcribe/youtube/ لليوتيوب أو /transcribe/podcast/ للبودكاست (Apple, Spotify, RSS). نحن نقوم بتنزيل الصوت، وتشغيله من خلال Whisper مع language=ur، ونعيد النص مع الختم الزمني وعلامات المتحدث. المحتوى النموذجي لـ الأوردية: الملاحظات الصوتية على واتساب، والمدونات على يوتيوب، والفيديو القصير هي أكثر أشكال العمل شيوعا في الأوردية - لصق عنوان URL في /transcribe/youtube/ أو تحميل الصوت مباشرة.

Question 8

كم تكلف ساعة من الصوت الأوردية بالرموز؟

Accepted Answer

إن تسجيل ساعة واحدة يكلف نحو 3000 رمز. و$1 يشتري 750000 رمز، وهو ما يعادل حوالي 250 ساعة من التسجيلات الصوتية مقابل كل دولار. ولا ينفق أغلب المستخدمين أي شيء على الإطلاق ــ فالمجموعة اليومية المجانية تغطي مقاطع قصيرة، ومذكرات صوتية، وبرامج إذاعية لمرة واحدة.

Question 9

هل يمكنني الحصول على ختم زمني على مستوى الكلمة لصوت الأوردية؟

Accepted Answer

نعم — كل من مستوى القطاع (كل ~ 10-30 ثانية) ومستوى الكلمة الختم الزمني متاح. مستوى الكلمة هو الافتراضي لتصدير VTT / SRT النصوص الفرعية بحيث أن النصوص الفرعية تزامن سطر بسطر. على API وضع timestamps="كلمة" في جسد الطلب. تُسترجع النصوص المستنسخة من الأوردية في نصها الأصلي من اليمين إلى اليسار وتُعرض بشكل صحيح في أي متصفح يدعم النص من اليمين إلى اليسار (المتصفحات، وورد، وملفات غوغل).

Question 10

هل هناك واجهة برمجة تطبيقات لـ الأوردية؟

Accepted Answer

نعم. صوت POST (بيانات متعددة الأجزاء/شكل، اسم الحقل "الملف") إلى /v1/transcribe/ مع language=ur — أو حذف بارامترات اللغة للسماح ل Whisper بالاكتشاف التلقائي. يعيد JSON مع النص، الأجزاء، الختم الزمني، وعلامات المتحدث. المرجع الكامل وقطع من SDK في /api/.

Question 11

هل يمكنني ترجمة النص المدون لـ الأوردية إلى لغة أخرى؟

Accepted Answer

نعم - بمجرد الانتهاء من الترجمة، انقر على ترجمة أو لصق النص في /translate/. الأوردية يتوافق مع كل لغة أخرى ندعمها (200+). بالنسبة لمحاضر الاجتماعات، أرسل النص إلى /summarize/؛ بالنسبة للترجمة، أرسله إلى /voice/tts/ لعرض الصوت باللغة المستهدفة.

Question 12

ماذا لو كان الصوت من الأوردية مشوش أو منخفض الجودة؟

Accepted Answer

لا تزال قوة الضوضاء في Whisper تنطبق على الأوردية، ولكن في هذا المستوى من الدقة، أي ضوضاء إضافية تزيد من معدل خط الأخطاء الأساسي.إذا عادت نسخة غير قابلة للاستخدام، يرجى إرسال بريد إلكتروني إلى contact@free.ai مع الملف - سنعيد الرموز وننظر فيما إذا كان محرك مختلف يتعامل مع الصوت بشكل أفضل.

ألف - اللغة	الأوردية
الرمز ISO	`ur`
نموذج الذكاء الاصطناعي	أسرع-همس
السعر	مجاني

الأوردية مجاني

كيف يعمل

الأوردية خصائص النسخ

تفاصيل اللغة

لغات أخرى

الأسئلة المتكررة