Question 1

ما مدى دقة النسخة المسجلة بواسطة Whisper لـ العربية؟

Accepted Answer

Whisper large-v3-turbo يتعامل مع العربية بشكل متين - 7-15% معدل خطأ الكلمات على الصوت المرجعي. توقع الاستبدالات العرضية على الكيانات المسماة، والأرقام، والمفردات التقنية الكثيفة؛ سيكون الجزء الأكبر من النص الصحيح.(الطبقة B، 7-15% word error rate على مجموعات المعايير - ننشر مستويات قيمة السوق الحقيقية بدلا من ادعاءات التسويق.)

Question 2

هل العربية يقوم بتحويل النصوص الصوتية إلى نصوص مجانية؟

Accepted Answer

نعم — العربية يستمد النص من مجمع الرموز اليومي المجاني أولاً. تكلفة الصوت حوالي 50 رموز في الدقيقة، لذا فإن المجمع اليومي المجهول يغطى بضع ساعات من الصوت في اليوم. الحسابات المسجلة تحصل على مجمع أكبر بالإضافة إلى 10000 رموز التسجيل. بعد ذلك، يشتري $1 750000 رموز (~250 ساعة من الصوت).

Question 3

هل يتعامل المسجل مع لهجات العربية؟

Accepted Answer

العربية تُعالج على مستوى العربية الموحدة الحديثة (MSA) بصورة افتراضية. يتم التعرف على الكلام المتداول المصري والعربي الشرقي والخليجي والمغاربي ولكنه يُنسخ في تهجئة MSA - لا يقوم Whisper بتحويله إلى الحروف اللاتينية أو الحفاظ على تهجئة لهجة معينة. بالنسبة للأخبار/المحاضرات الصوتية MSA النقية، توقع مستوى دقة باء؛ تدفع المحادثات المغربية أو المصرية المكثفة ذلك إلى أسفل.

Question 4

ما هي الصيغ الصوتية التي تدعمها العربية؟

Accepted Answer

MP3, WAV, M4A, FLAC, OGG, OPUS, and WEBM مقبولة مباشرة. بالنسبة للفيديو (MP4, MOV, MKV) نقوم باستخراج المسار الصوتي من جانب الخادم قبل إرساله إلى Whisper — لا تحتاج إلى تحويل أي شيء بنفسك. نفس الأنبوب بغض النظر عن لغة المصدر، بما في ذلك العربية.

Question 5

كم يمكن أن يكون طول ملف صوت العربية؟

Accepted Answer

لا يوجد حد زمني صارم للمدة - الملفات الطويلة يتم تقطيعها تلقائيا (نافذة 30 ثانية مع التداخل) ويتم دمجها في نسخة واحدة مع ختم زمني مستمر. التسجيلات المتعددة الساعات العربية (البودكاست، المحاضرات الكاملة، الاجتماعات) تعمل بشكل جيد.

Question 6

هل يحدد النص المستنسخ العربية هوية متكلمين مختلفين؟

Accepted Answer

نعم - تفعيل تسجيل المتحدثين في السجلات بصورة افتراضية لكل نسخة من العربية. ويقسم المخرج إلى المتحدث 1 / المتحدث 2 / المتحدث 3 مع علامات زمنية، وبالتالي فإن المقابلات، ومناقشات الأفرقة، والاجتماعات المتعددة الأطراف تعود مع علامات. ويجري تسجيل المتحدثين في السجلات على نموذج منفصل ويعمل بنفس الطريقة عبر جميع اللغات التي ندعمها.

Question 7

هل يمكنني نسخ فيديو يوتيوب أو بث صوتي من العربية؟

Accepted Answer

نعم - لصق العنوان في /transcribe/youtube/ لليوتيوب أو /transcribe/podcast/ للبودكاست (Apple, Spotify, RSS). نحن نقوم بتنزيل الصوت، وتشغيله من خلال Whisper مع language=ar، ونعيد النص مع الختم الزمني وعلامات المتحدث. المحتوى النموذجي لـ العربية: :: المقاطع الإخبارية، والعظات، والمحاضرات، والمقابلات السياسية في العربية هي أكثر أشكال العمل شيوعاً؛ لصق عنوان يوتيوب في /transcribe/youtube/ أو تحميل الملف.

Question 8

كم تكلف ساعة من الصوت العربية بالرموز؟

Accepted Answer

إن تسجيل ساعة واحدة يكلف نحو 3000 رمز. و$1 يشتري 750000 رمز، وهو ما يعادل حوالي 250 ساعة من التسجيلات الصوتية مقابل كل دولار. ولا ينفق أغلب المستخدمين أي شيء على الإطلاق ــ فالمجموعة اليومية المجانية تغطي مقاطع قصيرة، ومذكرات صوتية، وبرامج إذاعية لمرة واحدة.

Question 9

هل يمكنني الحصول على ختم زمني على مستوى الكلمة لصوت العربية؟

Accepted Answer

نعم — كل من مستوى القطاع (كل ~ 10-30 ثانية) ومستوى الكلمة الختم الزمني متاح. مستوى الكلمة هو الافتراضي لتصدير VTT / SRT النصوص الفرعية بحيث أن النصوص الفرعية تزامن سطر بسطر. على API وضع timestamps="كلمة" في جسد الطلب. تُسترجع النصوص المستنسخة من العربية في نصها الأصلي من اليمين إلى اليسار وتُعرض بشكل صحيح في أي متصفح يدعم النص من اليمين إلى اليسار (المتصفحات، وورد، وملفات غوغل).

Question 10

هل هناك واجهة برمجة تطبيقات لـ العربية؟

Accepted Answer

نعم. صوت POST (بيانات متعددة الأجزاء/شكل، اسم الحقل "الملف") إلى /v1/transcribe/ مع language=ar — أو حذف بارامترات اللغة للسماح ل Whisper بالاكتشاف التلقائي. يعيد JSON مع النص، الأجزاء، الختم الزمني، وعلامات المتحدث. المرجع الكامل وقطع من SDK في /api/.

Question 11

هل يمكنني ترجمة النص المدون لـ العربية إلى لغة أخرى؟

Accepted Answer

نعم - بمجرد الانتهاء من الترجمة، انقر على ترجمة أو لصق النص في /translate/. العربية يتوافق مع كل لغة أخرى ندعمها (200+). بالنسبة لمحاضر الاجتماعات، أرسل النص إلى /summarize/؛ بالنسبة للترجمة، أرسله إلى /voice/tts/ لعرض الصوت باللغة المستهدفة.

Question 12

ماذا لو كان الصوت من العربية مشوش أو منخفض الجودة؟

Accepted Answer

تم تدريب Whisper على مئات الآلاف من ساعات الصوت الحقيقي، لذا فإنه يتحمل الضوضاء الخلفية والتسجيلات ذات النوعية الهاتفية على العربية. ولأفضل النتائج، وفر صوتاً نظيفاً (ميكروفون سماعة الرأس، لا سرير موسيقي) - في هذا المستوى، تزيد الضوضاء من معدل خط الأخطاء الأساسي.إذا عادت نسخة غير قابلة للاستخدام، يرجى إرسال بريد إلكتروني إلى contact@free.ai مع الملف - سنعيد الرموز وننظر فيما إذا كان محرك مختلف يتعامل مع الصوت بشكل أفضل.

ألف - اللغة	العربية
الرمز ISO	`ar`
نموذج الذكاء الاصطناعي	أسرع-همس
السعر	مجاني

العربية مجاني

كيف يعمل

العربية خصائص النسخ

تفاصيل اللغة

لغات أخرى

الأسئلة المتكررة