العربية مجاني

. نقل العربية صوت وفيديو إلى نص مع الذكاء الاصطناعي. سريع، دقيق، ومجاني

كيف يعمل

  1. اذهب إلى Free.ai مسجل
  2. تحميل ملفك العربية السمعي أو الفيديو
  3. الذكاء الاصطناعي لدينا يكتشف العربية تلقائياً ويسجلها
  4. تحميل النصوص النصية أو النصوص الجانبية

العربية خصائص النسخ

  • تشغيل بواسطة أسرع-همس (MIT مرخصة)
  • كشف العربية لغة آليا
  • دعم MP3, WAV, MP4, M4A, FLAC, وأكثر
  • تصدير الختم الزمني والترجمة النصية (SRT)
  • لا حدود لحجم الملف على الخطط المدفوعة
  • سرية وآمنة - تُحذف الملفات بعد التجهيز

تفاصيل اللغة

ألف - اللغةالعربية
الرمز ISOar
نموذج الذكاء الاصطناعيأسرع-همس
السعرمجاني

لغات أخرى

جميع اللغات

الأسئلة المتكررة

Whisper large-v3-turbo يتعامل مع العربية بشكل متين - 7-15% معدل خطأ الكلمات على الصوت المرجعي. توقع الاستبدالات العرضية على الكيانات المسماة، والأرقام، والمفردات التقنية الكثيفة؛ سيكون الجزء الأكبر من النص الصحيح.(الطبقة B، 7-15% word error rate على مجموعات المعايير - ننشر مستويات قيمة السوق الحقيقية بدلا من ادعاءات التسويق.)

نعم — العربية يستمد النص من مجمع الرموز اليومي المجاني أولاً. تكلفة الصوت حوالي 50 رموز في الدقيقة، لذا فإن المجمع اليومي المجهول يغطى بضع ساعات من الصوت في اليوم. الحسابات المسجلة تحصل على مجمع أكبر بالإضافة إلى 10000 رموز التسجيل. بعد ذلك، يشتري $1 750000 رموز (~250 ساعة من الصوت).

العربية تُعالج على مستوى العربية الموحدة الحديثة (MSA) بصورة افتراضية. يتم التعرف على الكلام المتداول المصري والعربي الشرقي والخليجي والمغاربي ولكنه يُنسخ في تهجئة MSA - لا يقوم Whisper بتحويله إلى الحروف اللاتينية أو الحفاظ على تهجئة لهجة معينة. بالنسبة للأخبار/المحاضرات الصوتية MSA النقية، توقع مستوى دقة باء؛ تدفع المحادثات المغربية أو المصرية المكثفة ذلك إلى أسفل.

MP3, WAV, M4A, FLAC, OGG, OPUS, and WEBM مقبولة مباشرة. بالنسبة للفيديو (MP4, MOV, MKV) نقوم باستخراج المسار الصوتي من جانب الخادم قبل إرساله إلى Whisper — لا تحتاج إلى تحويل أي شيء بنفسك. نفس الأنبوب بغض النظر عن لغة المصدر، بما في ذلك العربية.

لا يوجد حد زمني صارم للمدة - الملفات الطويلة يتم تقطيعها تلقائيا (نافذة 30 ثانية مع التداخل) ويتم دمجها في نسخة واحدة مع ختم زمني مستمر. التسجيلات المتعددة الساعات العربية (البودكاست، المحاضرات الكاملة، الاجتماعات) تعمل بشكل جيد.

نعم - تفعيل تسجيل المتحدثين في السجلات بصورة افتراضية لكل نسخة من العربية. ويقسم المخرج إلى المتحدث 1 / المتحدث 2 / المتحدث 3 مع علامات زمنية، وبالتالي فإن المقابلات، ومناقشات الأفرقة، والاجتماعات المتعددة الأطراف تعود مع علامات. ويجري تسجيل المتحدثين في السجلات على نموذج منفصل ويعمل بنفس الطريقة عبر جميع اللغات التي ندعمها.

نعم - لصق العنوان في /transcribe/youtube/ لليوتيوب أو /transcribe/podcast/ للبودكاست (Apple, Spotify, RSS). نحن نقوم بتنزيل الصوت، وتشغيله من خلال Whisper مع language=ar، ونعيد النص مع الختم الزمني وعلامات المتحدث. المحتوى النموذجي لـ العربية: :: المقاطع الإخبارية، والعظات، والمحاضرات، والمقابلات السياسية في العربية هي أكثر أشكال العمل شيوعاً؛ لصق عنوان يوتيوب في /transcribe/youtube/ أو تحميل الملف.

إن تسجيل ساعة واحدة يكلف نحو 3000 رمز. و$1 يشتري 750000 رمز، وهو ما يعادل حوالي 250 ساعة من التسجيلات الصوتية مقابل كل دولار. ولا ينفق أغلب المستخدمين أي شيء على الإطلاق ــ فالمجموعة اليومية المجانية تغطي مقاطع قصيرة، ومذكرات صوتية، وبرامج إذاعية لمرة واحدة.

نعم — كل من مستوى القطاع (كل ~ 10-30 ثانية) ومستوى الكلمة الختم الزمني متاح. مستوى الكلمة هو الافتراضي لتصدير VTT / SRT النصوص الفرعية بحيث أن النصوص الفرعية تزامن سطر بسطر. على API وضع timestamps="كلمة" في جسد الطلب. تُسترجع النصوص المستنسخة من العربية في نصها الأصلي من اليمين إلى اليسار وتُعرض بشكل صحيح في أي متصفح يدعم النص من اليمين إلى اليسار (المتصفحات، وورد، وملفات غوغل).

نعم. صوت POST (بيانات متعددة الأجزاء/شكل، اسم الحقل "الملف") إلى /v1/transcribe/ مع language=ar — أو حذف بارامترات اللغة للسماح ل Whisper بالاكتشاف التلقائي. يعيد JSON مع النص، الأجزاء، الختم الزمني، وعلامات المتحدث. المرجع الكامل وقطع من SDK في /api/.

نعم - بمجرد الانتهاء من الترجمة، انقر على ترجمة أو لصق النص في /translate/. العربية يتوافق مع كل لغة أخرى ندعمها (200+). بالنسبة لمحاضر الاجتماعات، أرسل النص إلى /summarize/؛ بالنسبة للترجمة، أرسله إلى /voice/tts/ لعرض الصوت باللغة المستهدفة.

تم تدريب Whisper على مئات الآلاف من ساعات الصوت الحقيقي، لذا فإنه يتحمل الضوضاء الخلفية والتسجيلات ذات النوعية الهاتفية على العربية. ولأفضل النتائج، وفر صوتاً نظيفاً (ميكروفون سماعة الرأس، لا سرير موسيقي) - في هذا المستوى، تزيد الضوضاء من معدل خط الأخطاء الأساسي.إذا عادت نسخة غير قابلة للاستخدام، يرجى إرسال بريد إلكتروني إلى contact@free.ai مع الملف - سنعيد الرموز وننظر فيما إذا كان محرك مختلف يتعامل مع الصوت بشكل أفضل.

Love this tool? Share it!

تقييم هذه الصفحة