الصينية مجاني

. نقل الصينية صوت وفيديو إلى نص مع الذكاء الاصطناعي. سريع، دقيق، ومجاني

كيف يعمل

  1. اذهب إلى Free.ai مسجل
  2. تحميل ملفك الصينية السمعي أو الفيديو
  3. الذكاء الاصطناعي لدينا يكتشف الصينية تلقائياً ويسجلها
  4. تحميل النصوص النصية أو النصوص الجانبية

الصينية خصائص النسخ

  • تشغيل بواسطة أسرع-همس (MIT مرخصة)
  • كشف الصينية لغة آليا
  • دعم MP3, WAV, MP4, M4A, FLAC, وأكثر
  • تصدير الختم الزمني والترجمة النصية (SRT)
  • لا حدود لحجم الملف على الخطط المدفوعة
  • سرية وآمنة - تُحذف الملفات بعد التجهيز

تفاصيل اللغة

ألف - اللغةالصينية
الرمز ISOzh
نموذج الذكاء الاصطناعيأسرع-همس
السعرمجاني

لغات أخرى

جميع اللغات

الأسئلة المتكررة

يسقط Whisper large-v3-turbo في أعلى مستوى من الدقة على الصينية - تحت 7% معدل خطأ الكلمات على المعايير القياسية. في الممارسة العملية، يعني ذلك أن الصوت النظيف في الاستوديو يعود قريبا من الكمال، والصوت المحادثة قابلة للاستخدام مع الحد الأدنى من التنظيف.(الطبقة A، under 7% word error rate على مجموعات المعايير - ننشر مستويات قيمة السوق الحقيقية بدلا من ادعاءات التسويق.)

نعم — الصينية يستمد النص من مجمع الرموز اليومي المجاني أولاً. تكلفة الصوت حوالي 50 رموز في الدقيقة، لذا فإن المجمع اليومي المجهول يغطى بضع ساعات من الصوت في اليوم. الحسابات المسجلة تحصل على مجمع أكبر بالإضافة إلى 10000 رموز التسجيل. بعد ذلك، يشتري $1 750000 رموز (~250 ساعة من الصوت).

ضع language=zh للماندارين (الافتراضي — مخرج مبسط أو تقليدي اعتمادا على المصدر). بالنسبة للكانتوني استخدم language=yue إذا كان الصوت هو حديث هونغ كونغ / غوانغزو؛ الكانتوني الذي يتم نقله إلى zh سينتج تقريبا من تهجئة الماندارين يفقد النبرة واللغة العامية.

MP3, WAV, M4A, FLAC, OGG, OPUS, and WEBM مقبولة مباشرة. بالنسبة للفيديو (MP4, MOV, MKV) نقوم باستخراج المسار الصوتي من جانب الخادم قبل إرساله إلى Whisper — لا تحتاج إلى تحويل أي شيء بنفسك. نفس الأنبوب بغض النظر عن لغة المصدر، بما في ذلك الصينية.

لا يوجد حد زمني صارم للمدة - الملفات الطويلة يتم تقطيعها تلقائيا (نافذة 30 ثانية مع التداخل) ويتم دمجها في نسخة واحدة مع ختم زمني مستمر. التسجيلات المتعددة الساعات الصينية (البودكاست، المحاضرات الكاملة، الاجتماعات) تعمل بشكل جيد.

نعم - تفعيل تسجيل المتحدثين في السجلات بصورة افتراضية لكل نسخة من الصينية. ويقسم المخرج إلى المتحدث 1 / المتحدث 2 / المتحدث 3 مع علامات زمنية، وبالتالي فإن المقابلات، ومناقشات الأفرقة، والاجتماعات المتعددة الأطراف تعود مع علامات. ويجري تسجيل المتحدثين في السجلات على نموذج منفصل ويعمل بنفس الطريقة عبر جميع اللغات التي ندعمها.

نعم - لصق العنوان في /transcribe/youtube/ لليوتيوب أو /transcribe/podcast/ للبودكاست (Apple, Spotify, RSS). نحن نقوم بتنزيل الصوت، وتشغيله من خلال Whisper مع language=zh، ونعيد النص مع الختم الزمني وعلامات المتحدث. المحتوى النموذجي لـ الصينية: :: أكثر أنواع العمل شيوعاً التي نراها هي البرامج الصوتية، والمحاضرات، والمقابلات، والمحتوى الطويل على يوتيوب في الصينية.

إن تسجيل ساعة واحدة يكلف نحو 3000 رمز. و$1 يشتري 750000 رمز، وهو ما يعادل حوالي 250 ساعة من التسجيلات الصوتية مقابل كل دولار. ولا ينفق أغلب المستخدمين أي شيء على الإطلاق ــ فالمجموعة اليومية المجانية تغطي مقاطع قصيرة، ومذكرات صوتية، وبرامج إذاعية لمرة واحدة.

نعم — كل من مستوى القطاع (كل ~ 10-30 ثانية) ومستوى الكلمة الختم الزمني متاح. مستوى الكلمة هو الافتراضي لتصدير VTT / SRT النصوص الفرعية بحيث أن النصوص الفرعية تزامن سطر بسطر. على API وضع timestamps="كلمة" في جسد الطلب. الصينية النصوص المستنسخة تعود في الحروف الأصلية هان (UTF-8) - مبسطة أو تقليدية حسب الصوت المصدر والرمز ISO.

نعم. صوت POST (بيانات متعددة الأجزاء/شكل، اسم الحقل "الملف") إلى /v1/transcribe/ مع language=zh — أو حذف بارامترات اللغة للسماح ل Whisper بالاكتشاف التلقائي. يعيد JSON مع النص، الأجزاء، الختم الزمني، وعلامات المتحدث. المرجع الكامل وقطع من SDK في /api/.

نعم - بمجرد الانتهاء من الترجمة، انقر على ترجمة أو لصق النص في /translate/. الصينية يتوافق مع كل لغة أخرى ندعمها (200+). بالنسبة لمحاضر الاجتماعات، أرسل النص إلى /summarize/؛ بالنسبة للترجمة، أرسله إلى /voice/tts/ لعرض الصوت باللغة المستهدفة.

تم تدريب Whisper على 680K ساعة من الصوت الضجيج في العالم الحقيقي، لذلك الصينية النسخة قوية لضوضاء الخلفية، أسرة الموسيقى، والتسجيلات ذات الجودة الهاتفية.إذا عادت نسخة غير قابلة للاستخدام، يرجى إرسال بريد إلكتروني إلى contact@free.ai مع الملف - سنعيد الرموز وننظر فيما إذا كان محرك مختلف يتعامل مع الصوت بشكل أفضل.

Love this tool? Share it!

تقييم هذه الصفحة