AI Voice — Sesame CSM-1B

الاستخدام التجاري 380+ طراز لا يوجد علامة مائية لا حاجة للتسجيل
النموذج:
+ GPT-5, Claude, Gemini
محرك TTS المستضافة ذاتيا Apache 2.0
Sesame CSM-1B — Sesame CSM-1B — Apache 2.0. Conversational Speech Model designed for low-latency, real-time voice. 24 kHz output, sounds best with a short reference-audio context turn. Self-hosted on Free.ai for the /voice/realtime/ tool.
0 حروف ~ صفر رموز
جداول التكاليف مع عدد الحروف
توليد الكلام...

ماذا يفعل Sesame CSM-1B يبدو مثل؟

Sesame CSM-1B — Apache 2.0. Conversational Speech Model designed for low-latency, real-time voice. 24 kHz output, sounds best with a short reference-audio context turn. Self-hosted on Free.ai for the /voice/realtime/ tool.

حاول المربع أعلاه مع: مرحبا، اسمي سام، وأنا أقرأ هذه العينة لإظهار الصوت. — هذه هي العبارة النموذجية لاختبار ترجمة الصوت إلى لغة.

متى تستخدم Sesame CSM-1B

كتب مسموعة

صيغة طويلة للسرد مع نغمة ثابتة، لصق فصل في كل مرة، تنزيل على WAV أو MP3، وجمع خارجيا.

مقدمات البودكاست

.. ضع حواجز مرورية قصيرة و إعلانات.. عدِّل السرعة لتوفير الطاقة.. و تغير الشكل إلى MP3 للملفات الصغيرة

نظام الاستجابة الهاتفية + البريد الصوتي

تلقّي نداءات من نظام الهاتف، إنتاج عالي الجودة بدون حجز أو تسجيل أو عقد سرّي مع الموهبة الصوتية.

إمكانية الوصول

إضافة محتويات سمعية إلى جانب المحتويات المكتوبة للقراء ذوي الإعاقة البصرية وذوي صعوبة القراءة.

عينة من العبارات

"Welcome to the show, today we are exploring the future of AI."
"Your package has arrived. Please retrieve it from the front desk."
"Once upon a time, in a quiet village far away, lived a curious child."
"Press one for sales, two for support, or stay on the line for an agent."
"Breaking news: scientists have discovered a new species of deep-sea fish."
"Thank you for choosing us. We appreciate your business and look forward to serving you again."

التسعير

يستضيف نفسه على وحدات المعالجة المركزية لدينا. الجيل يستمد من مجمعك اليومي المجاني أولا؛ بمجرد أن تنفد، تبدأ حزم الرموز المدفوعة في $ 5 → 200،000 رموز. تقريبا ~ 5 رموز لكل شخصية، الحد الأدنى 100 لكل مقطع.

المرجع الكامل للنموذج → · انظر جميع الأصوات → · مقارنة صوتين جنبا إلى جنب →

الخيارات المتقدمة
النتيجة
الرموز تنفد Get More Tokens
Want better results? نماذج عالية الجودة (GPT-5, Claude, Gemini) deliver higher quality. View Plans

❤️ Love this tool? Share it!

انضم للحصول على رابط إحالتك وكسب 25,000 رمز لكل صديق.

تريد المزيد؟ انضم مجانا ل 30K الرموز/يوم + 10K مكافأة
انضم مجانا

... معالجة طلبك

Sesame CSM-1B — Apache 2.0. Conversational Speech Model designed for low-latency, real-time voice. 24 kHz output, sounds best with a short reference-audio …

كيف تستخدم AI Voice — Sesame CSM-1B

1
أدخل مدخلك

أدخل نص، أو تحميل ملف، أو وصف ما تريد. لا حساب مطلوب.

2
انقر على إنشاء

الذكاء الاصطناعي لدينا يعالج طلبك في ثوان باستخدام أفضل نماذج المصدر المفتوح.

3
تنزيل وتقاسم

تحميل، نسخ، أو مشاركة نتائجك مجانا للاستخدام الشخصي والتجاري.

استخدام هذه الأداة عن طريق API

أتمتة هذه الأداة من شفرة الخاصة بك. OpenAI-متوافق REST نقطة نهاية، حامل-رمز التوثيق، لا يلزم إضافي SDK. تكاليف الرموز تطابق واجهة شبكة الويب.

curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"text": "Hello from Free.ai", "voice": "af_heart", "model": "kokoro"}'

AI Voice — Sesame CSM-1B — FAQ

Sesame CSM-1B يدعم مجموعة واسعة من اللغات. القائمة الدقيقة تعتمد على المحرك؛ النموذج في هذه الصفحة يقبل أي نص والمحرك سيعرض باللغات المدعومة. انظر /voice/ للحصول على خيار كامل متعدد المحركات إذا كنت بحاجة إلى لغة محددة.

معظم المحركات تقوم بعرض اللغة الإنجليزية الأمريكية المحايدة تلقائيا ولهجة مناسبة للمنطقة بالنسبة للغات غير الإنجليزية.المحركات العالية الجودة قد تكشف عن أشكال مختلفة من اللهجة - لصق عينة للمقارنة.

يختلف دعم SSML حسب المحرك. يتم احترام علامات التوقف، والصوتية، والتأكيد على معظم محركات الدفع العالية وبعض المحركات المستضافة ذاتياً. يعمل النص العادي دائماً - لا توجد علامات مطلوبة.

تدفق TTS متاح على محركات عالية الجودة من خلال نقطة نهاية /v1/tts/ API مع stream=true.

Sesame CSM-1B يعمل على وحدات المعالجة الخاصة بنا. يسحب الجيل من مجمعك اليومي المجاني أولاً. بمجرد استنفادها، تبدأ الرموز المدفوعة من $5 → 200,000 رموز. تقريباً ~5 رموز لكل شخصية، الحد الأدنى 100 لكل مقطع.

يصل طول كل طلب على واجهة المستخدم الشبكية إلى 000 5 حرف. وبالنسبة للقطع الأطول (الكتب السمعية، الفصول الكاملة)، استخدم /voice/audiobook/ الذي يقسم الطلب إلى أجزاء ويجمعها تلقائيا، أو استدعاء برنامج التطبيقات البرمجية في حلقة.

نعم — POST قائمة من السلسلة إلى /v1/tts/batch/، أو استخدام واجهة المستخدم في مساحة العمل في /workspace/ لتسلسل TTS في خط أنابيب أطول (مثلا، ترجمة → تحدث → لصق).

نعم — POST text to /v1/tts/ with model="Sesame CSM-1B" (or the slug on this page). returns WAV or MP3. See /api/ for full reference + SDK snippets.

هذه الصفحة هي نص إلى حديث، وليس استنساخ الصوت - الصوت هو المحرك الافتراضي. للاستنساخ الصوتي (تحميل مرجع صوت)، انظر /voice/clone/، الذي يتطلب منك إما امتلاك حقوق الصوت أو الحصول على موافقة كتابية صريحة.

محركات الاستضافة الذاتية تعمل على وحدات المعالجة المركزية المملوكة لـ Free.ai؛ لا شيء يغادر خوادمنا. محركات الدفع تنقل النص إلى مقدمي النماذج في المرحلة الأولى تحت DPA. نحن لا ندرب على مدخلاتك ولا نبيع البيانات.

نعم — Free.ai يمنح الاستخدام التجاري للصوت المولد. ترخيص المحرك الأساسي (أباتشي 2.0، MIT، أو شروط البائع) يظهر أعلاه وفي الصفحة المرجعية للنموذج؛ في الممارسة العملية، يعني هذا أن الصوتيات، والإعلانات، والبودكاست، والتطبيقات كلها في النطاق.

نعم - الوظائف الفاشلة إعادة تلقائية إلى المصدر (المجمع اليومي أو الرموز المدفوعة). إذا لم يظهر رد في اليوم نفسه، بريد إلكتروني contact@free.ai.

تسجيل مجاني ل 10000 رموز

إنشاء حساب مجاني

لا تلزم بطاقة ائتمان

كيف تقيِّم هذه الأداة؟

4.3/5 from 3 ratings

Love this tool? Share it!