VibeVoice

Free.ai (self-hosted) · tts · ~500 ٹوکنس پر clip · 4.3 سے 3 اس زمرے کے صارفين
~500 ٹوکنس پر clip

VibeVoice a متن سے بولنے والی آواز Microsoft سے بنائی گئی ہے. Long-form audiobooks and multi-speaker podcasts with up to four distinct voices. پر سب سے زیادہ مضبوط. Free.ai GPUs پر خود مہمان — آپ کے روزانہ ٹوکن پول کے خلاف مفت چلتا ہے (500 ٹوکن کلپ). MIT کے تحت آزاد کیا گیا — تجارتی استعمال Free.ai پر اجازت دی گئی.

API کے ذریعے استعمال کریں
curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"vibevoice","text":"hello world"}'
API دستاویزی API کلید حاصل کریں

بار بار پوچھے گئے سوالات

VibeVoice زبانوں کی ایک وسیع رينج کو مدد دے تا هے صحيح فہرست انجن پر منحصر هے اس صفحے پر فارم کو ايک متن قبول کريں اور انجن اسکے مدد دئيے جا نے والی زبانوں ميں رنڈ کريں گا اگر آپ کو خاص زبان جي ضرورت هے تو مکمل ملٹی اينجني پيکر کے ليے /voice/د

اکثر انجنیں امریکن انگریزی کو دیفالٹ کے طور پر اور غیر انگریزی زبانوں کے لئے ایک علاقہ مناسب لہجے کو رلینڈ کرتے ہیں. پرائم انجنز لہجے کے مختلف شکلوں کو ظاہر کر سکتے ہیں - موازنہ کے لئے نمونے کو پسٹ کریں.

SSML کی حمایت مختلف انجنوں کے مطابق مختلف ہوتی ہے. توقف، prosody، اور تاکید ٹیگ زیادہ تر پرائم انجنوں پر اور چند خود مہماندار انجنوں پر قابل احترام ہیں. صاف تحریر ہمیشہ کام کرتا ہے - کوئی مارک اپ کی ضرورت نہیں ہے.

/v1/tts/ API ے کے ذریعے پرائم انجنوں پر /v1/tts/ API ے کے ذریعے دسترس میں ہے stream=true کے ساتھ. اس صفحے پر ویب UI پورے کلیپ کو واپس لاتا ہے جب رنڈنگ ختم ہو جائے.

VibeVoice ہمارے GPUs پر چلتا هے جنيريز آپکے روزانہ مفت پول سے اول دوڑتا هے يک بار ختم ہو جا تا هے ، ادا کيے گئے ٹوکنز $5 سے شروع هے → 200,000 ٹوکنز تقريبا ~5 ٹوکنز پر کر کتر ، کم از کم 100 ٹوکنز پر کلپ

ویب UI پر ہر درخواست پر 5000 حروف تک. طویل حصوں کے لیے (آڈیو بک، پورے فصل)، /voice/audiobook/ استعمال کریں جو خودکار طور پر ٹکڑے اور سٹیچز ہے، یا ایک لوپ میں API کو بلایا جائے.

ہاں - /v1/tts/batch/ پر سٹرنگز کی فہرست پوسٹ کریں، يا /workspace/ پر ورلڈ وائڈ وائڈ UI استعمال کریں TTS کو لمبے پائپ لائن میں جوڑنے کے ليے (مثال ، ترجمہ کريں → بوليں → ستچ کريں)

ہاں - /v1/tts/ پر POST متن موڈل ""VibeVoice" کے ساتھ (یا اس صفحے پر سلگ). WAV يا MP3 واپس کرتا ہے. مکمل حوالے + SDK snippets کے ليے /api/ د

یہ صفحہ متن سے بولنے کا ہے، آواز کلوننگ نہیں ہے - آواز انجن کے ڈیفالٹ ہے آواز کلوننگ کے ليے (اے رفرنس آ ڈیو اپ لوڈ کر نے کے ليے) /voice/clone/کو دیکھيں، جس کے ليے آپ کو آواز کے حق يا تو خود رکھنے يا واضح ليکم اجازت ملنے کی ضرورت هے

خود مہیا کردہ انجن Free.ai-موجود GPUs پر چلتے ہیں؛ کچھ بھی ہمارے سروروں کو نہیں چھوڑتا۔ پرائم انجن ہمارے DPA کے تحت اپسٹریم ماڈل پرو ورڈرز کو متن پہنچاتے ہیں۔ ہم آپ کے ان پٹ پر تربیت نہیں کرتے اور ڈیٹا نہیں بیچتے۔

ہاں - Free.ai پیدا کی گئی اوڈیو کے تجارتی استعمال کو اجازت دیتا ہے. انجن کی بنیادی لائسنس (اپاشی 2.0، ایم آئی ٹی، یا وینڈر کے شرطوں) کو اوپر اور ماڈل حوالہ صفحے پر دکھایا گیا ہے؛ عملی طور پر اس کا مطلب ہے کہ وائٹ اوور، اشتہارات، پوڈکاسٹ اور ایپلیکیشنز سب اسکے دائرے میں ہیں.

ہاں - ناکام کام خودکار طور پر ذريعے کو واپس کر دیے جاتے ہیں (دنوی پول یا ادا کیے گئے ٹوکن). اگر ایک واپسی ایک ہی دن میں نہیں دکھائی دی جاتی تو ای میل contact@free.ai.

Free.ai سے محبت؟ اپنے دوستوں کو بتاؤ۔

اس صفحے کو درجہ دیں