VibeVoice

Free.ai (self-hosted) · tts · ~500 टोकन प्रति clip · 4.3 पासून 3 या विभागातील वापरकर्ता
~500 टोकन प्रति clip

VibeVoice हे a आहे पाठ्य- ते- वक्तव्य आवाजName Microsoft द्वारे बनवलेले आहे. सर्वात जवळील अभियांत्रिकी महाविद्यालय (अकोला) ५. Free.ai GPUs वर स्व-होस्ट - आपल्या दैनंदिन टोकन पूल विरुद्ध मुक्तपणे चालते (500 टोकन प्रति क्लिप). Released under MIT — commercial use permitted on Free.ai.

API द्वारे वापरा
curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"vibevoice","text":"hello world"}'
API दस्तऐवजीकरण API कि प्राप्त करा

वारंवार विचारले जाणारे प्रश्न

VibeVoice भाषांची एक विस्तृत यादी समर्थित करते. सखोल यादी इंजिनवर अवलंबून असते; या पानावरील फॉर्म कोणत्याही पाठ्य स्वीकारतो व इंजिन समर्थित भाषांमध्ये रेंडरिंग करेल. तुम्हाला विशिष्ट भाषा हवी असल्यास पूर्ण बहु-इंजिन निवडक करीता /voice/ पहा.

बहुतेक इंजिन मुलभूतरित्या न्युट्रल- अमेरिकन इंग्रजी व इंग्रजी नसून इतर भाषांसाठी क्षेत्र- योग्य उच्चारण दर्शवितात. प्रीमियम इंजिन उच्चारण रूपे दर्शवू शकतात - तुलना करीता नमुना चिकटवा.

SSML समर्थन इंजिन नुसार बदलते. पॅसेज, प्रोसोडी, व जोर टॅग सर्वात प्रीमियम इंजिन व काही स्वयं- यजमानांवर मानले जातात. सादा पाठ्य नेहमीच कार्य करते - मार्कअपची आवश्यकता नाही.

स्ट्रीमिंग TTS प्रीमियम इंजिनवर /v1/tts/ API endpoint द्वारे stream=true सह उपलब्ध आहे. या पानावरील वेब UI रेंडरिंग पूर्ण झाल्यानंतर संपूर्ण क्लिप परत करतो.

VibeVoice आपल्या स्वतःच्या GPU वर चालते. जनरेशन प्रथम आपल्या दैनंदिन मोफत पूल पासून ड्रॉप करते. एकदा संपल्यावर, मोफत टोकन $5 → 200,000 टोकन पासून सुरू होतात. सुमारे ~5 टोकन प्रति अक्षर, किमान 100 प्रति क्लिप.

वेब UI वर प्रति विनंती 5,000 अक्षरांपर्यंत. लांब भागांसाठी (ऑडिओबुक, पूर्ण अध्याय), /voice/audiobook/ वापरा जे स्वयंचलितपणे तुकडे आणि स्टिच करते, किंवा loop मध्ये API ला कॉल करा.

Yes — POST a list of strings to /v1/tts/batch/, or use the workspace UI at /workspace/ to chain TTS into a longer pipeline (e.g., translate → speak → stitch).

होय — /v1/tts/ वर POST पाठ्य मॉडेल="VibeVoice" (किंवा या पानावरील slug) सह. WAV किंवा MP3 परत करते. पूर्ण संदर्भ + SDK स्निपेट्ससाठी /api/ पहा.

हे पान पाठ्य-आणि-भाषण आहे, आवाज क्लोन नाही - आवाज हे इंजिनचे मुलभूत आहे. आवाज क्लोन करीता (संदर्भ ऑडिओ अपलोड करणे), /voice/clone/ पहा, ज्यास तुम्हाला आवाज अधिकार किंवा स्पष्ट लिखित परवानगी आवश्यक आहे.

स्वयं- होस्ट केलेले इंजिन Free.ai- मालकीचे GPU वर चालविले जाते; आमचे सर्वर सोडून काहीही जात नाही. प्रीमियम इंजिन आमच्या DPA अंतर्गत upstream मॉडेल पुरवठादारांना पाठ्य पाठवतात. आम्ही तुमच्या इनपुटवर प्रशिक्षण देत नाही आणि माहिती विकत घेत नाही.

होय — Free.ai निर्मित ऑडिओचा व्यावसायिक वापर करण्यास परवानगी देते. इंजिनची अंतर्गत परवाना (Apache 2.0, MIT, किंवा विक्रेता नियम) वरील आणि मॉडेल संदर्भ पानावर दर्शविले आहे; याचा अर्थ असा आहे की, आवाज, जाहिरात, पॉडकास्ट, आणि अनुप्रयोग सर्व क्षेत्रात आहेत.

होय — अपयशी कामांना स्त्रोताकडे (दिवसभराचा पूल किंवा मोजलेले टोकन) स्वचलित परतफेड करा. जर परतफेड त्याच दिवशी दिसली नाही तर, contact@free.ai या इमेलवर पाठवा.

Free.ai ला आवडते?

या पानाला गुण द्या