VibeVoice

Free.ai (self-hosted) · tts · ~500 குறிகள் clip · 4.3 இருந்து 3 இந்த வகையின் பயனர்கள்
~500 குறிகள் clip

VibeVoice is a உரையிலிருந்து பேசு குரல் built by Microsoft. Long-form audiobooks and multi-speaker podcasts with up to four distinct voices. இல் மிகவும் வலிமையானது. Free.ai GPUs களில் தனியாக நிறுவப்பட்டது — உங்கள் தினசரி டாக்கன் பல்லுடன் (500 டாக்கன்கள் ஒவ்வொரு பிடிப்புக்கும்) இலவசமாக இயங்குகிறது. MIT கீழ் வெளியிடப்பட்டது — வணிக பயன்பாட்டிற்கு Free.ai இல் அனுமதிக்கப்பட்டது.

API மூலம் பயன்படுத்து
curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"vibevoice","text":"hello world"}'
API ஆவணமாக்கல் API விசை பெறு

அடிக்கடி கேட்கப்படும் கேள்விகள்

VibeVoice பல மொழிகளை ஆதரிக்கிறது. சரியான பட்டியல் இயந்திரத்தை பொறுத்து மாறுபடும்; இந்த பக்கத்தில் உள்ள வடிவம் எந்த உரைகளையும் ஏற்றுக்கொள்ளும் மற்றும் இயந்திரம் அதன் ஆதரவு மொழிகளில் காட்டும். உங்களுக்கு குறிப்பிட்ட மொழி தேவைப்பட்டால் முழுமையான பல- இயந்திர தேர்வாளர் / voice / ஐ பார்க்கவும்.

பெரும்பாலான இயந்திரங்கள் முன்னிருப்பாக நடுநிலையான அமெரிக்க ஆங்கிலத்தை காட்டுகின்றன மற்றும் ஆங்கிலமல்லாத மொழிகளுக்கு ஒரு பகுதிக்கு ஏற்ற உச்சரிப்பு. பிரீமியம் இயந்திரங்கள் உச்சரிப்பு மாறுபாடுகளை வெளிப்படுத்தலாம் - ஒப்பிட ஒரு மாதிரியை ஒட்டு.

SSML ஆதரவு இயந்திரம் சார்ந்து மாறுபடும். தற்காலிக நிறுத்தம், வரிவடிவம், மற்றும் உறுதிப்படுத்தல் குறிகள் பெரும்பாலான பிரீமியம் இயந்திரங்களில் மற்றும் சில தனியாக இயங்கும் இயந்திரங்களில் மதிக்கப்படுகின்றன. வெறும் உரை எப்போதும் வேலை செய்கிறது - குறியாக்கம் தேவையில்லை.

/v1/tts/ API endpoint with stream=true மூலம் பிரீமியம் இயந்திரங்களில் டிடிஎஸ் ஒலியை ஒலிக்கச் செய்வது கிடைக்கிறது. இந்த பக்கத்தில் உள்ள வலை UI, ஒலிப்பதிவு முடிந்தவுடன் முழு கிளிப்பையும் திரும்பத் தரும்.

VibeVoice நம்முடைய GPUs களில் இயங்குகிறது. உங்கள் தினசரி இலவச பந்தலில் இருந்து முதலில் உருவாக்கப்படுகிறது. ஒருமுறை முடிந்தவுடன், செலுத்தப்பட்ட டாக்கன்கள் $5 → 200,000 டாக்கன்களில் தொடங்குகின்றன. ஒவ்வொரு எழுத்துக்கும் சுமார் ~5 டாக்கன்கள், ஒவ்வொரு கிளிப்பிற்கும் குறைந்தபட்சம் 100.

வலைத்தள UI யில் ஒவ்வொரு கோரிக்கைக்கும் 5,000 எழுத்துக்கள் வரை. நீண்ட பகுதிகளுக்கு (ஒலி புத்தகங்கள், முழு அத்தியாயங்கள்), /voice/audiobook/ ஐ பயன்படுத்தவும், இது தானாகவே துண்டுகள் மற்றும் தையல்களை உருவாக்கும் அல்லது API ஐ ஒரு சுழலில் அழைக்கவும்.

ஆம் — /v1/tts/batch/ க்கு சரங்களின் பட்டியலை POST செய்யவும், அல்லது /workspace/ இல் உள்ள பணிப்பகுதி UI ஐ பயன்படுத்தி TTS ஐ நீண்ட குழாய் வழியாக இணைக்கவும் (உதாரணமாக, translate → speak → stitch).

ஆம் — POST உரை / v1/ tts / with model=" VibeVoice" (அல்லது இந்த பக்கத்தில் உள்ள slug). WAV அல்லது MP3 திரும்பும். முழுமையான குறிப்பு + SDK சின்னங்களுக்கு / api / பார்க்கவும்.

இந்த பக்கம் உரையிலிருந்து பேசு, குரல் ஒத்தமைப்பு அல்ல - குரல் இயந்திரத்தின் முன்னிருப்பு. குரல் ஒத்தமைப்பு (ஒரு குறிப்பு ஒலியை ஏற்றுதல்) க்கு, /voice/clone/ பார்க்கவும், இது உங்களுக்கு குரல் உரிமைகளை வைத்திருக்க வேண்டும் அல்லது தெளிவான எழுத்து அனுமதியைக் கொண்டிருக்க வேண்டும்.

Free.ai- க்கு சொந்தமான GPUs களில் இயங்கும் தனித்தனியே நிறுவப்பட்ட இயந்திரங்கள்; எங்கள் சேவையகங்களை விட்டு எதுவும் வெளியேறாது. பிரீமியம் இயந்திரங்கள் உரைகளை எங்கள் DPA கீழ் உள்ள உற்பத்தியாளர்களுக்கு அனுப்புகின்றன. நாங்கள் உங்கள் உள்ளீடுகளை பயிற்சி செய்யவில்லை மற்றும் தரவை விற்கவில்லை.

ஆம் — Free.ai உருவாக்கப்பட்ட ஒலியை வர்த்தக ரீதியாக பயன்படுத்த அனுமதிக்கிறது. இயந்திரத்தின் அடிப்படை உரிமம் (அபாச்சி 2.0, MIT, அல்லது விற்பனையாளரின் விதிமுறைகள்) மேலேயும் மாதிரி குறிப்பு பக்கத்திலும் காட்டப்பட்டுள்ளது; இது செயல்படுத்துவதில் குரல், விளம்பரங்கள், போட்காஸ்ட்கள் மற்றும் பயன்பாடுகள் அனைத்தும் உள்ளடக்கத்தில் உள்ளன.

ஆம் - தோல்வியடைந்த பணிகள் மூலத்திற்கு தானாக திரும்ப வழங்கப்படும் (தினசரி தொகுப்பு அல்லது செலுத்தப்பட்ட டாக்கன்கள்). அதே நாளில் திரும்ப வழங்கப்படவில்லை என்றால், contact@free.ai மின்னஞ்சல் அனுப்பவும்.

Free.ai ஐ நேசிக்கிறீர்களா?

இந்த பக்கத்தை மதிப்பீடு செய்