CosyVoice 2

Free.ai (self-hosted) · tts · ~500 குறிகள் clip · 4.3 இருந்து 3 இந்த வகையின் பயனர்கள்
~500 குறிகள் clip

CosyVoice 2 is a உரையிலிருந்து பேசு குரல் built by Alibaba FunAudioLLM. Low-latency streaming TTS, cross-lingual voice cloning, real-time voice. இல் மிகவும் வலிமையானது. Free.ai GPUs களில் தனியாக நிறுவப்பட்டது — உங்கள் தினசரி டாக்கன் பல்லுடன் (500 டாக்கன்கள் ஒவ்வொரு பிடிப்புக்கும்) இலவசமாக இயங்குகிறது. Apache 2.0 கீழ் வெளியிடப்பட்டது — வணிக பயன்பாட்டிற்கு Free.ai இல் அனுமதிக்கப்பட்டது.

API மூலம் பயன்படுத்து
curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"cosyvoice2","text":"hello world"}'
API ஆவணமாக்கல் API விசை பெறு

அடிக்கடி கேட்கப்படும் கேள்விகள்

CosyVoice 2 பல மொழிகளை ஆதரிக்கிறது. சரியான பட்டியல் இயந்திரத்தை பொறுத்து மாறுபடும்; இந்த பக்கத்தில் உள்ள வடிவம் எந்த உரைகளையும் ஏற்றுக்கொள்ளும் மற்றும் இயந்திரம் அதன் ஆதரவு மொழிகளில் காட்டும். உங்களுக்கு குறிப்பிட்ட மொழி தேவைப்பட்டால் முழுமையான பல- இயந்திர தேர்வாளர் / voice / ஐ பார்க்கவும்.

பெரும்பாலான இயந்திரங்கள் முன்னிருப்பாக நடுநிலையான அமெரிக்க ஆங்கிலத்தை காட்டுகின்றன மற்றும் ஆங்கிலமல்லாத மொழிகளுக்கு ஒரு பகுதிக்கு ஏற்ற உச்சரிப்பு. பிரீமியம் இயந்திரங்கள் உச்சரிப்பு மாறுபாடுகளை வெளிப்படுத்தலாம் - ஒப்பிட ஒரு மாதிரியை ஒட்டு.

SSML ஆதரவு இயந்திரம் சார்ந்து மாறுபடும். தற்காலிக நிறுத்தம், வரிவடிவம், மற்றும் உறுதிப்படுத்தல் குறிகள் பெரும்பாலான பிரீமியம் இயந்திரங்களில் மற்றும் சில தனியாக இயங்கும் இயந்திரங்களில் மதிக்கப்படுகின்றன. வெறும் உரை எப்போதும் வேலை செய்கிறது - குறியாக்கம் தேவையில்லை.

/v1/tts/ API endpoint with stream=true மூலம் பிரீமியம் இயந்திரங்களில் டிடிஎஸ் ஒலியை ஒலிக்கச் செய்வது கிடைக்கிறது. இந்த பக்கத்தில் உள்ள வலை UI, ஒலிப்பதிவு முடிந்தவுடன் முழு கிளிப்பையும் திரும்பத் தரும்.

CosyVoice 2 நம்முடைய GPUs களில் இயங்குகிறது. உங்கள் தினசரி இலவச பந்தலில் இருந்து முதலில் உருவாக்கப்படுகிறது. ஒருமுறை முடிந்தவுடன், செலுத்தப்பட்ட டாக்கன்கள் $5 → 200,000 டாக்கன்களில் தொடங்குகின்றன. ஒவ்வொரு எழுத்துக்கும் சுமார் ~5 டாக்கன்கள், ஒவ்வொரு கிளிப்பிற்கும் குறைந்தபட்சம் 100.

வலைத்தள UI யில் ஒவ்வொரு கோரிக்கைக்கும் 5,000 எழுத்துக்கள் வரை. நீண்ட பகுதிகளுக்கு (ஒலி புத்தகங்கள், முழு அத்தியாயங்கள்), /voice/audiobook/ ஐ பயன்படுத்தவும், இது தானாகவே துண்டுகள் மற்றும் தையல்களை உருவாக்கும் அல்லது API ஐ ஒரு சுழலில் அழைக்கவும்.

ஆம் — /v1/tts/batch/ க்கு சரங்களின் பட்டியலை POST செய்யவும், அல்லது /workspace/ இல் உள்ள பணிப்பகுதி UI ஐ பயன்படுத்தி TTS ஐ நீண்ட குழாய் வழியாக இணைக்கவும் (உதாரணமாக, translate → speak → stitch).

ஆம் — POST உரை / v1/ tts / with model=" CosyVoice 2" (அல்லது இந்த பக்கத்தில் உள்ள slug). WAV அல்லது MP3 திரும்பும். முழுமையான குறிப்பு + SDK சின்னங்களுக்கு / api / பார்க்கவும்.

இந்த பக்கம் உரையிலிருந்து பேசு, குரல் ஒத்தமைப்பு அல்ல - குரல் இயந்திரத்தின் முன்னிருப்பு. குரல் ஒத்தமைப்பு (ஒரு குறிப்பு ஒலியை ஏற்றுதல்) க்கு, /voice/clone/ பார்க்கவும், இது உங்களுக்கு குரல் உரிமைகளை வைத்திருக்க வேண்டும் அல்லது தெளிவான எழுத்து அனுமதியைக் கொண்டிருக்க வேண்டும்.

Free.ai- க்கு சொந்தமான GPUs களில் இயங்கும் தனித்தனியே நிறுவப்பட்ட இயந்திரங்கள்; எங்கள் சேவையகங்களை விட்டு எதுவும் வெளியேறாது. பிரீமியம் இயந்திரங்கள் உரைகளை எங்கள் DPA கீழ் உள்ள உற்பத்தியாளர்களுக்கு அனுப்புகின்றன. நாங்கள் உங்கள் உள்ளீடுகளை பயிற்சி செய்யவில்லை மற்றும் தரவை விற்கவில்லை.

ஆம் — Free.ai உருவாக்கப்பட்ட ஒலியை வர்த்தக ரீதியாக பயன்படுத்த அனுமதிக்கிறது. இயந்திரத்தின் அடிப்படை உரிமம் (அபாச்சி 2.0, MIT, அல்லது விற்பனையாளரின் விதிமுறைகள்) மேலேயும் மாதிரி குறிப்பு பக்கத்திலும் காட்டப்பட்டுள்ளது; இது செயல்படுத்துவதில் குரல், விளம்பரங்கள், போட்காஸ்ட்கள் மற்றும் பயன்பாடுகள் அனைத்தும் உள்ளடக்கத்தில் உள்ளன.

ஆம் - தோல்வியடைந்த பணிகள் மூலத்திற்கு தானாக திரும்ப வழங்கப்படும் (தினசரி தொகுப்பு அல்லது செலுத்தப்பட்ட டாக்கன்கள்). அதே நாளில் திரும்ப வழங்கப்படவில்லை என்றால், contact@free.ai மின்னஞ்சல் அனுப்பவும்.

Free.ai ஐ நேசிக்கிறீர்களா?

இந்த பக்கத்தை மதிப்பீடு செய்