Kokoro

Free.ai (self-hosted) · tts · ~500 குறிகள் clip · 4.3 இருந்து 3 இந்த வகையின் பயனர்கள்
~500 குறிகள் clip

Kokoro is a உரையிலிருந்து பேசு குரல் built by Hexgrad. Fast, natural speech இல் மிகவும் வலிமையானது. Free.ai GPUs களில் தனியாக நிறுவப்பட்டது — உங்கள் தினசரி டாக்கன் பல்லுடன் (500 டாக்கன்கள் ஒவ்வொரு பிடிப்புக்கும்) இலவசமாக இயங்குகிறது. Apache 2.0 கீழ் வெளியிடப்பட்டது — வணிக பயன்பாட்டிற்கு Free.ai இல் அனுமதிக்கப்பட்டது.

API மூலம் பயன்படுத்து

OpenAI-க்கு ஏற்ற REST API. ஒரு விசை உருவாக்கவும் இந்த மாதிரியை நொடிகளில் அழைக்கவும்.

curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"kokoro","text":"hello world"}'
API ஆவணமாக்கல் API விசை பெறு

அடிக்கடி கேட்கப்படும் கேள்விகள்

Kokoro பல மொழிகளை ஆதரிக்கிறது. சரியான பட்டியல் இயந்திரத்தை பொறுத்து மாறுபடும்; இந்த பக்கத்தில் உள்ள வடிவம் எந்த உரைகளையும் ஏற்றுக்கொள்ளும் மற்றும் இயந்திரம் அதன் ஆதரவு மொழிகளில் காட்டும். உங்களுக்கு குறிப்பிட்ட மொழி தேவைப்பட்டால் முழுமையான பல- இயந்திர தேர்வாளர் / voice / ஐ பார்க்கவும்.

பெரும்பாலான இயந்திரங்கள் முன்னிருப்பாக நடுநிலையான அமெரிக்க ஆங்கிலத்தை காட்டுகின்றன மற்றும் ஆங்கிலமல்லாத மொழிகளுக்கு ஒரு பகுதிக்கு ஏற்ற உச்சரிப்பு. பிரீமியம் இயந்திரங்கள் உச்சரிப்பு மாறுபாடுகளை வெளிப்படுத்தலாம் - ஒப்பிட ஒரு மாதிரியை ஒட்டு.

SSML ஆதரவு இயந்திரம் சார்ந்து மாறுபடும். தற்காலிக நிறுத்தம், வரிவடிவம், மற்றும் உறுதிப்படுத்தல் குறிகள் பெரும்பாலான பிரீமியம் இயந்திரங்களில் மற்றும் சில தனியாக இயங்கும் இயந்திரங்களில் மதிக்கப்படுகின்றன. வெறும் உரை எப்போதும் வேலை செய்கிறது - குறியாக்கம் தேவையில்லை.

/v1/tts/ API endpoint with stream=true மூலம் பிரீமியம் இயந்திரங்களில் டிடிஎஸ் ஒலியை ஒலிக்கச் செய்வது கிடைக்கிறது. இந்த பக்கத்தில் உள்ள வலை UI, ஒலிப்பதிவு முடிந்தவுடன் முழு கிளிப்பையும் திரும்பத் தரும்.

Kokoro நம்முடைய GPUs களில் இயங்குகிறது. உங்கள் தினசரி இலவச பந்தலில் இருந்து முதலில் உருவாக்கப்படுகிறது. ஒருமுறை முடிந்தவுடன், செலுத்தப்பட்ட டாக்கன்கள் $5 → 200,000 டாக்கன்களில் தொடங்குகின்றன. ஒவ்வொரு எழுத்துக்கும் சுமார் ~5 டாக்கன்கள், ஒவ்வொரு கிளிப்பிற்கும் குறைந்தபட்சம் 100.

வலைத்தள UI யில் ஒவ்வொரு கோரிக்கைக்கும் 5,000 எழுத்துக்கள் வரை. நீண்ட பகுதிகளுக்கு (ஒலி புத்தகங்கள், முழு அத்தியாயங்கள்), /voice/audiobook/ ஐ பயன்படுத்தவும், இது தானாகவே துண்டுகள் மற்றும் தையல்களை உருவாக்கும் அல்லது API ஐ ஒரு சுழலில் அழைக்கவும்.

ஆம் — /v1/tts/batch/ க்கு சரங்களின் பட்டியலை POST செய்யவும், அல்லது /workspace/ இல் உள்ள பணிப்பகுதி UI ஐ பயன்படுத்தி TTS ஐ நீண்ட குழாய் வழியாக இணைக்கவும் (உதாரணமாக, translate → speak → stitch).

ஆம் — POST உரை / v1/ tts / with model=" Kokoro" (அல்லது இந்த பக்கத்தில் உள்ள slug). WAV அல்லது MP3 திரும்பும். முழுமையான குறிப்பு + SDK சின்னங்களுக்கு / api / பார்க்கவும்.

இந்த பக்கம் உரையிலிருந்து பேசு, குரல் ஒத்தமைப்பு அல்ல - குரல் இயந்திரத்தின் முன்னிருப்பு. குரல் ஒத்தமைப்பு (ஒரு குறிப்பு ஒலியை ஏற்றுதல்) க்கு, /voice/clone/ பார்க்கவும், இது உங்களுக்கு குரல் உரிமைகளை வைத்திருக்க வேண்டும் அல்லது தெளிவான எழுத்து அனுமதியைக் கொண்டிருக்க வேண்டும்.

Free.ai- க்கு சொந்தமான GPUs களில் இயங்கும் தனித்தனியே நிறுவப்பட்ட இயந்திரங்கள்; எங்கள் சேவையகங்களை விட்டு எதுவும் வெளியேறாது. பிரீமியம் இயந்திரங்கள் உரைகளை எங்கள் DPA கீழ் உள்ள உற்பத்தியாளர்களுக்கு அனுப்புகின்றன. நாங்கள் உங்கள் உள்ளீடுகளை பயிற்சி செய்யவில்லை மற்றும் தரவை விற்கவில்லை.

ஆம் — Free.ai உருவாக்கப்பட்ட ஒலியை வர்த்தக ரீதியாக பயன்படுத்த அனுமதிக்கிறது. இயந்திரத்தின் அடிப்படை உரிமம் (அபாச்சி 2.0, MIT, அல்லது விற்பனையாளரின் விதிமுறைகள்) மேலேயும் மாதிரி குறிப்பு பக்கத்திலும் காட்டப்பட்டுள்ளது; இது செயல்படுத்துவதில் குரல், விளம்பரங்கள், போட்காஸ்ட்கள் மற்றும் பயன்பாடுகள் அனைத்தும் உள்ளடக்கத்தில் உள்ளன.

ஆம் - தோல்வியடைந்த பணிகள் மூலத்திற்கு தானாக திரும்ப வழங்கப்படும் (தினசரி தொகுப்பு அல்லது செலுத்தப்பட்ட டாக்கன்கள்). அதே நாளில் திரும்ப வழங்கப்படவில்லை என்றால், contact@free.ai மின்னஞ்சல் அனுப்பவும்.

Free.ai ஐ நேசிக்கிறீர்களா?

இந்த பக்கத்தை மதிப்பீடு செய்