Gemini 3.1 Flash TTS
Google
·
tts
·
~500 குறிகள் clip
·
4.3
இருந்து 3 இந்த வகையின் பயனர்கள்
Gemini 3.1 Flash TTS is a உரையிலிருந்து பேசு குரல் built by Google. வெளி மாதிரிகள் வழியாக வழிநடத்தப்பட்டது — ~500 டாக்கன்கள் ஒவ்வொரு பிடிப்புக்கும் (50% மார்கப் மேலே செலவு).
API மூலம் பயன்படுத்து
OpenAI-க்கு ஏற்ற REST API. ஒரு விசை உருவாக்கவும் இந்த மாதிரியை நொடிகளில் அழைக்கவும்.
curl -X POST https://api.free.ai/v1/tts/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/gemini-3.1-flash-tts","text":"hello world"}'
API ஆவணமாக்கல்
API விசை பெறு
ஒத்த மாதிரிகள்
அடிக்கடி கேட்கப்படும் கேள்விகள்
Gemini 3.1 Flash TTS பல மொழிகளை ஆதரிக்கிறது. சரியான பட்டியல் இயந்திரத்தை பொறுத்து மாறுபடும்; இந்த பக்கத்தில் உள்ள வடிவம் எந்த உரைகளையும் ஏற்றுக்கொள்ளும் மற்றும் இயந்திரம் அதன் ஆதரவு மொழிகளில் காட்டும். உங்களுக்கு குறிப்பிட்ட மொழி தேவைப்பட்டால் முழுமையான பல- இயந்திர தேர்வாளர் / voice / ஐ பார்க்கவும்.
பெரும்பாலான இயந்திரங்கள் முன்னிருப்பாக நடுநிலையான அமெரிக்க ஆங்கிலத்தை காட்டுகின்றன மற்றும் ஆங்கிலமல்லாத மொழிகளுக்கு ஒரு பகுதிக்கு ஏற்ற உச்சரிப்பு. பிரீமியம் இயந்திரங்கள் உச்சரிப்பு மாறுபாடுகளை வெளிப்படுத்தலாம் - ஒப்பிட ஒரு மாதிரியை ஒட்டு.
SSML ஆதரவு இயந்திரம் சார்ந்து மாறுபடும். தற்காலிக நிறுத்தம், வரிவடிவம், மற்றும் உறுதிப்படுத்தல் குறிகள் பெரும்பாலான பிரீமியம் இயந்திரங்களில் மற்றும் சில தனியாக இயங்கும் இயந்திரங்களில் மதிக்கப்படுகின்றன. வெறும் உரை எப்போதும் வேலை செய்கிறது - குறியாக்கம் தேவையில்லை.
/v1/tts/ API endpoint with stream=true மூலம் பிரீமியம் இயந்திரங்களில் டிடிஎஸ் ஒலியை ஒலிக்கச் செய்வது கிடைக்கிறது. இந்த பக்கத்தில் உள்ள வலை UI, ஒலிப்பதிவு முடிந்தவுடன் முழு கிளிப்பையும் திரும்பத் தரும்.
Gemini 3.1 Flash TTS ஒரு சிறந்த TTS இயந்திரம். எழுத்துகளின் எண்ணிக்கையைப் பொறுத்து விலை மாறும் - பொதுவாக ஒவ்வொரு எழுத்துக்கும் ~30 டாக்கன்கள். $1 750,000 டாக்கன்களை வாங்குகிறது, எனவே $5 தொகுப்பு பல்லாயிரக்கணக்கான எழுத்துக்களைக் கொண்டுள்ளது.
வலைத்தள UI யில் ஒவ்வொரு கோரிக்கைக்கும் 5,000 எழுத்துக்கள் வரை. நீண்ட பகுதிகளுக்கு (ஒலி புத்தகங்கள், முழு அத்தியாயங்கள்), /voice/audiobook/ ஐ பயன்படுத்தவும், இது தானாகவே துண்டுகள் மற்றும் தையல்களை உருவாக்கும் அல்லது API ஐ ஒரு சுழலில் அழைக்கவும்.
ஆம் — /v1/tts/batch/ க்கு சரங்களின் பட்டியலை POST செய்யவும், அல்லது /workspace/ இல் உள்ள பணிப்பகுதி UI ஐ பயன்படுத்தி TTS ஐ நீண்ட குழாய் வழியாக இணைக்கவும் (உதாரணமாக, translate → speak → stitch).
ஆம் — POST உரை / v1/ tts / with model=" Gemini 3.1 Flash TTS" (அல்லது இந்த பக்கத்தில் உள்ள slug). WAV அல்லது MP3 திரும்பும். முழுமையான குறிப்பு + SDK சின்னங்களுக்கு / api / பார்க்கவும்.
இந்த பக்கம் உரையிலிருந்து பேசு, குரல் ஒத்தமைப்பு அல்ல - குரல் இயந்திரத்தின் முன்னிருப்பு. குரல் ஒத்தமைப்பு (ஒரு குறிப்பு ஒலியை ஏற்றுதல்) க்கு, /voice/clone/ பார்க்கவும், இது உங்களுக்கு குரல் உரிமைகளை வைத்திருக்க வேண்டும் அல்லது தெளிவான எழுத்து அனுமதியைக் கொண்டிருக்க வேண்டும்.
Free.ai- க்கு சொந்தமான GPUs களில் இயங்கும் தனித்தனியே நிறுவப்பட்ட இயந்திரங்கள்; எங்கள் சேவையகங்களை விட்டு எதுவும் வெளியேறாது. பிரீமியம் இயந்திரங்கள் உரைகளை எங்கள் DPA கீழ் உள்ள உற்பத்தியாளர்களுக்கு அனுப்புகின்றன. நாங்கள் உங்கள் உள்ளீடுகளை பயிற்சி செய்யவில்லை மற்றும் தரவை விற்கவில்லை.
ஆம் — Free.ai உருவாக்கப்பட்ட ஒலியை வர்த்தக ரீதியாக பயன்படுத்த அனுமதிக்கிறது. இயந்திரத்தின் அடிப்படை உரிமம் (அபாச்சி 2.0, MIT, அல்லது விற்பனையாளரின் விதிமுறைகள்) மேலேயும் மாதிரி குறிப்பு பக்கத்திலும் காட்டப்பட்டுள்ளது; இது செயல்படுத்துவதில் குரல், விளம்பரங்கள், போட்காஸ்ட்கள் மற்றும் பயன்பாடுகள் அனைத்தும் உள்ளடக்கத்தில் உள்ளன.
ஆம் - தோல்வியடைந்த பணிகள் மூலத்திற்கு தானாக திரும்ப வழங்கப்படும் (தினசரி தொகுப்பு அல்லது செலுத்தப்பட்ட டாக்கன்கள்). அதே நாளில் திரும்ப வழங்கப்படவில்லை என்றால், contact@free.ai மின்னஞ்சல் அனுப்பவும்.