Gemini 3.1 Flash TTS
Google
·
tts
·
~500 ਟੋਕਨਾਂ ਪ੍ਰਤੀ clip
·
4.3
ਤੋਂ 3 ਇਸ ਕੈਟਾਗਰੀ ਦੇ ਉਪਭੋਗਤਾ
Gemini 3.1 Flash TTS a ਪਾਠ- ਤੋਂ- ਬੋਲੀ ਆਵਾਜ਼ ਹੈ, ਜੋ ਕਿ Google ਨੇ ਬਣਾਇਆ ਹੈ । ਬਾਹਰੀ ਮਾਡਲਾਂ ਰਾਹੀਂ ਰੂਟ ਕੀਤਾ — ~500 ਟੋਕਨ ਪ੍ਰਤੀ ਕਲਿੱਪ (ਅੱਪਸਟਰੀਮ ਲਾਗਤ ਤੋਂ 50% ਮਾਰਕਅਪ)
API ਰਾਹੀਂ ਵਰਤੋਂ
OpenAI- ਅਨੁਕੂਲ REST API। ਇੱਕ ਕੁੰਜੀ ਬਣਾਓ ਅਤੇ ਇਸ ਮਾਡਲ ਨੂੰ ਸਕਿੰਟਾਂ ਵਿੱਚ ਕਾਲ ਕਰੋ।
curl -X POST https://api.free.ai/v1/tts/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/gemini-3.1-flash-tts","text":"hello world"}'
API ਡੌਕੂਮੈਂਟੇਸ਼ਨ
API ਕੁੰਜੀ ਲਵੋ
ਇਸੇ ਤਰ੍ਹਾਂ ਦੇ ਮਾਡਲ
ਅਕਸਰ ਪੁੱਛੇ ਜਾਂਦੇ ਸਵਾਲ
Gemini 3.1 Flash TTS ਭਾਸ਼ਾਵਾਂ ਦੀ ਇੱਕ ਵਿਸ਼ਾਲ ਲੜੀ ਲਈ ਸਹਾਇਕ ਹੈ। ਸਹੀ ਲਿਸਟ ਇੰਜਣ ਉੱਤੇ ਨਿਰਭਰ ਕਰਦੀ ਹੈ; ਇਸ ਸਫ਼ੇ ਉੱਤੇ ਫਾਰਮ ਕਿਸੇ ਵੀ ਪਾਠ ਨੂੰ ਸਵੀਕਾਰ ਕਰੇਗਾ ਅਤੇ ਇੰਜਣ ਸਹਾਇਕ ਭਾਸ਼ਾਵਾਂ ਵਿੱਚ ਪੇਸ਼ ਕਰੇਗਾ। ਪੂਰੀ ਮਲਟੀ-ਇੰਜਣ ਚੋਣਕਾਰ ਲਈ /voice/ ਵੇਖੋ, ਜੇਕਰ ਤੁਹਾਨੂੰ ਕੋਈ ਖਾਸ ਭਾਸ਼ਾ ਦੀ ਲੋੜ ਹੈ।
ਬਹੁਤੇ ਇੰਜਣ ਡਿਫਾਲਟ ਤੌਰ ਉੱਤੇ ਨਿਊਟਰਲ ਅਮਰੀਕੀ ਅੰਗਰੇਜ਼ੀ ਅਤੇ ਗੈਰ- ਅੰਗਰੇਜ਼ੀ ਭਾਸ਼ਾਵਾਂ ਲਈ ਖੇਤਰ- ਅਨੁਕੂਲ ਇਕਸਟੈਨਸ਼ਨ ਪੇਸ਼ ਕਰਦੇ ਹਨ । ਪ੍ਰੀਮੀਅਮ ਇੰਜਣ ਇਕਸਟੈਨਸ਼ਨ ਵੇਰੀਏਬਲ ਪੇਸ਼ ਕਰ ਸਕਦੇ ਹਨ — ਤੁਲਨਾ ਲਈ ਇੱਕ ਨਮੂਨਾ ਚੇਪੋ ।
SSML ਸਹਿਯੋਗ ਇੰਜਣ ਦੇ ਅਧਾਰ ਤੇ ਵੱਖਰਾ ਹੁੰਦਾ ਹੈ । ਵਿਰਾਮ, ਪਰੋਸੌਡੀ ਅਤੇ ਉਭਾਰ ਟੈਗ ਬਹੁਤੇ ਪ੍ਰੀਮੀਅਮ ਇੰਜਣਾਂ ਤੇ ਕੁਝ ਸਵੈ- ਹੋਸਟ ਕੀਤੇ ਟੈਗਾਂ ਉੱਤੇ ਵਰਤੇ ਜਾਂਦੇ ਹਨ । ਸਾਦਾ ਟੈਕਸਟ ਹਮੇਸ਼ਾ ਕੰਮ ਕਰਦਾ ਹੈ — ਕੋਈ ਮਾਰਕਅਪ ਲੋੜੀਦਾ ਨਹੀਂ ਹੈ ।
ਸਟਰੀਮਿੰਗ TTS ਪ੍ਰੀਮੀਅਮ ਇੰਜਣਾਂ ਉੱਤੇ /v1/tts/ API ਅੰਤ- ਬਿੰਦੂ ਨਾਲ stream=true ਨਾਲ ਉਪਲੱਬਧ ਹੈ। ਇਸ ਸਫ਼ੇ ਉੱਤੇ ਵੈਬ UI ਇੱਕ ਵਾਰ ਰਿਡਰਿੰਗ ਮੁਕੰਮਲ ਹੋਣ ਉੱਤੇ ਪੂਰਾ ਕਲਿੱਪ ਮੁੜ- ਭੇਜਦਾ ਹੈ।
Gemini 3.1 Flash TTS ਇੱਕ ਪ੍ਰੀਮੀਅਮ TTS ਇੰਜਣ ਹੈ। ਕੀਮਤ ਅੱਖਰ ਗਿਣਤੀ ਨਾਲ ਬਦਲਦੀ ਹੈ - ਆਮ ਤੌਰ ਤੇ ਹਰ ਅੱਖਰ ਲਈ ~30 ਟੋਕਨ ਹਨ। $1 ਨੇ 750,000 ਟੋਕਨ ਖਰੀਦੇ ਹਨ, ਇਸ ਲਈ $5 ਪੈਕ ਅੱਖਰ ਦੇ ਹਜ਼ਾਰਾਂ ਨੂੰ ਕਵਰ ਕਰਦਾ ਹੈ।
ਵੈਬ UI ਉੱਤੇ ਪ੍ਰਤੀ ਬੇਨਤੀ 5,000 ਅੱਖਰ ਤੱਕ ਹਨ। ਲੰਬੇ ਟੁਕੜਿਆਂ (ਆਡੀਓਬੁੱਕਾਂ, ਪੂਰੇ ਭਾਗਾਂ) ਲਈ /voice/audiobook/ ਵਰਤੋਂ, ਜੋ ਕਿ ਆਟੋਮੈਟਿਕ ਹੀ ਟੁਕੜਿਆਂ ਵਿੱਚ ਵੰਡਦਾ ਹੈ ਜਾਂ ਲੂਪ ਵਿੱਚ API ਨੂੰ ਕਾਲ ਕਰਦਾ ਹੈ।
ਹਾਂ — /v1/tts/batch/ ਨੂੰ ਸਤਰ ਦੀ ਲਿਸਟ POST ਕਰੋ, ਜਾਂ /workspace/ ਉੱਤੇ ਵਰਕਸਪੇਸ UI ਦੀ ਵਰਤੋਂ ਕਰੋ, ਤਾਂ ਕਿ TTS ਨੂੰ ਲੰਬੇ ਪਾਈਪਲਾਈਨ ਵਿੱਚ ਚੈਨਲ ਕੀਤਾ ਜਾ ਸਕੇ (ਜਿਵੇਂ ਕਿ, translate → speak → stitch) ।
ਹਾਂ — /v1/tts/ ਨੂੰ POST ਟੈਕਸਟ ਨਾਲ model="Gemini 3.1 Flash TTS" (ਜਾਂ ਇਸ ਸਫ਼ੇ ਉੱਤੇ slug) ਨਾਲ ਭੇਜੋ । WAV ਜਾਂ MP3 ਵਾਪਸ ਮਿਲੇਗਾ । ਪੂਰੇ ਹਵਾਲੇ + SDK ਨਿਸ਼ਾਨ ਲਈ /api/ ਵੇਖੋ ।
ਇਹ ਪੇਜ਼ ਪਾਠ-ਤੋਂ-ਭਾਸ਼ਾ ਹੈ, ਬੋਲੀ ਕਲੋਨਿੰਗ ਨਹੀਂ ਹੈ - ਬੋਲੀ ਇੰਜਣ ਦਾ ਡਿਫਾਲਟ ਹੈ। ਬੋਲੀ ਕਲੋਨਿੰਗ (ਰੁਪਏ ਆਡੀਓ ਅੱਪਲੋਡ ਕਰਨ ਲਈ) ਲਈ /voice/clone/ ਵੇਖੋ, ਜਿਸ ਲਈ ਤੁਹਾਨੂੰ ਬੋਲੀ ਅਧਿਕਾਰ ਹੋਣ ਜਾਂ ਸਪੱਸ਼ਟ ਲਿਖਤੀ ਮਨਜ਼ੂਰੀ ਹੋਣ ਦੀ ਲੋੜ ਹੈ।
ਸੇਲਫ- ਹੋਸਟਡ ਇੰਜਣ Free.ai- ਮਾਲਕ GPUs ਉੱਤੇ ਚੱਲਦੇ ਹਨ; ਸਾਡੇ ਸਰਵਰਾਂ ਤੋਂ ਕੁਝ ਵੀ ਨਹੀਂ ਜਾਂਦਾ ਹੈ । ਪ੍ਰੀਮੀਅਮ ਇੰਜਣ ਸਾਡੇ DPA ਅਧੀਨ ਟੈਕਸਟ ਨੂੰ ਉੱਪਰਲੇ ਮਾਡਲ ਪਰੋਵਾਈਡਰਾਂ ਨੂੰ ਭੇਜਦੇ ਹਨ । ਅਸੀਂ ਤੁਹਾਡੇ ਇੰਪੁੱਟ ਉੱਤੇ ਟਰੇਨਿੰਗ ਨਹੀਂ ਦਿੰਦੇ ਅਤੇ ਡਾਟਾ ਨਹੀਂ ਵੇਚਦੇ ।
ਹਾਂ — Free.ai ਬਣਾਈ ਆਡੀਓ ਲਈ ਵਪਾਰਕ ਵਰਤੋਂ ਲਈ ਮਨਜ਼ੂਰ ਹੈ। ਇੰਜਣ ਦਾ ਹੇਠਲਾ ਲਾਈਸੈਂਸ (ਅਪਾਚੀ 2.0, MIT, ਜਾਂ ਵਿਕਰੇਤਾ ਸ਼ਰਤਾਂ) ਉੱਤੇ ਅਤੇ ਮਾਡਲ ਹਵਾਲਾ ਪੇਜ਼ ਉੱਤੇ ਵੇਖਾਇਆ ਗਿਆ ਹੈ; ਪਰਿਭਾਸ਼ਾ ਵਿੱਚ ਇਸ ਦਾ ਮਤਲਬ ਹੈ ਕਿ ਬੋਲੀ, ਐਡ, ਪੋਡਕਾਸਟ ਅਤੇ ਐਪਲੀਕੇਸ਼ਨ ਸਭ ਇਸ ਦੇ ਢਾਂਚੇ ਵਿੱਚ ਹਨ।
ਹਾਂ — ਫੇਲ੍ਹ ਕੰਮ ਨੂੰ ਸਰੋਤ (ਦਿਨਵਾਰ ਪੁਲ ਜਾਂ ਭੁਗਤਾਨ ਕੀਤੇ ਟੋਕਨ) ਨੂੰ ਆਟੋ-ਰਿਫੰਡ ਕਰੋ। ਜੇਕਰ ਇੱਕ ਰਿਫੰਡ ਉਸੇ ਦਿਨ ਨਹੀਂ ਦਿਖਾਈ ਦਿੰਦਾ ਹੈ ਤਾਂ contact@free.ai ਨੂੰ ਈ-ਮੇਲ ਕਰੋ।