MiniMax Speech 02 HD
MiniMax
·
tts
·
~500 ਟੋਕਨਾਂ ਪ੍ਰਤੀ clip
·
4.3
ਤੋਂ 3 ਇਸ ਕੈਟਾਗਰੀ ਦੇ ਉਪਭੋਗਤਾ
MiniMax Speech 02 HD a ਪਾਠ- ਤੋਂ- ਬੋਲੀ ਆਵਾਜ਼ ਹੈ, ਜੋ ਕਿ MiniMax ਨੇ ਬਣਾਇਆ ਹੈ । ਬਾਹਰੀ ਮਾਡਲਾਂ ਰਾਹੀਂ ਰੂਟ ਕੀਤਾ — ~500 ਟੋਕਨ ਪ੍ਰਤੀ ਕਲਿੱਪ (ਅੱਪਸਟਰੀਮ ਲਾਗਤ ਤੋਂ 50% ਮਾਰਕਅਪ)
API ਰਾਹੀਂ ਵਰਤੋਂ
OpenAI- ਅਨੁਕੂਲ REST API। ਇੱਕ ਕੁੰਜੀ ਬਣਾਓ ਅਤੇ ਇਸ ਮਾਡਲ ਨੂੰ ਸਕਿੰਟਾਂ ਵਿੱਚ ਕਾਲ ਕਰੋ।
curl -X POST https://api.free.ai/v1/tts/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/minimax/speech-02-hd","text":"hello world"}'
API ਡੌਕੂਮੈਂਟੇਸ਼ਨ
API ਕੁੰਜੀ ਲਵੋ
ਇਸੇ ਤਰ੍ਹਾਂ ਦੇ ਮਾਡਲ
ਅਕਸਰ ਪੁੱਛੇ ਜਾਂਦੇ ਸਵਾਲ
MiniMax Speech 02 HD ਭਾਸ਼ਾਵਾਂ ਦੀ ਇੱਕ ਵਿਸ਼ਾਲ ਲੜੀ ਲਈ ਸਹਾਇਕ ਹੈ। ਸਹੀ ਲਿਸਟ ਇੰਜਣ ਉੱਤੇ ਨਿਰਭਰ ਕਰਦੀ ਹੈ; ਇਸ ਸਫ਼ੇ ਉੱਤੇ ਫਾਰਮ ਕਿਸੇ ਵੀ ਪਾਠ ਨੂੰ ਸਵੀਕਾਰ ਕਰੇਗਾ ਅਤੇ ਇੰਜਣ ਸਹਾਇਕ ਭਾਸ਼ਾਵਾਂ ਵਿੱਚ ਪੇਸ਼ ਕਰੇਗਾ। ਪੂਰੀ ਮਲਟੀ-ਇੰਜਣ ਚੋਣਕਾਰ ਲਈ /voice/ ਵੇਖੋ, ਜੇਕਰ ਤੁਹਾਨੂੰ ਕੋਈ ਖਾਸ ਭਾਸ਼ਾ ਦੀ ਲੋੜ ਹੈ।
ਬਹੁਤੇ ਇੰਜਣ ਡਿਫਾਲਟ ਤੌਰ ਉੱਤੇ ਨਿਊਟਰਲ ਅਮਰੀਕੀ ਅੰਗਰੇਜ਼ੀ ਅਤੇ ਗੈਰ- ਅੰਗਰੇਜ਼ੀ ਭਾਸ਼ਾਵਾਂ ਲਈ ਖੇਤਰ- ਅਨੁਕੂਲ ਇਕਸਟੈਨਸ਼ਨ ਪੇਸ਼ ਕਰਦੇ ਹਨ । ਪ੍ਰੀਮੀਅਮ ਇੰਜਣ ਇਕਸਟੈਨਸ਼ਨ ਵੇਰੀਏਬਲ ਪੇਸ਼ ਕਰ ਸਕਦੇ ਹਨ — ਤੁਲਨਾ ਲਈ ਇੱਕ ਨਮੂਨਾ ਚੇਪੋ ।
SSML ਸਹਿਯੋਗ ਇੰਜਣ ਦੇ ਅਧਾਰ ਤੇ ਵੱਖਰਾ ਹੁੰਦਾ ਹੈ । ਵਿਰਾਮ, ਪਰੋਸੌਡੀ ਅਤੇ ਉਭਾਰ ਟੈਗ ਬਹੁਤੇ ਪ੍ਰੀਮੀਅਮ ਇੰਜਣਾਂ ਤੇ ਕੁਝ ਸਵੈ- ਹੋਸਟ ਕੀਤੇ ਟੈਗਾਂ ਉੱਤੇ ਵਰਤੇ ਜਾਂਦੇ ਹਨ । ਸਾਦਾ ਟੈਕਸਟ ਹਮੇਸ਼ਾ ਕੰਮ ਕਰਦਾ ਹੈ — ਕੋਈ ਮਾਰਕਅਪ ਲੋੜੀਦਾ ਨਹੀਂ ਹੈ ।
ਸਟਰੀਮਿੰਗ TTS ਪ੍ਰੀਮੀਅਮ ਇੰਜਣਾਂ ਉੱਤੇ /v1/tts/ API ਅੰਤ- ਬਿੰਦੂ ਨਾਲ stream=true ਨਾਲ ਉਪਲੱਬਧ ਹੈ। ਇਸ ਸਫ਼ੇ ਉੱਤੇ ਵੈਬ UI ਇੱਕ ਵਾਰ ਰਿਡਰਿੰਗ ਮੁਕੰਮਲ ਹੋਣ ਉੱਤੇ ਪੂਰਾ ਕਲਿੱਪ ਮੁੜ- ਭੇਜਦਾ ਹੈ।
MiniMax Speech 02 HD ਇੱਕ ਪ੍ਰੀਮੀਅਮ TTS ਇੰਜਣ ਹੈ। ਕੀਮਤ ਅੱਖਰ ਗਿਣਤੀ ਨਾਲ ਬਦਲਦੀ ਹੈ - ਆਮ ਤੌਰ ਤੇ ਹਰ ਅੱਖਰ ਲਈ ~30 ਟੋਕਨ ਹਨ। $1 ਨੇ 750,000 ਟੋਕਨ ਖਰੀਦੇ ਹਨ, ਇਸ ਲਈ $5 ਪੈਕ ਅੱਖਰ ਦੇ ਹਜ਼ਾਰਾਂ ਨੂੰ ਕਵਰ ਕਰਦਾ ਹੈ।
ਵੈਬ UI ਉੱਤੇ ਪ੍ਰਤੀ ਬੇਨਤੀ 5,000 ਅੱਖਰ ਤੱਕ ਹਨ। ਲੰਬੇ ਟੁਕੜਿਆਂ (ਆਡੀਓਬੁੱਕਾਂ, ਪੂਰੇ ਭਾਗਾਂ) ਲਈ /voice/audiobook/ ਵਰਤੋਂ, ਜੋ ਕਿ ਆਟੋਮੈਟਿਕ ਹੀ ਟੁਕੜਿਆਂ ਵਿੱਚ ਵੰਡਦਾ ਹੈ ਜਾਂ ਲੂਪ ਵਿੱਚ API ਨੂੰ ਕਾਲ ਕਰਦਾ ਹੈ।
ਹਾਂ — /v1/tts/batch/ ਨੂੰ ਸਤਰ ਦੀ ਲਿਸਟ POST ਕਰੋ, ਜਾਂ /workspace/ ਉੱਤੇ ਵਰਕਸਪੇਸ UI ਦੀ ਵਰਤੋਂ ਕਰੋ, ਤਾਂ ਕਿ TTS ਨੂੰ ਲੰਬੇ ਪਾਈਪਲਾਈਨ ਵਿੱਚ ਚੈਨਲ ਕੀਤਾ ਜਾ ਸਕੇ (ਜਿਵੇਂ ਕਿ, translate → speak → stitch) ।
ਹਾਂ — /v1/tts/ ਨੂੰ POST ਟੈਕਸਟ ਨਾਲ model="MiniMax Speech 02 HD" (ਜਾਂ ਇਸ ਸਫ਼ੇ ਉੱਤੇ slug) ਨਾਲ ਭੇਜੋ । WAV ਜਾਂ MP3 ਵਾਪਸ ਮਿਲੇਗਾ । ਪੂਰੇ ਹਵਾਲੇ + SDK ਨਿਸ਼ਾਨ ਲਈ /api/ ਵੇਖੋ ।
ਇਹ ਪੇਜ਼ ਪਾਠ-ਤੋਂ-ਭਾਸ਼ਾ ਹੈ, ਬੋਲੀ ਕਲੋਨਿੰਗ ਨਹੀਂ ਹੈ - ਬੋਲੀ ਇੰਜਣ ਦਾ ਡਿਫਾਲਟ ਹੈ। ਬੋਲੀ ਕਲੋਨਿੰਗ (ਰੁਪਏ ਆਡੀਓ ਅੱਪਲੋਡ ਕਰਨ ਲਈ) ਲਈ /voice/clone/ ਵੇਖੋ, ਜਿਸ ਲਈ ਤੁਹਾਨੂੰ ਬੋਲੀ ਅਧਿਕਾਰ ਹੋਣ ਜਾਂ ਸਪੱਸ਼ਟ ਲਿਖਤੀ ਮਨਜ਼ੂਰੀ ਹੋਣ ਦੀ ਲੋੜ ਹੈ।
ਸੇਲਫ- ਹੋਸਟਡ ਇੰਜਣ Free.ai- ਮਾਲਕ GPUs ਉੱਤੇ ਚੱਲਦੇ ਹਨ; ਸਾਡੇ ਸਰਵਰਾਂ ਤੋਂ ਕੁਝ ਵੀ ਨਹੀਂ ਜਾਂਦਾ ਹੈ । ਪ੍ਰੀਮੀਅਮ ਇੰਜਣ ਸਾਡੇ DPA ਅਧੀਨ ਟੈਕਸਟ ਨੂੰ ਉੱਪਰਲੇ ਮਾਡਲ ਪਰੋਵਾਈਡਰਾਂ ਨੂੰ ਭੇਜਦੇ ਹਨ । ਅਸੀਂ ਤੁਹਾਡੇ ਇੰਪੁੱਟ ਉੱਤੇ ਟਰੇਨਿੰਗ ਨਹੀਂ ਦਿੰਦੇ ਅਤੇ ਡਾਟਾ ਨਹੀਂ ਵੇਚਦੇ ।
ਹਾਂ — Free.ai ਬਣਾਈ ਆਡੀਓ ਲਈ ਵਪਾਰਕ ਵਰਤੋਂ ਲਈ ਮਨਜ਼ੂਰ ਹੈ। ਇੰਜਣ ਦਾ ਹੇਠਲਾ ਲਾਈਸੈਂਸ (ਅਪਾਚੀ 2.0, MIT, ਜਾਂ ਵਿਕਰੇਤਾ ਸ਼ਰਤਾਂ) ਉੱਤੇ ਅਤੇ ਮਾਡਲ ਹਵਾਲਾ ਪੇਜ਼ ਉੱਤੇ ਵੇਖਾਇਆ ਗਿਆ ਹੈ; ਪਰਿਭਾਸ਼ਾ ਵਿੱਚ ਇਸ ਦਾ ਮਤਲਬ ਹੈ ਕਿ ਬੋਲੀ, ਐਡ, ਪੋਡਕਾਸਟ ਅਤੇ ਐਪਲੀਕੇਸ਼ਨ ਸਭ ਇਸ ਦੇ ਢਾਂਚੇ ਵਿੱਚ ਹਨ।
ਹਾਂ — ਫੇਲ੍ਹ ਕੰਮ ਨੂੰ ਸਰੋਤ (ਦਿਨਵਾਰ ਪੁਲ ਜਾਂ ਭੁਗਤਾਨ ਕੀਤੇ ਟੋਕਨ) ਨੂੰ ਆਟੋ-ਰਿਫੰਡ ਕਰੋ। ਜੇਕਰ ਇੱਕ ਰਿਫੰਡ ਉਸੇ ਦਿਨ ਨਹੀਂ ਦਿਖਾਈ ਦਿੰਦਾ ਹੈ ਤਾਂ contact@free.ai ਨੂੰ ਈ-ਮੇਲ ਕਰੋ।