OpenAI: GPT-4o Audio
OpenAI
·
tts
·
~4781 ਟੋਕਨਾਂ ਪ੍ਰਤੀ clip
·
4.3
ਤੋਂ 3 ਇਸ ਕੈਟਾਗਰੀ ਦੇ ਉਪਭੋਗਤਾ
OpenAI: GPT-4o Audio a ਪਾਠ- ਤੋਂ- ਬੋਲੀ ਆਵਾਜ਼ ਹੈ, ਜੋ ਕਿ OpenAI ਨੇ ਬਣਾਇਆ ਹੈ । ਬਾਹਰੀ ਮਾਡਲਾਂ ਰਾਹੀਂ ਰੂਟ ਕੀਤਾ — ~4,781 ਟੋਕਨ ਪ੍ਰਤੀ ਕਲਿੱਪ (ਅੱਪਸਟਰੀਮ ਲਾਗਤ ਤੋਂ 50% ਮਾਰਕਅਪ)
API ਰਾਹੀਂ ਵਰਤੋਂ
curl -X POST https://api.free.ai/v1/tts/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"openai/gpt-4o-audio-preview","text":"hello world"}'
API ਡੌਕੂਮੈਂਟੇਸ਼ਨ
API ਕੁੰਜੀ ਲਵੋ
ਅਕਸਰ ਪੁੱਛੇ ਜਾਂਦੇ ਸਵਾਲ
OpenAI: GPT-4o Audio ਭਾਸ਼ਾਵਾਂ ਦੀ ਇੱਕ ਵਿਸ਼ਾਲ ਲੜੀ ਲਈ ਸਹਾਇਕ ਹੈ। ਸਹੀ ਲਿਸਟ ਇੰਜਣ ਉੱਤੇ ਨਿਰਭਰ ਕਰਦੀ ਹੈ; ਇਸ ਸਫ਼ੇ ਉੱਤੇ ਫਾਰਮ ਕਿਸੇ ਵੀ ਪਾਠ ਨੂੰ ਸਵੀਕਾਰ ਕਰੇਗਾ ਅਤੇ ਇੰਜਣ ਸਹਾਇਕ ਭਾਸ਼ਾਵਾਂ ਵਿੱਚ ਪੇਸ਼ ਕਰੇਗਾ। ਪੂਰੀ ਮਲਟੀ-ਇੰਜਣ ਚੋਣਕਾਰ ਲਈ /voice/ ਵੇਖੋ, ਜੇਕਰ ਤੁਹਾਨੂੰ ਕੋਈ ਖਾਸ ਭਾਸ਼ਾ ਦੀ ਲੋੜ ਹੈ।
ਬਹੁਤੇ ਇੰਜਣ ਡਿਫਾਲਟ ਤੌਰ ਉੱਤੇ ਨਿਊਟਰਲ ਅਮਰੀਕੀ ਅੰਗਰੇਜ਼ੀ ਅਤੇ ਗੈਰ- ਅੰਗਰੇਜ਼ੀ ਭਾਸ਼ਾਵਾਂ ਲਈ ਖੇਤਰ- ਅਨੁਕੂਲ ਇਕਸਟੈਨਸ਼ਨ ਪੇਸ਼ ਕਰਦੇ ਹਨ । ਪ੍ਰੀਮੀਅਮ ਇੰਜਣ ਇਕਸਟੈਨਸ਼ਨ ਵੇਰੀਏਬਲ ਪੇਸ਼ ਕਰ ਸਕਦੇ ਹਨ — ਤੁਲਨਾ ਲਈ ਇੱਕ ਨਮੂਨਾ ਚੇਪੋ ।
SSML ਸਹਿਯੋਗ ਇੰਜਣ ਦੇ ਅਧਾਰ ਤੇ ਵੱਖਰਾ ਹੁੰਦਾ ਹੈ । ਵਿਰਾਮ, ਪਰੋਸੌਡੀ ਅਤੇ ਉਭਾਰ ਟੈਗ ਬਹੁਤੇ ਪ੍ਰੀਮੀਅਮ ਇੰਜਣਾਂ ਤੇ ਕੁਝ ਸਵੈ- ਹੋਸਟ ਕੀਤੇ ਟੈਗਾਂ ਉੱਤੇ ਵਰਤੇ ਜਾਂਦੇ ਹਨ । ਸਾਦਾ ਟੈਕਸਟ ਹਮੇਸ਼ਾ ਕੰਮ ਕਰਦਾ ਹੈ — ਕੋਈ ਮਾਰਕਅਪ ਲੋੜੀਦਾ ਨਹੀਂ ਹੈ ।
ਸਟਰੀਮਿੰਗ TTS ਪ੍ਰੀਮੀਅਮ ਇੰਜਣਾਂ ਉੱਤੇ /v1/tts/ API ਅੰਤ- ਬਿੰਦੂ ਨਾਲ stream=true ਨਾਲ ਉਪਲੱਬਧ ਹੈ। ਇਸ ਸਫ਼ੇ ਉੱਤੇ ਵੈਬ UI ਇੱਕ ਵਾਰ ਰਿਡਰਿੰਗ ਮੁਕੰਮਲ ਹੋਣ ਉੱਤੇ ਪੂਰਾ ਕਲਿੱਪ ਮੁੜ- ਭੇਜਦਾ ਹੈ।
OpenAI: GPT-4o Audio ਇੱਕ ਪ੍ਰੀਮੀਅਮ TTS ਇੰਜਣ ਹੈ। ਕੀਮਤ ਅੱਖਰ ਗਿਣਤੀ ਨਾਲ ਬਦਲਦੀ ਹੈ - ਆਮ ਤੌਰ ਤੇ ਹਰ ਅੱਖਰ ਲਈ ~30 ਟੋਕਨ ਹਨ। $1 ਨੇ 750,000 ਟੋਕਨ ਖਰੀਦੇ ਹਨ, ਇਸ ਲਈ $5 ਪੈਕ ਅੱਖਰ ਦੇ ਹਜ਼ਾਰਾਂ ਨੂੰ ਕਵਰ ਕਰਦਾ ਹੈ।
ਵੈਬ UI ਉੱਤੇ ਪ੍ਰਤੀ ਬੇਨਤੀ 5,000 ਅੱਖਰ ਤੱਕ ਹਨ। ਲੰਬੇ ਟੁਕੜਿਆਂ (ਆਡੀਓਬੁੱਕਾਂ, ਪੂਰੇ ਭਾਗਾਂ) ਲਈ /voice/audiobook/ ਵਰਤੋਂ, ਜੋ ਕਿ ਆਟੋਮੈਟਿਕ ਹੀ ਟੁਕੜਿਆਂ ਵਿੱਚ ਵੰਡਦਾ ਹੈ ਜਾਂ ਲੂਪ ਵਿੱਚ API ਨੂੰ ਕਾਲ ਕਰਦਾ ਹੈ।
ਹਾਂ — /v1/tts/batch/ ਨੂੰ ਸਤਰ ਦੀ ਲਿਸਟ POST ਕਰੋ, ਜਾਂ /workspace/ ਉੱਤੇ ਵਰਕਸਪੇਸ UI ਦੀ ਵਰਤੋਂ ਕਰੋ, ਤਾਂ ਕਿ TTS ਨੂੰ ਲੰਬੇ ਪਾਈਪਲਾਈਨ ਵਿੱਚ ਚੈਨਲ ਕੀਤਾ ਜਾ ਸਕੇ (ਜਿਵੇਂ ਕਿ, translate → speak → stitch) ।
ਹਾਂ — /v1/tts/ ਨੂੰ POST ਟੈਕਸਟ ਨਾਲ model="OpenAI: GPT-4o Audio" (ਜਾਂ ਇਸ ਸਫ਼ੇ ਉੱਤੇ slug) ਨਾਲ ਭੇਜੋ । WAV ਜਾਂ MP3 ਵਾਪਸ ਮਿਲੇਗਾ । ਪੂਰੇ ਹਵਾਲੇ + SDK ਨਿਸ਼ਾਨ ਲਈ /api/ ਵੇਖੋ ।
ਇਹ ਪੇਜ਼ ਪਾਠ-ਤੋਂ-ਭਾਸ਼ਾ ਹੈ, ਬੋਲੀ ਕਲੋਨਿੰਗ ਨਹੀਂ ਹੈ - ਬੋਲੀ ਇੰਜਣ ਦਾ ਡਿਫਾਲਟ ਹੈ। ਬੋਲੀ ਕਲੋਨਿੰਗ (ਰੁਪਏ ਆਡੀਓ ਅੱਪਲੋਡ ਕਰਨ ਲਈ) ਲਈ /voice/clone/ ਵੇਖੋ, ਜਿਸ ਲਈ ਤੁਹਾਨੂੰ ਬੋਲੀ ਅਧਿਕਾਰ ਹੋਣ ਜਾਂ ਸਪੱਸ਼ਟ ਲਿਖਤੀ ਮਨਜ਼ੂਰੀ ਹੋਣ ਦੀ ਲੋੜ ਹੈ।
ਸੇਲਫ- ਹੋਸਟਡ ਇੰਜਣ Free.ai- ਮਾਲਕ GPUs ਉੱਤੇ ਚੱਲਦੇ ਹਨ; ਸਾਡੇ ਸਰਵਰਾਂ ਤੋਂ ਕੁਝ ਵੀ ਨਹੀਂ ਜਾਂਦਾ ਹੈ । ਪ੍ਰੀਮੀਅਮ ਇੰਜਣ ਸਾਡੇ DPA ਅਧੀਨ ਟੈਕਸਟ ਨੂੰ ਉੱਪਰਲੇ ਮਾਡਲ ਪਰੋਵਾਈਡਰਾਂ ਨੂੰ ਭੇਜਦੇ ਹਨ । ਅਸੀਂ ਤੁਹਾਡੇ ਇੰਪੁੱਟ ਉੱਤੇ ਟਰੇਨਿੰਗ ਨਹੀਂ ਦਿੰਦੇ ਅਤੇ ਡਾਟਾ ਨਹੀਂ ਵੇਚਦੇ ।
ਹਾਂ — Free.ai ਬਣਾਈ ਆਡੀਓ ਲਈ ਵਪਾਰਕ ਵਰਤੋਂ ਲਈ ਮਨਜ਼ੂਰ ਹੈ। ਇੰਜਣ ਦਾ ਹੇਠਲਾ ਲਾਈਸੈਂਸ (ਅਪਾਚੀ 2.0, MIT, ਜਾਂ ਵਿਕਰੇਤਾ ਸ਼ਰਤਾਂ) ਉੱਤੇ ਅਤੇ ਮਾਡਲ ਹਵਾਲਾ ਪੇਜ਼ ਉੱਤੇ ਵੇਖਾਇਆ ਗਿਆ ਹੈ; ਪਰਿਭਾਸ਼ਾ ਵਿੱਚ ਇਸ ਦਾ ਮਤਲਬ ਹੈ ਕਿ ਬੋਲੀ, ਐਡ, ਪੋਡਕਾਸਟ ਅਤੇ ਐਪਲੀਕੇਸ਼ਨ ਸਭ ਇਸ ਦੇ ਢਾਂਚੇ ਵਿੱਚ ਹਨ।
ਹਾਂ — ਫੇਲ੍ਹ ਕੰਮ ਨੂੰ ਸਰੋਤ (ਦਿਨਵਾਰ ਪੁਲ ਜਾਂ ਭੁਗਤਾਨ ਕੀਤੇ ਟੋਕਨ) ਨੂੰ ਆਟੋ-ਰਿਫੰਡ ਕਰੋ। ਜੇਕਰ ਇੱਕ ਰਿਫੰਡ ਉਸੇ ਦਿਨ ਨਹੀਂ ਦਿਖਾਈ ਦਿੰਦਾ ਹੈ ਤਾਂ contact@free.ai ਨੂੰ ਈ-ਮੇਲ ਕਰੋ।