Question 1

ਕੀ ਭਾਸ਼ਾਵਾਂ OpenAI: GPT-4o Audio ਕਵਰ ਕਰਦਾ ਹੈ?

Accepted Answer

OpenAI: GPT-4o Audio ਭਾਸ਼ਾਵਾਂ ਦੀ ਇੱਕ ਵਿਸ਼ਾਲ ਲੜੀ ਲਈ ਸਹਾਇਕ ਹੈ। ਸਹੀ ਲਿਸਟ ਇੰਜਣ ਉੱਤੇ ਨਿਰਭਰ ਕਰਦੀ ਹੈ; ਇਸ ਸਫ਼ੇ ਉੱਤੇ ਫਾਰਮ ਕਿਸੇ ਵੀ ਪਾਠ ਨੂੰ ਸਵੀਕਾਰ ਕਰੇਗਾ ਅਤੇ ਇੰਜਣ ਸਹਾਇਕ ਭਾਸ਼ਾਵਾਂ ਵਿੱਚ ਪੇਸ਼ ਕਰੇਗਾ। ਪੂਰੀ ਮਲਟੀ-ਇੰਜਣ ਚੋਣਕਾਰ ਲਈ /voice/ ਵੇਖੋ, ਜੇਕਰ ਤੁਹਾਨੂੰ ਕੋਈ ਖਾਸ ਭਾਸ਼ਾ ਦੀ ਲੋੜ ਹੈ।

Question 2

ਕੀ OpenAI: GPT-4o Audio ਵਿੱਚ ਇੱਕ ਪਛਾਣਨਯੋਗ ਅੱਖਰਾਂ ਦਾ ਜੋੜ ਹੈ?

Accepted Answer

ਬਹੁਤੇ ਇੰਜਣ ਡਿਫਾਲਟ ਤੌਰ ਉੱਤੇ ਨਿਊਟਰਲ ਅਮਰੀਕੀ ਅੰਗਰੇਜ਼ੀ ਅਤੇ ਗੈਰ- ਅੰਗਰੇਜ਼ੀ ਭਾਸ਼ਾਵਾਂ ਲਈ ਖੇਤਰ- ਅਨੁਕੂਲ ਇਕਸਟੈਨਸ਼ਨ ਪੇਸ਼ ਕਰਦੇ ਹਨ । ਪ੍ਰੀਮੀਅਮ ਇੰਜਣ ਇਕਸਟੈਨਸ਼ਨ ਵੇਰੀਏਬਲ ਪੇਸ਼ ਕਰ ਸਕਦੇ ਹਨ — ਤੁਲਨਾ ਲਈ ਇੱਕ ਨਮੂਨਾ ਚੇਪੋ ।

Question 3

ਕੀ ਮੈਂ OpenAI: GPT-4o Audio ਨਾਲ SSML ਵਰਤ ਸਕਦਾ ਹਾਂ?

Accepted Answer

SSML ਸਹਿਯੋਗ ਇੰਜਣ ਦੇ ਅਧਾਰ ਤੇ ਵੱਖਰਾ ਹੁੰਦਾ ਹੈ । ਵਿਰਾਮ, ਪਰੋਸੌਡੀ ਅਤੇ ਉਭਾਰ ਟੈਗ ਬਹੁਤੇ ਪ੍ਰੀਮੀਅਮ ਇੰਜਣਾਂ ਤੇ ਕੁਝ ਸਵੈ- ਹੋਸਟ ਕੀਤੇ ਟੈਗਾਂ ਉੱਤੇ ਵਰਤੇ ਜਾਂਦੇ ਹਨ । ਸਾਦਾ ਟੈਕਸਟ ਹਮੇਸ਼ਾ ਕੰਮ ਕਰਦਾ ਹੈ — ਕੋਈ ਮਾਰਕਅਪ ਲੋੜੀਦਾ ਨਹੀਂ ਹੈ ।

Question 4

ਕੀ OpenAI: GPT-4o Audio ਸਟਰੀਮਿੰਗ ਲਈ ਸਹਾਇਕ ਹੈ?

Accepted Answer

ਸਟਰੀਮਿੰਗ TTS ਪ੍ਰੀਮੀਅਮ ਇੰਜਣਾਂ ਉੱਤੇ /v1/tts/ API ਅੰਤ- ਬਿੰਦੂ ਨਾਲ stream=true ਨਾਲ ਉਪਲੱਬਧ ਹੈ। ਇਸ ਸਫ਼ੇ ਉੱਤੇ ਵੈਬ UI ਇੱਕ ਵਾਰ ਰਿਡਰਿੰਗ ਮੁਕੰਮਲ ਹੋਣ ਉੱਤੇ ਪੂਰਾ ਕਲਿੱਪ ਮੁੜ- ਭੇਜਦਾ ਹੈ।

Question 5

OpenAI: GPT-4o Audio ਪ੍ਰਤੀ ਕਲਿੱਪ ਕਿੰਨੀ ਕੀਮਤ ਹੈ?

Accepted Answer

OpenAI: GPT-4o Audio ਇੱਕ ਪ੍ਰੀਮੀਅਮ TTS ਇੰਜਣ ਹੈ। ਕੀਮਤ ਅੱਖਰ ਗਿਣਤੀ ਨਾਲ ਬਦਲਦੀ ਹੈ - ਆਮ ਤੌਰ ਤੇ ਹਰ ਅੱਖਰ ਲਈ ~30 ਟੋਕਨ ਹਨ। $1 ਨੇ 750,000 ਟੋਕਨ ਖਰੀਦੇ ਹਨ, ਇਸ ਲਈ $5 ਪੈਕ ਅੱਖਰ ਦੇ ਹਜ਼ਾਰਾਂ ਨੂੰ ਕਵਰ ਕਰਦਾ ਹੈ।

Question 6

OpenAI: GPT-4o Audio ਲਈ ਵੱਧੋ-ਵੱਧ ਪਾਠ ਲੰਬਾਈ ਕੀ ਹੈ?

Accepted Answer

ਵੈਬ UI ਉੱਤੇ ਪ੍ਰਤੀ ਬੇਨਤੀ 5,000 ਅੱਖਰ ਤੱਕ ਹਨ। ਲੰਬੇ ਟੁਕੜਿਆਂ (ਆਡੀਓਬੁੱਕਾਂ, ਪੂਰੇ ਭਾਗਾਂ) ਲਈ /voice/audiobook/ ਵਰਤੋਂ, ਜੋ ਕਿ ਆਟੋਮੈਟਿਕ ਹੀ ਟੁਕੜਿਆਂ ਵਿੱਚ ਵੰਡਦਾ ਹੈ ਜਾਂ ਲੂਪ ਵਿੱਚ API ਨੂੰ ਕਾਲ ਕਰਦਾ ਹੈ।

Question 7

ਕੀ ਮੈਂ OpenAI: GPT-4o Audio ਨੂੰ ਬੈਚ ਵਿੱਚ ਚਲਾ ਸਕਦਾ ਹਾਂ?

Accepted Answer

ਹਾਂ — /v1/tts/batch/ ਨੂੰ ਸਤਰ ਦੀ ਲਿਸਟ POST ਕਰੋ, ਜਾਂ /workspace/ ਉੱਤੇ ਵਰਕਸਪੇਸ UI ਦੀ ਵਰਤੋਂ ਕਰੋ, ਤਾਂ ਕਿ TTS ਨੂੰ ਲੰਬੇ ਪਾਈਪਲਾਈਨ ਵਿੱਚ ਚੈਨਲ ਕੀਤਾ ਜਾ ਸਕੇ (ਜਿਵੇਂ ਕਿ, translate → speak → stitch) ।

Question 8

ਕੀ OpenAI: GPT-4o Audio ਲਈ ਕੋਈ API ਹੈ?

Accepted Answer

ਹਾਂ — /v1/tts/ ਨੂੰ POST ਟੈਕਸਟ ਨਾਲ model="OpenAI: GPT-4o Audio" (ਜਾਂ ਇਸ ਸਫ਼ੇ ਉੱਤੇ slug) ਨਾਲ ਭੇਜੋ । WAV ਜਾਂ MP3 ਵਾਪਸ ਮਿਲੇਗਾ । ਪੂਰੇ ਹਵਾਲੇ + SDK ਨਿਸ਼ਾਨ ਲਈ /api/ ਵੇਖੋ ।

Question 9

ਕੀ ਮੈਨੂੰ OpenAI: GPT-4o Audio ਨਾਲ ਇੱਕ ਆਵਾਜ਼ ਕਲੋਨ ਕਰਨ ਲਈ ਮਨਜ਼ੂਰੀ ਦੀ ਲੋੜ ਹੈ?

Accepted Answer

ਇਹ ਪੇਜ਼ ਪਾਠ-ਤੋਂ-ਭਾਸ਼ਾ ਹੈ, ਬੋਲੀ ਕਲੋਨਿੰਗ ਨਹੀਂ ਹੈ - ਬੋਲੀ ਇੰਜਣ ਦਾ ਡਿਫਾਲਟ ਹੈ। ਬੋਲੀ ਕਲੋਨਿੰਗ (ਰੁਪਏ ਆਡੀਓ ਅੱਪਲੋਡ ਕਰਨ ਲਈ) ਲਈ /voice/clone/ ਵੇਖੋ, ਜਿਸ ਲਈ ਤੁਹਾਨੂੰ ਬੋਲੀ ਅਧਿਕਾਰ ਹੋਣ ਜਾਂ ਸਪੱਸ਼ਟ ਲਿਖਤੀ ਮਨਜ਼ੂਰੀ ਹੋਣ ਦੀ ਲੋੜ ਹੈ।

Question 10

OpenAI: GPT-4o Audio ਨਾਲ ਪ੍ਰਾਈਵੇਸੀ ਬਾਰੇ ਕੀ?

Accepted Answer

ਸੇਲਫ- ਹੋਸਟਡ ਇੰਜਣ Free.ai- ਮਾਲਕ GPUs ਉੱਤੇ ਚੱਲਦੇ ਹਨ; ਸਾਡੇ ਸਰਵਰਾਂ ਤੋਂ ਕੁਝ ਵੀ ਨਹੀਂ ਜਾਂਦਾ ਹੈ । ਪ੍ਰੀਮੀਅਮ ਇੰਜਣ ਸਾਡੇ DPA ਅਧੀਨ ਟੈਕਸਟ ਨੂੰ ਉੱਪਰਲੇ ਮਾਡਲ ਪਰੋਵਾਈਡਰਾਂ ਨੂੰ ਭੇਜਦੇ ਹਨ । ਅਸੀਂ ਤੁਹਾਡੇ ਇੰਪੁੱਟ ਉੱਤੇ ਟਰੇਨਿੰਗ ਨਹੀਂ ਦਿੰਦੇ ਅਤੇ ਡਾਟਾ ਨਹੀਂ ਵੇਚਦੇ ।

Question 11

ਕੀ OpenAI: GPT-4o Audio ਆਉਟਪੁੱਟ ਵਪਾਰਕ ਵਰਤੋਂ ਲਈ ਸੁਰੱਖਿਅਤ ਹੈ?

Accepted Answer

ਹਾਂ — Free.ai ਬਣਾਈ ਆਡੀਓ ਲਈ ਵਪਾਰਕ ਵਰਤੋਂ ਲਈ ਮਨਜ਼ੂਰ ਹੈ। ਇੰਜਣ ਦਾ ਹੇਠਲਾ ਲਾਈਸੈਂਸ (ਅਪਾਚੀ 2.0, MIT, ਜਾਂ ਵਿਕਰੇਤਾ ਸ਼ਰਤਾਂ) ਉੱਤੇ ਅਤੇ ਮਾਡਲ ਹਵਾਲਾ ਪੇਜ਼ ਉੱਤੇ ਵੇਖਾਇਆ ਗਿਆ ਹੈ; ਪਰਿਭਾਸ਼ਾ ਵਿੱਚ ਇਸ ਦਾ ਮਤਲਬ ਹੈ ਕਿ ਬੋਲੀ, ਐਡ, ਪੋਡਕਾਸਟ ਅਤੇ ਐਪਲੀਕੇਸ਼ਨ ਸਭ ਇਸ ਦੇ ਢਾਂਚੇ ਵਿੱਚ ਹਨ।

Question 12

ਕੀ ਮੈਨੂੰ ਮੁੜ-ਭੁਗਤਾਨ ਮਿਲ ਸਕਦਾ ਹੈ ਜੇ OpenAI: GPT-4o Audio ਅਸਫਲ ਹੋ ਜਾਵੇ?

Accepted Answer

ਹਾਂ — ਫੇਲ੍ਹ ਕੰਮ ਨੂੰ ਸਰੋਤ (ਦਿਨਵਾਰ ਪੁਲ ਜਾਂ ਭੁਗਤਾਨ ਕੀਤੇ ਟੋਕਨ) ਨੂੰ ਆਟੋ-ਰਿਫੰਡ ਕਰੋ। ਜੇਕਰ ਇੱਕ ਰਿਫੰਡ ਉਸੇ ਦਿਨ ਨਹੀਂ ਦਿਖਾਈ ਦਿੰਦਾ ਹੈ ਤਾਂ contact@free.ai ਨੂੰ ਈ-ਮੇਲ ਕਰੋ।

OpenAI: GPT-4o Audio

ਅਕਸਰ ਪੁੱਛੇ ਜਾਂਦੇ ਸਵਾਲ

ਕੀ ਭਾਸ਼ਾਵਾਂ OpenAI: GPT-4o Audio ਕਵਰ ਕਰਦਾ ਹੈ?

ਕੀ OpenAI: GPT-4o Audio ਵਿੱਚ ਇੱਕ ਪਛਾਣਨਯੋਗ ਅੱਖਰਾਂ ਦਾ ਜੋੜ ਹੈ?

ਕੀ ਮੈਂ OpenAI: GPT-4o Audio ਨਾਲ SSML ਵਰਤ ਸਕਦਾ ਹਾਂ?

ਕੀ OpenAI: GPT-4o Audio ਸਟਰੀਮਿੰਗ ਲਈ ਸਹਾਇਕ ਹੈ?