Sesame CSM-1B

Free.ai (self-hosted) · tts · ~500 ਟੋਕਨਾਂ ਪ੍ਰਤੀ clip · 4.3 ਤੋਂ 3 ਇਸ ਕੈਟਾਗਰੀ ਦੇ ਉਪਭੋਗਤਾ
~500 ਟੋਕਨਾਂ ਪ੍ਰਤੀ clip

Sesame CSM-1B a ਪਾਠ- ਤੋਂ- ਬੋਲੀ ਆਵਾਜ਼ ਹੈ, ਜੋ ਕਿ Sesame ਨੇ ਬਣਾਇਆ ਹੈ । Real-time voice agents, conversational AI, streaming TTS where time-to-first-audio matters more than studio-perfect reads. ਉੱਤੇ ਸਭ ਤੋਂ ਮਜ਼ਬੂਤ। Free.ai GPUs ਉੱਤੇ ਸਵੈ-ਹੋਸਟ ਕੀਤਾ — ਤੁਹਾਡੀ ਰੋਜ਼ਾਨਾ ਟੋਕਨ ਪੁਲ (500 ਟੋਕਨ ਪ੍ਰਤੀ ਕਲਿੱਪ) ਦੇ ਖਿਲਾਫ ਮੁਫ਼ਤ ਚੱਲਦਾ ਹੈ। Apache 2.0 ਅਧੀਨ ਜਾਰੀ — Free.ai ਉੱਤੇ ਵਪਾਰਕ ਵਰਤੋਂ ਲਈ ਮਨਜ਼ੂਰ ਹੈ।

API ਰਾਹੀਂ ਵਰਤੋਂ
curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"csm-1b","text":"hello world"}'
API ਡੌਕੂਮੈਂਟੇਸ਼ਨ API ਕੁੰਜੀ ਲਵੋ

ਅਕਸਰ ਪੁੱਛੇ ਜਾਂਦੇ ਸਵਾਲ

Sesame CSM-1B ਭਾਸ਼ਾਵਾਂ ਦੀ ਇੱਕ ਵਿਸ਼ਾਲ ਲੜੀ ਲਈ ਸਹਾਇਕ ਹੈ। ਸਹੀ ਲਿਸਟ ਇੰਜਣ ਉੱਤੇ ਨਿਰਭਰ ਕਰਦੀ ਹੈ; ਇਸ ਸਫ਼ੇ ਉੱਤੇ ਫਾਰਮ ਕਿਸੇ ਵੀ ਪਾਠ ਨੂੰ ਸਵੀਕਾਰ ਕਰੇਗਾ ਅਤੇ ਇੰਜਣ ਸਹਾਇਕ ਭਾਸ਼ਾਵਾਂ ਵਿੱਚ ਪੇਸ਼ ਕਰੇਗਾ। ਪੂਰੀ ਮਲਟੀ-ਇੰਜਣ ਚੋਣਕਾਰ ਲਈ /voice/ ਵੇਖੋ, ਜੇਕਰ ਤੁਹਾਨੂੰ ਕੋਈ ਖਾਸ ਭਾਸ਼ਾ ਦੀ ਲੋੜ ਹੈ।

ਬਹੁਤੇ ਇੰਜਣ ਡਿਫਾਲਟ ਤੌਰ ਉੱਤੇ ਨਿਊਟਰਲ ਅਮਰੀਕੀ ਅੰਗਰੇਜ਼ੀ ਅਤੇ ਗੈਰ- ਅੰਗਰੇਜ਼ੀ ਭਾਸ਼ਾਵਾਂ ਲਈ ਖੇਤਰ- ਅਨੁਕੂਲ ਇਕਸਟੈਨਸ਼ਨ ਪੇਸ਼ ਕਰਦੇ ਹਨ । ਪ੍ਰੀਮੀਅਮ ਇੰਜਣ ਇਕਸਟੈਨਸ਼ਨ ਵੇਰੀਏਬਲ ਪੇਸ਼ ਕਰ ਸਕਦੇ ਹਨ — ਤੁਲਨਾ ਲਈ ਇੱਕ ਨਮੂਨਾ ਚੇਪੋ ।

SSML ਸਹਿਯੋਗ ਇੰਜਣ ਦੇ ਅਧਾਰ ਤੇ ਵੱਖਰਾ ਹੁੰਦਾ ਹੈ । ਵਿਰਾਮ, ਪਰੋਸੌਡੀ ਅਤੇ ਉਭਾਰ ਟੈਗ ਬਹੁਤੇ ਪ੍ਰੀਮੀਅਮ ਇੰਜਣਾਂ ਤੇ ਕੁਝ ਸਵੈ- ਹੋਸਟ ਕੀਤੇ ਟੈਗਾਂ ਉੱਤੇ ਵਰਤੇ ਜਾਂਦੇ ਹਨ । ਸਾਦਾ ਟੈਕਸਟ ਹਮੇਸ਼ਾ ਕੰਮ ਕਰਦਾ ਹੈ — ਕੋਈ ਮਾਰਕਅਪ ਲੋੜੀਦਾ ਨਹੀਂ ਹੈ ।

ਸਟਰੀਮਿੰਗ TTS ਪ੍ਰੀਮੀਅਮ ਇੰਜਣਾਂ ਉੱਤੇ /v1/tts/ API ਅੰਤ- ਬਿੰਦੂ ਨਾਲ stream=true ਨਾਲ ਉਪਲੱਬਧ ਹੈ। ਇਸ ਸਫ਼ੇ ਉੱਤੇ ਵੈਬ UI ਇੱਕ ਵਾਰ ਰਿਡਰਿੰਗ ਮੁਕੰਮਲ ਹੋਣ ਉੱਤੇ ਪੂਰਾ ਕਲਿੱਪ ਮੁੜ- ਭੇਜਦਾ ਹੈ।

Sesame CSM-1B ਸਾਡੇ ਆਪਣੇ GPUs ਉੱਤੇ ਚੱਲਦਾ ਹੈ। ਜਨਰੇਸ਼ਨ ਪਹਿਲਾਂ ਤੁਹਾਡੇ ਰੋਜ਼ਾਨਾ ਮੁਫ਼ਤ ਪੁਲ ਤੋਂ ਖਿੱਚਦਾ ਹੈ। ਇੱਕ ਵਾਰ ਖਤਮ ਹੋਣ ਤੇ, ਭੁਗਤਾਨ ਟੋਕਨ $5 → 200,000 ਟੋਕਨ ਤੋਂ ਸ਼ੁਰੂ ਹੁੰਦੇ ਹਨ। ਲਗਭਗ ~5 ਟੋਕਨ ਪ੍ਰਤੀ ਅੱਖਰ, ਘੱਟੋ-ਘੱਟ 100 ਪ੍ਰਤੀ ਕਲਿੱਪ।

ਵੈਬ UI ਉੱਤੇ ਪ੍ਰਤੀ ਬੇਨਤੀ 5,000 ਅੱਖਰ ਤੱਕ ਹਨ। ਲੰਬੇ ਟੁਕੜਿਆਂ (ਆਡੀਓਬੁੱਕਾਂ, ਪੂਰੇ ਭਾਗਾਂ) ਲਈ /voice/audiobook/ ਵਰਤੋਂ, ਜੋ ਕਿ ਆਟੋਮੈਟਿਕ ਹੀ ਟੁਕੜਿਆਂ ਵਿੱਚ ਵੰਡਦਾ ਹੈ ਜਾਂ ਲੂਪ ਵਿੱਚ API ਨੂੰ ਕਾਲ ਕਰਦਾ ਹੈ।

ਹਾਂ — /v1/tts/batch/ ਨੂੰ ਸਤਰ ਦੀ ਲਿਸਟ POST ਕਰੋ, ਜਾਂ /workspace/ ਉੱਤੇ ਵਰਕਸਪੇਸ UI ਦੀ ਵਰਤੋਂ ਕਰੋ, ਤਾਂ ਕਿ TTS ਨੂੰ ਲੰਬੇ ਪਾਈਪਲਾਈਨ ਵਿੱਚ ਚੈਨਲ ਕੀਤਾ ਜਾ ਸਕੇ (ਜਿਵੇਂ ਕਿ, translate → speak → stitch) ।

ਹਾਂ — /v1/tts/ ਨੂੰ POST ਟੈਕਸਟ ਨਾਲ model="Sesame CSM-1B" (ਜਾਂ ਇਸ ਸਫ਼ੇ ਉੱਤੇ slug) ਨਾਲ ਭੇਜੋ । WAV ਜਾਂ MP3 ਵਾਪਸ ਮਿਲੇਗਾ । ਪੂਰੇ ਹਵਾਲੇ + SDK ਨਿਸ਼ਾਨ ਲਈ /api/ ਵੇਖੋ ।

ਇਹ ਪੇਜ਼ ਪਾਠ-ਤੋਂ-ਭਾਸ਼ਾ ਹੈ, ਬੋਲੀ ਕਲੋਨਿੰਗ ਨਹੀਂ ਹੈ - ਬੋਲੀ ਇੰਜਣ ਦਾ ਡਿਫਾਲਟ ਹੈ। ਬੋਲੀ ਕਲੋਨਿੰਗ (ਰੁਪਏ ਆਡੀਓ ਅੱਪਲੋਡ ਕਰਨ ਲਈ) ਲਈ /voice/clone/ ਵੇਖੋ, ਜਿਸ ਲਈ ਤੁਹਾਨੂੰ ਬੋਲੀ ਅਧਿਕਾਰ ਹੋਣ ਜਾਂ ਸਪੱਸ਼ਟ ਲਿਖਤੀ ਮਨਜ਼ੂਰੀ ਹੋਣ ਦੀ ਲੋੜ ਹੈ।

ਸੇਲਫ- ਹੋਸਟਡ ਇੰਜਣ Free.ai- ਮਾਲਕ GPUs ਉੱਤੇ ਚੱਲਦੇ ਹਨ; ਸਾਡੇ ਸਰਵਰਾਂ ਤੋਂ ਕੁਝ ਵੀ ਨਹੀਂ ਜਾਂਦਾ ਹੈ । ਪ੍ਰੀਮੀਅਮ ਇੰਜਣ ਸਾਡੇ DPA ਅਧੀਨ ਟੈਕਸਟ ਨੂੰ ਉੱਪਰਲੇ ਮਾਡਲ ਪਰੋਵਾਈਡਰਾਂ ਨੂੰ ਭੇਜਦੇ ਹਨ । ਅਸੀਂ ਤੁਹਾਡੇ ਇੰਪੁੱਟ ਉੱਤੇ ਟਰੇਨਿੰਗ ਨਹੀਂ ਦਿੰਦੇ ਅਤੇ ਡਾਟਾ ਨਹੀਂ ਵੇਚਦੇ ।

ਹਾਂ — Free.ai ਬਣਾਈ ਆਡੀਓ ਲਈ ਵਪਾਰਕ ਵਰਤੋਂ ਲਈ ਮਨਜ਼ੂਰ ਹੈ। ਇੰਜਣ ਦਾ ਹੇਠਲਾ ਲਾਈਸੈਂਸ (ਅਪਾਚੀ 2.0, MIT, ਜਾਂ ਵਿਕਰੇਤਾ ਸ਼ਰਤਾਂ) ਉੱਤੇ ਅਤੇ ਮਾਡਲ ਹਵਾਲਾ ਪੇਜ਼ ਉੱਤੇ ਵੇਖਾਇਆ ਗਿਆ ਹੈ; ਪਰਿਭਾਸ਼ਾ ਵਿੱਚ ਇਸ ਦਾ ਮਤਲਬ ਹੈ ਕਿ ਬੋਲੀ, ਐਡ, ਪੋਡਕਾਸਟ ਅਤੇ ਐਪਲੀਕੇਸ਼ਨ ਸਭ ਇਸ ਦੇ ਢਾਂਚੇ ਵਿੱਚ ਹਨ।

ਹਾਂ — ਫੇਲ੍ਹ ਕੰਮ ਨੂੰ ਸਰੋਤ (ਦਿਨਵਾਰ ਪੁਲ ਜਾਂ ਭੁਗਤਾਨ ਕੀਤੇ ਟੋਕਨ) ਨੂੰ ਆਟੋ-ਰਿਫੰਡ ਕਰੋ। ਜੇਕਰ ਇੱਕ ਰਿਫੰਡ ਉਸੇ ਦਿਨ ਨਹੀਂ ਦਿਖਾਈ ਦਿੰਦਾ ਹੈ ਤਾਂ contact@free.ai ਨੂੰ ਈ-ਮੇਲ ਕਰੋ।

Free.ai ਪਸੰਦ ਹੈ? ਆਪਣੇ ਦੋਸਤਾਂ ਨੂੰ ਦੱਸੋ!

ਇਹ ਪੇਜ਼ ਰੇਟਿੰਗ