AI Voice — Sesame CSM-1B

વ્યાપારિક ઉપયોગ બરાબર છે 380+ મોડેલો વોટરમાર્ક નથી નોંધણીની જરૂર નથી
મોડેલ:
+ GPT-5, Claude, Gemini
TTS એન્જિન સ્વયં-હોસ્ટ થયેલ Apache 2.0
Sesame CSM-1B — Sesame CSM-1B — Apache 2.0. Conversational Speech Model designed for low-latency, real-time voice. 24 kHz output, sounds best with a short reference-audio context turn. Self-hosted on Free.ai for the /voice/realtime/ tool.
0 અક્ષરો ~0 ટોકન
અક્ષરોની ગણતરી સાથે ખર્ચ માપદંડો
ભાષા બનાવી રહ્યા છીએ...

શું કરે છે Sesame CSM-1B શું આવું લાગે છે?

Sesame CSM-1B — Apache 2.0. Conversational Speech Model designed for low-latency, real-time voice. 24 kHz output, sounds best with a short reference-audio context turn. Self-hosted on Free.ai for the /voice/realtime/ tool.

ઉપરના બોક્સને આ સાથે પ્રયત્ન કરો: હલો, મારું નામ સેમ છે, અને હું આ નમૂનો અવાજને પ્રદર્શિત કરવા માટે વાંચી રહ્યો છું. — તે કેનોનિકલ TTS ડેમો વાક્ય છે.

ક્યારે વાપરવું Sesame CSM-1B

ઓડિયોબુક્સ

સુસંગત ટોન સાથે લાંબા-રૂપે વાર્તાલાપ. એક સમયે એક પ્રકરણ ચોંટાડો, WAV અથવા MP3 તરીકે ડાઉનલોડ કરો, અને બાહ્ય રીતે સ્ટીચ કરો.

પોડકાસ્ટ પ્રવેશો

ટૂંકી ખોલવાની બમ્પર અને એડ-રીડ. ઊર્જા માટે ઝડપ સુયોજિત કરો, નાની ફાઈલો માટે MP3 માં બંધારણ-સ્વીકારો.

IVR + વૉઇસમેઇલ

ફોન-સિસ્ટમ પ્રશ્નો. સ્ટુડિયો-ગુણવત્તા આઉટપુટ બુકિંગ, રેકોર્ડિંગ, અથવા NDAs વૉઇસ પ્રતિભા વગર.

સુલભતા

ઓછા-દ્રષ્ટિ અને dyslexic વાચકો માટે લખાયેલ સમાવિષ્ટો સાથે ઓડિયો ઉમેરો. કોઈપણ પાના પર ડ્રોપ-ઇન.

ઉદાહરણ વાક્યો

"Welcome to the show, today we are exploring the future of AI."
"Your package has arrived. Please retrieve it from the front desk."
"Once upon a time, in a quiet village far away, lived a curious child."
"Press one for sales, two for support, or stay on the line for an agent."
"Breaking news: scientists have discovered a new species of deep-sea fish."
"Thank you for choosing us. We appreciate your business and look forward to serving you again."

કિંમત

આપણા GPUs પર સ્વયં-હોસ્ટ થયેલ. પેઢી તમારી રોજિંદી મુક્ત પુલમાંથી પહેલેથી ખેંચે છે; એકવાર તે બહાર નીકળે છે, ચૂકવેલ ટોકન પેક $5 → 200,000 ટોકન પર શરૂ થાય છે. લગભગ ~5 ટોકન પ્રતિ અક્ષર, ઓછામાં ઓછા 100 પ્રતિ ક્લિપ.

સંપૂર્ણ મોડેલ સંદર્ભ → · બધા TTS અવાજોને જુઓ → · ૨ અવાજોની બાજુ-બે બાજુ સરખામણી કરો →

ઉચ્ચ વિકલ્પો
પરિણામ
ટોકન નીચા ચાલી રહ્યા છે. વધુ ટોકન મેળવો
સારાં પરિણામો ઇચ્છો છો? પ્રીમિયમ મોડેલો (GPT-5, Claude, Gemini) ઉચ્ચ ગુણવત્તા પૂરી પાડે છે. યોજનાઓ જુઓ

❤️ Free.ai ને પ્રેમ છે? તમારા મિત્રોને કહો!

સબમિટ કરો સૂચના કડી મેળવવા અને મિત્ર દીઠ ૨૫,૦૦૦ ટોકન મેળવવા માટે.

વધારે ઇચ્છો છો? 30K ટોકન/દિવસ + 10K બોનસ માટે મફત નોંધણી કરો
મફત નોંધણી કરો

તમારી વિનંતી પ્રક્રિયા કરી રહ્યા છીએ...

Sesame CSM-1B — Apache 2.0. Conversational Speech Model designed for low-latency, real-time voice. 24 kHz output, sounds best with a short reference-audio …

કેવી રીતે વાપરવું AI Voice — Sesame CSM-1B

1
તમારો ઇનપુટ દાખલ કરો

લખાણ લખો, ફાઇલ અપલોડ કરો, અથવા તમે જે ઇચ્છો તે વર્ણવો. ખાતાની જરૂર નથી.

2
બનાવો ક્લિક કરો

અમારું એઆઈ શ્રેષ્ઠ ઓપન-સોર્સ મોડેલનો ઉપયોગ કરીને તમારી વિનંતીઓને સેકન્ડોમાં પ્રક્રિયા કરે છે.

3
ડાઉનલોડ કરો અને વહેંચો

તમારા પરિણામને ડાઉનલોડ કરો, નકલ કરો, અથવા વહેંચો. અંગત અને વ્યવસાયિક ઉપયોગ માટે મફત.

API મારફતે આ સાધન વાપરો

તમારા પોતાના કોડમાંથી આ સાધનને સ્વયં ચલાવો. OpenAI-સુસંગત REST અંતિમબિંદુ, બેરર-ટોકન સત્તાધિકરણ, કોઈ વધારાની SDK જરૂરી નથી. ટોકન ખર્ચાઓ વેબ ઇન્ટરફેસ સાથે બંધબેસે છે.

curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"text": "Hello from Free.ai", "voice": "af_heart", "model": "kokoro"}'

AI Voice — Sesame CSM-1B — FAQ

Sesame CSM-1B ભાષાઓની વિશાળ શ્રેણીને આધાર આપે છે. ચોક્કસ યાદી એ એન્જિન પર આધારિત છે; આ પાના પરનો ફોર્મ કોઈપણ લખાણને સ્વીકારે છે અને એન્જિન તેની આધારભૂત ભાષાઓમાં રેન્ડર કરશે. જો તમને ચોક્કસ ભાષાની જરૂર હોય તો સંપૂર્ણ બહુ-એન્જિન પસંદ કરનાર માટે /voice/ જુઓ.

મોટાભાગના એન્જિનો મૂળભૂત રીતે તટસ્થ-અમેરિકન અંગ્રેજી અને બિન-અંગ્રેજી ભાષાઓ માટે વિસ્તાર-સંબંધિત ઉચ્ચારણ રજૂ કરે છે. પ્રીમિયમ એન્જિનો ઉચ્ચારણ વિવિધતાઓ રજૂ કરી શકે છે - સરખામણી કરવા માટે નમૂનો ચોંટાડો.

SSML આધાર એંજિન દ્વારા બદલાય છે. અટકાવો, પ્રોસોડી, અને ભાર મૂકો ટેગો મોટાભાગના પ્રીમિયમ એંજિન પર અને થોડા સ્વયં-હોસ્ટ થયેલ પર માન્ય છે. સાદું લખાણ હંમેશા કામ કરે છે — કોઈ માર્કઅપ જરૂરી નથી.

સ્ટ્રીમિંગ TTS એ /v1/tts/ API અંતબિંદુ દ્વારા stream=true સાથે પ્રીમિયમ એન્જિનો પર ઉપલબ્ધ છે. આ પાનાં પરનું વેબ UI એકવાર રેન્ડરીંગ સમાપ્ત થાય ત્યારે સંપૂર્ણ ક્લિપને પાછું આપે છે.

Sesame CSM-1B આપણા પોતાના GPUs પર ચલાવે છે. પેઢી તમારી દરરોજની મુક્ત પુલમાંથી પહેલેથી ખેંચે છે. એકવાર ખતમ થઈ જાય, ચૂકવેલ ટોકન $5 → 200,000 ટોકન પર શરૂ થાય છે. લગભગ ~5 ટોકન પ્રતિ અક્ષર, ઓછામાં ઓછા 100 પ્રતિ ક્લિપ.

વેબ UI પર પ્રતિ વિનંતી ૫,૦૦૦ અક્ષરો સુધી. લાંબા ટુકડાઓ માટે (ઓડિયોબુક, સંપૂર્ણ પ્રકરણો), /voice/audiobook/ વાપરો જે આપમેળે ચુકે છે અને સ્ટીચ કરે છે, અથવા લુપમાં API ને બોલાવે છે.

હા — /v1/tts/batch/ માં શબ્દમાળાઓની યાદી POST કરો, અથવા /workspace/ પર કાર્યસ્થળ UI ને TTS ને લાંબી પાઇપલાઇનમાં ચેનલ કરવા માટે વાપરો (દા.ત., અનુવાદ કરો → બોલો → સ્તંભ).

હા — /v1/tts/ ને મોડેલ="Sesame CSM-1B" સાથે લખાણ POST કરો (અથવા આ પાના પરની slug). WAV અથવા MP3 પાછું આપે છે. સંપૂર્ણ સંદર્ભ + SDK સ્નિપેટો માટે /api/ જુઓ.

આ પાનું લખાણ-થી-ભાષા છે, અવાજ ક્લોનિંગ નથી - અવાજ એ એન્જિનનું મૂળભૂત છે. અવાજ ક્લોનિંગ માટે (સંદર્ભ ઓડિયો અપલોડ કરવા માટે), /voice/clone/ જુઓ, જે તમને અવાજના અધિકારો અથવા સ્પષ્ટ લખાયેલ સંમતિની જરૂરિયાત છે.

સ્વયં-હોસ્ટ થયેલ એન્જિનો Free.ai-માલિકી ધરાવતા GPUs પર ચલાવે છે; કંઇપણ અમારા સર્વરોને છોડતું નથી. પ્રીમિયમ એન્જિનો અમારા DPA ની અંદર અપસ્ટ્રીમ મોડેલ પૂરૂં પાડનારાઓને લખાણને પસાર કરે છે. અમે તમારા ઇનપુટ્સ પર તાલીમ આપતા નથી અને માહિતી વેચતા નથી.

હા — Free.ai ઉત્પન્ન થયેલ ઓડિયોનો વાણિજ્યિક ઉપયોગ પ્રદાન કરે છે. એન્જિનની નીચેની લાઇસન્સ (Apache 2.0, MIT, અથવા વેપારી શરતો) ઉપર અને મોડેલ સંદર્ભ પાના પર બતાવવામાં આવે છે; વાસ્તવિકતામાં આનો અર્થ વૉઇસોવર, જાહેરાતો, પોડકાસ્ટ, અને કાર્યક્રમો બધા વિસ્તારમાં છે.

હા — નિષ્ફળ કામો આપોઆપ સ્ત્રોતને પરત કરો (દૈનિક પુલ અથવા ચૂકવેલ ટોકન). જો પરત કરવું એ જ દિવસે દેખાય નહિં, contact@free.ai ને ઇમેઇલ કરો.

30,000 ટોકન માટે મફત નોંધણી કરો

ખાતું બનાવો

ક્રેડિટ કાર્ડની જરૂર નથી

તમે આ સાધનને કેવી રીતે રેટિંગ આપશો?

4.3/5 from 3 ratings

Free.ai ને પ્રેમ છે? તમારા મિત્રોને કહો!