Sesame CSM-1B

Free.ai (self-hosted) · tts · ~500 ટોકન પ્રતિ clip · 4.3 માંથી 3 આ વર્ગના વપરાશકર્તાઓ
~500 ટોકન પ્રતિ clip

Sesame CSM-1B એ a લખાણ-થી-વાક્ય અવાજ છે જે Sesame દ્વારા બનાવવામાં આવ્યું છે. Real-time voice agents, conversational AI, streaming TTS where time-to-first-audio matters more than studio-perfect reads. પર સૌથી મજબૂત. Free.ai GPUs પર સ્વયં-હોસ્ટ થયેલ — તમારા રોજિંદા ટોકન પુલ (500 ટોકન ક્લિપ પ્રતિ) સામે મુક્ત રીતે ચાલે છે. Apache 2.0 હેઠળ બહાર પાડવામાં આવ્યું — વ્યાવસાયિક ઉપયોગ માટે Free.ai પર પરવાનગી આપવામાં આવી છે.

API મારફતે વાપરો

OpenAI-સુસંગત REST API. કી ઉત્પન્ન કરો અને સેકન્ડોમાં આ મોડેલને બોલાવો.

curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"csm-1b","text":"hello world"}'
API દસ્તાવેજ API કી મેળવો

વારંવાર પૂછાતા પ્રશ્નો

Sesame CSM-1B ભાષાઓની વિશાળ શ્રેણીને આધાર આપે છે. ચોક્કસ યાદી એ એન્જિન પર આધારિત છે; આ પાના પરનો ફોર્મ કોઈપણ લખાણને સ્વીકારે છે અને એન્જિન તેની આધારભૂત ભાષાઓમાં રેન્ડર કરશે. જો તમને ચોક્કસ ભાષાની જરૂર હોય તો સંપૂર્ણ બહુ-એન્જિન પસંદ કરનાર માટે /voice/ જુઓ.

મોટાભાગના એન્જિનો મૂળભૂત રીતે તટસ્થ-અમેરિકન અંગ્રેજી અને બિન-અંગ્રેજી ભાષાઓ માટે વિસ્તાર-સંબંધિત ઉચ્ચારણ રજૂ કરે છે. પ્રીમિયમ એન્જિનો ઉચ્ચારણ વિવિધતાઓ રજૂ કરી શકે છે - સરખામણી કરવા માટે નમૂનો ચોંટાડો.

SSML આધાર એંજિન દ્વારા બદલાય છે. અટકાવો, પ્રોસોડી, અને ભાર મૂકો ટેગો મોટાભાગના પ્રીમિયમ એંજિન પર અને થોડા સ્વયં-હોસ્ટ થયેલ પર માન્ય છે. સાદું લખાણ હંમેશા કામ કરે છે — કોઈ માર્કઅપ જરૂરી નથી.

સ્ટ્રીમિંગ TTS એ /v1/tts/ API અંતબિંદુ દ્વારા stream=true સાથે પ્રીમિયમ એન્જિનો પર ઉપલબ્ધ છે. આ પાનાં પરનું વેબ UI એકવાર રેન્ડરીંગ સમાપ્ત થાય ત્યારે સંપૂર્ણ ક્લિપને પાછું આપે છે.

Sesame CSM-1B આપણા પોતાના GPUs પર ચલાવે છે. પેઢી તમારી દરરોજની મુક્ત પુલમાંથી પહેલેથી ખેંચે છે. એકવાર ખતમ થઈ જાય, ચૂકવેલ ટોકન $5 → 200,000 ટોકન પર શરૂ થાય છે. લગભગ ~5 ટોકન પ્રતિ અક્ષર, ઓછામાં ઓછા 100 પ્રતિ ક્લિપ.

વેબ UI પર પ્રતિ વિનંતી ૫,૦૦૦ અક્ષરો સુધી. લાંબા ટુકડાઓ માટે (ઓડિયોબુક, સંપૂર્ણ પ્રકરણો), /voice/audiobook/ વાપરો જે આપમેળે ચુકે છે અને સ્ટીચ કરે છે, અથવા લુપમાં API ને બોલાવે છે.

હા — /v1/tts/batch/ માં શબ્દમાળાઓની યાદી POST કરો, અથવા /workspace/ પર કાર્યસ્થળ UI ને TTS ને લાંબી પાઇપલાઇનમાં ચેનલ કરવા માટે વાપરો (દા.ત., અનુવાદ કરો → બોલો → સ્તંભ).

હા — /v1/tts/ ને મોડેલ="Sesame CSM-1B" સાથે લખાણ POST કરો (અથવા આ પાના પરની slug). WAV અથવા MP3 પાછું આપે છે. સંપૂર્ણ સંદર્ભ + SDK સ્નિપેટો માટે /api/ જુઓ.

આ પાનું લખાણ-થી-ભાષા છે, અવાજ ક્લોનિંગ નથી - અવાજ એ એન્જિનનું મૂળભૂત છે. અવાજ ક્લોનિંગ માટે (સંદર્ભ ઓડિયો અપલોડ કરવા માટે), /voice/clone/ જુઓ, જે તમને અવાજના અધિકારો અથવા સ્પષ્ટ લખાયેલ સંમતિની જરૂરિયાત છે.

સ્વયં-હોસ્ટ થયેલ એન્જિનો Free.ai-માલિકી ધરાવતા GPUs પર ચલાવે છે; કંઇપણ અમારા સર્વરોને છોડતું નથી. પ્રીમિયમ એન્જિનો અમારા DPA ની અંદર અપસ્ટ્રીમ મોડેલ પૂરૂં પાડનારાઓને લખાણને પસાર કરે છે. અમે તમારા ઇનપુટ્સ પર તાલીમ આપતા નથી અને માહિતી વેચતા નથી.

હા — Free.ai ઉત્પન્ન થયેલ ઓડિયોનો વાણિજ્યિક ઉપયોગ પ્રદાન કરે છે. એન્જિનની નીચેની લાઇસન્સ (Apache 2.0, MIT, અથવા વેપારી શરતો) ઉપર અને મોડેલ સંદર્ભ પાના પર બતાવવામાં આવે છે; વાસ્તવિકતામાં આનો અર્થ વૉઇસોવર, જાહેરાતો, પોડકાસ્ટ, અને કાર્યક્રમો બધા વિસ્તારમાં છે.

હા — નિષ્ફળ કામો આપોઆપ સ્ત્રોતને પરત કરો (દૈનિક પુલ અથવા ચૂકવેલ ટોકન). જો પરત કરવું એ જ દિવસે દેખાય નહિં, contact@free.ai ને ઇમેઇલ કરો.

Free.ai ને પ્રેમ છે? તમારા મિત્રોને કહો!

આ પાનાંને દર આપો