Orpheus TTS
Free.ai
·
tts
·
~500 ટોકન પ્રતિ clip
·
4.3
માંથી 3 આ વર્ગના વપરાશકર્તાઓ
Orpheus TTS એ a લખાણ-થી-વાક્ય અવાજ છે. બાહ્ય મોડેલો મારફતે માર્ગદર્શિત — ~500 ટોકન્સ ક્લિપ પ્રતિ (ઉપરના ખર્ચ પર 50% માર્કઅપ).
API મારફતે વાપરો
OpenAI-સુસંગત REST API. કી ઉત્પન્ન કરો અને સેકન્ડોમાં આ મોડેલને બોલાવો.
curl -X POST https://api.free.ai/v1/tts/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/orpheus-tts","text":"hello world"}'
API દસ્તાવેજ
API કી મેળવો
આવા જ મોડેલો
વારંવાર પૂછાતા પ્રશ્નો
Orpheus TTS ભાષાઓની વિશાળ શ્રેણીને આધાર આપે છે. ચોક્કસ યાદી એ એન્જિન પર આધારિત છે; આ પાના પરનો ફોર્મ કોઈપણ લખાણને સ્વીકારે છે અને એન્જિન તેની આધારભૂત ભાષાઓમાં રેન્ડર કરશે. જો તમને ચોક્કસ ભાષાની જરૂર હોય તો સંપૂર્ણ બહુ-એન્જિન પસંદ કરનાર માટે /voice/ જુઓ.
મોટાભાગના એન્જિનો મૂળભૂત રીતે તટસ્થ-અમેરિકન અંગ્રેજી અને બિન-અંગ્રેજી ભાષાઓ માટે વિસ્તાર-સંબંધિત ઉચ્ચારણ રજૂ કરે છે. પ્રીમિયમ એન્જિનો ઉચ્ચારણ વિવિધતાઓ રજૂ કરી શકે છે - સરખામણી કરવા માટે નમૂનો ચોંટાડો.
SSML આધાર એંજિન દ્વારા બદલાય છે. અટકાવો, પ્રોસોડી, અને ભાર મૂકો ટેગો મોટાભાગના પ્રીમિયમ એંજિન પર અને થોડા સ્વયં-હોસ્ટ થયેલ પર માન્ય છે. સાદું લખાણ હંમેશા કામ કરે છે — કોઈ માર્કઅપ જરૂરી નથી.
સ્ટ્રીમિંગ TTS એ /v1/tts/ API અંતબિંદુ દ્વારા stream=true સાથે પ્રીમિયમ એન્જિનો પર ઉપલબ્ધ છે. આ પાનાં પરનું વેબ UI એકવાર રેન્ડરીંગ સમાપ્ત થાય ત્યારે સંપૂર્ણ ક્લિપને પાછું આપે છે.
Orpheus TTS એ પ્રીમિયમ TTS એન્જિન છે. ખર્ચ અક્ષરોની ગણતરી સાથે માપવામાં આવે છે - સામાન્ય રીતે ~30 ટોકન પ્રતિ અક્ષર. $1 750,000 ટોકન ખરીદે છે, તેથી $5 પેક અક્ષરોના હજારો દસ્યોને આવરી લે છે.
વેબ UI પર પ્રતિ વિનંતી ૫,૦૦૦ અક્ષરો સુધી. લાંબા ટુકડાઓ માટે (ઓડિયોબુક, સંપૂર્ણ પ્રકરણો), /voice/audiobook/ વાપરો જે આપમેળે ચુકે છે અને સ્ટીચ કરે છે, અથવા લુપમાં API ને બોલાવે છે.
હા — /v1/tts/batch/ માં શબ્દમાળાઓની યાદી POST કરો, અથવા /workspace/ પર કાર્યસ્થળ UI ને TTS ને લાંબી પાઇપલાઇનમાં ચેનલ કરવા માટે વાપરો (દા.ત., અનુવાદ કરો → બોલો → સ્તંભ).
હા — /v1/tts/ ને મોડેલ="Orpheus TTS" સાથે લખાણ POST કરો (અથવા આ પાના પરની slug). WAV અથવા MP3 પાછું આપે છે. સંપૂર્ણ સંદર્ભ + SDK સ્નિપેટો માટે /api/ જુઓ.
આ પાનું લખાણ-થી-ભાષા છે, અવાજ ક્લોનિંગ નથી - અવાજ એ એન્જિનનું મૂળભૂત છે. અવાજ ક્લોનિંગ માટે (સંદર્ભ ઓડિયો અપલોડ કરવા માટે), /voice/clone/ જુઓ, જે તમને અવાજના અધિકારો અથવા સ્પષ્ટ લખાયેલ સંમતિની જરૂરિયાત છે.
સ્વયં-હોસ્ટ થયેલ એન્જિનો Free.ai-માલિકી ધરાવતા GPUs પર ચલાવે છે; કંઇપણ અમારા સર્વરોને છોડતું નથી. પ્રીમિયમ એન્જિનો અમારા DPA ની અંદર અપસ્ટ્રીમ મોડેલ પૂરૂં પાડનારાઓને લખાણને પસાર કરે છે. અમે તમારા ઇનપુટ્સ પર તાલીમ આપતા નથી અને માહિતી વેચતા નથી.
હા — Free.ai ઉત્પન્ન થયેલ ઓડિયોનો વાણિજ્યિક ઉપયોગ પ્રદાન કરે છે. એન્જિનની નીચેની લાઇસન્સ (Apache 2.0, MIT, અથવા વેપારી શરતો) ઉપર અને મોડેલ સંદર્ભ પાના પર બતાવવામાં આવે છે; વાસ્તવિકતામાં આનો અર્થ વૉઇસોવર, જાહેરાતો, પોડકાસ્ટ, અને કાર્યક્રમો બધા વિસ્તારમાં છે.
હા — નિષ્ફળ કામો આપોઆપ સ્ત્રોતને પરત કરો (દૈનિક પુલ અથવા ચૂકવેલ ટોકન). જો પરત કરવું એ જ દિવસે દેખાય નહિં, contact@free.ai ને ઇમેઇલ કરો.