OpenAI: GPT Audio

OpenAI · tts · ~4781 ટોકન પ્રતિ clip · 4.3 માંથી 3 આ વર્ગના વપરાશકર્તાઓ
~4781 ટોકન પ્રતિ clip Sign up + buy tokens to try
અથવા અમારા મફત સ્વયં-હોસ્ટ થયેલનો પ્રયત્ન કરો Kokoro TTS → — નોંધણીની જરૂર નથી

OpenAI: GPT Audio એ a લખાણ-થી-વાક્ય અવાજ છે જે OpenAI દ્વારા બનાવવામાં આવ્યું છે. બાહ્ય મોડેલો મારફતે માર્ગદર્શિત — ~4,781 ટોકન્સ ક્લિપ પ્રતિ (ઉપરના ખર્ચ પર 50% માર્કઅપ).

API મારફતે વાપરો
curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"openai/gpt-audio","text":"hello world"}'
API દસ્તાવેજ API કી મેળવો

વારંવાર પૂછાતા પ્રશ્નો

OpenAI: GPT Audio ભાષાઓની વિશાળ શ્રેણીને આધાર આપે છે. ચોક્કસ યાદી એ એન્જિન પર આધારિત છે; આ પાના પરનો ફોર્મ કોઈપણ લખાણને સ્વીકારે છે અને એન્જિન તેની આધારભૂત ભાષાઓમાં રેન્ડર કરશે. જો તમને ચોક્કસ ભાષાની જરૂર હોય તો સંપૂર્ણ બહુ-એન્જિન પસંદ કરનાર માટે /voice/ જુઓ.

મોટાભાગના એન્જિનો મૂળભૂત રીતે તટસ્થ-અમેરિકન અંગ્રેજી અને બિન-અંગ્રેજી ભાષાઓ માટે વિસ્તાર-સંબંધિત ઉચ્ચારણ રજૂ કરે છે. પ્રીમિયમ એન્જિનો ઉચ્ચારણ વિવિધતાઓ રજૂ કરી શકે છે - સરખામણી કરવા માટે નમૂનો ચોંટાડો.

SSML આધાર એંજિન દ્વારા બદલાય છે. અટકાવો, પ્રોસોડી, અને ભાર મૂકો ટેગો મોટાભાગના પ્રીમિયમ એંજિન પર અને થોડા સ્વયં-હોસ્ટ થયેલ પર માન્ય છે. સાદું લખાણ હંમેશા કામ કરે છે — કોઈ માર્કઅપ જરૂરી નથી.

સ્ટ્રીમિંગ TTS એ /v1/tts/ API અંતબિંદુ દ્વારા stream=true સાથે પ્રીમિયમ એન્જિનો પર ઉપલબ્ધ છે. આ પાનાં પરનું વેબ UI એકવાર રેન્ડરીંગ સમાપ્ત થાય ત્યારે સંપૂર્ણ ક્લિપને પાછું આપે છે.

OpenAI: GPT Audio એ પ્રીમિયમ TTS એન્જિન છે. ખર્ચ અક્ષરોની ગણતરી સાથે માપવામાં આવે છે - સામાન્ય રીતે ~30 ટોકન પ્રતિ અક્ષર. $1 750,000 ટોકન ખરીદે છે, તેથી $5 પેક અક્ષરોના હજારો દસ્યોને આવરી લે છે.

વેબ UI પર પ્રતિ વિનંતી ૫,૦૦૦ અક્ષરો સુધી. લાંબા ટુકડાઓ માટે (ઓડિયોબુક, સંપૂર્ણ પ્રકરણો), /voice/audiobook/ વાપરો જે આપમેળે ચુકે છે અને સ્ટીચ કરે છે, અથવા લુપમાં API ને બોલાવે છે.

હા — /v1/tts/batch/ માં શબ્દમાળાઓની યાદી POST કરો, અથવા /workspace/ પર કાર્યસ્થળ UI ને TTS ને લાંબી પાઇપલાઇનમાં ચેનલ કરવા માટે વાપરો (દા.ત., અનુવાદ કરો → બોલો → સ્તંભ).

હા — /v1/tts/ ને મોડેલ="OpenAI: GPT Audio" સાથે લખાણ POST કરો (અથવા આ પાના પરની slug). WAV અથવા MP3 પાછું આપે છે. સંપૂર્ણ સંદર્ભ + SDK સ્નિપેટો માટે /api/ જુઓ.

આ પાનું લખાણ-થી-ભાષા છે, અવાજ ક્લોનિંગ નથી - અવાજ એ એન્જિનનું મૂળભૂત છે. અવાજ ક્લોનિંગ માટે (સંદર્ભ ઓડિયો અપલોડ કરવા માટે), /voice/clone/ જુઓ, જે તમને અવાજના અધિકારો અથવા સ્પષ્ટ લખાયેલ સંમતિની જરૂરિયાત છે.

સ્વયં-હોસ્ટ થયેલ એન્જિનો Free.ai-માલિકી ધરાવતા GPUs પર ચલાવે છે; કંઇપણ અમારા સર્વરોને છોડતું નથી. પ્રીમિયમ એન્જિનો અમારા DPA ની અંદર અપસ્ટ્રીમ મોડેલ પૂરૂં પાડનારાઓને લખાણને પસાર કરે છે. અમે તમારા ઇનપુટ્સ પર તાલીમ આપતા નથી અને માહિતી વેચતા નથી.

Yes — Free.ai grants commercial use of generated audio. The engine's underlying license (Apache 2.0, MIT, or vendor terms) is shown above and on the model reference page; in practice this means voiceovers, ads, podcasts, and apps are all in-scope.

હા — નિષ્ફળ કામો આપોઆપ સ્ત્રોતને પરત કરો (દૈનિક પુલ અથવા ચૂકવેલ ટોકન). જો પરત કરવું એ જ દિવસે દેખાય નહિં, contact@free.ai ને ઇમેઇલ કરો.

Free.ai ને પ્રેમ છે? તમારા મિત્રોને કહો!

આ પાનાંને દર આપો