OpenAI: GPT-4o Audio
OpenAI
·
tts
·
~4781 žetonov na clip
·
4.3
od 3 uporabniki te kategorije
_FREEAI_PH_Leada {kategorija} zgrajena z OpenAI. Pot prek zunanjih modelov – ~4,781 žetonov na posnetek (50 % označevanja nad stroški nad tokom).
Uporaba prek API
curl -X POST https://api.free.ai/v1/tts/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"openai/gpt-4o-audio-preview","text":"hello world"}'
Dokumentacija API
Dobi ključ API
Pogosta vprašanja
OpenAI: GPT-4o Audio podpira široko paleto jezikov. Natančen seznam je odvisen od motorja; obrazec na tej strani sprejema katero koli besedilo in motor bo prikazan v podprtih jezikih. Glej /voice/ za polni izbirnik večmotorjev, če potrebujete določen jezik.
Večina motorjev je nevtralno-ameriški angleški privzeto in regijsko primeren naglas za neangleške jezike. Premium motorji lahko izpostavijo naglasne različice – vstavite vzorec za primerjavo.
Podpora SSML se razlikuje po motorju. Pavza, prozodija in označevalne oznake so izpolnjeni na večini premium motorjev in na nekaj samostojnih motorjev. Običajno besedilo vedno deluje – ni potrebno označevanje.
Streaming TTS je na voljo na premium motorjih prek dogodka /v1/tts/ API s stream=true. Spletni uporabniški interfejs na tej strani vrne celoten posnetek, ko izdelava konča.
OpenAI: GPT-4o Audio je premium TTS motor. Stroški lestvice s številom znakov – običajno ~30 žetonov na znak. $1 kupuje 750.000 žetonov, tako da paket $5 pokriva desetine tisoč znakov.
Do 5000 znakov na zahtevo na spletnem uporabniku. Za daljše kose (audiobooks, polna poglavja), uporabite /voice/audiobook /, ki kose in šive samodejno, ali pokličite API v zanke.
Da – POST seznam nizov na /v1/tts/batch /, ali uporabite delovno mesto na /workspace/ na verigo TTS v daljši cevovod (npr., prevesti → govoriti → šiv).
Da – besedilo POST na /v1/tts/ z modelom="OpenAI: GPT-4o Audio" (ali kroglo na tej strani). Vrne WAV ali MP3. Glej /api/ za celoten referenčni odsek + SDK.
Ta stran je tekst-to-speech, ne kloniranje glasu – glas je privzeto motorju. Za kloniranje glasu (nalaganje referenčnega zvoka), glej /voice/klon /, ki zahteva bodisi lastništvo glasovnih pravic ali izrecno pisno soglasje.
Samostojni motorji, ki tečejo na Free.ai GPU v lasti; nič ne zapusti naših strežnikov. Premium motorji predajo besedilo ponudnikom modelov navzgor pod našim DPA. Ne treniramo na vaših vhodih in ne prodajamo podatkov.
Da – Free.ai dodeljuje komercialno uporabo generiranega zvoka. Osnovna licenca motorja (Apache 2.0, MIT ali prodajni pogoji) je prikazana zgoraj in na modelni referenčni strani; v praksi to pomeni glasovne preglede, oglase, podcast in aplikacije so vse v okviru.
Da – neuspela delovna mesta samodejno povrnitev vira (dnevno združevanje ali plačane žetone). Če se nadomestilo ne pojavi istega dne, e-poštni naslov contact@free.ai.