OpenAI: GPT-4o Audio
OpenAI
·
tts
·
~4781 žetoni uz vienu clip
·
4.3
no 3 šīs kategorijas lietotāji
OpenAI: GPT-4o Audio ir {da}ļiņu__ {kategorija}, ko {pied}āvātājs_. Maršruts, izmantojot ārējos modeļus — ~{tpm_markes} uz vienu klipu(50 % atzīme virs iepriekšējā posma izmaksām).
Izmantošana caur API
curl -X POST https://api.free.ai/v1/tts/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"openai/gpt-4o-audio-preview","text":"hello world"}'
API dokumentācija
Iegūst API atslēgu
Bieži uzdoti jautājumi
OpenAI: GPT-4o Audio atbalsta plašu valodu klāstu. Precīzs saraksts ir atkarīgs no motora; šajā lapā esošā veidlapa pieņem jebkuru tekstu, un motors izpildīs to atbalstītajās valodās. Pilnu vairāku dzinēju izvēlētāju, ja jums ir nepieciešama konkrēta valoda, skatiet /balss/.
Lielākā daļa dzinēju pēc noklusējuma veido neitrālu amerikāņu angļu valodu un reģionam atbilstošu akcentu ne angļu valodā. Premium dzinēji var atklāt akcenta variantus — ielīmēt paraugu, lai salīdzinātu.
SSML atbalsts mainās atkarībā no dzinēja. Pause, prosody, un uzsvara tagi tiek pagodināti uz lielāko daļu premium motoriem un uz dažiem patstāvīgi. Vienkāršs teksts vienmēr darbojas — nav nepieciešama marka.
Straumēšana TTS ir pieejama premium dzinējiem, izmantojot /v1/tts/ API galapunkts ar straume=patiesība. Web UI šajā lapā atgriež pilnu klipu, kad renderēšana beidzas.
OpenAI: GPT-4o Audio ir premium TTS dzinējs. Izmaksu svari ar rakstzīmju skaitu — parasti ~30 žetoni uz rakstzīmes. $1 pērk 750,000 žetonus, tā $5 iepakojums aptver desmitiem tūkstošu rakstzīmju.
Līdz 5000 rakstzīmēm par pieprasījumu tīmekļa UI. Ilgākus gabalus (audiobooks, pilnas nodaļas), izmantot /balss/audiobook / kas gabalos un šuves automātiski, vai zvana API cilpā.
Jā — Pēc virknes sarakstu, lai /v1/tts/partija/, vai izmantot darbtelpu UI pie /workspace/ ķēde TTS ilgākā cauruļvadā (piem, tulkot → runāt → dūriens).
Jā — Post text to /v1/ tts/ with model="_ FREEALI_ PH_name_" (vai slug on this page). Atgriež WAV vai MP3. Skatīt /api/ pilnu atsauci + SDK fragmenti.
Šī lapa ir teksta- to- speech, nevis balss klonēšana - balss ir dzinēja noklusējuma. Balss klonēšanai (ielādējot atsauces audio), skatiet / balss/kluba/, kas prasa, lai jums vai nu pieder balss tiesības, vai ir skaidra rakstiska piekrišana.
Pašapkalpošanās dzinēji darbojas ar Free.ai pieder GPU; nekas atstāj mūsu serveri. Premium dzinēji nodot tekstu augšupējiem modeļu piegādātājiem saskaņā ar mūsu DPA. Mēs neapmācām jūsu ievades un nepārdod datus.
Jā — Free.ai piešķir komerciālu izmantošanu ģenerēta audio. Dzinēja pamata licence (Apache 2.0, MIT, vai pārdevēja noteikumi) ir norādīta iepriekš un uz modeļa atsauces lapā; praksē tas nozīmē, ka skaļrunis, reklāmas, podcast, un aplikācijas ir visas iekšskopā.
Jā – neizdevās darbu auto-atmaksāt avotu (dienas baseins vai apmaksāti žetoni). Ja kompensācija neuzrāda tajā pašā dienā, e-pasts contact@free.ai.