OpenAI: GPT Audio

OpenAI · tts · ~4781 tocynnau y eiliad clip · 4.3 o 3 defnyddwyr y categori yma

Testun i' w ddweud

Llywio

Cyflymder

~4781 tocynnau y eiliad clip

Rhedeg yn rhad ar ein GPUs. Uwchraddio am OpenAI: GPT Audio →

OpenAI: GPT Audio yw a testun-i-lafaru a adeiladwyd gan OpenAI. Wedi'i lwybro drwy ddelweddau allanol — ~4,781 tocynnau am bob clip (marc 50% dros gost uwch).

Defnyddio trwy API

API REST OpenAI-cydnaws. Creu allwedd a galw'r model hwn mewn eiliad.

curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"openai/gpt-audio","text":"hello world"}'

Dogfennaeth API Nôl Allwedd API

Modelau tebyg

Bark TTS

Cartesia Sonic 3 (real-time)

ElevenLabs Multilingual v2

ElevenLabs Turbo v2.5

Inworld TTS

Orpheus TTS

Parler TTS Large

PlayAI v3 TTS

Pori pob model →

Cwestiynau a Ofynnir yn Aml

Mae OpenAI: GPT Audio yn cynnal ystod eang o ieithoedd. Mae'r rhestr gywir yn dibynnu ar yr injan; mae'r ffurflen ar y dudalen hon yn derbyn unrhyw destun a bydd yr injan yn arlunio mewn ei ieithoedd a gynhelir. Gweler /voice/ am y dewisydd aml-beiriant llawn os oes angen iaith benodol arnoch.

Mae'r rhan fwyaf o beirianwyr yn lunio Saesneg Americanaidd canolog yn rhagosodedig a chaneuon addas i'r ardal ar gyfer ieithoedd nad ydynt yn Saesneg. Gall beirianwyr premiwm arddangos amrywiolion caneuon - gludwch enghraifft i'w chymharu.

Mae cynhaliaeth SSML yn amrywio yn ôl peiriant. Mae tagiau seibio, prosod, ac amlygu yn cael eu cydnabod ar y rhan fwyaf o beirianyddion premiwm ac ar rai hunanghostedig. Mae testun plaen yn gweithio o hyd — nid oes angen marcio.

Mae TTS llif ar gael ar beiriannau premiwm drwy'r diweddbwyntiau API /v1/tts/ gyda stream=true. Mae'r rhyngwyneb defnyddiwr gwe ar y dudalen hon yn dychwelyd y clip llawn pan orffennir y lluniadu.

Mae OpenAI: GPT Audio yn beiriant TTS premiwm. Mae'r gost yn amrywio yn ôl nifer y nodau - ~30 tocyn am bob nod fel arfer. Mae $1 yn prynu 750,000 o tocynnau, felly mae pecyn o $5 yn cwmpasu degau o filoedd o nodau.

hyd at 5,000 o nodau ar gyfer pob cais ar y rhyngwyneb defnyddiwr gwe. Ar gyfer darnau hirach (llyfr sain, pennod gyfan), defnyddiwch /voice/audiobook/ sy'n torri a sticio'n awtomatig, neu ffoniwch yr API mewn cylch.

Ie — POST rhestr o linynnau i /v1/tts/batch/, neu defnyddiwch y rhyngwyneb defnyddiwr gweithfan yn /workspace/ i gysgodi TTS i mewn i pibellau hirach (e.e., cyfieithu → siarad → stitch).

Ie — POST testun i /v1/tts/ gyda model="OpenAI: GPT Audio" (neu'r slug ar y dudalen hon). Dychwelyd WAV neu MP3. Gweler /api/ am gyfeiriad llawn + darnau SDK.

Testun-i-ganu yw'r dudalen hon, nid clonio llais - y llais yw rhagosodiad y peiriant. Am glonio llais (lwytho sain cyfeirio i fyny), gweler /voice/clone/, sy'n gofyn i chi fod yn berchen ar hawliau'r llais neu fod gennych ganiatâd ysgrifenedig clir.

Rheda peiriannau hunan-gartrefedig ar GPUau Free.ai-ei-berchen; nid yw dim yn gadael ein gweinyddion. Mae peiriannau premiwm yn pasio testun i ddarparwyr modelau uwchlaw ein DPA. Ni ydym yn hyfforddi ar eich mewnbwn ac ni werthwn ddata.

Ie — Free.ai yn caniatáu defnydd masnachol o sain a gynhyrchir. Mae trwydded sylfaenol yr injan (Apache 2.0, MIT, neu delerau'r gwerthwr) yn cael ei dangos uchod ac ar dudalen cyfeirio'r model; yn ymarferol mae hyn yn golygu bod y geiriau, hysbysebion, podiau, a rhaglenni i gyd yn rhan o'r amrediad.

Ie — ad-dalu tasgau methu'n awtomatig i'r ffynhonnell (pool diwrnod neu tocynnau talu). Os nad yw ad-daliad yn ymddangos yr un diwrnod, anfonwch e-bost at contact@free.ai.

OpenAI: GPT Audio

Defnyddio trwy API

Modelau tebyg

Cwestiynau a Ofynnir yn Aml

Pa ieithoedd mae OpenAI: GPT Audio yn eu cwmpasu?

A oes gan OpenAI: GPT Audio gyweiriad adnabod?

A allaf ddefnyddio SSML gyda OpenAI: GPT Audio?

A yw OpenAI: GPT Audio yn cynnal llifogydd?

Faint mae OpenAI: GPT Audio yn costio am bob clip?

Pa hyd testun uchaf sydd ar gyfer OpenAI: GPT Audio?

A allaf redeg OpenAI: GPT Audio mewn batch?

A oes API ar gyfer OpenAI: GPT Audio?

A oes angen caniatâd arnaf i gloni llais gyda OpenAI: GPT Audio?

Beth am breifatrwydd gyda OpenAI: GPT Audio?

A yw'r allbwn OpenAI: GPT Audio yn ddiogel ar gyfer defnydd masnachol?

A allaf gael ad-daliad os mae OpenAI: GPT Audio yn methu?

Derbyn 10,000 o Tocynnau Am Ddim

Aros — Cael 10K o Ddyfeisiau Am Ddim!

Hoffech fwy?