OpenAI: GPT Audio

OpenAI · tts · ~4781 tocynnau y eiliad clip · 4.3 o 3 defnyddwyr y categori yma
~4781 tocynnau y eiliad clip Sign up + buy tokens to try
Neu ceisiwch ein gwefan hunan-gyfeillgar am ddim Kokoro TTS → — Dim angen cofrestru

OpenAI: GPT Audio yw a testun-i-lafaru a adeiladwyd gan OpenAI. Wedi'i lwybro drwy ddelweddau allanol — ~4,781 tocynnau am bob clip (marc 50% dros gost uwch).

Defnyddio trwy API
curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"openai/gpt-audio","text":"hello world"}'
Dogfennaeth API Nôl Allwedd API

Cwestiynau a Ofynnir yn Aml

Mae OpenAI: GPT Audio yn cynnal ystod eang o ieithoedd. Mae'r rhestr gywir yn dibynnu ar yr injan; mae'r ffurflen ar y dudalen hon yn derbyn unrhyw destun a bydd yr injan yn arlunio mewn ei ieithoedd a gynhelir. Gweler /voice/ am y dewisydd aml-beiriant llawn os oes angen iaith benodol arnoch.

Mae'r rhan fwyaf o beirianwyr yn lunio Saesneg Americanaidd canolog yn rhagosodedig a chaneuon addas i'r ardal ar gyfer ieithoedd nad ydynt yn Saesneg. Gall beirianwyr premiwm arddangos amrywiolion caneuon - gludwch enghraifft i'w chymharu.

Mae cynhaliaeth SSML yn amrywio yn ôl peiriant. Mae tagiau seibio, prosod, ac amlygu yn cael eu cydnabod ar y rhan fwyaf o beirianyddion premiwm ac ar rai hunanghostedig. Mae testun plaen yn gweithio o hyd — nid oes angen marcio.

Mae TTS llif ar gael ar beiriannau premiwm drwy'r diweddbwyntiau API /v1/tts/ gyda stream=true. Mae'r rhyngwyneb defnyddiwr gwe ar y dudalen hon yn dychwelyd y clip llawn pan orffennir y lluniadu.

Mae OpenAI: GPT Audio yn beiriant TTS premiwm. Mae'r gost yn amrywio yn ôl nifer y nodau - ~30 tocyn am bob nod fel arfer. Mae $1 yn prynu 750,000 o tocynnau, felly mae pecyn o $5 yn cwmpasu degau o filoedd o nodau.

hyd at 5,000 o nodau ar gyfer pob cais ar y rhyngwyneb defnyddiwr gwe. Ar gyfer darnau hirach (llyfr sain, pennod gyfan), defnyddiwch /voice/audiobook/ sy'n torri a sticio'n awtomatig, neu ffoniwch yr API mewn cylch.

Ie — POST rhestr o linynnau i /v1/tts/batch/, neu defnyddiwch y rhyngwyneb defnyddiwr gweithfan yn /workspace/ i gysgodi TTS i mewn i pibellau hirach (e.e., cyfieithu → siarad → stitch).

Ie — POST testun i /v1/tts/ gyda model="OpenAI: GPT Audio" (neu'r slug ar y dudalen hon). Dychwelyd WAV neu MP3. Gweler /api/ am gyfeiriad llawn + darnau SDK.

Testun-i-ganu yw'r dudalen hon, nid clonio llais - y llais yw rhagosodiad y peiriant. Am glonio llais (lwytho sain cyfeirio i fyny), gweler /voice/clone/, sy'n gofyn i chi fod yn berchen ar hawliau'r llais neu fod gennych ganiatâd ysgrifenedig clir.

Rheda peiriannau hunan-gartrefedig ar GPUau Free.ai-ei-berchen; nid yw dim yn gadael ein gweinyddion. Mae peiriannau premiwm yn pasio testun i ddarparwyr modelau uwchlaw ein DPA. Ni ydym yn hyfforddi ar eich mewnbwn ac ni werthwn ddata.

Ie — Free.ai yn caniatáu defnydd masnachol o sain a gynhyrchir. Mae trwydded sylfaenol yr injan (Apache 2.0, MIT, neu delerau'r gwerthwr) yn cael ei dangos uchod ac ar dudalen cyfeirio'r model; yn ymarferol mae hyn yn golygu bod y geiriau, hysbysebion, podiau, a rhaglenni i gyd yn rhan o'r amrediad.

Ie — ad-dalu tasgau methu'n awtomatig i'r ffynhonnell (pool diwrnod neu tocynnau talu). Os nad yw ad-daliad yn ymddangos yr un diwrnod, anfonwch e-bost at contact@free.ai.

Hoffwch Free.ai? Meddwl am eich ffrindiau!

Graddio'r dudalen hon