Manylion Model
Am
Mae Dia Voice Clone yn a Model AI. Wedi'i lwybro drwy ddelweddau allanol — ~500 tocynnau Defnyddio (marc 50% dros gost uwch).
Defnyddio trwy API
curl https://api.free.ai/v1/chat/ \
-H "Authorization: Bearer YOUR_KEY" \
-d '{"model":"premium/dia-tts/voice-clone"}'
Cymharu
Cwestiynau Cyffredin
Mae Dia Voice Clone yn cynnal ystod eang o ieithoedd. Mae'r rhestr gywir yn dibynnu ar yr injan; mae'r ffurflen ar y dudalen hon yn derbyn unrhyw destun a bydd yr injan yn arlunio mewn ei ieithoedd a gynhelir. Gweler /voice/ am y dewisydd aml-beiriant llawn os oes angen iaith benodol arnoch.
Mae'r rhan fwyaf o beirianwyr yn lunio Saesneg Americanaidd canolog yn rhagosodedig a chaneuon addas i'r ardal ar gyfer ieithoedd nad ydynt yn Saesneg. Gall beirianwyr premiwm arddangos amrywiolion caneuon - gludwch enghraifft i'w chymharu.
Mae cynhaliaeth SSML yn amrywio yn ôl peiriant. Mae tagiau seibio, prosod, ac amlygu yn cael eu cydnabod ar y rhan fwyaf o beirianyddion premiwm ac ar rai hunanghostedig. Mae testun plaen yn gweithio o hyd — nid oes angen marcio.
Mae TTS llif ar gael ar beiriannau premiwm drwy'r diweddbwyntiau API /v1/tts/ gyda stream=true. Mae'r rhyngwyneb defnyddiwr gwe ar y dudalen hon yn dychwelyd y clip llawn pan orffennir y lluniadu.
Mae Dia Voice Clone yn beiriant TTS premiwm. Mae'r gost yn amrywio yn ôl nifer y nodau - ~30 tocyn am bob nod fel arfer. Mae $1 yn prynu 750,000 o tocynnau, felly mae pecyn o $5 yn cwmpasu degau o filoedd o nodau.
hyd at 5,000 o nodau ar gyfer pob cais ar y rhyngwyneb defnyddiwr gwe. Ar gyfer darnau hirach (llyfr sain, pennod gyfan), defnyddiwch /voice/audiobook/ sy'n torri a sticio'n awtomatig, neu ffoniwch yr API mewn cylch.
Ie — POST rhestr o linynnau i /v1/tts/batch/, neu defnyddiwch y rhyngwyneb defnyddiwr gweithfan yn /workspace/ i gysgodi TTS i mewn i pibellau hirach (e.e., cyfieithu → siarad → stitch).
Ie — POST testun i /v1/tts/ gyda model="Dia Voice Clone" (neu'r slug ar y dudalen hon). Dychwelyd WAV neu MP3. Gweler /api/ am gyfeiriad llawn + darnau SDK.
Testun-i-ganu yw'r dudalen hon, nid clonio llais - y llais yw rhagosodiad y peiriant. Am glonio llais (lwytho sain cyfeirio i fyny), gweler /voice/clone/, sy'n gofyn i chi fod yn berchen ar hawliau'r llais neu fod gennych ganiatâd ysgrifenedig clir.
Rheda peiriannau hunan-gartrefedig ar GPUau Free.ai-ei-berchen; nid yw dim yn gadael ein gweinyddion. Mae peiriannau premiwm yn pasio testun i ddarparwyr modelau uwchlaw ein DPA. Ni ydym yn hyfforddi ar eich mewnbwn ac ni werthwn ddata.
Ie — Free.ai yn caniatáu defnydd masnachol o sain a gynhyrchir. Mae trwydded sylfaenol yr injan (Apache 2.0, MIT, neu delerau'r gwerthwr) yn cael ei dangos uchod ac ar dudalen cyfeirio'r model; yn ymarferol mae hyn yn golygu bod y geiriau, hysbysebion, podiau, a rhaglenni i gyd yn rhan o'r amrediad.
Ie — ad-dalu tasgau methu'n awtomatig i'r ffynhonnell (pool diwrnod neu tocynnau talu). Os nad yw ad-daliad yn ymddangos yr un diwrnod, anfonwch e-bost at contact@free.ai.