Bark TTS
Free.ai
·
tts
·
~500 tokens għal kull clip
·
4.3
minn 3 Utenti ta' din il-kategorija
Bark TTS huwa a vuċi tat-test għal diskors. Immaniġġjat permezz ta’ mudelli esterni — ~500 tokens għal kull klipp (50% markup fuq l-ispiża upstream).
Użu permezz tal-API
curl -X POST https://api.free.ai/v1/tts/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/bark-tts","text":"hello world"}'
Dokumentazzjoni tal-API
Ikseb il-Kwalità API
Mistoqsijiet li jsiru ta’ spiss
Bark TTS jappoġġja firxa wiesgħa ta' lingwi. Il-lista eżatta tiddependi fuq il-magna; il-formola f'din il-paġna taċċetta kwalunkwe test u l-magna se tirrendi fil-lingwi appoġġjati tagħha. Ara /voice/ għall-għażla sħiħa ta' diversi magni jekk għandek bżonn lingwa speċifika.
Il-biċċa l-kbira tal-magni jirrendu l-Ingliż Amerikan newtrali b'mod awtomatiku u aċċent xieraq għar-reġjun għal lingwi li mhumiex l-Ingliż.
L-appoġġ SSML ivarja skont il-magna. It-tags ta' pauza, prosodija u enfasi huma onorati fuq il-biċċa l-kbira tal-magni premium u fuq ftit minnhom li huma ospitati minnhom infushom.
Streaming TTS huwa disponibbli fuq magni premium permezz tal-/v1/tts/ API endpoint ma stream=true.Il-web UI fuq din il-paġna jirritorna l-klipp sħiħ ladarba r-rendering jispiċċa.
Bark TTS huwa magna TTS premium.Skala tal-ispejjeż mal-għadd tal-karattru — tipikament ~30 tokens għal kull karattru. $1 jixtri 750,000 tokens, għalhekk pakkett ta'$5 ikopri għexieren ta'eluf ta'karattri.
Sa 5,000 karattru għal kull talba fuq il-web UI. Għal biċċiet itwal (awdjokotba, kapitoli sħaħ), uża /voice/audiobook/ li jinqata' u jinħjata awtomatikament, jew sejħa l-API f'ċirku.
Iva — POST lista ta' strings għal /v1/tts/batch/, jew uża l-interface tal-utent tal-ispazju tax-xogħol f'/workspace/ biex tgħaqqad TTS f'pipeline itwal (eż., traduzzjoni → tkellem → stitch).
Iva — POST test għal /v1/tts/ ma model="Bark TTS" (jew l-slug fuq din il-paġna). Jirritorna WAV jew MP3. Ara /api/ għal referenza sħiħa + snippets SDK.
Din il-paġna hija test-to-speech, mhux klonazzjoni tal-vuċi — il-vuċi hija l-magna default. Għal klonazzjoni tal-vuċi (li ttella' awdjo ta' referenza), ara /voice/clone/. Dan jeħtieġ li inti jkollok id-drittijiet tal-vuċi jew li jkollok kunsens espliċitu bil-miktub.
Magni awto-ospitati jaħdmu fuq GPUs Free.ai-proprjetà; xejn ma jħalli s-servers tagħna. magni premium jgħaddu test lill-fornituri mudell upstream taħt DPA tagħna. aħna ma taħriġ fuq l-inputs tiegħek u ma jbiegħux data.
Iva — Free.ai tagħti użu kummerċjali tal-awdjo ġġenerat.Il-liċenzja sottostanti tal-magna (Apache 2.0, MIT, jew termini tal-bejjiegħ) hija murija hawn fuq u fuq il-paġna ta' referenza tal-mudell; fil-prattika dan ifisser voiceovers, reklami, podcasts, u applikazzjonijiet huma kollha fl-iskop.
Iva — xogħol li ma jirnexxux auto-rifużjoni lill-sors (pool kuljum jew tokens imħallsa) Jekk rifużjoni ma jurux l-istess jum, email contact@free.ai.