Cartesia Sonic 3 (real-time)
Free.ai
·
tts
·
~500 ტოკენები clip
·
4.3
დან 3 ამ კატეგორიის მომხმარებლები
Cartesia Sonic 3 (real-time) is a ტექსტის საუბრად გადამუშავების ხმა. 1999 წელს ფილმმა მიიღო ოსკარის ჯილდო საუკეთესო ფილმისთვის („სამყაროს საზღვრები“). ფილმი 1999 წლის ოსკარის ნომინაციაში იყო წარდგენილი.
API- ს გამოყენება
curl -X POST https://api.free.ai/v1/tts/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/cartesia/sonic-3","text":"hello world"}'
დოკუმენტაცია
API კოდის მიღება
ხშირად დასმული კითხვები
Cartesia Sonic 3 (real-time) მხარს უჭერს მრავალ ენას. ზუსტი სია დამოკიდებულია პროგრამაზე; ამ გვერდის ფორმაში ნებისმიერი ტექსტი მიიღება და პროგრამა გამოსახავს მას მხარდაჭერილ ენაზე. თუ თქვენ სპეციფიკური ენა გჭირდებათ, ნახეთ /voice/ სრული მრავალ- პროგრამის არჩევისთვის.
უმეტესობა პროგრამების ნაგულისხმევი რედაქტირების ენაა ნეიტრალური ამერიკული ინგლისური, ხოლო არაინგლისური ენებისთვის რეგიონისთვის დამახასიათებელი აქცენტები. Premium პროგრამებმა შეიძლება აქცენტების ვარიანტებიც გამოავლინონ - შეადარეთ მაგალითი.
SSML მხარდაჭერა განსხვავდება მოდულის მიხედვით. პაუზის, პროზოდიის და ხაზგასმის ჭდეები ითვლება უმაღლესი ხარისხის მოდულებზე და ზოგიერთ თვითდაფუძნებულზე. ჩვეულებრივი ტექსტი ყოველთვის მუშაობს - მარკეტინგი არ არის საჭირო.
TTS-ის სტრიმინგის შესაძლებლობა ხელმისაწვდომია premium-ის მოდულებზე /v1/tts/ API-ს დასასრული stream=true-ით. ამ გვერდის ვებ-ინტერფეისი სრულ ვიდეო კლიპს უბრუნებს რენდერინგის დასრულების შემდეგ.
Cartesia Sonic 3 (real-time) არის პრემიუმ TTS მოდული. ღირებულება იზრდება სიმბოლოების რაოდენობის მიხედვით — ჩვეულებრივ ~30 ტოკენი სიმბოლოზე. $1-ით იყიდება 750,000 ტოკენი, ასე რომ $5-ის პაკეტი მოიცავს ათასობით სიმბოლოს.
5000 სიმბოლომდე ერთ მოთხოვნაზე ვებ UI-ზე. უფრო გრძელი ნაწილებისთვის (აუდიო წიგნები, სრული თავები), გამოიყენეთ /voice/audiobook/, რომელიც ავტომატურად ჭრის და აკავშირებს, ან API-ს გამოძახება ციკლით.
1999 წელს გამოვიდა მისი პირველი ალბომი, სახელწოდებით „The Way I Am“ (ინგლისური: „გზა, რომელიც მე ვარ“), რომელიც შეიცავს სიმღერებს „The Way I Am“, „The Way I Am“ და „The Way I Am“.
დიახ — POST ტექსტი /v1/tts/-ში model="Cartesia Sonic 3 (real-time)"-ით (ან slug ამ გვერდზე). უკან ბრუნავს WAV ან MP3. ნახეთ /api/ სრული მისამართისთვის + SDK ნაჭრები.
ეს გვერდი კონტექსტიდან საუბრის გადამუშავებას ახდენს, არა კი ხმათა კლონირებას - ხმაები მოწყობილობის ნაგულისხმევი პარამეტრია. ხმათა კლონირებისთვის (რეფერენტული აუდიოს ჩატვირთვა), იხილეთ /voice/clone/, რომლისთვისაც საჭიროა ხმათა უფლებათა მფლობელი ან წერილობითი თანხმობა.
თვითდაფუძნებული მოდული მუშაობს Free.ai- ის გრაფიკული პროცესორების გამოყენებით; ჩვენი სერვერებიდან არაფერი არ გადის. პრემიუმ მოდული ტექსტს გადასცემს ზემოდან მომავალ მოდელების მომწოდებლებს ჩვენი DPA- ს მიხედვით. ჩვენ არ ვასწავლით თქვენს ჩანაწერებს და არ ვყიდით მონაცემებს.
დიახ — Free.ai აუდიოს კომერციული გამოყენების უფლებას იძლევა. მოდულის უკან მდგომი ლიცენზია (Apache 2.0, MIT ან მწარმოებლის პირობები) მითითებულია ზემოთ და მოდელის რეფერენტულ გვერდზე; პრაქტიკაში ეს ნიშნავს, რომ აუდიოს, რეკლამების, ვიდეოების და პროგრამების გამოყენება ყველასთვის ნებადართულია.
დიახ — ვერ შესრულებული დავალებები ავტომატურად დაბრუნდება წყაროში (დღეღამისო ან გადახდილი ტოკენები). თუ დაბრუნება იმავე დღეს არ მოხდება, დაგვიკავშირდით contact@free.ai.