Sesame CSM-1B

Free.ai (self-hosted) · tts · ~500 Токен clip · 4.3 ээс 3 энэ ангиллын хэрэглэгчид
~500 Токен clip

Sesame CSM-1B нь a текст- рүү- яриа дуу-ийн Sesame-ээр бүтээсэн хэсэг юм. 1995 онд "Best of" цомог гаргажээ. Free.ai GPU дээр өөрийн хосттой — таны өдөр тутмын токен нөөц (500 токен нэг бичлэг)-ийн эсрэг үнэгүй ажиллана. Apache 2.0-ийн дор хэвлэгдсэн — Free.ai дээр худалдааны зорилгоор ашиглах зөвшөөрөлтэй.

API- ээр ашиглах
curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"csm-1b","text":"hello world"}'
Хяналт API түлхүүрийг авах

Заримдаа асуудаг асуултууд

Sesame CSM-1B нь олон тооны хэлийг дэмждэг. Тодорхой жагсаалт нь хөдөлгүүрээс хамаарна; энэ хуудсан дахь маягт нь ямар ч текстийг хүлээн авч, хөдөлгүүр нь дэмждэг хэлүүдийг харуулна. Хэрэв танд тодорхой хэл хэрэгтэй бол /voice/-г олон хөдөлгүүрийн сонгогчийг харахын тулд үзнэ үү.

Ихэнх програмууд нь үндсэн байдлаар Америк Англи хэлийг, Англи хэл биш бол бүс нутгийн онцлогтой хэлийг харуулдаг. Premium програмууд нь онцлогтой хэлийг харуулах боломжтой. харьцуулахын тулд жишээг оруулаарай.

SSML дэмжлэг нь хөдөлгүүрээс хамаарна. Хязгаарлалт, үгийн утга, онцлог зэрэг тэмдгүүд нь ихэвчлэн үнэтэй хөдөлгүүрүүд болон зарим нэг өөрсдөө байрлуулсан хөдөлгүүрүүдэд дэмжлэг үзүүлдэг. Жинхэнэ текст үргэлж ажилладаг - тэмдэглэгээ шаардахгүй.

ТТС-ийн шууд дамжуулалт нь premium engine-д /v1/tts/ API endpoint-ийн stream=true-тэй хамт ашиглагддаг. Энэ хуудасны вэб интерфэйс нь дүрслэл дууссаны дараа бүрэн бичлэгийг буцаадаг.

Sesame CSM-1B нь бидний өөрийн график процессор дээр ажилладаг. Эхлээд өдөр тутмын үнэгүй нөөцөөс үүсгэнэ. Хэрэгцээ нь дууссаны дараа, төлбөртэй жетонууд $5 → 200,000 жетоноор эхэлнэ. Жишээ нь, дүр бүрт ~5 жетон, нэг клипэд хамгийн багадаа 100 жетон.

Веб интерфэйс дээр нэг хүсэлт 5000 хүртэлх тэмдэгттэй. урт хэсгүүдэд (аудио ном, бүрэн бүлэг) /voice/audiobook/ ашиглан автоматаар хэсэгчлэн хувааж, холбох эсвэл API-г эргэлтээр дуудна.

Тийм — /v1/tts/batch/ руу мөрийн жагсаалтыг POST хий, эсвэл /workspace/ дээрх ажлын талбайн UI-г ашиглан TTS-ийг урт хоолойгоор холбоно (жишээ нь, translate → speak → stitch).

Тийм — POST текстийг /v1/tts/ руу model="Sesame CSM-1B" (эсвэл энэ хуудасны slug) -тай илгээх. WAV эсвэл MP3-ийг буцаана. Тодорхойлолт + SDK-ийн хэсгүүдийг /api/-г үзнэ үү.

Энэ хуудас нь текстээс яриа гаргах, дууны клон биш юм. Энэ нь дуу нь хөдөлгүүрийн урьдчилсан тохиргоо юм. дууны клон (холбооны дууг татах)-ын хувьд /voice/clone/-ийг үзнэ үү. Энэ нь дууны эрхийг эзэмших эсвэл бичгээр зөвшөөрөл авахыг шаарддаг.

Өөрийн сервертэй хөдөлгүүрүүд Free.ai-ийн GPU дээр ажилладаг; бидний серверээс юу ч гарч ирдэггүй. Хамгийн сайн хөдөлгүүрүүд текстийг DPA-ийн дагуу эх үүсвэрийн загвар ханган нийлүүлэгчдэд дамжуулдаг. Бид таны оруулсан мэдээллийг сургаж, мэдээллийг худалдаж авдаггүй.

Тийм — Free.ai нь үүсгэсэн дууг худалдааны зорилгоор ашиглах эрх олгоно. Дизелийн үндсэн лиценз (Apache 2.0, MIT, эсвэл үйлдвэрлэгчийн нөхцөл) дээр болон загварын холбоо барих хуудсанд харагдана; энэ нь дуу хоолой, сурталчилгаа, подкаст, болон програмууд бүгд хамаарна гэсэн үг.

Тийм — бүтэлгүйтсэн ажлуудыг эх үүсвэрт (өдөр тутмын нөөц эсвэл төлбөртэй токен) автоматаар буцаан олгоно. Хэрэв буцаан олголт ижил өдөрт гарч ирээгүй бол contact@free.ai хаягаар имэйл илгээнэ үү.

Free.ai-ыг хайрладаг уу? Найзуудаа хэлж өгөөрэй!

Энэ хуудсыг үнэл