Sesame CSM-1B

Free.ai (self-hosted) · tts · ~500 ຕົວ​ແທນ​ຕໍ່ clip · 4.3 ຈາກ 3 ຜູ້ໃຊ້​ໃນ​ປະເພດ​ນີ້
~500 ຕົວ​ແທນ​ຕໍ່ clip

Sesame CSM-1B ແມ່ນ a ສຽງ​ແປ​ຂໍ້ຄວາມ​ເປັນ​ຄຳ​ເວົ້າ ສ້າງໂດຍ Sesame. ແຂງແຮງທີ່ສຸດທີ່ Real-time voice agents, conversational AI, streaming TTS where time-to-first-audio matters more than studio-perfect reads.. ເປັນເຈົ້າພາບຕົນເອງໃນ Free.ai GPUs - ແລ່ນຟຣີຕໍ່ຕ້ານສະໂມສອນໂຕກອນຂອງທ່ານທຸກໆມື້ (500 tokens ລະ​ຄລິບ). ອອກອາກາດພາຍໃຕ້ Apache 2.0 — ອະນຸຍາດໃຫ້ໃຊ້ໃນການຄ້າ Free.ai.

ប្រើ​ຜ່ານ API
curl -X POST https://api.free.ai/v1/tts/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"csm-1b","text":"hello world"}'
ເອກະສານ API ເອົາ​ກຸນແຈ API

ຄໍາຖາມທີ່ຖາມເລື້ອຍໆ

Sesame CSM-1B ສະໜັບສະໜູນ​ພາສາ​ຫຼາຍໆ​ພາສາ. ລາຍຊື່ທີ່ຖືກຕ້ອງແມ່ນຂຶ້ນກັບ​ເຄື່ອງຈັກ; ແບບຟອມ​ໃນ​ໜ້າ​ນີ້ ຍອມຮັບ​ຂໍ້ຄວາມ​ໃດໆ ແລະ ເຄື່ອງຈັກ​ຈະ​ສະແດງ​ໃນ​ພາສາ​ທີ່​ມັນ​ສະໜັບສະໜູນ. ເບິ່ງ / voice / ສຳ​ລັບ​ຕົວເລືອກ​ຫຼາຍໆ​ເຄື່ອງຈັກ​ເຕັມ ຖ້າ​ທ່ານ​ຕ້ອງການ​ພາສາ​ສະເພາະ.

ເຄື່ອງຈັກ​ສ່ວນ​ຫຼາຍ​ຈະ​ສະແດງ​ພາສາ​ອັງກິດ​ແບບ​ສະ​ເໝີ​ພາບ​ຂອງ​ສະຫະລັດ​ໂດຍ​ປັ​ບ​ໂຫລດ ແລະ​ການ​ເວົ້າ​ທີ່​ເໝາະສົມ​ກັບ​ເຂດ​ພື້ນ​ທີ່​ສຳລັບ​ພາສາ​ທີ່​ບໍ່ແມ່ນ​ພາສາ​ອັງກິດ. ເຄື່ອງຈັກ​ທີ່​ມີ​ຄຸນ​ນະ​ພາບ​ສູງ​ສາມາດ​ເປີດ​ເຜີຍ​ການ​ເວົ້າ​ທີ່​ແຕກຕ່າງ​ກັນ - ປ້າຍ​ຕົວຢ່າງ​ເພື່ອ​ທຽບ​ທຽບ.

ການ​ສະໜັບສະໜູນ SSML ແຕກຕ່າງກັນ​ຕາມ​ເຄື່ອງຈັກ​. ຂໍ້​ຄວາມ​ຢຸດ, ຂໍ້​ຄວາມ​ທີ່​ມີ​ສຽງ​ແລະ ຂໍ້​ຄວາມ​ທີ່​ເນັ້ນ​ແມ່ນ​ຖືກ​ຮັບ​ຮູ້​ໃນ​ເຄື່ອງຈັກ​ທີ່​ມີ​ລາຄາ​ຖືກ​ຫຼາຍ​ທີ່ສຸດ ແລະ ບາງ​ອັນ​ທີ່​ຖືກ​ຈັດ​ຕັ້ງ​ເອງ​ໄດ້. ຂໍ້ຄວາມ​ປົກກະຕິ​ຈະ​ເຮັດວຽກ​ໄດ້​ສະ​ເໝີ — ບໍ່​ຕ້ອງ​ການ​ເຮັດ​ການ​ສັງເກດ​ການ​ໃດໆ.

ການ​ຖ່າຍ​ທອດ​ສຽງ​ເປັນ​ສຽງ​ສາມາດ​ໃຊ້​ໄດ້​ໃນ​ເຄື່ອງຈັກ​ທີ່​ມີ​ຄຸນ​ນະ​ພາບ​ສູງ​ຜ່ານ​ຈຸດ​ຈົບ /v1/tts/ API ດ້ວຍ stream=true. ເວບ UI ເທິງ​ໜ້າ​ນີ້ ຈະ​ສົ່ງ​ຄລິບ​ເຕັມ​ຄືນ​ເມື່ອ​ການ​ສະແດງ​ອອກ​ໄດ້​ສຳເລັດ.

Sesame CSM-1B ແລ່ນຢູ່ໃນ GPUs ຂອງພວກເຮົາເອງ. ການສ້າງດຶງຈາກ pool ຂອງທ່ານຟຣີທຸກໆມື້ກ່ອນ. ຫຼັງຈາກທີ່ດ້ອຍໂອກາດ, ບັດເຄດິດທີ່ຈ່າຍເລີ່ມຕົ້ນທີ່ $5 → 200,000 ບັດເຄດິດ. ປະມານ ~5ບັດເຄດິດຕໍ່ຕົວອັກສອນ, ຢ່າງຫນ້ອຍ 100 ຕໍ່ຄລິບ.

ເຖິງ 5,000 ຕົວອັກສອນຕໍ່ຄໍາຮ້ອງຂໍໃນເວບ UI. ສໍາລັບສ່ວນທີ່ຍາວກວ່າ (Audiobooks, ບົດເຕັມ), ນໍາໃຊ້ / voice / audiobook / ເຊິ່ງ chunks ແລະ stitches ໂດຍອັດຕະໂນມັດ, ຫຼືໂທ API ໃນ loop.

ຍິນດີ — POST ລາຍຊື່ຂອງ strings ໄປ /v1/tts/batch/, ຫຼືໃຊ້ workspace UI ທີ່ /workspace/ ເພື່ອເຊື່ອມຕໍ່ TTS ເຂົ້າສູ່ pipeline ຍາວກວ່າ (ຕົວຢ່າງ, ແປ → ເວົ້າ → stitch).

ຍິນດີ — POST ຂໍ້ຄວາມໄປຍັງ /v1/tts/ ດ້ວຍ model="Sesame CSM-1B" (ຫຼື slug ຢູ່ໃນ ໜ້າ ນີ້). ສົ່ງຄືນ WAV ຫຼື MP3. ເບິ່ງ /api/ ສຳ ລັບ ຄຳ ອ້າງອີງເຕັມ + SDK snippets.

ຫນ້ານີ້ເປັນຂໍ້ຄວາມ-ເປັນ-ການເວົ້າ, ບໍ່ແມ່ນການຖ່າຍທອດສຽງ — ສຽງແມ່ນ​ປັ໊ກ​ໄອ​ຂອງ​ເຄື່ອງຈັກ. ສຳ​ລັບ​ການຖ່າຍທອດສຽງ (ອັບໂຫລດ​ສຽງ​ທີ່​ອ້າງອີງ), ເບິ່ງ /voice/clone/, ເຊິ່ງ​ຮຽກຮ້ອງ​ໃຫ້​ທ່ານ​ມີ​ສິດ​ໃນການ​ຖ່າຍທອດສຽງ ຫຼື ໄດ້ຮັບ​ການ​ອະນຸຍາດ​ຢ່າງ​ຊັດເຈນ​ໂດຍ​ທາງ​ຈົດໝາຍ.

ເຄື່ອງຈັກທີ່ເປັນເຈົ້າພາບຕົນເອງແລ່ນຢູ່ໃນ Free.ai- ເປັນເຈົ້າຂອງ GPUs; ບໍ່ມີຫຍັງອອກຈາກເຊີບເວີຂອງພວກເຮົາ. ເຄື່ອງຈັກ Premium ສົ່ງຂໍ້ຄວາມໄປຫາຜູ້ສະ ໜອງ ແບບຟອມພາຍໃຕ້ DPA ຂອງພວກເຮົາ. ພວກເຮົາບໍ່ຝຶກອົບຮົມກ່ຽວກັບຂໍ້ມູນຂອງທ່ານແລະບໍ່ຂາຍຂໍ້ມູນ.

ຍອມຮັບ — Free.ai ອະນຸຍາດໃຫ້ໃຊ້ສຽງທີ່ສ້າງຂຶ້ນເພື່ອການຂາຍ. ໃບອະນຸຍາດຂອງເຄື່ອງຈັກ (Apache 2.0, MIT, ຫຼື ເງື່ອນໄຂຂອງຜູ້ຂາຍ) ສະແດງຢູ່ເທິງ ແລະ ຢູ່ໃນ ໜ້າ ແບບແບບ; ໃນການປະຕິບັດນີ້ ໝາຍຄວາມວ່າ voiceovers, ໂຄສະນາ, podcasts, ແລະ ແອັບພລິເຄຊັນແມ່ນຢູ່ໃນຂອບເຂດ.

ຍິນດີຕ້ອນຮັບ - ວຽກທີ່ລົ້ມເຫລວຄືນເງິນອັດຕະໂນມັດໃຫ້ກັບແຫຼ່ງ ( pool ມື້ຫຼື tokens ຈ່າຍ). ຖ້າການຄືນເງິນບໍ່ປາກົດຂຶ້ນໃນມື້ດຽວກັນ, ສົ່ງອີເມວ contact@free.ai.

ຮັກ Free.ai? ເວົ້າກັບເພື່ອນຂອງທ່ານ!

ຈັດອັນດັບ​ໜ້ານີ້