OpenAI: GPT Audio Mini
OpenAI
·
tts
·
~1147 ຕົວແທນຕໍ່ clip
·
4.3
ຈາກ 3 ຜູ້ໃຊ້ໃນປະເພດນີ້
OpenAI: GPT Audio Mini ແມ່ນ a ສຽງແປຂໍ້ຄວາມເປັນຄຳເວົ້າ ສ້າງໂດຍ OpenAI. ຜ່ານແບບແບບພາຍນອກ - ~ 1,147 tokens ລະຄລິບ (50% ລາຄາຕໍ່າກວ່າຄ່າໃຊ້ຈ່າຍ).
ប្រើຜ່ານ API
curl -X POST https://api.free.ai/v1/tts/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"openai/gpt-audio-mini","text":"hello world"}'
ເອກະສານ API
ເອົາກຸນແຈ API
ຄໍາຖາມທີ່ຖາມເລື້ອຍໆ
OpenAI: GPT Audio Mini ສະໜັບສະໜູນພາສາຫຼາຍໆພາສາ. ລາຍຊື່ທີ່ຖືກຕ້ອງແມ່ນຂຶ້ນກັບເຄື່ອງຈັກ; ແບບຟອມໃນໜ້ານີ້ ຍອມຮັບຂໍ້ຄວາມໃດໆ ແລະ ເຄື່ອງຈັກຈະສະແດງໃນພາສາທີ່ມັນສະໜັບສະໜູນ. ເບິ່ງ / voice / ສຳລັບຕົວເລືອກຫຼາຍໆເຄື່ອງຈັກເຕັມ ຖ້າທ່ານຕ້ອງການພາສາສະເພາະ.
ເຄື່ອງຈັກສ່ວນຫຼາຍຈະສະແດງພາສາອັງກິດແບບສະເໝີພາບຂອງສະຫະລັດໂດຍປັບໂຫລດ ແລະການເວົ້າທີ່ເໝາະສົມກັບເຂດພື້ນທີ່ສຳລັບພາສາທີ່ບໍ່ແມ່ນພາສາອັງກິດ. ເຄື່ອງຈັກທີ່ມີຄຸນນະພາບສູງສາມາດເປີດເຜີຍການເວົ້າທີ່ແຕກຕ່າງກັນ - ປ້າຍຕົວຢ່າງເພື່ອທຽບທຽບ.
ການສະໜັບສະໜູນ SSML ແຕກຕ່າງກັນຕາມເຄື່ອງຈັກ. ຂໍ້ຄວາມຢຸດ, ຂໍ້ຄວາມທີ່ມີສຽງແລະ ຂໍ້ຄວາມທີ່ເນັ້ນແມ່ນຖືກຮັບຮູ້ໃນເຄື່ອງຈັກທີ່ມີລາຄາຖືກຫຼາຍທີ່ສຸດ ແລະ ບາງອັນທີ່ຖືກຈັດຕັ້ງເອງໄດ້. ຂໍ້ຄວາມປົກກະຕິຈະເຮັດວຽກໄດ້ສະເໝີ — ບໍ່ຕ້ອງການເຮັດການສັງເກດການໃດໆ.
ການຖ່າຍທອດສຽງເປັນສຽງສາມາດໃຊ້ໄດ້ໃນເຄື່ອງຈັກທີ່ມີຄຸນນະພາບສູງຜ່ານຈຸດຈົບ /v1/tts/ API ດ້ວຍ stream=true. ເວບ UI ເທິງໜ້ານີ້ ຈະສົ່ງຄລິບເຕັມຄືນເມື່ອການສະແດງອອກໄດ້ສຳເລັດ.
OpenAI: GPT Audio Mini ແມ່ນເຄື່ອງຈັກ TTS ທີ່ມີລາຄາຖືກ. ຄ່າໃຊ້ຈ່າຍແມ່ນຂື້ນກັບຈໍານວນຕົວອັກສອນ - ປົກກະຕິແລ້ວ ~30 ຕົວອັກສອນຕໍ່ຕົວອັກສອນ. $1 ຊື້ 750,000 ຕົວອັກສອນ, ສະນັ້ນ $5 ຊຸດປົກຄຸມຫຼາຍຮ້ອຍພັນຕົວອັກສອນ.
ເຖິງ 5,000 ຕົວອັກສອນຕໍ່ຄໍາຮ້ອງຂໍໃນເວບ UI. ສໍາລັບສ່ວນທີ່ຍາວກວ່າ (Audiobooks, ບົດເຕັມ), ນໍາໃຊ້ / voice / audiobook / ເຊິ່ງ chunks ແລະ stitches ໂດຍອັດຕະໂນມັດ, ຫຼືໂທ API ໃນ loop.
ຍິນດີ — POST ລາຍຊື່ຂອງ strings ໄປ /v1/tts/batch/, ຫຼືໃຊ້ workspace UI ທີ່ /workspace/ ເພື່ອເຊື່ອມຕໍ່ TTS ເຂົ້າສູ່ pipeline ຍາວກວ່າ (ຕົວຢ່າງ, ແປ → ເວົ້າ → stitch).
ຍິນດີ — POST ຂໍ້ຄວາມໄປຍັງ /v1/tts/ ດ້ວຍ model="OpenAI: GPT Audio Mini" (ຫຼື slug ຢູ່ໃນ ໜ້າ ນີ້). ສົ່ງຄືນ WAV ຫຼື MP3. ເບິ່ງ /api/ ສຳ ລັບ ຄຳ ອ້າງອີງເຕັມ + SDK snippets.
ຫນ້ານີ້ເປັນຂໍ້ຄວາມ-ເປັນ-ການເວົ້າ, ບໍ່ແມ່ນການຖ່າຍທອດສຽງ — ສຽງແມ່ນປັ໊ກໄອຂອງເຄື່ອງຈັກ. ສຳລັບການຖ່າຍທອດສຽງ (ອັບໂຫລດສຽງທີ່ອ້າງອີງ), ເບິ່ງ /voice/clone/, ເຊິ່ງຮຽກຮ້ອງໃຫ້ທ່ານມີສິດໃນການຖ່າຍທອດສຽງ ຫຼື ໄດ້ຮັບການອະນຸຍາດຢ່າງຊັດເຈນໂດຍທາງຈົດໝາຍ.
ເຄື່ອງຈັກທີ່ເປັນເຈົ້າພາບຕົນເອງແລ່ນຢູ່ໃນ Free.ai- ເປັນເຈົ້າຂອງ GPUs; ບໍ່ມີຫຍັງອອກຈາກເຊີບເວີຂອງພວກເຮົາ. ເຄື່ອງຈັກ Premium ສົ່ງຂໍ້ຄວາມໄປຫາຜູ້ສະ ໜອງ ແບບຟອມພາຍໃຕ້ DPA ຂອງພວກເຮົາ. ພວກເຮົາບໍ່ຝຶກອົບຮົມກ່ຽວກັບຂໍ້ມູນຂອງທ່ານແລະບໍ່ຂາຍຂໍ້ມູນ.
ຍອມຮັບ — Free.ai ອະນຸຍາດໃຫ້ໃຊ້ສຽງທີ່ສ້າງຂຶ້ນເພື່ອການຂາຍ. ໃບອະນຸຍາດຂອງເຄື່ອງຈັກ (Apache 2.0, MIT, ຫຼື ເງື່ອນໄຂຂອງຜູ້ຂາຍ) ສະແດງຢູ່ເທິງ ແລະ ຢູ່ໃນ ໜ້າ ແບບແບບ; ໃນການປະຕິບັດນີ້ ໝາຍຄວາມວ່າ voiceovers, ໂຄສະນາ, podcasts, ແລະ ແອັບພລິເຄຊັນແມ່ນຢູ່ໃນຂອບເຂດ.
ຍິນດີຕ້ອນຮັບ - ວຽກທີ່ລົ້ມເຫລວຄືນເງິນອັດຕະໂນມັດໃຫ້ກັບແຫຼ່ງ ( pool ມື້ຫຼື tokens ຈ່າຍ). ຖ້າການຄືນເງິນບໍ່ປາກົດຂຶ້ນໃນມື້ດຽວກັນ, ສົ່ງອີເມວ contact@free.ai.