faster-whisper large-v3

Free.ai (self-hosted) · stt · ~500 ຕົວ​ແທນ​ຕໍ່ minute

ຖອດ​ໄຟລ໌​ສຽງ ຫຼື ວີດີໂອ ຫຼື ປ້າຍ URL ລົງ​ຂ້າງລຸ່ມ

~500 ຕົວ​ແທນ​ຕໍ່ minute

faster-whisper large-v3 ແມ່ນ a ແບບ​ແບບ​ເວົ້າ​ເປັນ​ຂໍ້​ຄວາມ ສ້າງໂດຍ OpenAI / SYSTRAN. ແຂງແຮງທີ່ສຸດທີ່ Accurate transcription. ເປັນເຈົ້າພາບຕົນເອງໃນ Free.ai GPUs - ແລ່ນຟຣີຕໍ່ຕ້ານສະໂມສອນໂຕກອນຂອງທ່ານທຸກໆມື້ (500 tokens ​ຕໍ່​ນາທີ). ອອກອາກາດພາຍໃຕ້ MIT — ອະນຸຍາດໃຫ້ໃຊ້ໃນການຄ້າ Free.ai.

ប្រើ​ຜ່ານ API

REST API ທີ່ເຂົ້າກັນໄດ້ກັບ OpenAI. ສ້າງກຸນແຈ ແລະ ໂທຫາແບບຟອມນີ້ໃນສອງວິນາທີ.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"faster-whisper-large-v3","audio_url":"https://..."}'
ເອກະສານ API ເອົາ​ກຸນແຈ API

ຄໍາຖາມທີ່ຖາມເລື້ອຍໆ

faster-whisper large-v3 ແປສຽງອອກສຽງເປັນຂໍ້ຄວາມ. ສົ່ງໄຟລ MP3, WAV, M4A, ຫຼື ວີດີໂອ ແລະ faster-whisper large-v3 ສົ່ງຄືນການແປເຕັມພ້ອມດ້ວຍບົດຄວາມ SRT/VTT ທີ່ເປັນທາງເລືອກພ້ອມກັບເວລາ.

faster-whisper large-v3 ຈັດການກັບພາສາຫຼາຍສິບພາສາ — Whisper-ຄອບຄົວແບບຈໍາລອງປົກຄຸມ 90%, Parakeet ປົກຄຸມ ~25, ອື່ນໆແຕກຕ່າງກັນ. ເລືອກ "ກວດພົບອັດຕະໂນມັດ" ຫຼື ລະບຸພາສາສໍາລັບການຄວາມຖືກຕ້ອງສູງສຸດ.

ອັດຕາຄວາມຜິດພາດຂອງຄໍາແມ່ນ 5-10% ສໍາລັບສຽງພາສາອັງກິດທີ່ສະອາດ, 10-20% ສໍາລັບສຽງທີ່ມີສຽງດັງຫຼືສຽງທີ່ອ່ອນແອ. ຕົວເລືອກທີ່ໃຫຍ່ກວ່າຂອງໂຄງສ້າງທີ່ຄ້າຍຄືກັນເຮັດໄດ້ດີກວ່າໃນກໍລະນີທີ່ຫຍຸ້ງຍາກ - ເລືອກຂະຫນາດໃຫຍ່ກວ່າເມື່ອສຽງແມ່ນຫຍາບ.

ຍິນດີ — ທຸກໆສ່ວນປະກອບມີເວລາເລີ່ມຕົ້ນ/ຈົບ. ສົ່ງອອກເປັນ SRT ຫຼື VTT ແລະເວລາທີ່ວາງແຜນໂດຍກົງໃສ່ວິດີໂອຂອງທ່ານ.

faster-whisper large-v3 ແລ່ນຢູ່ໃນ GPUs ຂອງພວກເຮົາເອງຕໍ່ຕ້ານ pool ຂອງທ່ານຟຣີທຸກໆມື້ກ່ອນ; $5 → 200,000 ບັດເຄຣດິດຈ່າຍຫຼັງຈາກນັ້ນ. ປະມານ ~ 500 ບັດເຄຣດິດຕໍ່ນາທີ.

MP3, WAV, M4A, FLAC, OGG, ນອກນັ້ນຍັງມີວິດີໂອ (MP4, MOV, WebM) — ພວກເຮົາດຶງອອກສຽງ. ສູງສຸດ 500 MB ຕໍ່ການອັບໂຫລດ. ໄຟລ໌ຍາວກວ່າ? Split ກັບ / audio / cut / ຫຼືໃຊ້ / v1 / stt / batch /.

ການ​ພິມ​ລາຍ​ຊື່​ຜູ້​ເວົ້າ​ແມ່ນ​ການ​ຜ່ານ​ທີ່​ແຍກ​ອອກ​ມາ — ປິດ​ການ​ໃຊ້​ງານ "diarize" ໃນ / transcribe /. faster-whisper large-v3 ຈັດການ​ການ​ພິມ​ລາຍ​ຊື່​; ການ​ພິມ​ລາຍ​ຊື່​ຜູ້​ເວົ້າ​ແມ່ນ​ການ​ວາງ​ស្លាກ​ໃສ່​ສ່ວນ​ຕ່າງໆ​ຂອງ​ຜູ້​ເວົ້າ​ແຕ່ລະ​ສ່ວນ​ດ້ວຍ​ຜູ້​ເວົ້າ 1 / ຜູ້​ເວົ້າ2/ ແລະ​ອື່ນໆ.

ຍອມຮັບ — /batch/ ຮັບເອົາ​ໂຟນເດີ​ຂອງ​ໄຟລ໌​ສຽງ. ລາຍການ​ບັນທຶກ​ແຕ່ລະອັນ​ຈະ​ຕົກ​ຢູ່​ໃນ /account/?tab=history ​ພ້ອມ​ກັບ​ຊື່​ໄຟລ໌​ຕົ້ນ​ຕໍ. ສຳ​ລັບ​ການ​ຮັກສາ​ຕົ້ນ​ຂອງ​ໂຟນເດີ​ໃຊ້ API.

ຍິນດີ — POST ສຽງຂອງທ່ານໄປທີ່ /v1/stt/transcribe/ ດ້ວຍແບບ "faster-whisper large-v3". ສົ່ງຄືນ JSON ທີ່ມີຂໍ້ຄວາມ + ພາກ + ເວລາລະດັບຄໍາ. /api/ ມີຄໍາແນະນໍາເຕັມ.

ແບບທີ່ຈັດການເອງຮັກສາສຽງໃນ GPUs ຂອງພວກເຮົາ; ຄ່າໃຊ້ຈ່າຍຜ່ານຜ່ານກັບ DPA. ສຽງຖືກລຶບຫຼັງຈາກແບ່ງປັນ-window (24h anon, 7d ເຂົ້າສູ່ລະບົບ). ພວກເຮົາບໍ່ຝຶກອົບຮົມກ່ຽວກັບຂໍ້ມູນເຂົ້າຂອງທ່ານ.

ຍິນດີ — Free.ai ອະນຸຍາດໃຫ້ໃຊ້ການພິມຖ່າຍທອດສຽງໃນທາງທຸລະກິດ. ທ່ານຕ້ອງມີສິດໃນການອັບໂຫລດສຽງ (ການບັນທຶກຂອງທ່ານເອງ, ວັດຖຸທີ່ມີໃບອະນຸຍາດ, ຫຼື ເນື້ອໃນທີ່ມີການອະນຸຍາດ).

ປັດໃຈເວລາຈິງແມ່ນປະມານ 0.05-0.2 × - ບົດຂຽນ podcast 60 ນາທີໃນ 3-12 ນາທີ. ແບບຟອມປະກັນໄພມັກຈະສິ້ນສຸດລົງໄວກວ່າ. ໃຊ້ປຸ່ມລໍຖ້າເພື່ອປິດແທັບ.

ຮັກ Free.ai? ເວົ້າກັບເພື່ອນຂອງທ່ານ!

ຈັດອັນດັບ​ໜ້ານີ້