Q: faster-whisper large-v3 ສາມາດລະບຸຜູ້ເວົ້າໄດ້ບໍ?

ການພິມລາຍຊື່ຜູ້ເວົ້າແມ່ນການຜ່ານທີ່ແຍກອອກມາ — ປິດການໃຊ້ງານ "diarize" ໃນ / transcribe /. faster-whisper large-v3 ຈັດການການພິມລາຍຊື່; ການພິມລາຍຊື່ຜູ້ເວົ້າແມ່ນການວາງស្លាກໃສ່ສ່ວນຕ່າງໆຂອງຜູ້ເວົ້າແຕ່ລະສ່ວນດ້ວຍຜູ້ເວົ້າ 1 / ຜູ້ເວົ້າ2/ ແລະອື່ນໆ.

Q: ຂ້າພະເຈົ້າສາມາດ transcribe ຈໍານວນຫຼາຍກັບ faster-whisper large-v3?

ຍອມຮັບ — /batch/ ຮັບເອົາໂຟນເດີຂອງໄຟລ໌ສຽງ. ລາຍການບັນທຶກແຕ່ລະອັນຈະຕົກຢູ່ໃນ /account/?tab=history ພ້ອມກັບຊື່ໄຟລ໌ຕົ້ນຕໍ. ສຳລັບການຮັກສາຕົ້ນຂອງໂຟນເດີໃຊ້ API.

Question 1

faster-whisper large-v3 ເຮັດຫຍັງ?

Accepted Answer

faster-whisper large-v3 ແປສຽງອອກສຽງເປັນຂໍ້ຄວາມ. ສົ່ງໄຟລ MP3, WAV, M4A, ຫຼື ວີດີໂອ ແລະ faster-whisper large-v3 ສົ່ງຄືນການແປເຕັມພ້ອມດ້ວຍບົດຄວາມ SRT/VTT ທີ່ເປັນທາງເລືອກພ້ອມກັບເວລາ.

Question 2

ພາສາ​ໃດ​ແດ່​ທີ່ faster-whisper large-v3 ສະໜັບສະໜູນ?

Accepted Answer

faster-whisper large-v3 ຈັດການກັບພາສາຫຼາຍສິບພາສາ — Whisper-ຄອບຄົວແບບຈໍາລອງປົກຄຸມ 90%, Parakeet ປົກຄຸມ ~25, ອື່ນໆແຕກຕ່າງກັນ. ເລືອກ "ກວດພົບອັດຕະໂນມັດ" ຫຼື ລະບຸພາສາສໍາລັບການຄວາມຖືກຕ້ອງສູງສຸດ.

Question 3

faster-whisper large-v3 ຖືກຕ້ອງເທົ່າໃດ?

Accepted Answer

ອັດຕາຄວາມຜິດພາດຂອງຄໍາແມ່ນ 5-10% ສໍາລັບສຽງພາສາອັງກິດທີ່ສະອາດ, 10-20% ສໍາລັບສຽງທີ່ມີສຽງດັງຫຼືສຽງທີ່ອ່ອນແອ. ຕົວເລືອກທີ່ໃຫຍ່ກວ່າຂອງໂຄງສ້າງທີ່ຄ້າຍຄືກັນເຮັດໄດ້ດີກວ່າໃນກໍລະນີທີ່ຫຍຸ້ງຍາກ - ເລືອກຂະຫນາດໃຫຍ່ກວ່າເມື່ອສຽງແມ່ນຫຍາບ.

Question 4

faster-whisper large-v3 ມີ​ເວລາ​ສິ້ນສຸດ​ບໍ?

Accepted Answer

ຍິນດີ — ທຸກໆສ່ວນປະກອບມີເວລາເລີ່ມຕົ້ນ/ຈົບ. ສົ່ງອອກເປັນ SRT ຫຼື VTT ແລະເວລາທີ່ວາງແຜນໂດຍກົງໃສ່ວິດີໂອຂອງທ່ານ.

Question 5

ຄ່າໃຊ້ຈ່າຍຂອງ faster-whisper large-v3 ຕໍ່ນາທີແມ່ນເທົ່າໃດ?

Accepted Answer

faster-whisper large-v3 ແລ່ນຢູ່ໃນ GPUs ຂອງພວກເຮົາເອງຕໍ່ຕ້ານ pool ຂອງທ່ານຟຣີທຸກໆມື້ກ່ອນ; $5 → 200,000 ບັດເຄຣດິດຈ່າຍຫຼັງຈາກນັ້ນ. ປະມານ ~ 500 ບັດເຄຣດິດຕໍ່ນາທີ.

Question 6

ຮູບແບບສຽງໃດທີ່ຂ້ອຍສາມາດອັບໂຫລດໄປທີ່ faster-whisper large-v3?

Accepted Answer

MP3, WAV, M4A, FLAC, OGG, ນອກນັ້ນຍັງມີວິດີໂອ (MP4, MOV, WebM) — ພວກເຮົາດຶງອອກສຽງ. ສູງສຸດ 500 MB ຕໍ່ການອັບໂຫລດ. ໄຟລ໌ຍາວກວ່າ? Split ກັບ / audio / cut / ຫຼືໃຊ້ / v1 / stt / batch /.

Question 7

faster-whisper large-v3 ສາມາດລະບຸຜູ້ເວົ້າໄດ້ບໍ?

Accepted Answer

ການ​ພິມ​ລາຍ​ຊື່​ຜູ້​ເວົ້າ​ແມ່ນ​ການ​ຜ່ານ​ທີ່​ແຍກ​ອອກ​ມາ — ປິດ​ການ​ໃຊ້​ງານ "diarize" ໃນ / transcribe /. faster-whisper large-v3 ຈັດການ​ການ​ພິມ​ລາຍ​ຊື່​; ການ​ພິມ​ລາຍ​ຊື່​ຜູ້​ເວົ້າ​ແມ່ນ​ການ​ວາງ​ស្លាກ​ໃສ່​ສ່ວນ​ຕ່າງໆ​ຂອງ​ຜູ້​ເວົ້າ​ແຕ່ລະ​ສ່ວນ​ດ້ວຍ​ຜູ້​ເວົ້າ 1 / ຜູ້​ເວົ້າ2/ ແລະ​ອື່ນໆ.

Question 8

ຂ້າພະເຈົ້າສາມາດ transcribe ຈໍານວນຫຼາຍກັບ faster-whisper large-v3?

Accepted Answer

ຍອມຮັບ — /batch/ ຮັບເອົາ​ໂຟນເດີ​ຂອງ​ໄຟລ໌​ສຽງ. ລາຍການ​ບັນທຶກ​ແຕ່ລະອັນ​ຈະ​ຕົກ​ຢູ່​ໃນ /account/?tab=history ​ພ້ອມ​ກັບ​ຊື່​ໄຟລ໌​ຕົ້ນ​ຕໍ. ສຳ​ລັບ​ການ​ຮັກສາ​ຕົ້ນ​ຂອງ​ໂຟນເດີ​ໃຊ້ API.

Question 9

ມີ API ສໍາລັບ faster-whisper large-v3 ບໍ?

Accepted Answer

ຍິນດີ — POST ສຽງຂອງທ່ານໄປທີ່ /v1/stt/transcribe/ ດ້ວຍແບບ "faster-whisper large-v3". ສົ່ງຄືນ JSON ທີ່ມີຂໍ້ຄວາມ + ພາກ + ເວລາລະດັບຄໍາ. /api/ ມີຄໍາແນະນໍາເຕັມ.

Question 10

ຄວາມເປັນສ່ວນຕົວແມ່ນຫຍັງເມື່ອຂ້ອຍຂຽນດ້ວຍ faster-whisper large-v3?

Accepted Answer

ແບບທີ່ຈັດການເອງຮັກສາສຽງໃນ GPUs ຂອງພວກເຮົາ; ຄ່າໃຊ້ຈ່າຍຜ່ານຜ່ານກັບ DPA. ສຽງຖືກລຶບຫຼັງຈາກແບ່ງປັນ-window (24h anon, 7d ເຂົ້າສູ່ລະບົບ). ພວກເຮົາບໍ່ຝຶກອົບຮົມກ່ຽວກັບຂໍ້ມູນເຂົ້າຂອງທ່ານ.

Question 11

ຜົນອອກມາຂອງ faster-whisper large-v3 ມີຄວາມປອດໄພສຳລັບການໃຊ້ໃນການຄ້າບໍ?

Accepted Answer

ຍິນດີ — Free.ai ອະນຸຍາດໃຫ້ໃຊ້ການພິມຖ່າຍທອດສຽງໃນທາງທຸລະກິດ. ທ່ານຕ້ອງມີສິດໃນການອັບໂຫລດສຽງ (ການບັນທຶກຂອງທ່ານເອງ, ວັດຖຸທີ່ມີໃບອະນຸຍາດ, ຫຼື ເນື້ອໃນທີ່ມີການອະນຸຍາດ).

Question 12

faster-whisper large-v3 ໃຊ້ເວລາດົນປານໃດ?

Accepted Answer

ປັດໃຈເວລາຈິງແມ່ນປະມານ 0.05-0.2 × - ບົດຂຽນ podcast 60 ນາທີໃນ 3-12 ນາທີ. ແບບຟອມປະກັນໄພມັກຈະສິ້ນສຸດລົງໄວກວ່າ. ໃຊ້ປຸ່ມລໍຖ້າເພື່ອປິດແທັບ.

faster-whisper large-v3

ប្រើຜ່ານ API

ແບບທີ່ຄ້າຍຄືກັນ

ຄໍາຖາມທີ່ຖາມເລື້ອຍໆ

faster-whisper large-v3

ប្រើ​ຜ່ານ API

ແບບ​ທີ່​ຄ້າຍ​ຄື​ກັນ

ຄໍາຖາມທີ່ຖາມເລື້ອຍໆ