Q: Fal Speech-to-Text ສາມາດລະບຸຜູ້ເວົ້າໄດ້ບໍ?

ການພິມລາຍຊື່ຜູ້ເວົ້າແມ່ນການຜ່ານທີ່ແຍກອອກມາ — ປິດການໃຊ້ງານ "diarize" ໃນ / transcribe /. Fal Speech-to-Text ຈັດການການພິມລາຍຊື່; ການພິມລາຍຊື່ຜູ້ເວົ້າແມ່ນການວາງស្លាກໃສ່ສ່ວນຕ່າງໆຂອງຜູ້ເວົ້າແຕ່ລະສ່ວນດ້ວຍຜູ້ເວົ້າ 1 / ຜູ້ເວົ້າ2/ ແລະອື່ນໆ.

Q: ຂ້າພະເຈົ້າສາມາດ transcribe ຈໍານວນຫຼາຍກັບ Fal Speech-to-Text?

ຍອມຮັບ — /batch/ ຮັບເອົາໂຟນເດີຂອງໄຟລ໌ສຽງ. ລາຍການບັນທຶກແຕ່ລະອັນຈະຕົກຢູ່ໃນ /account/?tab=history ພ້ອມກັບຊື່ໄຟລ໌ຕົ້ນຕໍ. ສຳລັບການຮັກສາຕົ້ນຂອງໂຟນເດີໃຊ້ API.

Question 1

Fal Speech-to-Text ເຮັດຫຍັງ?

Accepted Answer

Fal Speech-to-Text ແປສຽງອອກສຽງເປັນຂໍ້ຄວາມ. ສົ່ງໄຟລ MP3, WAV, M4A, ຫຼື ວີດີໂອ ແລະ Fal Speech-to-Text ສົ່ງຄືນການແປເຕັມພ້ອມດ້ວຍບົດຄວາມ SRT/VTT ທີ່ເປັນທາງເລືອກພ້ອມກັບເວລາ.

Question 2

ພາສາ​ໃດ​ແດ່​ທີ່ Fal Speech-to-Text ສະໜັບສະໜູນ?

Accepted Answer

Fal Speech-to-Text ຈັດການກັບພາສາຫຼາຍສິບພາສາ — Whisper-ຄອບຄົວແບບຈໍາລອງປົກຄຸມ 90%, Parakeet ປົກຄຸມ ~25, ອື່ນໆແຕກຕ່າງກັນ. ເລືອກ "ກວດພົບອັດຕະໂນມັດ" ຫຼື ລະບຸພາສາສໍາລັບການຄວາມຖືກຕ້ອງສູງສຸດ.

Question 3

Fal Speech-to-Text ຖືກຕ້ອງເທົ່າໃດ?

Accepted Answer

ອັດຕາຄວາມຜິດພາດຂອງຄໍາແມ່ນ 5-10% ສໍາລັບສຽງພາສາອັງກິດທີ່ສະອາດ, 10-20% ສໍາລັບສຽງທີ່ມີສຽງດັງຫຼືສຽງທີ່ອ່ອນແອ. ຕົວເລືອກທີ່ໃຫຍ່ກວ່າຂອງໂຄງສ້າງທີ່ຄ້າຍຄືກັນເຮັດໄດ້ດີກວ່າໃນກໍລະນີທີ່ຫຍຸ້ງຍາກ - ເລືອກຂະຫນາດໃຫຍ່ກວ່າເມື່ອສຽງແມ່ນຫຍາບ.

Question 4

Fal Speech-to-Text ມີ​ເວລາ​ສິ້ນສຸດ​ບໍ?

Accepted Answer

ຍິນດີ — ທຸກໆສ່ວນປະກອບມີເວລາເລີ່ມຕົ້ນ/ຈົບ. ສົ່ງອອກເປັນ SRT ຫຼື VTT ແລະເວລາທີ່ວາງແຜນໂດຍກົງໃສ່ວິດີໂອຂອງທ່ານ.

Question 5

ຄ່າໃຊ້ຈ່າຍຂອງ Fal Speech-to-Text ຕໍ່ນາທີແມ່ນເທົ່າໃດ?

Accepted Answer

Fal Speech-to-Text ແມ່ນເຄື່ອງຈັກແປພາສາທີ່ມີລາຄາຖືກ. ປະມານ ~500–1,500 ບັດຕໍ່ນາທີຂອງສຽງ. $1 = 750,000 ບັດ.

Question 6

ຮູບແບບສຽງໃດທີ່ຂ້ອຍສາມາດອັບໂຫລດໄປທີ່ Fal Speech-to-Text?

Accepted Answer

MP3, WAV, M4A, FLAC, OGG, ນອກນັ້ນຍັງມີວິດີໂອ (MP4, MOV, WebM) — ພວກເຮົາດຶງອອກສຽງ. ສູງສຸດ 500 MB ຕໍ່ການອັບໂຫລດ. ໄຟລ໌ຍາວກວ່າ? Split ກັບ / audio / cut / ຫຼືໃຊ້ / v1 / stt / batch /.

Question 7

Fal Speech-to-Text ສາມາດລະບຸຜູ້ເວົ້າໄດ້ບໍ?

Accepted Answer

ການ​ພິມ​ລາຍ​ຊື່​ຜູ້​ເວົ້າ​ແມ່ນ​ການ​ຜ່ານ​ທີ່​ແຍກ​ອອກ​ມາ — ປິດ​ການ​ໃຊ້​ງານ "diarize" ໃນ / transcribe /. Fal Speech-to-Text ຈັດການ​ການ​ພິມ​ລາຍ​ຊື່​; ການ​ພິມ​ລາຍ​ຊື່​ຜູ້​ເວົ້າ​ແມ່ນ​ການ​ວາງ​ស្លាກ​ໃສ່​ສ່ວນ​ຕ່າງໆ​ຂອງ​ຜູ້​ເວົ້າ​ແຕ່ລະ​ສ່ວນ​ດ້ວຍ​ຜູ້​ເວົ້າ 1 / ຜູ້​ເວົ້າ2/ ແລະ​ອື່ນໆ.

Question 8

ຂ້າພະເຈົ້າສາມາດ transcribe ຈໍານວນຫຼາຍກັບ Fal Speech-to-Text?

Accepted Answer

ຍອມຮັບ — /batch/ ຮັບເອົາ​ໂຟນເດີ​ຂອງ​ໄຟລ໌​ສຽງ. ລາຍການ​ບັນທຶກ​ແຕ່ລະອັນ​ຈະ​ຕົກ​ຢູ່​ໃນ /account/?tab=history ​ພ້ອມ​ກັບ​ຊື່​ໄຟລ໌​ຕົ້ນ​ຕໍ. ສຳ​ລັບ​ການ​ຮັກສາ​ຕົ້ນ​ຂອງ​ໂຟນເດີ​ໃຊ້ API.

Question 9

ມີ API ສໍາລັບ Fal Speech-to-Text ບໍ?

Accepted Answer

ຍິນດີ — POST ສຽງຂອງທ່ານໄປທີ່ /v1/stt/transcribe/ ດ້ວຍແບບ "Fal Speech-to-Text". ສົ່ງຄືນ JSON ທີ່ມີຂໍ້ຄວາມ + ພາກ + ເວລາລະດັບຄໍາ. /api/ ມີຄໍາແນະນໍາເຕັມ.

Question 10

ຄວາມເປັນສ່ວນຕົວແມ່ນຫຍັງເມື່ອຂ້ອຍຂຽນດ້ວຍ Fal Speech-to-Text?

Accepted Answer

ແບບທີ່ຈັດການເອງຮັກສາສຽງໃນ GPUs ຂອງພວກເຮົາ; ຄ່າໃຊ້ຈ່າຍຜ່ານຜ່ານກັບ DPA. ສຽງຖືກລຶບຫຼັງຈາກແບ່ງປັນ-window (24h anon, 7d ເຂົ້າສູ່ລະບົບ). ພວກເຮົາບໍ່ຝຶກອົບຮົມກ່ຽວກັບຂໍ້ມູນເຂົ້າຂອງທ່ານ.

Question 11

ຜົນອອກມາຂອງ Fal Speech-to-Text ມີຄວາມປອດໄພສຳລັບການໃຊ້ໃນການຄ້າບໍ?

Accepted Answer

ຍິນດີ — Free.ai ອະນຸຍາດໃຫ້ໃຊ້ການພິມຖ່າຍທອດສຽງໃນທາງທຸລະກິດ. ທ່ານຕ້ອງມີສິດໃນການອັບໂຫລດສຽງ (ການບັນທຶກຂອງທ່ານເອງ, ວັດຖຸທີ່ມີໃບອະນຸຍາດ, ຫຼື ເນື້ອໃນທີ່ມີການອະນຸຍາດ).

Question 12

Fal Speech-to-Text ໃຊ້ເວລາດົນປານໃດ?

Accepted Answer

ປັດໃຈເວລາຈິງແມ່ນປະມານ 0.05-0.2 × - ບົດຂຽນ podcast 60 ນາທີໃນ 3-12 ນາທີ. ແບບຟອມປະກັນໄພມັກຈະສິ້ນສຸດລົງໄວກວ່າ. ໃຊ້ປຸ່ມລໍຖ້າເພື່ອປິດແທັບ.

Fal Speech-to-Text

ប្រើຜ່ານ API

Similar models

ຄໍາຖາມທີ່ຖາມເລື້ອຍໆ

Fal Speech-to-Text

ប្រើ​ຜ່ານ API

Similar models

ຄໍາຖາມທີ່ຖາມເລື້ອຍໆ