Fal Speech-to-Text

Free.ai · stt · ~500 ຕົວ​ແທນ​ຕໍ່ minute

ຖອດ​ໄຟລ໌​ສຽງ ຫຼື ວີດີໂອ ຫຼື ປ້າຍ URL ລົງ​ຂ້າງລຸ່ມ

~500 ຕົວ​ແທນ​ຕໍ່ minute
ແລ່ນຟຣີໃນ GPUs ຂອງພວກເຮົາ. ປັບປຸງ​ໃຫ້​ດີ​ຂຶ້ນ​ສຳລັບ Fal Speech-to-Text →

Fal Speech-to-Text ແມ່ນ a ແບບ​ແບບ​ເວົ້າ​ເປັນ​ຂໍ້​ຄວາມ. ຜ່ານແບບແບບພາຍນອກ - ~ 500 tokens ​ຕໍ່​ນາທີ (50% ລາຄາຕໍ່າກວ່າຄ່າໃຊ້ຈ່າຍ).

ប្រើ​ຜ່ານ API

OpenAI-compatible REST API. Generate a key and call this model in seconds.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/speech-to-text","audio_url":"https://..."}'
ເອກະສານ API ເອົາ​ກຸນແຈ API

ຄໍາຖາມທີ່ຖາມເລື້ອຍໆ

Fal Speech-to-Text ແປສຽງອອກສຽງເປັນຂໍ້ຄວາມ. ສົ່ງໄຟລ MP3, WAV, M4A, ຫຼື ວີດີໂອ ແລະ Fal Speech-to-Text ສົ່ງຄືນການແປເຕັມພ້ອມດ້ວຍບົດຄວາມ SRT/VTT ທີ່ເປັນທາງເລືອກພ້ອມກັບເວລາ.

Fal Speech-to-Text ຈັດການກັບພາສາຫຼາຍສິບພາສາ — Whisper-ຄອບຄົວແບບຈໍາລອງປົກຄຸມ 90%, Parakeet ປົກຄຸມ ~25, ອື່ນໆແຕກຕ່າງກັນ. ເລືອກ "ກວດພົບອັດຕະໂນມັດ" ຫຼື ລະບຸພາສາສໍາລັບການຄວາມຖືກຕ້ອງສູງສຸດ.

ອັດຕາຄວາມຜິດພາດຂອງຄໍາແມ່ນ 5-10% ສໍາລັບສຽງພາສາອັງກິດທີ່ສະອາດ, 10-20% ສໍາລັບສຽງທີ່ມີສຽງດັງຫຼືສຽງທີ່ອ່ອນແອ. ຕົວເລືອກທີ່ໃຫຍ່ກວ່າຂອງໂຄງສ້າງທີ່ຄ້າຍຄືກັນເຮັດໄດ້ດີກວ່າໃນກໍລະນີທີ່ຫຍຸ້ງຍາກ - ເລືອກຂະຫນາດໃຫຍ່ກວ່າເມື່ອສຽງແມ່ນຫຍາບ.

ຍິນດີ — ທຸກໆສ່ວນປະກອບມີເວລາເລີ່ມຕົ້ນ/ຈົບ. ສົ່ງອອກເປັນ SRT ຫຼື VTT ແລະເວລາທີ່ວາງແຜນໂດຍກົງໃສ່ວິດີໂອຂອງທ່ານ.

Fal Speech-to-Text ແມ່ນເຄື່ອງຈັກແປພາສາທີ່ມີລາຄາຖືກ. ປະມານ ~500–1,500 ບັດຕໍ່ນາທີຂອງສຽງ. $1 = 750,000 ບັດ.

MP3, WAV, M4A, FLAC, OGG, ນອກນັ້ນຍັງມີວິດີໂອ (MP4, MOV, WebM) — ພວກເຮົາດຶງອອກສຽງ. ສູງສຸດ 500 MB ຕໍ່ການອັບໂຫລດ. ໄຟລ໌ຍາວກວ່າ? Split ກັບ / audio / cut / ຫຼືໃຊ້ / v1 / stt / batch /.

ການ​ພິມ​ລາຍ​ຊື່​ຜູ້​ເວົ້າ​ແມ່ນ​ການ​ຜ່ານ​ທີ່​ແຍກ​ອອກ​ມາ — ປິດ​ການ​ໃຊ້​ງານ "diarize" ໃນ / transcribe /. Fal Speech-to-Text ຈັດການ​ການ​ພິມ​ລາຍ​ຊື່​; ການ​ພິມ​ລາຍ​ຊື່​ຜູ້​ເວົ້າ​ແມ່ນ​ການ​ວາງ​ស្លាກ​ໃສ່​ສ່ວນ​ຕ່າງໆ​ຂອງ​ຜູ້​ເວົ້າ​ແຕ່ລະ​ສ່ວນ​ດ້ວຍ​ຜູ້​ເວົ້າ 1 / ຜູ້​ເວົ້າ2/ ແລະ​ອື່ນໆ.

ຍອມຮັບ — /batch/ ຮັບເອົາ​ໂຟນເດີ​ຂອງ​ໄຟລ໌​ສຽງ. ລາຍການ​ບັນທຶກ​ແຕ່ລະອັນ​ຈະ​ຕົກ​ຢູ່​ໃນ /account/?tab=history ​ພ້ອມ​ກັບ​ຊື່​ໄຟລ໌​ຕົ້ນ​ຕໍ. ສຳ​ລັບ​ການ​ຮັກສາ​ຕົ້ນ​ຂອງ​ໂຟນເດີ​ໃຊ້ API.

ຍິນດີ — POST ສຽງຂອງທ່ານໄປທີ່ /v1/stt/transcribe/ ດ້ວຍແບບ "Fal Speech-to-Text". ສົ່ງຄືນ JSON ທີ່ມີຂໍ້ຄວາມ + ພາກ + ເວລາລະດັບຄໍາ. /api/ ມີຄໍາແນະນໍາເຕັມ.

ແບບທີ່ຈັດການເອງຮັກສາສຽງໃນ GPUs ຂອງພວກເຮົາ; ຄ່າໃຊ້ຈ່າຍຜ່ານຜ່ານກັບ DPA. ສຽງຖືກລຶບຫຼັງຈາກແບ່ງປັນ-window (24h anon, 7d ເຂົ້າສູ່ລະບົບ). ພວກເຮົາບໍ່ຝຶກອົບຮົມກ່ຽວກັບຂໍ້ມູນເຂົ້າຂອງທ່ານ.

ຍິນດີ — Free.ai ອະນຸຍາດໃຫ້ໃຊ້ການພິມຖ່າຍທອດສຽງໃນທາງທຸລະກິດ. ທ່ານຕ້ອງມີສິດໃນການອັບໂຫລດສຽງ (ການບັນທຶກຂອງທ່ານເອງ, ວັດຖຸທີ່ມີໃບອະນຸຍາດ, ຫຼື ເນື້ອໃນທີ່ມີການອະນຸຍາດ).

ປັດໃຈເວລາຈິງແມ່ນປະມານ 0.05-0.2 × - ບົດຂຽນ podcast 60 ນາທີໃນ 3-12 ນາທີ. ແບບຟອມປະກັນໄພມັກຈະສິ້ນສຸດລົງໄວກວ່າ. ໃຊ້ປຸ່ມລໍຖ້າເພື່ອປິດແທັບ.

ຮັກ Free.ai? ເວົ້າກັບເພື່ອນຂອງທ່ານ!

ຈັດອັນດັບ​ໜ້ານີ້