Free ສະແປນນິຊ Transcription
ແປສຽງ ແລະ ວີດີໂອ ສະແປນນິຊ ເປັນຂໍ້ຄວາມດ້ວຍ AI. ໄວ, ຖືກຕ້ອງ ແລະ ຟຣີ.
ວິທີການເຮັດວຽກ
- ໄປທີ່ Free.ai Transcriber
- ສົ່ງໄຟລ໌ສຽງ ຫຼື ວີດີໂອ ສະແປນນິຊ ຂອງທ່ານ
- AI ຂອງພວກເຮົາກວດພົບ ສະແປນນິຊ ໂດຍອັດຕະໂນມັດ ແລະ ແປມັນ
- ດາວໂຫລດບົດບັນທຶກຂອງທ່ານເປັນບົດຄວາມ ຫຼື ບົດລາຍຊື່ຜູ້ອ່ານ SRT
ສະແປນນິຊ ຄຸນສົມບັດການແປເປັນພາສາອັງກິດ
- ✓ພັດທະນາໂດຍ faster-whisper (ມີໃບອະນຸຍາດ MIT)
- ✓ກວດພົບພາສາ ສະແປນນິຊ ໂດຍອັດຕະໂນມັດ
- ✓ສະຫນັບສະຫນູນ MP3, WAV, MP4, M4A, FLAC, ແລະອື່ນໆ
- ✓ສົ່ງອອກເວລາແລະບົດລາຍຊື່ພາຍໃຕ້ (SRT)
- ✓ບໍ່ມີຂໍ້ຈໍາກັດຂະໜາດເອກະສານໃນແຜນທີ່ຈ່າຍ
- ✓ຄວາມເປັນສ່ວນຕົວ ແລະ ຄວາມປອດໄພ -- ໄຟລ໌ຈະຖືກລຶບຫຼັງຈາກການປະມວນຜົນ
ລາຍລະອຽດພາສາ
| ພາສາ | ສະແປນນິຊ |
| ລະຫັດ ISO | es |
| ແບບ AI | ສຽງຮ້ອງໄວຂຶ້ນ |
| ລາຄາ | ບໍ່ມີ |
ພາສາອື່ນໆ
ເບິ່ງພາສາທັງໝົດຄໍາຖາມທີ່ຖາມເລື້ອຍໆ
Whisper ໃຫຍ່-v3-turbo ດິນໃນລະດັບຄວາມຖືກຕ້ອງສູງສຸດຂອງຕົນກ່ຽວກັບ ສະແປນນິຊ - ຕ່ໍາກວ່າ 7% ອັດຕາຄວາມຜິດພາດຄໍາເວົ້າກ່ຽວກັບມາດຕະຖານ benchmarks. ໃນການປະຕິບັດທີ່ຫມາຍຄວາມວ່າສຽງສະຕູດິໂອສະອາດມາກັບຄືນໃກ້-ສົມບູນແບບ, ແລະສຽງສົນທະນາແມ່ນໃຊ້ໄດ້ກັບການລ້າງຢ່າງຫນ້ອຍ.(ລະດັບ A, under 7% word error rate ຕາມມາດຕະຖານທີ່ວາງໄວ້ - ພວກເຮົາເຜີຍແຜ່ລະດັບ WER ທີ່ຊື່ສັດ ແທນທີ່ຈະເປັນຂໍ້ກ່າວຫາດ້ານການຕະຫຼາດ.)
ຍິນດີຕ້ອນຮັບ - ສະແປນນິຊ transcription draws from your daily free token pool first. ສຽງຄ່າໃຊ້ຈ່າຍປະມານ 50 tokens per minute, ດັ່ງນັ້ນ pool ທີ່ບໍ່ລະບຸຊື່ປະຈໍາວັນປົກຄຸມບາງຊົ່ວໂມງຂອງສຽງຕໍ່ມື້. ບັນຊີທີ່ລົງທະບຽນເຂົ້າມາໄດ້ຮັບ pool ໃຫຍ່ກວ່າ plus 10,000 signup tokens. Past that, $1 buys 750,000 tokens (~250 hours of audio).
ພາສາສະເປນປົກຄຸມ Castilian (ສະເປນ), ເມັກຊິໂກ, ອາເຈນຕິນາ (rioplatense), Caribbean, ແລະ Andean ປະເພດ. Whisper ໄດ້ຖືກຝຶກອົບຮົມໃນການປະສົມແລະຈັດການທັງຫມົດຫ້າໃນແບບດຽວກັນ - ພຽງແຕ່ຜ່ານພາສາ=es ແລະ transcript ຈະສະແດງໃຫ້ເຫັນໃດ dialect ແມ່ນໃນສຽງ (ລວມທັງ voseo ແລະ seseo).
MP3, WAV, M4A, FLAC, OGG, OPUS, ແລະ WEBM ແມ່ນໄດ້ຮັບການຍອມຮັບໂດຍກົງ. ສຳ ລັບວິດີໂອ (MP4, MOV, MKV) ພວກເຮົາຖອດອອກສຽງດົນຕີດ້ານເຊີບເວີກ່ອນທີ່ຈະສົ່ງມັນໄປຫາ Whisper - ທ່ານບໍ່ ຈຳ ເປັນຕ້ອງປ່ຽນແປງຫຍັງເລີຍ. ສາຍສົ່ງດຽວກັນບໍ່ວ່າຈະເປັນພາສາຕົ້ນສະບັບ, ລວມທັງ ສະແປນນິຊ.
ບໍ່ມີຊື່ອັບໂຫລດ cap ປະມານ 500 MB ຕໍ່ໄຟລ໌. ເຂົ້າບັນຊີໄປເຖິງ2GB. ໄລຍະເວລາແມ່ນບໍ່ຈໍາກັດຫຍຸ້ງຍາກ - ໄຟລ໌ຍາວແມ່ນ chunked ໂດຍອັດຕະໂນມັດ (30 ວິນາທີກັບ overlap window) ແລະ stitch ຄືນໄປສູ່ transcript ດຽວກັບ timestamps ຕິດຕໍ່ກັນ. ຫຼາຍຊົ່ວໂມງ ສະແປນນິຊ ການບັນທຶກ (podcasts, ເຕັມການສອນ, ກອງປະຊຸມ) ເຮັດວຽກໄດ້ດີ.
ຍິນດີ — ການບັນທຶກສຽງຂອງຜູ້ເວົ້າແມ່ນເປີດໂດຍ default ສໍາລັບ transcript ທຸກໆ ສະແປນນິຊ. ຜົນໄດ້ຮັບແມ່ນແບ່ງອອກເປັນ Speaker 1 / Speaker2/ Speaker3ດ້ວຍເວລາ, ສະນັ້ນການສໍາພາດ, ການສົນທະນາຂອງຄະນະ, ແລະ ການປະຊຸມຫຼາຍຝ່າຍມາກັບຄືນມາມີស្លាກ. Diarization ແລ່ນຢູ່ໃນແບບທີ່ແຍກຕ່າງຫາກແລະເຮັດວຽກຄືກັນໃນພາສາທັງ ໝົດ ທີ່ພວກເຮົາສະຫນັບສະຫນູນ.
ຍິນດີຕ້ອນຮັບ - ຕິດ URL ເຂົ້າ / transcribe/youtube/ ສຳ ລັບ YouTube ຫຼື / transcribe/podcast/ ສຳ ລັບ podcast feeds (Apple, Spotify, RSS). ພວກເຮົາດາວໂຫລດສຽງ, ແລ່ນມັນຜ່ານ Whisper ດ້ວຍພາສາ=es, ແລະສົ່ງຄືນການແປດ້ວຍເວລາແລະເຄື່ອງ ໝາຍ ຂອງຜູ້ເວົ້າ. ເນື້ອໃນ ສະແປນນິຊ ແບບດັ້ງເດີມ: ເພງ, ບົດຮຽນ, ການສໍາພາດ, ແລະເນື້ອໃນ YouTube ແບບຍາວໆໃນ ສະແປນນິຊ ແມ່ນວຽກທີ່ມັກທີ່ສຸດທີ່ພວກເຮົາເຫັນ.
ສຽງລົມຄ່າໃຊ້ຈ່າຍປະມານ 50 ບັດໃນແຕ່ລະນາທີຂອງສຽງ, ດັ່ງນັ້ນການບັນທຶກຫນຶ່ງຊົ່ວໂມງແມ່ນ ~ 3,000 ບັດ. $ 1 ຊື້ 750,000 ບັດ, ເຊິ່ງເຮັດວຽກອອກໄປປະມານ 250 ຊົ່ວໂມງຂອງສຽງຕໍ່ໂດລາ. ຜູ້ໃຊ້ສ່ວນໃຫຍ່ບໍ່ເຄີຍໃຊ້ຈ່າຍຫຍັງ - ນ້ໍາສະອາດປະຈໍາວັນປົກຄຸມຄລິບສັ້ນ, ຂໍ້ຄວາມສຽງ, ແລະ podcasts ຫນຶ່ງ-off.
ຍິນດີ — ລະດັບພາກ (ທຸກໆ ~ 10-30 ວິນາທີ) ແລະ ເວລາລະດັບຄໍາແມ່ນມີ. ລະດັບຄໍາແມ່ນປັ໊ມເດີມສໍາລັບສົ່ງອອກ VTT / SRT ບົດຄວາມດັ່ງນັ້ນບົດຄວາມ sync ສາຍ-by-line. ຢູ່ໃນ API ຕັ້ງ timestamps="word" ໃນຮ່າງກາຍຄໍາຮ້ອງຂໍ. ສະແປນນິຊ transcripts ແມ່ນຖືກສົ່ງຄືນເປັນ UTF-8 ມາດຕະຖານກັບພາສາທີ່ປົກກະຕິຂອງພາສາ.
ຍິນດີ. POST ສຽງ (multipart/form-data, ຊື່ແຫລ່ງ "file") ໄປທີ່ /v1/transcribe/ ດ້ວຍການເລືອກພາສາ=es — ຫຼືລົບພາຣາມິເຕີພາສາເພື່ອໃຫ້ Whisper ກວດພົບອັດຕະໂນມັດ. ສົ່ງຄືນ JSON ທີ່ມີການແປ, ພາກ, ເວລາແລະແທັກຜູ້ເວົ້າ. ແຫຼ່ງອ້າງອີງເຕັມແລະ SDK snippets ທີ່ /api/.
ຍິນດີ — ເມື່ອການແປພາສາສຳເລັດ, ກົດ ແປ ຫຼື ປ້າຍ ຂໍ້ຄວາມ ເຂົ້າ /translate/. ສະແປນນິຊ ຄູ່ກັບພາສາອື່ນໆທີ່ເຮົາສະໜັບສະໜູນ (200+). ສຳລັບກອງປະຊຸມນາທີ ສົ່ງບົດແປຜ່ານ /summarize/; ສຳລັບການແປສຽງ ສົ່ງມັນໄປ /voice/tts/ ເພື່ອສົ່ງສຽງໃນພາສາເປົ້າໝາຍ.
Whisper ໄດ້ຖືກຝຶກສອນໃນ 680K ຊົ່ວໂມງຂອງສຽງທີ່ສຽງດັງໃນໂລກຈິງ, ສະນັ້ນ ສະແປນນິຊ ການແປສຽງແມ່ນແຂງແຮງຕໍ່ສຽງດັງໃນພື້ນຫລັງ, ຕຽງດົນຕີ, ແລະ ການບັນທຶກຄຸນນະພາບໂທລະສັບ. ການຕັດທີ່ຮ້າຍແຮງຫຼືສຽງດັງຫຼາຍໆສຽງຈະຍັງເຮັດໃຫ້ຄວາມຖືກຕ້ອງເສຍຫາຍ.ຖ້າວ່າ ບົດບັນທຶກ ນັ້ນ ບໍ່ສາມາດໃຊ້ໄດ້ ສົ່ງອີເມວໄປທີ່ contact@free.ai ນໍາເອກະສານນັ້ນມາ - ພວກເຮົາ ຈະ ຈ່າຍຄືນເງິນຄ່າ ລິ້ງ ແລະ ເບິ່ງວ່າ ເຄື່ອງຈັກ ອື່ນ ໆ ຈະ ຈັດການ ສຽງຂອງທ່ານໄດ້ດີຂຶ້ນຫຼືບໍ່.