การบันทึกเสียง

ใช้ในเชิงพาณิชย์ได้ 380+ โมเดล ไม่มีสัญลักษณ์น้ำ ไม่ต้องลงทะเบียน
รุ่น:
+ GPT-5, Claude, Gemini
อัพโหลดโพดักซ์ตอน และรับการตีพิมพ์ที่สะอาด ติดป้ายผู้พูด ด้วยการตรวจจับตัวบ่งชี้บทอัตโนมัติจากช่องว่างความเงียบ แฟ้มรูปแบบยาว สูงสุด 2GB, ภาษา 99 ภาษา, ความแม่นยำ Whisper-large-v3 ส่งออกเป็น SRT/VTT สำหรับโพดักซ์วิดีโอของคุณ, TXT ธรรมดาสำหรับบันทึกการแสดง หรือ JSON สำหรับแก้ไขในกระบวนการทำงานแบบ Descript

ลากและวางโพดำของคุณ หรือคลิกเพื่อค้นหา

MP3, WAV, M4A, OGG, MP4 — ตอนยาว ขนาดสูงสุด 2GB

ตัวบ่งชี้บทจะถูกคำนวณจากช่องว่างของส่วนและติดตั้งไว้กับการแปลเสียง ใส่มันลงในคำอธิบายของ YouTube หรือ Spotify ตามที่มันเป็น
ค่าที่คาดการณ์ไว้สำหรับคลิปนี้
ข้อมูลของพอดแคสต์
บทที่ตรวจจับอัตโนมัติ

กำลังแปลโพดักท์ของคุณ...

ตอนยาวใช้เวลาหลายนาที คุณสามารถปิดแท็บนี้ได้ หากคุณเลือก อีเมลเมื่อเสร็จสิ้น

สร้างขึ้นสำหรับผู้สร้างพอดคาสต์ + บรรณาธิการรายการ

แสดงโน้ตในแผ่นเดียว

โหลดตอน ดาวน์โหลด TXT แท็กผู้พูดในแถว ฉลากเวลาบท เตรียมไว้สำหรับ Spotify/ YouTube คำอธิบายของคุณ เขียนบล๊อกใน 10 นาที แทนที่จะ4ชั่วโมง

ชื่อเสียง

ส่งออก SRT หรือ WebVTT ด้วยแท็กผู้พูด ทิ้งลงไปใน Premiere, Final Cut หรือ DaVinci Resolve หรืออัพโหลดพร้อมกับวิดีโอ YouTube ของคุณเพื่อใช้คำอธิบายที่สะอาด

ปรับแต่งตอนบนพื้นฐานข้อความ

การส่งออก JSON จะให้คุณได้คำทุกคำพร้อมกับสแตมป์เวลาเริ่ม/จบ นำเข้าไปยัง Descript, Reaper หรือกระบวนการทำงานที่กำหนดเอง - แก้ไขโดยการทำลายข้อความแทนการทำลาย

วิธีการแปลภาษาของพอดแคสต์ทำงานอย่างไร

  1. ลากเอกสารของคุณไปยังพื้นที่วาง — MP3, WAV, M4A, MP4, สูงสุด 2GB
  2. ทิ้งป้ายกำกับของผู้พูดและเครื่องหมายบทไว้เปิด (เป็นค่าปริยาย) เลือกรูปแบบการส่งออก
  3. เราจะตรวจสอบระยะเวลา + ราคาก่อนที่คุณจะใช้เงิน คลิก เขียนต่อ
  4. ดาวน์โหลด TXT, SRT, VTT หรือ JSON ที่ติดป้ายด้วยตัวผู้พูด ตัวบ่งชี้บทจะถูกส่งพร้อมกันพร้อมที่จะปัก

Free.ai บทแปลโพดักซ์ กับ เดสคริปต์, ริเวอร์ไซด์, โอเตอร์

ตัวเลือก Free.ai Descript Riverside Otter.ai
ค่าPay-per-use ($0.003/min)$15-30/mo$19/mo$16.99/mo
ขนาดแฟ้มสูงสุด2 GB5 GBTied to record session500 MB (varies)
ปรับแต่งการแสดงผลของตัวเล่าเรื่อง
เครื่องหมายบทอัตโนมัติ (ที่อยู่บนความเงียบ)ManualPaid tier
ส่งออก SRT/VTTPaid
ภาษา9922100+English-focused
API สาธารณะLimited
ค่าบริการของคู่แข่ง สะท้อนระดับการให้บริการในปี 2026 ตรวจสอบแผนปัจจุบันของแต่ละผู้ให้บริการ
ตัวเลือกระดับสูง
ผลลัพธ์
เหรียญหมดแล้ว เอาชิปเพิ่ม
ต้องการผลลัพธ์ที่ดีกว่านี้ไหม? รุ่นพิเศษ (GPT-5, Claude, Gemini) ทำให้คุณภาพดีขึ้น แสดงแผน

❤️ Love this tool? Share it!

ลงทะเบียนเพื่อรับลิงค์แนะนำ และรับ 25,000 โต๊กเกอร์ต่อเพื่อน

อยากได้อีกมั้ย ลงทะเบียนฟรี 30K ชิ้น/วัน + 10K โบโน
ลงทะเบียน

กำลังประมวลผลคำขอของคุณ...

เขียนแปลงโพดำเป็นข้อความด้วย AI ฟรี แท็กผู้พูด ตัวบ่งชี้บท นำเข้า SRT

วิธีการใช้ การบันทึกเสียง

1
เติมข้อมูลของคุณ

พิมพ์ข้อความ, โหลดแฟ้ม, หรืออธิบายสิ่งที่คุณต้องการ ไม่จำเป็นต้องมีบัญชีผู้ใช้

2
คลิกสร้าง

ระบบ AI ของเราจะประมวลผลคำขอของคุณในไม่กี่วินาที โดยใช้แบบจำลอง Open Source ที่ยอดเยี่ยม

3
ดาวน์โหลดและแบ่งปัน

ดาวน์โหลด, คัดลอก, หรือแบ่งปันผลลัพธ์ของคุณ ฟรีสำหรับใช้ส่วนตัวและใช้ในเชิงพาณิชย์

ใช้เครื่องมือนี้ผ่าน API

สร้างเครื่องมือนี้โดยอัตโนมัติจากโค้ดของคุณเอง จุดจบ REST ที่เข้ากันได้กับ OpenAI, การตรวจสอบสิทธิ์ด้วยโทเค็นผู้ใช้, ไม่จำเป็นต้องใช้ SDK เพิ่มเติม ค่าโทเค็นจะตรงกับส่วนติดต่อของเว็บ

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

การบันทึกเสียง — FAQ

เครื่องมือโพดำใช้การตั้งค่าปริยายให้เป็นการจัดเรียงผู้พูดและเครื่องหมายบท (ตรวจจับความเงียบ > 2s) และรองรับแฟ้มรูปแบบยาว ขนาดสูงสุด 2GB รูปแบบผลลัพธ์รวมถึง SRT + VTT สำหรับวิดีโอคลิปแสดงโน้ต, TXT ธรรมดาสำหรับโพสต์บล๊อก และ JSON ที่มีโครงสร้างพร้อมกับสแตมป์เวลาต่อรอบ + แท็กผู้พูด เพื่อใช้ในการแก้ไขในกระบวนการทำงานแบบ Descript

สูงสุด 2GB ต่อแฟ้ม — ประมาณ 14 ชั่วโมงของพอดคาสต์เสียงที่ 128 kbps MP3 แฟ้มยาวจะถูกแยกออกจากกันบนเซิร์ฟเวอร์เพื่อความยืดหยุ่น; คุณจะได้รับแค่แผ่นเดียวที่รวมกันกลับมา

ใช่ การจัดเรียงเสียงของผู้พูดจะเปิดไว้โดยปริยาย เราจะตรวจจับเสียงที่แตกต่างกัน 2- 10 เสียงผ่านการฝังเสียง ECAPA ติดป้ายว่า ผู้พูด 1 / 2/... และใช้ป้ายนี้กับทุกๆ ส่วน คุณสามารถเปลี่ยนชื่อพวกเขาได้ในมุมมองผลลัพธ์

ช่วงเวลาเงียบยาวกว่า2วินาที - เป็นการหยุดชะงักตามธรรมชาติที่ผู้สร้างพอดคาสต์ใช้ระหว่างการแยกแยะ ทุกบทจะได้รับสแตมป์เวลาที่คุณสามารถปักหมุดเข้าไปในโน้ตรายการของคุณได้โดยตรงด้วยบล็อก "บท:" สำหรับ YouTube + Spotify

เดสคริปต์เรียกค่าบริการ 15-30 เหรียญต่อเดือน สำหรับ 10 ชั่วโมงของการแปล ติดกับผู้แปลของเรา เราเรียกค่าบริการต่อการใช้งาน 500 เหรียญ/นาทีบน Whisper (5 เหรียญ = 200,000 เหรียญ = 400 นาที) ไม่มีค่าใช้จ่าย เพียงแค่ส่งออก คุณสามารถปักลงไปที่ไหนก็ได้

ริเวอร์ไซด์เป็นสตูดิโอที่บันทึกเสียง ที่จะบันทึกการทำงานของคุณเองฟรี ในแอพของพวกเขา แต่หลังจากที่คุณบันทึกกับพวกเขา เราบันทึก MP3/WAV/MP4 ทุกรูปแบบ ไม่ว่ามันจะบันทึกที่ไหน

Otter จำกัดเวลา 300 นาทีต่อเดือน ในระดับฟรี และเน้นภาษาอังกฤษ เราสนับสนุน 99 ภาษา ด้วยความแม่นยำ Whisper-large-v3 เดียวกัน โดยไม่มีจำกัดจำนวนเดือน - คุณจ่ายตามนาทีที่แปล

ใช่ — เลือก SRT หรือ WebVTT เป็นรูปแบบการส่งออก แท็กของผู้พูดจะถูกรวมไว้ในบรรทัด (SRT) หรือเป็นแท็ก < v Speaker N > (VTT) ซึ่งผู้เล่นสมัยใหม่ส่วนใหญ่จะแสดงให้เห็นอย่างถูกต้อง

Whisper-large-v3 จัดการเพลงและเสียงสะท้อนแสงได้ดี (อัตราความผิดพลาดของคำโดยทั่วไป 3-7%) เพลงที่ดังมากหรือเสียงซ้อนกันมากจะทำให้ความแม่นยำลดลง - ลองคิดดูว่าควรจะใช้ / music/ vocal-remover / ก่อนหรือแยกการเปิดเสียงของคุณออกเป็นส่วน ๆ

Whisper จัดการชื่อที่ใช้กันมากที่สุด แต่คำศัพท์เฉพาะของแบรนด์อาจจะต้องผ่านการแก้ไขหลังการส่งออก ตอน ~30 นาทีโดยทั่วไปจะมี 5-10 ชื่อแบรนด์/ชื่อที่ต้องแก้ไขโดยใช้มือ

โหลดมันขึ้นมาที่นี่ ครั้งละอัน หรือใช้ฟังก์ชัน / batch / เมื่อเข้าระบบแล้ว เพื่อจัดแถวรอดูซีซั่น API ที่ / api / ยังรองรับ POST / v1/ stt / สำหรับการจัดแถวรอด้วยโปรแกรม

ไม่ แฟ้มที่อัพโหลดจะถูกลบออกหลังจากที่การแปลภาษาเสร็จสมบูรณ์ หากคุณล็อกอินแล้ว แปลภาษาของคุณจะอยู่ใน / account / ประวัติการดาวน์โหลด ส่วนผู้ใช้ที่ไม่ระบุชื่อ จะได้รับลิงก์เพื่อแบ่งปัน 24 ชั่วโมง

ลงทะเบียนฟรี 30,000 ชิ้น

สร้างบัญชีผู้ใช้ฟรี

ไม่ต้องใช้บัตรเครดิต

คุณจะให้คะแนนเครื่องมือนี้ยังไง

Love this tool? Share it!