เครื่องสร้างวิดีโอ AI เครื่องมือแก้ไขวิดีโอ AI เครื่องมือปรับแต่งวิดีโอ AI สตูดิโอแปลงเสียงวิดีโอ AI ภาพถ่ายการแสดงของ AI (สนามบิน ตอนที่2) ลูกเล่นภาพยนตร์ AI - รูปแบบพิกเซล ปรับขนาดวิดีโอ AI เครื่องสร้างคำสั้น AI อีก →

เครื่องมือแปลวิดีโอ AI

ใช้ในเชิงพาณิชย์ได้ 380+ โมเดล ไม่มีสัญลักษณ์น้ำ ไม่ต้องลงทะเบียน

Repost your YouTube in Spanish, Hindi, French — with your face actually saying the words. Upload a video, pick a target language + voice, and we transcribe, translate, re-voice, and mix the new audio back into the original clip. Toggle lip-sync to also re-render the mouth.

โหลดวิดีโอของคุณ

ลากและวางวิดีโอของคุณที่นี่ หรือคลิกเพื่อค้นหา

MP4, MOV, WebM สูงสุด 100MB · คลิปที่ใช้เวลาน้อยกว่า5นาทีทำงานเร็วที่สุด

ภาษาต้นฉบับ

ภาษาเป้าหมาย

เสียงเป้าหมาย

แสดงปากของผู้พูดใหม่ (ลิปซินคอน)

ใช้ Sync Lipsync v2 ใช้เวลาประมาณ3เท่า และใช้เงินประมาณสองเท่า แต่ปากจะตรงกับภาษาใหม่ แนะนำให้ใช้กับภาพหัวพูดที่คุณจะโพสต์ต่อไป

~ 1,500 โต๊กเกอร์ต่อนาทีของวิดีโอ (พาธเสียง) · ~ 3,000/min ด้วยลิป-ซินคอน

ที่ที่วิดีโอแปลภาษามีค่า

รีโพสต์ YouTube ทั่วโลก

ภาษาอังกฤษ 1 ครั้ง → สเปน, ฮินดี, ฝรั่งเศส, โปรตุเกส, อินโดนีเซีย 1 ครั้ง เพิ่มเสียงผู้พูดในแต่ละภาษา 4x จำนวนผู้ชมในการผลิตครั้งเดียว

ปรับแต่งสนามกีฬาตามท้องถิ่น

นักเรียนออนไลน์แปลวิดีโอ 50 วิดีโอเป็น 10 ภาษาในเวลาเดียวกัน เลือกลิปซินคอน ทำให้ส่วนที่พูดหัวรู้สึกเหมือนคนพื้นเมือง ไม่ใช่คำอธิบาย

ปรับแต่งโฆษณา

แสดงผลงานเดียวกัน ผ่านแอคเคาท์โฆษณาเฉพาะประเทศ 10 แห่ง นักแสดงเดียวกัน ภาพเดียวกัน เสียงพื้นเมืองของแต่ละตลาด

วิธีการทำงานของเครื่องแปลวิดีโอ

ขั้นที่ 1

ดึงเสียงออกมา

เซิร์ฟเวอร์ด้าน ffmpeg ดึงข้อมูล MP3 สะอาดจากที่คุณอัพโหลด เร็ว — ทำงานบน API VPS

ขั้นที่ 2

เขียนต่อ

เสียงกระซิบเปลี่ยนเสียงเป็นข้อความด้วยการตรวจจับภาษาอัตโนมัติ สนับสนุนภาษา 99 ภาษา

ขั้นที่ 3

Translate + re-voice

MadLAD แปลภาษาเป้าหมาย; Kokoro พูดกลับในเสียงที่คุณเลือกจาก 174 ตัวเลือก

ขั้นที่4

Mix back + (optional) lip-sync

ffmpeg จะแทนที่เสียงต้นฉบับด้วยแทร็กใหม่ หากเปิดการปรับแต่งลิปซินคอน Sync Lipsync v2 จะปรับแต่งเสียงปากให้เข้ากับเสียงเดิม

คำแนะนำสำหรับวิดีโอแปลที่สะอาดที่สุด

เสียงลำโพงหน้าเดียว ฉากที่มีลำโพงหลายตัว ทำให้การแปลและเสียงสอดคล้องกับริมฝีปากสับสน
เสียงชัดเจนที่ -6 ดีบี เสียงดนตรีพื้นหลังหรือเสียงรบกวนจะลดความแม่นยำของการแปล
คลิปที่ยาวน้อยกว่า5นาที จะใช้เวลา 2-5 นาที (ทางเสียง) หรือ 5-15 นาที (ด้วยลิปซินคอน)
ภาษาสเปน ฝรั่งเศส เยอรมัน โปรตุเกส อิตาเลียน มีตัวเลือกเสียง Kokoro ที่ธรรมชาติที่สุด ฮินดี อาราบิก ญี่ปุ่น เกาหลี และจีนก็ทำงานได้

ปรับโพสต์ YouTube ของคุณเป็นภาษาสเปน, ฮินดี, ฝรั่งเศส — ด้วยเสียงของผู้พูดในภาษาเป้าหมาย Whisper เขียน, MadLAD แปล, Kokoro เสียงใหม่, ffmpeg ผสมกลับมา. ตัวเลือก Sync Lipsync v2 แสดงปากใหม่

วิธีการใช้ เครื่องมือแปลวิดีโอ AI

เติมข้อมูลของคุณ

พิมพ์ข้อความ, โหลดแฟ้ม, หรืออธิบายสิ่งที่คุณต้องการ ไม่จำเป็นต้องมีบัญชีผู้ใช้

คลิกสร้าง

ระบบ AI ของเราจะประมวลผลคำขอของคุณในไม่กี่วินาที โดยใช้แบบจำลอง Open Source ที่ยอดเยี่ยม

ดาวน์โหลดและแบ่งปัน

ดาวน์โหลด, คัดลอก, หรือแบ่งปันผลลัพธ์ของคุณ ฟรีสำหรับใช้ส่วนตัวและใช้ในเชิงพาณิชย์

ใช้เครื่องมือนี้ผ่าน API

สร้างเครื่องมือนี้โดยอัตโนมัติจากโค้ดของคุณเอง จุดจบ REST ที่เข้ากันได้กับ OpenAI, การตรวจสอบสิทธิ์ด้วยโทเค็นผู้ใช้, ไม่จำเป็นต้องใช้ SDK เพิ่มเติม ค่าโทเค็นจะตรงกับส่วนติดต่อของเว็บ

เอกสาร API เอากุญแจ API มา

curl -X POST https://api.free.ai/v1/video/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"prompt": "A cat playing piano", "duration": 4}'

เครื่องมือ AI ฟรีที่เกี่ยวข้องName

เครื่องสร้างวิดีโอ AI

เครื่องมือแก้ไขวิดีโอ AI

เครื่องมือปรับแต่งวิดีโอ AI

สตูดิโอแปลงเสียงวิดีโอ AI

ภาพถ่ายการแสดงของ AI (สนามบิน ตอนที่2)

ลูกเล่นภาพยนตร์ AI - รูปแบบพิกเซล

ปรับขนาดวิดีโอ AI

เครื่องสร้างคำสั้น AI

เครื่องมือแปลวิดีโอ AI — FAQ

อัพโหลดวิดีโอใดๆก็ได้ (คลิป YouTube, บทสรุปการสอน, คำแนะนำเกี่ยวกับผลิตภัณฑ์) และเราจะแปลมันเป็นภาษาเป้าหมายพร้อมกับเสียงของผู้พูดที่ถูกสังเคราะห์ใหม่ในภาษานั้น หากต้องการ ลิปซินคอนจะแสดงปากให้ดูเหมือนเสียงใหม่ ความสูง: โพสต์วิดีโอ YouTube ของคุณเป็นภาษาสเปน ฮินดี ฝรั่งเศส ด้วยใบหน้าของคุณพูดคำนั้นๆ

ขั้นที่5คือการทำงานตามลำดับของคลาวด์: (1) ffmpeg ดึง MP3 ออกมาจากวิดีโอ (2) Whisper เขียนมันขึ้นมาใหม่ (ตรวจจับภาษาได้อัตโนมัติ 99 ภาษา) (3) MadLAD แปลข้อความ (4) Kokoro พูดคำแปลในเสียงที่คุณเลือก (5) ffmpeg ผสมเสียงใหม่กลับเข้าไปในวิดีโอต้นฉบับ แทนที่จะใช้เสียงเดิม หากเปิดการปรับแต่งลิปซินคอนแล้ว ขั้นที่6จะนำผลลัพธ์ไปยัง Sync Lipsync v2 เพื่อปรับแต่งปากใหม่

การแปลเสียงวิดีโอจะใช้การแปลเสียงแบบลิปซิงค์เต็มรูปแบบเสมอ - มันเป็นตัวเลือกที่คุ้มค่าและรักษาตัวตนไว้ได้ดีที่สุด ตัวแปลวิดีโอจะทำการแปลเสียงแบบลิปซิงค์แบบเลือกใช้: พลาดมันไปเพื่อการแปลที่เร็วขึ้น3เท่า, ถูกลง ~50% ซึ่งเหมาะสมสำหรับเนื้อหาแบบเสียงบนเนื้อหาที่การแปลเสียงแบบลิปซิงค์ที่สมบูรณ์แบบนั้นไม่สำคัญ (พอดแคสต์, บันทึกหน้าจอ, วิดีโอทำอาหาร, อะไรก็ตามที่ผู้พูดไม่ได้อยู่ในภาพใกล้ตลอดเวลา)

พาธเฉพาะเสียงจะทำงานเกือบทั้งหมดบนโมเดลที่โฮสต์เอง (ffmpeg + Whisper + MadLAD + Kokoro) ดังนั้นมันจะเข้ากับการให้สิทธิ์ในวันของคุณสำหรับคลิปสั้นๆ ลิปซินคอนใช้โมเดล Sync Lipsync v2 และต้องการซื้อโต๊กเกอร์ ประมาณ: ~ 1,500 โต๊กเกอร์ต่อนาทีของวิดีโอสำหรับพาธเสียง, ~ 3,000/ min ด้วยลิปซินคอน

รายการที่คลิกลงมาจะแสดงภาษาที่ใช้กันมากที่สุด 20 ภาษา (สเปน, ฝรั่งเศส, เยอรมัน, อิตาลี, โปรตุเกส, ดัตช์, โปแลนด์, รัสเซีย, ตุรกี, อาราบิก, ฮีบรู, ฮินดี, จีน, ญี่ปุ่น, เกาหลี, เวียดนาม, อินโดนีเซีย, ไทย, สวีเดน, อังกฤษ) MadLAD รองรับภาษา 450+ ภาษา โดยทางเทคนิค หากคุณต้องการภาษาอื่น ๆ โปรดติดต่อเรา

ใช่ — ตัวเลือกเสียงจะดึงเสียง Kokoro ทั้งหมด 174 เสียง จาก 37 ภาษา เสียงแต่ละเสียงจะถูกแท็กด้วยตัวอย่าง ดังนั้นคุณจะสามารถทดสอบก่อนที่จะทำการคอมมิชชั่นได้ เลือกเพศของเสียงให้ตรงกับผู้พูดเพื่อผลลัพธ์ที่สมบูรณ์แบบที่สุด

ไม่ — Kokoro เลือกจากเสียง 174 เสียง ไม่ใช่โคลนของผู้พูดตัวจริง สำหรับโคลนเสียงที่รักษาตัวตนไว้ ให้ใช้ /voice/clone/ เครื่องมือของเราก่อน เพื่อจับเสียงของผู้พูด จากนั้นใช้กระบวนการทำงานที่กำหนดเอง การโคลนเสียง + การแปลอัตโนมัติในท่อเดียวกัน อยู่ในแผนการ

คลิปขนาดใหญ่กว่า 100MB สามารถทำการประมวลผลได้ดี น้อยกว่า5นาที ใช้เวลา 2-5 นาที สำหรับพาธเสียง 5-15 นาที สำหรับวิดีโอยาวกว่านี้ แยกเป็นฉาก ปรับแต่งแต่ละฉาก แล้วรวมเข้าด้วยกันใน /video/editor/

MP4, MOV, WebM, MKV ขนาดสูงสุด 100MB ตัวเลขลำโพงด้านหน้าตัวเดียวจะให้การตีความที่สะอาดที่สุด และ (หากคุณเปิดใช้งาน) เสียงที่ตรงกันได้ดีที่สุด เสียงดนตรีเบื้องหลัง หรือ ลำโพงหลายตัวจะลดความแม่นยำของการตีความ

ไม่ใช่ด้วยเครื่องมือแปลวิดีโอ AI — มันจะแทนที่เสียง ไม่ใช่ภาพ หากต้องการเขียนคำอธิบายภาษาอังกฤษลงในวิดีโอ ให้ใช้เครื่องมือ /video/caption/ บนผลลัพธ์ หากต้องการส่งออกแฟ้มคำอธิบายภาษาอังกฤษ SRT/VTT ให้ใช้ /transcribe/ บนวิดีโอต้นฉบับ

ไม่ การอัพโหลดจะถูกลบออกภายในไม่กี่นาทีหลังจากการแสดงผล ข้อมูลที่ออกมาจะถูกเก็บไว้ใน CDN ของเราเป็นเวลา 24 ชั่วโมง (7 วันสำหรับผู้ใช้ที่จ่ายค่าบริการ) ที่ลิงก์การแบ่งปัน หลังจากนั้นจะถูกลบออก

ไม่ใช่เป็นจุดจบเดียว - เชื่อมโยงกับจุดที่อยู่แล้ว: POST /v1/video/to-audio/ → /v1/stt/ → /v1/translate/ → /v1/tts/ → /v1/video/add-audio/, จากนั้นเลือก /v1/video/lip-sync/. คำแนะนำการคูลลิ่งสำหรับแต่ละจุดที่ /api/. ส่วนหน้านี้จัดการกับโซ่นี้อย่างแน่นอน

ลงทะเบียนฟรี 30,000 ชิ้น

สร้างบัญชีผู้ใช้ฟรี

ไม่ต้องใช้บัตรเครดิต

คุณจะให้คะแนนเครื่องมือนี้ยังไง

เครื่องมือแปลวิดีโอ AI

วิดีโอแปลพร้อม

ที่ที่วิดีโอแปลภาษามีค่า

รีโพสต์ YouTube ทั่วโลก

ปรับแต่งสนามกีฬาตามท้องถิ่น

ปรับแต่งโฆษณา

วิธีการทำงานของเครื่องแปลวิดีโอ

ดึงเสียงออกมา

เขียนต่อ

Translate + re-voice

Mix back + (optional) lip-sync

คำแนะนำสำหรับวิดีโอแปลที่สะอาดที่สุด

ผลลัพธ์

วิธีการใช้ เครื่องมือแปลวิดีโอ AI

เติมข้อมูลของคุณ

คลิกสร้าง

ดาวน์โหลดและแบ่งปัน

ใช้เครื่องมือนี้ผ่าน API

เครื่องมือ AI ฟรีที่เกี่ยวข้องName

เครื่องมือแปลวิดีโอ AI — FAQ

อะไรคือ AI Video Translator?

ท่อส่งน้ำมันทำงานยังไง

นี่มันต่างจาก /video/dubbing/ ยังไง

มันฟรีหรือเปล่า

ภาษาอะไรที่รองรับ?

ผมเลือกเสียงได้ไหม

เสียงจะเหมือนกับคนที่พูดจริงๆหรือเปล่า

วิดีโอนี้ยาวได้เท่าไหร่

วิดีโอแบบไหนที่ใช้ได้?

คำอธิบายจะถูกเพิ่มด้วยหรือเปล่า

วิดีโอของฉันถูกเก็บไว้หรือเปล่า

มี API มั้ย

30,000 ชิ้นฟรีทุกวัน

เดี๋ยวก่อน - ได้รับ 10K ชิปฟรี!

อยากได้อีกมั้ย