AI Video Dubbing Studio

Dùng thương mại được. 380+ mẫu Không dấu nước Không cần đăng ký
Mô hình:
+ GPT-5, Claude, Gemini
Tải lên một đoạn phim nói chuyện và chuyển nó sang một ngôn ngữ khác với chuyển động miệng đồng bộ với môi. Whisper phiên dịch, MadLAD dịch, Kokoro nói bằng 174 giọng nói trên 37 ngôn ngữ, và Sync Lipsync v2 tái tạo lại miệng. 99% các đoạn phim tự động phát hiện ngôn ngữ nguồn.

Kéo video tới đây hoặc nhấn để tải lên

MP4, MOV, WebM lên đến 100MB · loa đơn nói chuyện đầu làm việc tốt nhất

Whisper phát hiện ngôn ngữ nguồn trên 99% đoạn phim. Chỉ ghi đè nếu phát hiện tự động đoán sai.
Nhấn vào Xem trước để nghe giọng nói nói một câu ngắn bằng ngôn ngữ mục tiêu trước khi bạn lồng tiếng toàn bộ đoạn phim.
Có ích nếu đoạn phim có âm nhạc hoặc âm thanh FX mà bạn muốn giữ lại dưới giọng nói mới. Tắt = làm sạch giọng nói đơn.
Ước tính token cho đoạn phim của bạn
Tải lên một video để xem chi phí chính xác cho đoạn phim của bạn.
Đường ống lồng tiếng
Bản dịch gốc
Dịch sang
Tải về

Đây là nơi lồng tiếng AI video tự trả tiền cho mình

Kênh YouTube

Thay đổi một video tiếng Anh thành phiên bản tiếng Tây Ban Nha, Bồ Đào Nha và Hindi trong đêm.

Tạo hình quảng cáo toàn cầu

Chụp một quảng cáo, lồng tiếng 20 thứ tiếng cho một tuần thử nghiệm A/B Beats trả cho một studio lồng tiếng 500 đô/phút cho mỗi thứ tiếng.

E-learning + corporate training

Video về việc tuân thủ, nhập ngũ và đào tạo sản phẩm cần đến hàng tá ngôn ngữ mà không cần ngân sách phòng thu.

Cách làm việc của ống dẫn lồng tiếng

Bước 1

Transcribe (Whisper large- v3)

Âm thanh của video được trích xuất và phiên âm với thời gian ở cấp từ. Ngôn ngữ nguồn được tự động phát hiện với độ chính xác 99%.

Bước 2

Dịch (MadLAD-400)

Bản ghi được dịch sang ngôn ngữ mục tiêu với một mô hình tham số 3B được điều chỉnh cho cụm từ nói tự nhiên, không phải từ ngữ theo từ ngữ.

Bước 3

Nói đi (Kokoro — 174 giọng)

Một giọng nói tự nhiên trong ngôn ngữ mục tiêu đọc bản dịch. 174 giọng nói trên 37 ngôn ngữ — chọn một và nghe xem trước trước.

Bước 4

Đồng bộ môi (Sync Lipsync v2)

Miệng được tái tạo từng khung hình để phù hợp với âm thanh mới.

Sao không là Rask, Papercup hay HeyGen?

Rask tính phí $24/ tháng cho 100 phút xuất và giới hạn ở 130 ngôn ngữ nguồn. Papercup chỉ dành cho doanh nghiệp (bán điện thoại, chờ hóa đơn 4 chữ số). Tầng lồng tiếng của HeyGen bắt đầu từ $29/ tháng với hạn mức 5 phút. Công cụ này sử dụng cùng một thành phần ống dẫn — Whisper cho STT, MadLAD cho dịch, Kokoro cho TTS, Sync Lipsync v2 cho tái tạo miệng — không có đăng ký, không có dấu nước, không có hạn mức hàng tháng. Bạn trả tiền bằng token từ nguồn bạn đã có.

Tùy chọn cao cấp
Kết quả
Tiền hết rồi. Lấy thêm biểu tượng
Muốn kết quả tốt hơn? Các mẫu cao cấp (GPT-5, Claude, Gemini) cung cấp chất lượng cao hơn. Xem kế hoạch

❤️ Love this tool? Share it!

Đăng ký để nhận được một liên kết giới thiệu và kiếm được 25.000 token cho mỗi người bạn.

Muốn thêm nữa không? Đăng ký miễn phí 30K token/ngày + 10K thưởng
Đăng ký miễn phí

Đang xử lý yêu cầu của bạn...

Đóng bất kỳ video nào thành hơn 20 ngôn ngữ với chuyển động môi đồng bộ. Whisper phiên âm, MadLAD dịch, Kokoro nói, Sync Lipsync v2 tương thích với miệng.

Cách sử dụng AI Video Dubbing Studio

1
Nhập thông tin

Nhập văn bản, tải lên tập tin, hoặc mô tả điều bạn muốn. Không cần tài khoản.

2
Nhấn để tạo

AI của chúng tôi xử lý yêu cầu của bạn trong vài giây sử dụng các mô hình nguồn mở tốt nhất.

3
Tải về và chia sẻ

Tải xuống, sao chép, hoặc chia sẻ kết quả của bạn. Miễn phí cho sử dụng cá nhân và thương mại.

Dùng công cụ này qua API

Tự động hóa công cụ này từ mã của bạn. Điểm kết thúc REST tương thích với OpenAI, xác thực bằng token của người mang, không cần SDK bổ sung. Chi phí token tương ứng với giao diện web.

curl -X POST https://api.free.ai/v1/video/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"prompt": "A cat playing piano", "duration": 4}'

AI Video Dubbing Studio — FAQ

Tải lên một video, chọn ngôn ngữ mục tiêu, và lấy lại cùng một video được lồng tiếng sang ngôn ngữ đó với miệng người nói được đồng bộ hóa lại để phù hợp với âm thanh mới. Tốt cho việc chuyển nội dung YouTube bằng tiếng Anh sang tiếng Tây Ban Nha, Pháp, Trung Quốc, vv.

Bốn bước chạy theo thứ tự bên máy chủ: (1) Whisper phiên âm âm thanh gốc, (2) MadLAD dịch phiên âm sang ngôn ngữ mục tiêu, (3) Kokoro tạo ra giọng nói tự nhiên trong ngôn ngữ đó, (4) Sync Lipsync v2 tái định vị miệng người nói để phù hợp với giọng nói mới. Tất cả được thực hiện trong một yêu cầu — không cần phải tự làm trò đùa.

Bảng trượt bao gồm 20 ngôn ngữ được yêu cầu nhiều nhất (Tây Ban Nha, Pháp, Đức, Bồ Đào Nha, Ý, Trung Quốc, Nhật Bản, Hàn Quốc, Ả Rập, Hindi, Thổ Nhĩ Kỳ, Nga, Hà Lan, Ba Lan, Việt Nam, Indonesia, Thái Lan, Hebrew, Thụy Điển, Anh).

Lồng tiếng chỉ dùng tiền mặt (~100. 000 mỗi đoạn). Đồng bộ Lipsync v2 là bước đắt tiền — ba bước đầu tiên miễn phí và tự lưu trữ. Tiền thưởng đăng ký không mở khóa AI Video Dubbing Studio.

Các đoạn phim dưới 30 giây được lồng tiếng trong khoảng 1–3 phút. Các video dài hơn sẽ mất thời gian tương ứng lâu hơn. Tải lên tối đa 100 MB. Đối với các tác phẩm dài, chia thành các cảnh và lồng tiếng mỗi cảnh.

Không — Kokoro sử dụng một trong 174 giọng nói được tích hợp (37 ngôn ngữ), không phải là phiên bản nhân bản của người nói gốc. Để nhân bản giọng nói bảo tồn danh tính, bạn cần công cụ riêng /voice/clone/ cộng với một đường ống tùy chỉnh.

Sync Lipsync v2 là công nghệ mới nhất cho những cảnh quay hướng về phía trước với một loa. Những cảnh có nhiều loa hoặc các đoạn phim nhìn từ góc nhìn profile có thể bị trôi. Kết quả tốt nhất đến từ những cảnh quay gần với người nói.

Bộ chọn đơn giản cung cấp Auto / Male / Female. Để chọn giọng nói tinh xảo, hãy dùng / voice/ tts/ trước để xem trước và sao chép ID giọng nói, sau đó chúng ta có thể gửi qua. Sẽ có sớm trong giao diện người dùng.

Không. Phim tải lên sẽ bị xóa trong vòng vài phút sau khi xử lý. Kết quả sẽ được lưu trên CDN của chúng tôi trong 24h (7 ngày cho người dùng trả phí) tại liên kết chia sẻ.

Có — cho dòng lệnh đồng bộ môi thuần túy (video của bạn + âm thanh đã ghi trước), sử dụng /v1/image/edit/ hoặc một điểm kết thúc tùy chỉnh. Đóng phim kết hợp tất cả bốn bước một cách tự động.

Dùng /transcribe/ cho tập tin phụ đề (SRT/VTT), hoặc /translate/subtitle/ để dịch một SRT đã có. Lồng tiếng thay thế âm thanh; phụ đề bao phủ văn bản — kết quả khác nhau.

Có — POST video đa phần đến /v1/video/dubbing/ với target_lang. Trả lại {output_url, transcript, translated_text}. Xem /api/ cho tài liệu.

Đăng ký miễn phí 30,000 token

Tạo tài khoản miễn phí

Không cần thẻ tín dụng

Anh đánh giá công cụ này thế nào?

Love this tool? Share it!