AI 视频Dubbing演播室

商业用途OK 380+模型 无水印 不需要注册
型号 :
+ GPT-5, Claude, Gemini
上传一个口语发音的剪辑,然后把它涂成另一种语言,用嘴唇传动。 Whisper 剪辑,MadLAD翻译,Kokoro 以174个声音在37种语言中说话,Sync Lipsync v2 重新张嘴。 99%的剪辑自动检测源语。

拖放视频到这里或单击上传

MP4、MOV、WebM最多达100MM · 单讲者说话头最有效

Whiper 在99%的剪辑中检测到源语言。 只有在自动检测猜错时才覆盖 。
点击预览可听到声音用目标语言说一个简短的短语,然后才能将整个剪辑调出来。
如果视频有音乐或音频 FX, 您想要保存在新声音下, 有用 。 关闭 = 干净的单音 dub 。
您剪辑的 Token 估计
上传一个视频 查看你剪辑的确切成本
Dubbing输油管
原始记录誊本
翻译为
下载下载

AI视频游戏本身付费的地方

将YouTube频道本地化

将一个英语视频在一夜之间转换成西班牙语、葡萄牙语和印地语版本。YouTube上的音轨互换让单次上传为3x观众提供口唇匹配的口语运动。

全球创意型

在一周A/B测试中,将一个广告(dub)译成20种语言,比支付每个语言500美元/分钟的超音频演播室。

E-learning + corporate training

合规、入职和产品培训视频需要十几种语言,没有工作室预算。 同样的课程,每个市场。

假冒管道如何运作

步骤1

笔记号(大号口号3)

视频的音频是提取的,并按字级时间抄录。源语言以99%的精确度自动检测。

步骤2

翻译(MadLAD-400)

记录稿被翻译成目标语言,3B参数模型按自然口述语法而不是字面文字逐字翻译。

步骤3

说(Kokoro -174个声音)

目标语言的自然声音读懂译文。 37种语言的174个声音——选择一种语言,先听预览。

步骤4

Lip-sync (Sync Lipsync v2)

口腔是重新配制的,与新的音频相匹配。 最先进的单声道前方镜头是最先进的。

为什么不是Rask、Papcup或HeyGen呢?

拉什克语为130种源语,以100分钟的输出和上限收费24美元/mo,每分钟100分钟。纸张是企业专用的(呼叫销售,预期4位数的账单 )。 HeyGen的dubbing 级别从29美元/mo开始,有5分钟的配额。这个工具使用同样的管道组件 — — STT的Whisper语、MadLAD翻译的MadLAD、TTS的Kokoro语、Sync Lipsync v2 口腔再发的口音 — — 没有订阅,没有水印,没有月配额。您已经从游泳池中支付代号。

高级选项
结果成果成果成果成果成果成果成果成果成果成果
声调越来越低 获取更多当当量
想要更好的结果吗? 模型 (GPT-5, Claude, Gemini) deliver higher quality. 查看计划

❤️ Love this tool? Share it!

< a href=" "/ signup/" style=" "color:#16A34A" > 签名 以获得查询链接, 并获得每个朋友25,000个象征性的 。

还要吗? 每天免费签署30K个纪念品 + 10K 奖金
签署自由

处理您的请求...

将任何视频以同步的嘴唇运动方式译成20+种语言。 Whiseper 抄录、 MadLAD 翻译、Kokoro 讲、 Sync Lipsync v2 和嘴吻合。

如何使用 AI 视频Dubbing演播室

1
输入输入

键入文本、上传文件或描述您想要的东西。不需要账户 。

2
点击生成

我们的人工智能使用最佳的开放源码模型,在秒内处理你的请求。

3
下载共享( S)

下载、复制或分享您的结果。 免费个人和商业使用 。

通过 API 使用此工具

从您自己的代码中自动启用此工具。 OpenAI 兼容的 REST 端点、 Bearer-tok 异常点、 不需要额外的 SDK 。 Token 成本符合网络界面 。

curl -X POST https://api.free.ai/v1/video/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"prompt": "A cat playing piano", "duration": 4}'

AI 视频Dubbing演播室 — FAQ

上传一个视频, 选择目标语言, 并重回一个被称作该语言的视频, 发言者的嘴唇与新音频同步。 将英语YouTube内容转换成西班牙语、 法语 、 中文 等非常适合 。

4个步骤按顺序运行服务器一侧:(1) Whisper抄录原音频,(2) MadLAD将笔录译成你的目标语言,(3) Kokoro用该语言制作自然语言演讲,(4) Sync Lipsync v2 重新绘制扬声器的嘴,以配合新声音,所有都是在一项请求中完成的,没有自己使用的工具。

下调包括20种最需要的语言(西班牙语、法语、德语、葡萄牙语、意大利语、中文、日语、韩语、阿拉伯语、印地语、土耳其语、俄语、荷兰语、波兰语、越南语、印度尼西亚语、泰语、希伯来语、瑞典语、英语)。

Dubbing只使用已付的标牌( 每段100 000元)。 Sync Lipsync v2 是昂贵的一步, 前三步是免费自行托管的。 注册奖金信用不会打开AI 视频Dubbing演播室 。

30秒以下的剪贴机在大约1-3分钟内折叠。 较长的视频需要相应长的时间。 硬上限 100 MB 上传 。 对于特别长的工作来说, 分为场景和副场景 。

否——Kokoro使用174个内置声音(37种语言)中的1个,而不是原发言者的克隆版本。对于保存身份的语音克隆,你需要我们单独的/声音/克隆/工具加上自定义管道。

Sync Lipsync v2 是最新一流的单声道前向镜头。 多声道场景或简介片段可以漂移。 最佳结果来自近距离谈话头版片段 。

简单拾取器提供自动/ 男性/ 女性。 对于精细的语音选择, 请先使用/ voice/ tts/ 预览并复制语音 ID, 然后我们就可以通过此连接。 即将在 UI 中完成 。

否。 上传的视频在处理的几分钟内被删除。 输出在共享链接的 24 小时 的 CDN 上( 7 d 给付费用户) 。

是的, 对于纯唇合成工作流程( 您的视频+您预先录制的音频), 使用底部/ v1/ image/ edit / 或自定义端点。 Dubbing 自动组合所有四个步骤 。

字幕文件(SRT/VTT)或/翻译/字幕/翻译现有的 SRT 。 Dubbing 替换音频; 字幕重叠文本—— 不同的输出。

是 — POST 多段视频到 /V1/ Video/buging/ 目标- lang。 返回 {output_ url, 抄本, 翻译_ text} 。 见 /api/ 文档 。

免费注册一万个符号

创建自由账户

无需信用卡

你会如何评分这个工具?

Love this tool? Share it!