Vídeo de IA Dubbing Studio

Utilização comercial OK 380+ modelos Sem marca de água Não é necessário inscrever
Modelo:
+ GPT-5, Claude, Gemini
Carregue um clipe de fala e coloque-o num outro idioma com movimento de boca sincronizada por lábios. Whisper transcribe, MadLAD traduce, Kokoro fala em 174 vozes em 37 idiomas, e Synch Lipsync v2 re-renders a boca. 99% de clipes auto-detecção da língua de origem.

Arraste um vídeo aqui ou clique para fazer upload

MP4, MOV, WebM até 100MB · falador único-cabeça funciona melhor

O Whisper detecta a linguagem de origem em 99% de clipes. Sobrescreva-se apenas se detectar automaticamente suposições erradas.
Clique em Previsualização para ouvir a voz falar uma frase curta na sua língua-alvo antes de dobrar todo o clipe.
Útil se o vídeo tem música ou som FX você quer preservar sob a nova voz. Desligado = limpo dub de uma única voz.
Estimativa de token para o seu clipe
Envie um vídeo para ver o custo exato para o seu clipe.
Oleoduto de abastecimento
Transcrição original
Tradução para
Baixar

Onde o vídeo dobramento de IA paga por si mesmo

Localizar canais do YouTube

Transformar um vídeo em inglês em versões de espanhol, português e hindi durante a noite. O swap de faixa de áudio no YouTube permite um único upload serve 3× o público com movimento de boca combinado com lábios.

Criação de anúncios globais

Atirar um anúncio, dub em 20 idiomas para uma semana de teste A/B. Beats pagando um estúdio de voz sobre $500/minuto por língua.

E-learning + corporate training

Conformidade, a bordo e vídeos de formação de produtos que precisam de uma dúzia de línguas sem um orçamento de estúdio. O mesmo curso, todos os mercados.

Como o conduto de duplicação funciona

Passo 1

Transcrição (Whisper large-v3)

O áudio do vídeo é extraído e transcrito com timing de nível de palavra. A linguagem-fonte é detectada automaticamente com precisão de 99%.

Passo 2

Traduzir (MadLAD-400)

A transcrição é traduzida para a língua-alvo com um modelo 3B-parametro sintonizado para fraseamento natural falado, não literal palavra-para-palavra.

Passo 3

Falar (Kokoro — 174 vozes)

Uma voz natural na língua-alvo lê a tradução. 174 vozes em 37 línguas — escolha um e ouça uma visualização primeiro.

Passo 4

Lip-sync (Sync Lipsync v2)

A boca é re-rendida frame-by-frame para corresponder ao novo áudio. Estado-de-the-art para tiros de um único falante em frente.

Porque não Rask, Papercup ou HeyGen?

Rask cobra $24/mo por 100 minutos de saída e tampa em 130 línguas de origem. Papercup é apenas empresarial (vendas de chamadas, espera facturas de 4 figuras). O nível de dublagem da HeyGen começa a $29/mo com uma quota de 5 minutos. Esta ferramenta usa os mesmos componentes de gasoduto — Whisper for STT, MadLAD para tradução, Kokoro for TTS, Synch Lipsync v2 para renúncia oral — sem assinatura, sem marca de água, sem quota mensal. Você paga fichas da piscina que você já tem.

Opções avançadas
Resultado
Os tokens estão a ficar baixos. Obter mais tokens
Queres melhores resultados? Modelos premium (GPT-5 Ver Planos

❤️ Love this tool? Share it!

Inscreva-se para obter um link de referência e ganhar 25 mil fichas por amigo.

Queres mais? Inscreva-se gratuitamente para 30K tokens/dia + 10K bônus
Inscreva-se gratuitamente

Processando o seu pedido...

Dub qualquer vídeo em mais de 20 idiomas com movimento de lábio sincronizado. Whisper transcribe, MadLAD traduz, Kokoro fala, Sincron Lipsync v2 corresponde à boca.

Como Utilizar Vídeo de IA Dubbing Studio

1
Insira a sua entrada

Digite texto, carregue um arquivo ou descreva o que você quer. Nenhuma conta necessária.

2
Clique em gerar

Nossa IA processa seu pedido em segundos usando os melhores modelos de código aberto.

3
Baixar & compartilhar

Baixe, copie ou compartilhe seu resultado. Gratuito para uso pessoal e comercial.

Use esta ferramenta através da API

Automate esta ferramenta a partir do seu próprio código. Endpoint REST compatível com o OpenAI, Bearer-token auth, não é necessário SDK extra. Custos de token correspondem à interface web.

curl -X POST https://api.free.ai/v1/video/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"prompt": "A cat playing piano", "duration": 4}'

Vídeo de IA Dubbing Studio — FAQ

Subir um vídeo, escolher um idioma alvo, e voltar o mesmo vídeo chamado para essa língua com os lábios do alto-falante re-sincronizado para corresponder ao novo áudio. Óptimo para transformar o conteúdo do YouTube inglês em espanhol, francês, chinês, etc.

Quatro passos executam o lado do servidor na sequência: (1) Whisper transcribe o áudio original, (2) MadLAD traduz a transcrição para sua língua-alvo, (3) Kokoro gera fala natural nessa língua, (4) Sincronização Lipsync v2 remapa a boca do alto-falante para corresponder à nova voz. Tudo feito em um pedido — sem ferramentas de malabarismo você mesmo.

O deslocamento abrange 20 línguas (espanhol, francês, alemão, português, italiano, chinês, japonês, coreano, árabe, hindi, turco, russo, neerlandês, polonês, vietnamita, indonésio, tailandês, hebraico, sueco, inglês). MadLAD apoia tecnicamente 450+ — ping us se você precisar de outros.

Abastecimento utiliza apenas fichas pagas (~100.000 por clipe). Sincronizar Lipsync v2 é o passo caro — os três primeiros são livres de auto-hosted. Os créditos de bônus de inscrição não desbloqueiam Vídeo de IA Dubbing Studio.

Clips com menos de 30 segundos dub em cerca de 1-3 minutos. Vídeos mais longos levam proporcionalmente mais tempo. Tampa dura 100 MB upload. Para trabalho de comprimento de característica, divididos em cenas e dub cada.

Não — Kokoro usa uma das 174 vozes incorporadas (37 idiomas), não uma versão clonada do alto-falante original. Para a clonagem de voz preservadora de identidade você precisaria da nossa ferramenta /voice/clone/ separado mais um gasoduto personalizado.

A Sync Lipsync v2 é de última geração para tiros de um único falante direcionados à frente. cenas de vários falantes ou clipes de visualização de perfil podem derivar. Os melhores resultados vêm de imagens de conversa inicial.

O simples picker oferece Auto / Masculino / Feminino. Para selecção de voz fina, use /voice/tts/ primeiro para visualizar e copiar o ID da voz, então podemos fazer isso através. Chegando em breve na UI.

Não. O vídeo carregado é excluído em minutos de processamento. A saída é mantida no nosso CDN por 24h (7d para usuários pagos) no link de compartilhamento.

Sim — para esse fluxo de trabalho puro lab-sync (o seu vídeo + o seu áudio pré-gravado), use o /v1/image/edit/ ou um endpoint personalizado. Dubbing combina automaticamente todos os quatro passos.

Use /transcribe/ para arquivos de subtítulos (SRT/VTT), ou /translate/subtitle/ para traduzir um SRT existente. Dubbing substitui o áudio; texto sobre legendas — diferentes saídas.

Sim — vídeo POST multipart para /v1/video/dubbing/ com target_lang. Devolve {output_url, transcrição, tradução_texto}. Veja /api/ para documentos.

Inscreva-se gratuitamente para 30.000 fichas

Criar Conta Livre

Não é exigido o cartão de crédito

Como iria avaliar esta ferramenta?

Love this tool? Share it!