Àwọn Àwọn Àkọ́kọ́

Ìlò Ìṣàmúlò-ètò 380+ àwọn ìṣàmúlò-ètò Kò ní àmì-ìwé Kò ní àwọn ìṣàmúlò-ètò
Àwọn ìṣàmúlò-ètò
+ GPT-5, Claude, Gemini
Upload a talking-head video and either an audio track or a script — we'll re-render the mouth frame-by-frame to match the new audio. Powered by Sync Lipsync v2. Ideal for redubbing, ADR, voice-over replacement, or making a silent clip talk.

Lọ́ọ́mú àwòrán síbẹ̀ tàbí tẹ̀

MP4 / MOV / WebM · 100MB max

· ·

Lọ fáìlì ìsàlẹ̀-ilà síbẹ̀ tàbí tẹ̀

MP3 / WAV / M4A · max 50MB

·
0 / 1500
Àwọn ìgbà kò jọra
Àwọn ìṣàmúlò-ètò fún àwọn àyọkà ìṣàmúlò-ètò rẹ
Upload a video + audio (or type a script) to see the exact cost.
_Ṣàfikún

Ààyè tí àwọn ìṣàfarawé àwọn àmì-ìwé AI tí wọ̀ inú

ADR / redub

Re-record a line in the booth, drop it in, the mouth re-renders to match. No more reshoots over a mispronounced word.

Àwọn àwọn àmì-ìwé

Ṣẹ̀dà láti inú àwọn aléfòó, dùbù láti inú àwọn aléfòó àwọn àwọn aléfòó rẹ̀ tí o fẹ́ (tabí aléfòó TTS) — àwọn ojú ń tẹlé, kò ń ṣẹ̀dà.

Àwọn àwọn àwòrán tí n bá sọrọ

Fi àwòrán àìdálẹ̀ àti àwòrán tí a ṣẹ̀dá láti inú AI pamọ́ sílẹ̀. Ṣẹ̀dà láti inú /ìyàn-si-vídeo/ láti mu àwòrán àìdálẹ̀ pamọ́ láti inú ìṣàfarawé, láti jẹ́ pé o sọ̀rọ̀.

Bií a ṣe lè ló àwọn àwọn ìṣàfarawé àwọn àyọkà AI

Àwọn ìṣàmúlò-ètò

Fi àwòrán pamọ́

Àwọn ojú tí o bá gbọ́wọ́lẹ̀ lọ́wọ́lọ́wọ́ ló jẹ́ àwọn tí o dara jù lọ. Àwọn olugbálẹ̀lú, àwọn ojú àwọn profaili, tàbí àwọn ìṣàfarawé ojú ní ìwọ̀n.

Àkóónú 2

Fi àwòrán hàn

Fi MP3 / WAV / M4A pamọ́ tabi tẹ́ ìwé kaǹ ki a si fi pamọ́ sí Kokoro (174 ìròyìn ni 37 ede).

Àkóónú ààyè-iṣẹ́

Ìjánu-ìgbà

A fi àwòrán pamọ́ láti jẹ́ pé àwọn àwòrán àti àwòrán tí wọ́n yatọ̀ jú 0.5 s lọ. A tí ṣàyẹwo ìṣàfarawe-ẹ̀yàn láti dí àwọn ìjánu-ìròyìn.

Àkóónú kejì

Àwọn ààyè-iṣẹ́

Àwọn àwọn àgbékalẹ̀ àwọn àgbékalẹ̀ àwọn àgbékalẹ̀ àwọn àgbékalẹ̀ àwọn àgbékalẹ̀ àwọn àgbékalẹ̀ àwọn àgbékalẹ̀ àwọn àgbékalẹ̀ àwọn àgbékalẹ̀ àwọn àgbékalẹ̀ àwọn àgbékalẹ̀ àwọn àgbékalẹ̀ àwọn àgbékalẹ̀ àwọn àgbékalẹ̀

Àwọn ìṣẹ̀dá fún àwọn ààtò ìṣàfarawé àwọn àmì-ìwé

  • Single forward-facing speaker. Multi-speaker shots confuse the face detector.
  • Àwọn ìwọ̀n tí a fi àwọ̀ pamọ́. Àwọn ìwọ̀n tí a fi àwọ̀ pamọ́ lórí àwọn ìwọ̀n náà tí wọ́n mú ìṣàfihàn àwọn àwọn ìsẹ̀.
  • Audio at -6 dB to -3 dB peak. Clipped or whisper-quiet audio sync worse.
  • Àwọn àwọn ààyè-iṣẹ́ àwọn ìṣàfarawé àwọn àwọn ààyè-iṣẹ́ 30-sekondì. Fún àwọn àwọn àwòrán 10+ àwọn àkókò, fi pamọ́ sí àwọn ààyè-iṣẹ́.
Àwọn ìkúndùǹ ìṣàfilọ́lẹ̀
Àwọn Àtòjọ-ẹ̀yàn
Àwọn tókè tí n bọ́. Gba àwọn àmì-ìwé mìíràn
_Ìjánu-ìròyìn tí o dara jù lọ? Àwọn ìṣàmúlò-ètò (GPT-5, Claude, Gemini) fi ìdáràǹyàǹ gàjú pamọ́. Àwọn ààyè-iṣẹ́

❤️ O fẹ́ Free.ai? Fì sọ̀kalẹ̀ fún àwọn ọrẹ̀ rẹ̀!

Ṣẹ̀dà lọ́wọ́lọ́wọ́ lati gba líǹkì ìṣàfilọ́lẹ̀ kan àti gba 25,000 tokè fún ẹnikẹni.

Tí o fẹ́ láti mú diẹ̀ sii? Sign up free — 30,000 tokens/day
Ṣẹ̀dà

Ń ṣàfihàn àgbèwọlé rẹ̀...

Ṣẹ̀dà àwọn àwòrán àwọn àmì-ìwé-ìṣàfarawé láti inú AI. Ṣàfikún àwòrán láti inú ojú wọn.

Bii o ṣe le lo Àwọn Àwọn Àkọ́kọ́

1
Fi àwọn ìṣàmúlò-ètò rẹ̀ pamọ́

Ṣàfihàn àkọlé, láti fi fáìlì pamọ́, tàbí láti ṣàfihàn ohun tí o fẹ́. Kò ní àwọn àwọn kọ́̀ǹpútà tí a fẹ́.

2
Tẹ̀ láti ṣẹ̀dà

AI wá ń ṣé iṣẹ́ àgbèkalẹ̀ rẹ̀ nínú àwọn ìṣísẹ̀ láti ló àwọn módèlè̀ tí a ṣí lè lò.

3
Ṣàfikún & Àwọn Àkọsílẹ̀

Ṣàfihàn, kọ́, tàbí fi àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn

Lo àtòjọ-ẹ̀yàn yìí láti inú API

Ṣàfikún àtòjọ-ẹ̀yàn yìí láti inú ìṣàmúlò-ètò rẹ̀. Ààyè ìparí REST tí a bá fẹ́ OpenAI, ìṣàfihàn tókè-àwọn àtílẹ̀, kò ní SDK tí a fẹ́. Àwọn owó tókè ní ìdáràn wẹ́ẹ̀bù.

curl -X POST https://api.free.ai/v1/video/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"prompt": "A cat playing piano", "duration": 4}'

Àwọn Àwọn Àkọ́kọ́ — FAQ

Fi àwòrán àwọn àwòrán-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀-ọ̀kan-ìrọ̀

Sync Lipsync v2 is a state-of-the-art mouth-rendering model. It analyses each phoneme in the audio, detects the face in each frame, and regenerates the lip region to match. The rest of the face, background, and body are untouched.

Lip-sync uses paid tokens (~10,000 minimum, scales with duration). Sign-up bonus tokens can be used once you're signed in.

MP4, MOV, WebM lọ́wọ́lú 100MB. Klip̀ẹ̀tì láti àwọn ìsàlẹ̀-ilà ìsàlẹ̀-ilà 30 sekúndù ló jẹ́ àwọn tí wọ́n lójútó. Àwọn àgbèkalẹ̀ tí wọ́n wòò jẹ́ àwọn tí wọ́n lójútó.

MP3, WAV, M4A to 50MB. Bẹẹni, tẹ àkọlé àwòrán ki o si yan láti inú àwọn àwòrán 174 Kokorò nínú àwọn ìtàn 37 — a yoo fi TTS pamọ́ láti lò bí afonifojí.

A fi o mọ̀ pé tí àwọn ìgbà tí a fi pamọ́ bá jẹ́ ìyatọ̀ jú àwọn ìsẹ́ẹ̀tì 0.5 lọ. "Ìdárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárárára

Best results: one clear forward-facing face, well-lit, mostly steady camera. Poor results: profile view, occluded face (sunglasses, masks), multiple competing faces, extreme close-ups with partial mouth in frame.

Dubbing (/video/dubbing/) ní pipeline tí o tí ìparí: STT → fàyè gbàyé → TTS → líǹpútà-sińkọ̀ọ̀kan. Líǹpútà-sińkọ̀ọ̀kan ní ìsẹ̀ kejì - ò fi àwòrán pamọ́ fún ara rẹ̀. Lo líǹpútà-sińkọ̀ọ̀kan tí o bá tì ní àkọ́kọ́ àwòrán-òkè tí o tì sàyé; ló dubbing tí o bá fẹ́ fàyè gbàyé atí fi àwòrán-ọ̀kan padà sípò.

Typical: 30-second clip renders in 1–2 minutes. The banner shows a wait estimate once you submit, and the result lands in your dashboard — you can close the tab.

Not in one pass — the model locks onto one face. For multi-speaker scenes, cut into single-speaker clips, lip-sync each, then stitch back together in a video editor.

Kò. Àwọn fáìlì ìpamọ́ nínú àwọn ààyè-iṣẹ́ tí a pà nínú àwọn ààyè-iṣẹ́. Àwọn ìṣàfihàn ní pàtó nínú CDN wa fun 24h (7d fún àwọn òǹlò tí a pàyà) nínú líǹkì ìpàpọ̀.

Yes — POST a multipart video + audio_file (or video + text + voice) to /v1/video/lip-sync/. See /api/ for docs.

Ṣàfihàn ọ̀fẹ̀ fun 10,000 tokens

Ṣẹ̀dà Àwọn Àwọn Àwọn Àwọn Àwọn Àwọn

Kò ní àwọn kaadí ẹ̀yàn tí a fẹ́

Bawo ní o ṣe lè fi àwọn ìṣàmúlò-ètò yìí hàn?

O fẹ́ Free.ai? Fì sọ̀kalẹ̀ fún àwọn ọrẹ̀ rẹ̀!