Glava, ki govori z UI

Trgovska uporaba OK 380+ modelov Brez vodnega žiga Prijava ni potrebna
Vzorec:
+ GPT-5, Claude, Gemini
Animate any portrait photo to speak. Drop a face image + an audio file (or paste TTS text), AI generates a video of the face talking with synchronized lip movements. Powered by SadTalker — fast and reliable for professional talking-head explainer videos.

PNG/JPG – sprednji portret, bister obraz

MP3/WAV – ali pusti prazno + uporabi TTS spodaj

Če nudite zvok zgoraj, se to besedilo ne upošteva. Največ 1000 znakov.
~6,000 žetonov na posnetek (prosto); premium lestvice po dolžini
Prenesi
Napredne možnosti
Rezultat
Tokensom je manjkalo. Priskrbi več tokov
Hočeš boljše rezultate? Prednostni modeli (GPT-5, Claude, Gemini) zagotavlja višjo kakovost. Ogled načrtov

❤️ Ljubezen Free.ai, povej prijateljem!

Pridružite se, da dobite napotitveno povezavo in zaslužite 25 000 žetonov na prijatelja.

Hočeš še? Vpišite se brezplačno za 30K žetonov/dan + 10K bonus
Prosto se prijavite

Obdelujem tvojo prošnjo...

Animiraj vsako portretno fotografijo, da govori. Free SadTalker (sebe-hosted) ali premium lipsync – spusti obraz sliko + zvok, dobijo ustnico sinhronizirani pogovorne glave video nazaj. Idealno za pojasnila, avatarji, glas-nad na video.

Kako uporabljati zdravilo Glava, ki govori z UI

1
Vnesite svoj vnos

Vpišite besedilo, naložite datoteko ali opišete, kaj želite. Račun ni potreben.

2
Kliknite, da ustvarite

Naš UI obdeluje vašo zahtevo v sekundah z uporabo najboljših odprtih modelov.

3
Prenesi & delitev

Prenesite, kopirajte ali delite rezultate. Brezplačen za osebno in komercialno uporabo.

Uporabi to orodje preko API

Avtomatizirajte to orodje iz lastne kode. Združljivo z OpenAI REST opazovalni dogodek, Bearer-taken auth, ni potreben dodatni SDK. Token stroški ustrezajo spletnemu vmesniku.

curl -X POST https://api.free.ai/v1/video/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"prompt": "A cat playing piano", "duration": 4}'

Glava, ki govori z UI — FAQ

Naloži portretno fotografijo + zvočni posnetek (ali govorna datoteka), UI animira obraz na lip-synch audio. Izhod je MP4 video fotografije "govori" z zvok z realističnimi gibi ust, nihanje glave in trepanje. Dva modela: brezplačni SadTalker (samohosted, MIT) ali premium lipsync (sharper usta, hitreje).

Da – SadTalker teče na naših samohostnih GPU, brezplačno v dnevni žeton bazen. Vsak posnetek stane ~6,000 žetonov baza + 800 žetonov na sekundo avdio. Torej 10-sekundni klip je ~14,000 žetonov. Anonimni dobijo 2.500/dan, prijavljeni-in dobijo 10.000/dan. Premium lestvice po dolžini preveč, vendar z ostrejšim izhodom.

SadTalker (privzeto) je brezplačno in proizvaja naravno pogovorno glavo s prefinjeno gibanje glave + migi. Premium lipsync ima ostrejša usta oblike (zlasti za plozive in bilabije, kot so "p", "b", "m") in naredi 2-3x hitreje na dolgem avdio. Za družbene medije pojasnilci in avatarji, SadTalker je odličen. Za visoko fidelnost dubbing in sinc-kritična vsebina, preklopite na premium.

Prednji portret, bister obraz, celo razsvetljava, nevtralni izraz. Obraz mora zapolniti vsaj 30% okvirja. Izogibajte se težkim sončnim očalim (slomijo sledenje oči), profilne posnetke (model potrebuje vidne oči) in ekstremne izraze. Studio shots glave in dobri selfies delujejo odlično.

WAV ali MP3 jasnega govora. SadTalker drži 1-30 sekundnih klipov zanesljivo, daljši je podprt, vendar počasnejši. Za najboljšo sinkronizacijo ustnic uporabite en sam zvočnik, nizko ozadje hrup, in jasno enunciranega govora. Najprej ustvarite zvok prek / tts /, če želite skriptirati govorno glavo.

SadTalker traja približno 10 sekund časa GPU na sekundo zvoka. Torej 10 sekund govorna glava traja ~100 sekund. Premium lipsync je hitrejši (~3-5 sekund na sekundo zvoka), vendar stane več. Oba teči na naših A100s – lahko zaprete zavihek in rezultat pristane v vaši plošči.

D-ID pristojbine $5,99/mesec za 5 minut videa. HeyGen je $24/mesec. Synthesisa je $30/mesec. Dajemo vam SadTalker brezplačno v dnevnem bazenu – primerljiva kakovost za pojasnilo / avatar video posnetki. Premium lipsync ujema D-ID Studio kakovost. Brezplačna možnost je resnično dovolj dobra za večino TikTok / YouTube kratka uporaba primerov.

Da – ustvarite obraz preko /image/avatar / ali /image/generate /, nato ga nahranite tukaj. Model obravnava vsak portret sprednje facing enako. Skupna veriga: prost → portret SDXL → SadTalker animira → / tts / za glas → končano.

SadTalker animira obličje obraza (usta, oči, nihanje glave, migljanje). Ramena, oblačila in ozadje ostajajo skoraj statična. Za polnotelesno govorno glavo z gibanjem telesa, uporabite premium lipsync model s širšim pridelkom.

Da – POST to /v1/video/talking-head/ with multipart `image' + `audio`. Ali uporabite /planirano/ za vrsto številnih zagonov. /batch / prav tako sprejema CSV sliko-URL + zvočno-URL parov.

Da – POST multipart `image' + `audio` do /v1/video/talking-head/ na api.free.ai. Bearrer auth. Vrne JSON z `video_url` + `share_token`. 10.000 žetonov/mesec brezplačno. Premium lestvice linearno z trajanjem zvoka. /api / ima kodri primer.

Fotografije in zvok se izbrišejo v 24 urah po generaciji. Izhodni videoposnetki sedijo na našem CDN 24 ur (7 dni za plačane uporabnike), tako da lahko ponovno prenesete iz /account /?tab=history. Nikoli se ne uporablja za usposabljanje. Politika zasebnosti v celoti na /privacy /.

Vpišite se brezplačno za 30.000 žetonov

Ustvari prosti račun

Kreditna kartica ni potrebna

Kako bi ocenili to orodje?

Ljubezen Free.ai, povej prijateljem!