UI Hovoriace hlavy

Komerčné použitie OK 380+ modelov Žiadny vodoznak Nie je potrebná registrácia
Model:
+ GPT-5, Claude, Gemini
Animate any portrait photo to speak. Drop a face image + an audio file (or paste TTS text), AI generates a video of the face talking with synchronized lip movements. Powered by SadTalker — fast and reliable for professional talking-head explainer videos.

PNG/JPG – na výšku, číra strana

MP3/WAV — alebo nechajte prázdne + použite TTS nižšie

Ak uvediete zvuk, tento text sa ignoruje. Maximálne 1 000 znakov.
~6,000 žetónov za klip (zadarmo); prémia sa odvíja od dĺžky
Stiahnuť
Rozšírené možnosti
Výsledok
Žetóny sa míňajú. Získať viac žetónov
Chcete lepšie výsledky? Prémiové modely 2018 (GPT-5, Claude, Gemini) poskytujú vyššiu kvalitu. Zobraziť plány

❤️ Milujete Free.ai? Povedzte svojim priateľom!

Zaregistruj sa a získaj odporúčací odkaz a získaj 25 000 žetónov za priateľa.

Chcete viac? Zaregistrujte sa zdarma pre 30K žetónov/deň + 10K bonus
Zaregistrujte sa zdarma

Spracovávam vašu požiadavku...

Animujte akúkoľvek portrétovú fotografiu, aby hovorila. Bezplatný SadTalker (vlastný hostiteľ) alebo prémiový lipsync — upustite obrázok tváre + zvuk, získajte video hovoriacej hlavy synchronizované s perami.Ideálne pre vysvetľovače, avatary, hlasy na videu.

Ako používať UI Hovoriace hlavy

1
Zadajte svoj vstup

Zadajte text, nahrajte súbor alebo popíšte, čo chcete. Nie je potrebné žiadne konto.

2
Kliknite na generovať

Naša UI spracuje vašu požiadavku v priebehu niekoľkých sekúnd pomocou najlepších open-source modelov.

3
Stiahnuť & zdieľať

Stiahnite si, skopírujte alebo zdieľajte svoj výsledok. Zdarma pre osobné a komerčné použitie.

Použite tento nástroj cez API

Automatizujte tento nástroj z vlastného kódu. Koncový bod REST kompatibilný s OpenAI, overenie tokenom nosiča, nie je potrebná žiadna ďalšia súprava SDK.

curl -X POST https://api.free.ai/v1/video/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"prompt": "A cat playing piano", "duration": 4}'

UI Hovoriace hlavy — FAQ

Nahrajte portrétnu fotografiu + zvukový klip (alebo súbor reči), UI animuje tvár, aby sa synchronizovala so zvukom. Výstupom je MP4 video fotografie "hovoriace" zvuk s realistickými pohybmi úst, kývaním hlavou a žmurknutím.Dva modely: bezplatný SadTalker (vlastný hostiteľ, MIT) alebo prémiový lipsync (ostrejšie ústa, rýchlejšie).

Áno — SadTalker beží na našich vlastných GPU, zadarmo v dennom tokenovom bazéne. Každý klip stojí ~6,000 žetónov + 800 žetónov za sekundu zvuku. Takže 10-sekundový klip je ~14,000 žetónov. Anonymní dostanú 2,500/deň, prihlásení dostanú 10,000/deň. Prémiová verzia sa tiež mení podľa dĺžky, ale s ostrejším výstupom.

SadTalker (predvolený) je zadarmo a produkuje prirodzený hovoriaci hlas s jemným pohybom hlavy + blikanie. Premium lipsync má ostrejšie tvary úst (najmä pre plosives a bilabials ako "p", "b", "m") a vykresľuje 2-3x rýchlejšie na dlhé audio. Pre sociálne-media vysvetľovače a avatary, SadTalker je skvelý.

Portrét smerujúci dopredu, jasná tvár, rovnomerné osvetlenie, neutrálny výraz. Tvár by mala vyplniť aspoň 30% záberu. Vyhnite sa ťažkým slnečným okuliarom (rušia sledovanie očí), profilovým záberom (model potrebuje vidieť obe oči) a extrémnym výrazom. Štúdiové zábery hlavy a dobré selfie fungujú skvele.

WAV alebo MP3 s jasnou rečou. SadTalker spoľahlivo zvládne 1-30 sekundové klipy, dlhšie sú podporované, ale pomalšie. Pre najlepšiu synchronizáciu úst, použite jeden reproduktor, nízky hluk pozadia a jasne vyslovovanú reč. Ak chcete skriptovať hovoriacu hlavu, vygenerujte zvuk najprv cez /tts/.

SadTalker zaberie približne 10 sekúnd GPU času na sekundu zvuku. Takže 10-sekundová hovoriaca hlava trvá ~100 sekúnd. Premium lipsync je rýchlejší (~3-5 sekúnd za sekundu zvuku), ale stojí viac. Obidva bežia na našich A100s - môžete zatvoriť kartu a výsledok pristane na vašom palubnej doske.

D-ID účtuje 5,99 USD / mesiac za 5 minút videa. HeyGen je 24 USD / mesiac. Synthesia je 30 USD / mesiac. V dennom bazéne vám dávame SadTalker zadarmo - porovnateľnú kvalitu pre vysvetľujúce / avatarové videá. Prémiová synchronizácia pier zodpovedá kvalite D-ID Studio. Bezplatná možnosť je úprimne dosť dobrá pre väčšinu prípadov krátkeho použitia TikTok / YouTube.

Áno — vygeneruj tvár cez /image/avatar/ alebo /image/generate/ a potom ju vlož sem. Model zaobchádza s akýmkoľvek portrétom smerom dopredu rovnakým spôsobom. Bežný reťazec: prompt → SDXL portrait → SadTalker animates → /tts/ pre hlas → hotovo.

SadTalker animuje oblasť tváre (ústa, oči, pohyby hlavy, žmurknutie), ramená, oblečenie a pozadie zostávajú takmer statické. Pre celé telo hovoriace hlavy s pohybom tela použite prémiový model lipsync s širším orezom.

Áno — POST do /v1/video/talking-head/ s viacdielnym `image` + `audio`. Alebo použite /scheduled/ na zaradenie viacerých spúšťaní do frontu. /batch/ tiež prijíma CSV párov image-URL + audio-URL.

Áno — POST multipart `image` + `audio` to /v1/video/talking-head/ on api.free.ai. Bearer auth. Vráti JSON s `video_url` + `share_token`. 10,000 tokenov/mesiac zadarmo. Prémia sa lineárne zvyšuje s dĺžkou trvania zvuku. /api/ má príklad curl.

Fotky a zvuk sa vymažú do 24 hodín od generovania. Výstupné videá sú uložené na našom CDN po dobu 24 hodín (7 dní pre platených používateľov), takže si ich môžete znova stiahnuť z /account/?tab=history. Nikdy sa nepoužívajú na školenie.

Zaregistrujte sa zdarma pre 30 000 žetónov

Vytvoriť bezplatný účet

Kreditná karta nie je potrebná

Ako by ste ohodnotili tento nástroj?

Milujete Free.ai? Povedzte svojim priateľom!