UI mluvící hlava

Komerční využití OK 380+ modely Žádné vodoznaky. Není třeba se zaregistrovat
Vzor:
+ GPT-5, Claude, Gemini
Animate any portrait photo to speak. Drop a face image + an audio file (or paste TTS text), AI generates a video of the face talking with synchronized lip movements. Powered by SadTalker — fast and reliable for professional talking-head explainer videos.

portrét PNG/JPG, čirý obličej

MP3/WAV nebo zanechat prázdné + použít TTS níže

Pokud poskytujete audio výše, tento text je ignorován. Max 1000 znaků.
~6,000 žetonů na klip (zdarma); prémiové váhy podle délky
Stáhnout
Pokročilé možnosti
Výsledek
Tokeny docházejí. Získejte více žetonů
Chceš lepší výsledky? Premium modely (GPT-5, Claude, Gemini) poskytovat vyšší kvalitu. Zobrazit plány

Zpracovávám vaši žádost...

Animovat jakékoliv portrét fotografie mluvit. Volný SadTalker (self-hosted) nebo prémiové rtyync?, spustit obrázek obličeje + audio, získat ret-synchronizované mluvící hlava video zpět. Ideální pro vysvětlovače, avatary, hlas-over do videa.

Jak se používá UI mluvící hlava

1
Zadejte svůj vstup

Zadejte text, nahrajte soubor nebo popište, co chcete. Žádný účet nepotřebujete.

2
Klikněte na generovat

Naše UI zpracovává váš požadavek během několika sekund pomocí nejlepších open-source modelů.

3
Stáhnout & podíl

Stáhnout, zkopírovat nebo sdílet svůj výsledek. Volný pro osobní a komerční použití.

Použijte tento nástroj přes API

Automatizovat tento nástroj z vašeho vlastního kódu. OpenAI kompatibilní REST koncového bodu, Bearer-token auth, není potřeba žádný SDK navíc. Token náklady odpovídají webové rozhraní.

curl -X POST https://api.free.ai/v1/video/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"prompt": "A cat playing piano", "duration": 4}'

UI mluvící hlava — FAQ

Nahrát portrét fotografie + audio klip (nebo slovní soubor), UI animuje tvář na lip-synchronizuje zvuk. Výstupem je MP4 video fotografie "mluvit" zvuk s realistickými pohyby úst, hýbat hlavou, a mrkne. Dva modely: zdarma SadTalker (samo-hosted, MIT) nebo prémiový lipsync (stříbrná ústa, rychleji).

Ano SadTalker běží na našich self-hosted GPU, zdarma v denním žeton bazénu. Každý klip stojí ~6,000 žetony základna + 800 žetonů za sekundu zvuku. Takže 10-sekundový klip je ~14,000 žetonů. Anonymní získat 2,500 / den, signed-in získat 10,000 / den. Prémiové stupnice o délce příliš, ale s ostřejší výstup.

SadTalker (výchozí) je zdarma a produkuje přírodní mluvící hlava s jemným pohybem hlavy + mrkne. Premium lipsync má ostřejší tvary úst (zejména pro plozive a bilabials jako "p," "b," "m") a vykresluje 2-3x rychleji na dlouhém zvuku. Pro sociální-mediální vysvětlovače a avatary, SadTalker je skvělý. Pro vysoce věrnostní dabing a lip-sync-kritický obsah, přepněte na premium.

Přední portrét, čirá tvář, dokonce i osvětlení, neutrální výraz. Obličej by měl zaplnit nejméně 30% rámu. Vyhněte se těžkým slunečním brýlím (rozbijí sledování očí), profilové záběry (model potřebuje vidět obě oči), a extrémní výrazy. Studio fotky a dobré selfie fungují skvěle.

WAV nebo MP3 jasné řeči. SadTalker zvládá 1-30 druhé klipy spolehlivě, delší je podporován, ale pomalejší. Pro nejlepší lip-synchronizace, použijte jeden reproduktor, nízký hluk pozadí, a jasně zvýrazněný projev. Generovat zvuk jako první prostřednictvím /tts / chcete-li skriptovat mluvící hlavu.

SadTalker trvá asi 10 sekund GPU času za sekundu zvuku. Takže 10 sekund mluvící hlava trvá ~100 sekund. Premium rtyync je rychlejší (~3-5 sekund za sekundu zvuku), ale stojí více. Oba běží na našich A100s ~ můžete zavřít kartu a výsledek přistane ve vaší palubní desce.

D-ID poplatky $5.99/měsíc za 5 minut videa. HeyGen je $24/měsíc. Synthesia je $30/měsíc. Dáme vám SadTalker zdarma v denním bazénu? srovnatelné kvality pro vysvětlení / avatar videa. Premium lipsync odpovídá D-ID Studio kvality. Volná volba je upřímně dost dobrá pro většinu TikTok / YouTube krátké případy použití.

Ano, vygenerovat obličej prostřednictvím /image/avatar/ nebo /image/generate/, pak jej krmit zde. Model léčí jakýkoliv přední portrét stejným způsobem. Společný řetězec: pohotovost → SDXL portrét → SadTalker animace → /tts/ pro hlas → hotovo.

SadTalker oživuje obličejovou oblast (ústa, oči, pohyb hlavy, mrknutí). Ramena, oblečení a pozadí zůstávají téměř statické. Pro celotělové mluvení hlavy s pohybem těla použijte prémiový model rtync s širší plodinou.

Ano, POST na /v1/video/talking-head/ s vícedílnou obrazovou obrazovkou, + audio. Nebo použít /plánované/ do fronty mnoho běhů. /batch/ také přijímá CSV obrazu-URL + audio-URL párů.

Ano POST multičástečná image (POST multipart) + (Audio) na /v1/video/talking-head/ on api.free.ai. Bearer auth. Vrací JSON s (Audio_url) + (Audio_url) Share_token. 10 000 žetonů/měsíc zdarma. Premium stupnice lineárně s dobou trvání zvuku. /api/ má curry example.

Fotografie a audio jsou smazány do 24 hodin po generaci. Výstupní videa sedí na našem CDN po dobu 24 hodin (7 dní pro placené uživatele), takže můžete znovu stáhnout z /účet/?tab=historie. Nikdy se používá pro trénink. Ochrana osobních údajů v plném rozsahu na /privacy/.

Zaregistrujte se zdarma pro 30 000 žetonů

Vytvořit volný účet

Kreditní karta není nutná

Jak byste ohodnotili tento nástroj?

Love this tool? Share it!