AI وڊيو پيدا ڪندڙ AI وڊيو ايڊيٽر AI وڊيو وڌائيندڙ AI وڊيو ڊوبنگ سٽيويو AI ڪارڪردگي ڪپيو (رانوي ايڪٽ- ٻه) AI وڊيو مترجم AI وڊيو اثر - پيڪا AI وڊيو اپسڪليئر وڌيڪ →

AI ڳالهائيندڙ

تجارتي استعمال صحيح ماڊل ڪوبه واٽر مارڪ نه ڪوبه رجسٽريشن جي ضرورت نه آهي

Animate any portrait photo to speak. Drop a face image + an audio file (or paste TTS text), AI generates a video of the face talking with synchronized lip movements. Powered by SadTalker — fast and reliable for professional talking-head explainer videos.

چهري جو تصوير

PNG/JPG — اڳيون پورٽريٽ، صاف

آڊيو (اختياري)

MP3/WAV — يا خالي ڇڏيو + هيٺ TTS استعمال ڪريو

يا اسڪرپٽ لکجو (Kokoro TTS استعمال ڪري ٿو)

جيڪڏھن اوھين مٿين آڊيو مهيا ڪريو ٿا ته ھيءُ متن نظرانداز ڪيو ويندو. وڌ ۾ وڌ 1,000 نشان.

Model

~6,000 ٽوڪنز في ڪلپ (آزاد)؛ پرائمري ڊگهي جي حساب سان

ڪنهن به تصوير کي ڳالهائڻ لاءِ متحرڪ ڪريو. مفت SadTalker (خود-موجود) يا پريميئم lipsync - هڪ چهري جي تصوير + آڊيو کي هٽايو، هڪ lip-synced ڳالهائيندڙ-سر ويڊيو واپس وٺو. وضاحتن، آواٽرز، وڊيو جي وڊيو لاءِ مثالي.

استعمال ڪرڻ جو طريقو AI ڳالهائيندڙ

پنھنجي داخلا داخل ڪريو

متن لکو، فائل اپ لوڊ ڪريو، يا جيڪي توهان چاهيو ٿا سو بيان ڪريو. ڪوبه اڪائونٽ نه گھرجي.

پيدا ڪرڻ لاءِ ڪلڪ ڪريو

اسان جو AI توهان جي درخواست کي سيڪنڊن ۾ بهترين مفت-سورس ماڊلز استعمال ڪندي پروسيس ڪندو.

ڊائون لوڊ ۽ ونڊو

پنھنجو نتيجو ڊائون لوڊ، ڪاپي يا ونڊ ڪريو. پاڻيءَ ۽ تجارتي استعمال لاءِ مفت.

ھي ٽولز API ذريعي استعمال ڪريو

ھن اوزار کي پنھنجي ڪوڊ مان خودڪار ڪريو. OpenAI-compatible REST endpoint, Bearer-token auth, no extra SDK required. Token costs match the web interface.

API دستاویز API ڪوڊ حاصل ڪريو

curl -X POST https://api.free.ai/v1/video/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"prompt": "A cat playing piano", "duration": 4}'

مفت AI اوزار

AI وڊيو پيدا ڪندڙ

AI وڊيو ايڊيٽر

AI وڊيو وڌائيندڙ

AI وڊيو ڊوبنگ سٽيويو

AI ڪارڪردگي ڪپيو (رانوي ايڪٽ- ٻه)

AI وڊيو مترجم

AI وڊيو اثر - پيڪا

AI وڊيو اپسڪليئر

AI ڳالهائيندڙ — FAQ

تصوير + آڊيو ڪلپ (يا ڳالهائڻ جي فائيل) اپ لوڊ ڪريو، AI آواز کي لپ-سينڪ ڪرڻ لاءِ چهري کي متحرڪ ڪري ٿو. نتيجو تصوير جو MP4 وڊيو آهي "سنڌو" آواز حقيقي منھن جي حرڪتن، سر جي ڦيرائڻ ۽ ڦوڪڻ سان. ٻه ماڊل: مفت SadTalker (خود-hosted، MIT) يا پريميئم lipsync (تڪڙو منھن، تيز).

ها — SadTalker اسان جي پاڻ کي ميزبان GPUs تي هلندو آهي، مفت ۾ روزاني ٽوڪين پول. هر ڪلپ جي قيمت ~6,000 ٽوڪين جي بنياد + 800 ٽوڪين جي هر سيڪنڊ جي آڊيو. تنهنڪري 10 سيڪنڊن جي ڪلپ ~14,000 ٽوڪين آهي. نامعلوم 2,500/ ڏينهن حاصل ڪريو، داخل ٿيو 10,000/ ڏينهن حاصل ڪريو. پريميئم به ڊگهي آهي پر وڌيڪ واضح خروجي سان.

سڊ ٽوڪر (درآمد) مفت آهي ۽ هڪ سادي سر جي حرڪت + ڦوڪ سان هڪ سادي ڳالهائيندڙ سر پيدا ڪري ٿو. پريميئم ليپس سينڪ ۾ وڌيڪ تيز منھن جا شڪلا آهن (خاص طور تي plosives ۽ bilabials جهڙوڪ "p"، "b"، "m") ۽ ڊگهي آڊيو تي 2-3x تيز ڪري ٿو. سماجي ميڊيا جي وضاحتن ۽ ائٽار لاءِ، سڊ ٽوڪر وڏو آهي. اعليٰ وفاداري ڊبنگ ۽ لپ-سينڪ-ڪريٽڪ مواد لاءِ پريميئم تي تبديل ڪريو.

اڳيان ڏسندڙ تصوير، صاف چهرو، برابر روشني، غير جانبدار اظهار. چهرو گهٽ ۾ گهٽ 30% فريم ڀرڻ گهرجي. ڳري سج جا چنڊ (اُھي اکين جي پيروي کي ٽوڙيندا آهن)، پروفائل شوٽ (ماڊل کي ٻنهي اکين کي ڏسڻ جي ضرورت آهي)، ۽ انتهائي اظهار کان پاسو ڪريو. اسٽوڊيو هيڊ شاٽ ۽ سٺي سلفي تمام سٺي ڪم ڪندا آهن.

صاف ڳالھائڻ جي WAV يا MP3. سڊ ٽوڪيئر 1-30 سيڪنڊن جي ڪلپ کي يقيني طور تي سنڀاليندو آھي، ڊگهو مدد ڏنل آھي پر سست آھي. بهترين لپ-سينڪ لاءِ، هڪ اسپيڪر استعمال ڪريو، گهٽ پس منظر جي ڍنگ ۽ صاف بيان ڪيل ڳالھائڻ. جيڪڏھن اوھين ڳالهائيندڙ کي اسڪرپٽ ڪرڻ چاھيو ٿا ته اوائلي آڊيو /tts/ ذريعي پيدا ڪريو.

SadTalker جي حوالي سان 10 سيڪنڊن جي GPU وقت جي هر سيڪنڊ جي آڊيو. تنهنڪري 10 سيڪنڊ ڳالهائڻ جي مٿان ~100 سيڪنڊن وٺي. پريميئم lipsync تيز آهي (~3-5 سيڪنڊن جي هر سيڪنڊ جي آڊيو) پر وڌيڪ خرچ. ٻئي اسان جي A100s تي هلندا آهن - توهان ٽيب بند ڪري سگهو ٿا ۽ نتيجو پنهنجي ڊيش بورڊ ۾ زمينون.

D-ID 5 منٽن جي وڊيو لاءِ $ 5.99 / مهيني جي چارج ڪري ٿو. HeyGen $ 24 / مهيني آهي. Synthesia $ 30 / مهيني آهي. اسان توهان کي روزاني پول ۾ SadTalker مفت ڏيندا آهيون - وضاحت ڪندڙ / ائٽوٽ وڊيوز لاءِ مقابلي واري معيار. پريميئم lipsync D-ID سٽيويو جي معيار سان مطابقت رکي ٿو. مفت آپشن اڪثر TikTok / يوٽيوب مختصر استعمال جي ڪيسن لاءِ سچو آهي.

ھائو — /image/avatar/ يا /image/generate/ ذريعي هڪ نڪ پيدا ڪريو، پوءِ ان کي اتي داخل ڪريو. ماڊل ڪنهن به اڳيان ڏسندڙ تصوير کي ان ئي طريقي سان ڏسندو آهي. عام سلسلو: پريمٽ → SDXL تصوير → SadTalker جيون ڏيندڙ → /tts/ آواز لاءِ → ڪيو ويو.

سڊ ٽوڪر چهري جي علائقي کي (مٺو، اکيون، مٿي جو ڦيرڦار، اکيون ڦاٽيون) متحرڪ ڪري ٿو. ڪپڙا، ڪپڙا ۽ پس منظر تقريبن سٽيل رھندا آھن. جسم جي حرڪت سان سموري جسم جو ڳالهائيندڙ سر لاءِ، پرائمري لیپسنڪ ماڊل وڏي ڪٽ سان استعمال ڪريو.

ھائو — /v1/video/talking-head/ کي POST ڪرڻ سان گڏو گڏ `image` + `audio`. يا /scheduled/ استعمال ڪريو گھڻن ھلائڻ جي انتظار ۾. /batch/ پڻ CSV کي قبول ڪري ٿو تصوير-URL + آڊيو-URL جوڙو.

ها - POST multipart `image` + `audio` to /v1/video/talking-head / on api.free.ai. Bearer auth. JSON سان `video_url` + `share_token`. 10,000 ٽوڪنز / مهيني مفت. پريميئم اوزارن سان اوزارن سان. /api / ۾ ڪرل مثال آهي.

تصويرون ۽ آڊيو پيدا ٿيڻ جي 24 ڪلاڪن اندر حذف ڪيا ويندا. 24 ڪلاڪن تائين اسان جي CDN تي آٽو ويڊيو (7 ڏينهن ادا ڪيل صارفين لاءِ) رھندا آھن ته جيئن توھان / اڪائونٽ / مان ٻيهر ڊائون لوڊ ڪري سگھو. تربيت لاءِ ڪڏھن به استعمال نه ڪيو ويندو. / privacy / تي مڪمل رازداري پاليسي.

30,000 ٽوڪنز لاءِ مفت ۾ رجسٽر ٿيو

اڪائونٽ ٺاهيو

ڪوبه ڪريڊٽ ڪارڊ نه گھرجي

توھان ھن اوزار کي ڪيئن تصنيف ڪريو ٿا؟

AI ڳالهائيندڙ

نتيجو

استعمال ڪرڻ جو طريقو AI ڳالهائيندڙ

پنھنجي داخلا داخل ڪريو

پيدا ڪرڻ لاءِ ڪلڪ ڪريو

ڊائون لوڊ ۽ ونڊو

ھي ٽولز API ذريعي استعمال ڪريو

مفت AI اوزار

AI ڳالهائيندڙ — FAQ

ڇا Free.ai AI ڳالهائڻ جي مٿان جنريٽر آهي؟

ڇا اهو واقعي مفت آهي؟

SadTalker ۽ پريميئم lipsync - مون کي ڪھڙو چونڊڻ گھرجي؟

ڪھڙي قسم جي فوٽو بهترين ڪم ڪري ٿو؟

ڪھڙي قسم جو آڊيو ڪم ڪري ٿو؟

هر ڪلپ پيدا ڪرڻ ۾ ڪيترو وقت لڳندو؟

D-ID / HeyGen / Synthesia سان اهو ڪيئن مقابلو ڪري ٿو؟

آءٌ پيدا ڪيل چهرو استعمال ڪري سگهان ٿو؟

پس منظر ۽ ڪپڙن بابت ڇا؟ ڇا فوٽو جي باقي حصي کي ڦيرائڻو آهي؟

ڪيترا وڊيوز گڏجي ٺاهي سگهجن ٿا؟

API مفت آهي؟

منھنجا اپ لوڊ محفوظ آھن يا تربيت لاءِ استعمال ڪيا ويا آھن؟

10,000 مفت ٽوڪنز حاصل ڪريو

انتظار ڪريو - 10K مفت ٽوڪنز حاصل ڪريو!

وڌيڪ گھرو ٿا؟