AI ڳالهائيندڙ

تجارتي استعمال صحيح ماڊل ڪوبه واٽر مارڪ نه ڪوبه رجسٽريشن جي ضرورت نه آهي
ماڊل:
+ GPT-5, Claude, Gemini
Animate any portrait photo to speak. Drop a face image + an audio file (or paste TTS text), AI generates a video of the face talking with synchronized lip movements. Powered by SadTalker — fast and reliable for professional talking-head explainer videos.

PNG/JPG — اڳيون پورٽريٽ، صاف

MP3/WAV — يا خالي ڇڏيو + هيٺ TTS استعمال ڪريو

جيڪڏھن اوھين مٿين آڊيو مهيا ڪريو ٿا ته ھيءُ متن نظرانداز ڪيو ويندو. وڌ ۾ وڌ 1,000 نشان.
~6,000 ٽوڪنز في ڪلپ (آزاد)؛ پرائمري ڊگهي جي حساب سان
ڊائون لوڊ
وڌيڪ اختيار
نتيجو
ھيءُ ھيءُ ھيءُ وڌيڪ ٽوڪنز حاصل ڪريو
بهتر نتيجا گھرو ٿا؟ پريميئم ماڊل (GPT-5, Claude, Gemini) اعليٰ معيار مهيا ڪن ٿا. منصوبا ڏسو

❤️ Free.ai کي پيارو آهي؟ پنھنجن دوستن کي چئو!

سڀني دوستن کي 25,000 ٽوڪنز حاصل ڪرڻ لاءِ رجسٽر ڪريو.

وڌيڪ گھرو ٿا؟ 30K ٽوڪنز / ڏينهن + 10K بونس لاء مفت ۾ رجسٽر
مفت ۾ رجسٽر ٿيو

توھان جو درخواست جو عمل...

ڪنهن به تصوير کي ڳالهائڻ لاءِ متحرڪ ڪريو. مفت SadTalker (خود-موجود) يا پريميئم lipsync - هڪ چهري جي تصوير + آڊيو کي هٽايو، هڪ lip-synced ڳالهائيندڙ-سر ويڊيو واپس وٺو. وضاحتن، آواٽرز، وڊيو جي وڊيو لاءِ مثالي.

استعمال ڪرڻ جو طريقو AI ڳالهائيندڙ

1
پنھنجي داخلا داخل ڪريو

متن لکو، فائل اپ لوڊ ڪريو، يا جيڪي توهان چاهيو ٿا سو بيان ڪريو. ڪوبه اڪائونٽ نه گھرجي.

2
پيدا ڪرڻ لاءِ ڪلڪ ڪريو

اسان جو AI توهان جي درخواست کي سيڪنڊن ۾ بهترين مفت-سورس ماڊلز استعمال ڪندي پروسيس ڪندو.

3
ڊائون لوڊ ۽ ونڊو

پنھنجو نتيجو ڊائون لوڊ، ڪاپي يا ونڊ ڪريو. پاڻيءَ ۽ تجارتي استعمال لاءِ مفت.

ھي ٽولز API ذريعي استعمال ڪريو

ھن اوزار کي پنھنجي ڪوڊ مان خودڪار ڪريو. OpenAI-compatible REST endpoint, Bearer-token auth, no extra SDK required. Token costs match the web interface.

curl -X POST https://api.free.ai/v1/video/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"prompt": "A cat playing piano", "duration": 4}'

AI ڳالهائيندڙ — FAQ

تصوير + آڊيو ڪلپ (يا ڳالهائڻ جي فائيل) اپ لوڊ ڪريو، AI آواز کي لپ-سينڪ ڪرڻ لاءِ چهري کي متحرڪ ڪري ٿو. نتيجو تصوير جو MP4 وڊيو آهي "سنڌو" آواز حقيقي منھن جي حرڪتن، سر جي ڦيرائڻ ۽ ڦوڪڻ سان. ٻه ماڊل: مفت SadTalker (خود-hosted، MIT) يا پريميئم lipsync (تڪڙو منھن، تيز).

ها — SadTalker اسان جي پاڻ کي ميزبان GPUs تي هلندو آهي، مفت ۾ روزاني ٽوڪين پول. هر ڪلپ جي قيمت ~6,000 ٽوڪين جي بنياد + 800 ٽوڪين جي هر سيڪنڊ جي آڊيو. تنهنڪري 10 سيڪنڊن جي ڪلپ ~14,000 ٽوڪين آهي. نامعلوم 2,500/ ڏينهن حاصل ڪريو، داخل ٿيو 10,000/ ڏينهن حاصل ڪريو. پريميئم به ڊگهي آهي پر وڌيڪ واضح خروجي سان.

سڊ ٽوڪر (درآمد) مفت آهي ۽ هڪ سادي سر جي حرڪت + ڦوڪ سان هڪ سادي ڳالهائيندڙ سر پيدا ڪري ٿو. پريميئم ليپس سينڪ ۾ وڌيڪ تيز منھن جا شڪلا آهن (خاص طور تي plosives ۽ bilabials جهڙوڪ "p"، "b"، "m") ۽ ڊگهي آڊيو تي 2-3x تيز ڪري ٿو. سماجي ميڊيا جي وضاحتن ۽ ائٽار لاءِ، سڊ ٽوڪر وڏو آهي. اعليٰ وفاداري ڊبنگ ۽ لپ-سينڪ-ڪريٽڪ مواد لاءِ پريميئم تي تبديل ڪريو.

اڳيان ڏسندڙ تصوير، صاف چهرو، برابر روشني، غير جانبدار اظهار. چهرو گهٽ ۾ گهٽ 30% فريم ڀرڻ گهرجي. ڳري سج جا چنڊ (اُھي اکين جي پيروي کي ٽوڙيندا آهن)، پروفائل شوٽ (ماڊل کي ٻنهي اکين کي ڏسڻ جي ضرورت آهي)، ۽ انتهائي اظهار کان پاسو ڪريو. اسٽوڊيو هيڊ شاٽ ۽ سٺي سلفي تمام سٺي ڪم ڪندا آهن.

صاف ڳالھائڻ جي WAV يا MP3. سڊ ٽوڪيئر 1-30 سيڪنڊن جي ڪلپ کي يقيني طور تي سنڀاليندو آھي، ڊگهو مدد ڏنل آھي پر سست آھي. بهترين لپ-سينڪ لاءِ، هڪ اسپيڪر استعمال ڪريو، گهٽ پس منظر جي ڍنگ ۽ صاف بيان ڪيل ڳالھائڻ. جيڪڏھن اوھين ڳالهائيندڙ کي اسڪرپٽ ڪرڻ چاھيو ٿا ته اوائلي آڊيو /tts/ ذريعي پيدا ڪريو.

SadTalker جي حوالي سان 10 سيڪنڊن جي GPU وقت جي هر سيڪنڊ جي آڊيو. تنهنڪري 10 سيڪنڊ ڳالهائڻ جي مٿان ~100 سيڪنڊن وٺي. پريميئم lipsync تيز آهي (~3-5 سيڪنڊن جي هر سيڪنڊ جي آڊيو) پر وڌيڪ خرچ. ٻئي اسان جي A100s تي هلندا آهن - توهان ٽيب بند ڪري سگهو ٿا ۽ نتيجو پنهنجي ڊيش بورڊ ۾ زمينون.

D-ID 5 منٽن جي وڊيو لاءِ $ 5.99 / مهيني جي چارج ڪري ٿو. HeyGen $ 24 / مهيني آهي. Synthesia $ 30 / مهيني آهي. اسان توهان کي روزاني پول ۾ SadTalker مفت ڏيندا آهيون - وضاحت ڪندڙ / ائٽوٽ وڊيوز لاءِ مقابلي واري معيار. پريميئم lipsync D-ID سٽيويو جي معيار سان مطابقت رکي ٿو. مفت آپشن اڪثر TikTok / يوٽيوب مختصر استعمال جي ڪيسن لاءِ سچو آهي.

ھائو — /image/avatar/ يا /image/generate/ ذريعي هڪ نڪ پيدا ڪريو، پوءِ ان کي اتي داخل ڪريو. ماڊل ڪنهن به اڳيان ڏسندڙ تصوير کي ان ئي طريقي سان ڏسندو آهي. عام سلسلو: پريمٽ → SDXL تصوير → SadTalker جيون ڏيندڙ → /tts/ آواز لاءِ → ڪيو ويو.

سڊ ٽوڪر چهري جي علائقي کي (مٺو، اکيون، مٿي جو ڦيرڦار، اکيون ڦاٽيون) متحرڪ ڪري ٿو. ڪپڙا، ڪپڙا ۽ پس منظر تقريبن سٽيل رھندا آھن. جسم جي حرڪت سان سموري جسم جو ڳالهائيندڙ سر لاءِ، پرائمري لیپسنڪ ماڊل وڏي ڪٽ سان استعمال ڪريو.

ھائو — /v1/video/talking-head/ کي POST ڪرڻ سان گڏو گڏ `image` + `audio`. يا /scheduled/ استعمال ڪريو گھڻن ھلائڻ جي انتظار ۾. /batch/ پڻ CSV کي قبول ڪري ٿو تصوير-URL + آڊيو-URL جوڙو.

ها - POST multipart `image` + `audio` to /v1/video/talking-head / on api.free.ai. Bearer auth. JSON سان `video_url` + `share_token`. 10,000 ٽوڪنز / مهيني مفت. پريميئم اوزارن سان اوزارن سان. /api / ۾ ڪرل مثال آهي.

تصويرون ۽ آڊيو پيدا ٿيڻ جي 24 ڪلاڪن اندر حذف ڪيا ويندا. 24 ڪلاڪن تائين اسان جي CDN تي آٽو ويڊيو (7 ڏينهن ادا ڪيل صارفين لاءِ) رھندا آھن ته جيئن توھان / اڪائونٽ / مان ٻيهر ڊائون لوڊ ڪري سگھو. تربيت لاءِ ڪڏھن به استعمال نه ڪيو ويندو. / privacy / تي مڪمل رازداري پاليسي.

30,000 ٽوڪنز لاءِ مفت ۾ رجسٽر ٿيو

اڪائونٽ ٺاهيو

ڪوبه ڪريڊٽ ڪارڊ نه گھرجي

توھان ھن اوزار کي ڪيئن تصنيف ڪريو ٿا؟

Free.ai کي پيارو آهي؟ پنھنجن دوستن کي چئو!