এআই কথা বলা মাথা

বাণিজ্যিক ব্যবহার ঠিক আছে ৩৮০+ মডেল কোন ওয়াটারমার্ক নেই কোন সাইন-আপ প্রয়োজন নেই
মডেল:
+ GPT-5, Claude, Gemini
Animate any portrait photo to speak. Drop a face image + an audio file (or paste TTS text), AI generates a video of the face talking with synchronized lip movements. Powered by SadTalker — fast and reliable for professional talking-head explainer videos.

PNG/JPG — সামনের দিকে মুখ করে পোর্ট্রেট, পরিষ্কার মুখ

MP3/WAV — অথবা ফাঁকা রাখুন + নিচে TTS ব্যবহার করুন

যদি আপনি উপরে অডিও প্রদান করেন, এই টেক্সট উপেক্ষা করা হবে। সর্বোচ্চ ১,০০০ অক্ষর।
প্রতি ক্লিপে ~৬,০০০ টোকেন (বিনামূল্যে); দৈর্ঘ্যের ভিত্তিতে প্রিমিয়াম স্কেল
ডাউনলোড
অগ্রসর অপশন
ফলাফল
টোকেন কমে যাচ্ছে। আরো ট্যাব পাওয়া যাচ্ছে না
ভাল ফলাফল চান? প্রাইম মডেল (GPT-5, Claude, Gemini) উচ্চমানের প্রদান করে। পরিকল্পনা প্রদর্শন করো

❤️ Free.ai ভালোবাসো?

সাবস্ক্রাইব করুন একটি রিফারেন্স লিংক পেতে এবং প্রতি বন্ধুর জন্য ২৫,০০০ টোকেন অর্জন করতে।

আরো চাও? ৩০K টোকেন/দিন + ১০K বোনাস এর জন্য বিনামূল্যে নিবন্ধন করুন
নিবন্ধন করুন

আপনার অনুরোধ প্রসেস করা হচ্ছে...

যেকোন পোর্ট্রেট ছবিকে কথা বলার জন্য অ্যানিমেট করুন। বিনামূল্যে SadTalker (স্বয়ংক্রিয়ভাবে হোস্ট করা) অথবা প্রিমিয়াম lipsync - একটি মুখের ছবি + অডিও ছেড়ে দিন, একটি লিপ-সিনকড কথা বলা-মস্তিষ্কের ভিডিও ফিরে পাবেন। ব্যাখ্যাকারী, অ্যাভাটার, ভিডিওতে ভয়েস-ওভারের জন্য আদর্শ।

ব্যবহারের নিয়ম এআই কথা বলা মাথা

1
আপনার ইনপুট লিখুন

টেক্সট টাইপ করুন, একটি ফাইল আপলোড করুন, অথবা আপনি যা চান তা বর্ণনা করুন। কোন অ্যাকাউন্টের প্রয়োজন নেই।

2
ক্লিক করে তৈরি করুন

আমাদের এআই সেকেন্ডের মধ্যেই আপনার আবেদনের প্রক্রিয়া সম্পন্ন করে, সে জন্য সেরা উন্মুক্ত উৎস মডেল ব্যবহার করে।

3
ডাউনলোড এবং শেয়ার

আপনার ফলাফল ডাউনলোড, অনুলিপি অথবা শেয়ার করুন। ব্যক্তিগত এবং বাণিজ্যিক ব্যবহারের জন্য বিনামূল্যে।

API-র মাধ্যমে এই টুলটি ব্যবহার করুন

আপনার নিজের কোড থেকে এই টুলটি স্বয়ংক্রিয় করুন। OpenAI-সমর্থিত REST এন্ডপয়েন্ট, Bearer-token auth, কোন অতিরিক্ত SDK প্রয়োজন নেই। টোকেন খরচ ওয়েব ইন্টারফেসের সাথে মিলবে।

curl -X POST https://api.free.ai/v1/video/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"prompt": "A cat playing piano", "duration": 4}'

এআই কথা বলা মাথা — FAQ

একটি পোর্ট্রেট ছবি + অডিও ক্লিপ (বা বক্তব্য ফাইল) আপলোড করুন, এআই মুখের অ্যানিমেশন অডিও লিপ-সিনক করতে। আউটপুট একটি MP4 ভিডিও ছবির "ভাষা" অডিও বাস্তব মুখের নড়াচড়া, মাথা ঘোরা, এবং ঝাপসা। দুইটি মডেল: বিনামূল্যে SadTalker (স্ব-হোস্ট, MIT) বা প্রিমিয়াম lipsync (তীক্ষ্ণ মুখ, দ্রুত)।

হ্যাঁ - সাডটোলকার আমাদের স্ব-হোস্ট করা জিপিইউতে চলছে, যা প্রতিদিনের টোকেন পুলে বিনামূল্যে। প্রতিটি ক্লিপের দাম ~৬,০০০ টোকেন ভিত্তি + প্রতি সেকেন্ডে অডিও ৮০০ টোকেন। তাই ১০ সেকেন্ডের একটি ক্লিপ ~১৪,০০০ টোকেন। বেনামীরা ২,৫০০/দিন পায়, লগ-ইন করারা ১০,০০০/দিন পায়। প্রাইমও দৈর্ঘ্যের ভিত্তিতে পরিমাপ করা হয়, কিন্তু এর ফলাফল আরও স্পষ্ট।

SadTalker (ডিফল্ট) বিনামূল্যে এবং একটি স্বাভাবিক কথা বলা মাথার সাথে সূক্ষ্ম মাথা নড়াচড়া + ঝলকানি তৈরি করে। Premium lipsync এর মুখের আকৃতি (বিশেষ করে plosives এবং bilabials যেমন "p", "b", "m") এবং দীর্ঘ অডিওতে 2-3x দ্রুত রেন্ডার করে। সামাজিক-মিডিয়া ব্যাখ্যাকারী এবং অ্যাভাটারের জন্য, SadTalker বিরাট। উচ্চ-সত্যতা ডাবিং এবং লিপ-সিনক-ক্রিটিক্যাল বিষয়বস্তু জন্য, premium এ পরিবর্তন করুন।

সামনের দিকে মুখ করা, পরিষ্কার মুখ, একই রকম আলোকসজ্জা, নিরপেক্ষ অভিব্যক্তি। মুখের জন্য অন্তত ৩০% ফ্রেম ভরাট করা উচিত। ভারী চশমা পরিহার করুন (এগুলি চোখের ট্র্যাকিং ভেঙ্গে দেয়), প্রোফাইল ছবি (মডেলের দুটি চোখ দেখার প্রয়োজন) এবং অতিরিক্ত অভিব্যক্তি। স্টুডিও হেডশট এবং ভাল সেলফিগুলি ভাল কাজ করে।

স্পষ্ট কথাবার্তার WAV অথবা MP3। SadTalker নির্ভরযোগ্যভাবে ১-৩০ সেকেন্ডের ক্লিপ পরিচালনা করে, দীর্ঘতর সমর্থিত কিন্তু ধীর। সর্বোত্তম লিপ-সিনক করার জন্য, একটি স্পিকার ব্যবহার করুন, কম পটভূমির শব্দ এবং স্পষ্টভাবে উচ্চারিত কথাবার্তা। আপনি যদি কথা বলা মাথা স্ক্রিপ্ট করতে চান তবে প্রথমে /tts/ ব্যবহার করে অডিও তৈরি করুন।

SadTalker প্রতি সেকেন্ডে অডিওতে ১০ সেকেন্ডের GPU সময় নেয়। তাই ১০ সেকেন্ডের কথা বলার জন্য ~১০০ সেকেন্ড সময় লাগে। Premium lipsync দ্রুততর (অডিও প্রতি সেকেন্ডে ~৩-৫ সেকেন্ড) কিন্তু এর খরচ বেশি। উভয়ই আমাদের A100s-এ চলবে - আপনি ট্যাব বন্ধ করতে পারেন এবং ফলাফল আপনার ড্যাশবোর্ডে আসবে।

ডি-আইডি ৫ মিনিটের ভিডিওতে মাসিক ৫. ৯৯ ডলার চার্জ করে। হেইজেনের দাম ২৪ ডলার। সিন্থেসিয়ার দাম ৩০ ডলার। আমরা আপনাকে সাডটোলকারকে বিনামূল্যে দিচ্ছি। এই ভিডিওগুলোর গুণগত মান তুলনামূলকভাবে ভালো। প্রাইম লিপসিনক ডি-আইডি স্টুডিওর সাথে মিল রেখেছে। বিনামূল্যের অপশনটি সত্যিই বেশীাংশ টিকটক/ ইউটিউব এর জন্য যথেষ্ট ভালো।

হ্যাঁ — /image/avatar/ অথবা /image/generate/ ব্যবহার করে একটি মুখ তৈরি করুন, তারপর এটি এখানে প্রবেশ করান। মডেলটি যেকোনো সামনের দিকে মুখ করা পোর্ট্রেটকে একইভাবে ব্যবহার করে। সাধারণ শৃঙ্খল: অনুরোধ করুন → SDXL পোর্ট্রেট → SadTalker অ্যানিমেশন → /tts/ কণ্ঠের জন্য → সম্পন্ন।

SadTalker মুখের অংশ (মুখ, চোখ, মাথার ঘোরাফেরা, ঝলক) অ্যানিমেট করে। কাঁধ, পোশাক এবং পটভূমি প্রায় স্থির থাকে। শরীরের নড়াচড়ার সাথে পুরো শরীরের কথা বলা-মাথার জন্য, প্রিমিয়াম লিপ-সিঙ্ক মডেল ব্যবহার করুন, যার আকার বড়।

হ্যাঁ — বহু-অংশ বিশিষ্ট `চিত্র` + `অডিও` সহ /v1/video/talking-head/ এ POST করুন। অথবা অনেকগুলো চালানোর জন্য /scheduled/ ব্যবহার করুন। /batch/ ছবি-URL + অডিও-URL জুটি CSV হিসাবে গ্রহণ করে।

হ্যাঁ — api.free.ai-এ /v1/video/talking-head/-এ বহু-অংশের `image` + `audio`-কে POST করুন। বহনকারীর অনুমোদন। `video_url` + `share_token`-এর সাথে JSON ফিরিয়ে দেয়। ১০,০০০ টোকেন/মাস বিনামূল্যে। অডিও দৈর্ঘ্যের সাথে প্রাইম লিনিয়ার স্কেলিং। /api/-তে কার্ল উদাহরণ আছে।

ছবি এবং অডিও তৈরির ২৪ ঘণ্টার মধ্যে মুছে ফেলা হয়। আউটপুট ভিডিও ২৪ ঘণ্টার জন্য আমাদের সিডিএন-এ থাকে (পয়সা দিয়ে ব্যবহারকারীদের জন্য ৭ দিন) যাতে আপনি /account/?tab=history থেকে আবার ডাউনলোড করতে পারেন। প্রশিক্ষণের জন্য কখনো ব্যবহার করা হয় না। গোপনীয়তা নীতির পূর্ণ বিবরণ /privacy/-এ পাওয়া যায়।

১০,০০০ টোকেন এর জন্য বিনামূল্যে নিবন্ধন করুন

ফ্রি অ্যাকাউন্ট তৈরি করুন

কোন ক্রেডিট কার্ডের প্রয়োজন নেই

আপনি কিভাবে এই টুলটি রেটিং করবেন?

Free.ai ভালোবাসো?