AI କଥାବାର୍ତ୍ତା ମଥାName

ବାଣିଜ୍ୟିକ ବ୍ୟବହାର ଠିକ ଅଛି 380+ ନମୁନା କୌଣସି ପାନୀୟ ଚିହ୍ନ ନାହିଁ କୌଣସି ସଦସ୍ୟତା ଆବଶ୍ୟକ ନାହିଁ
ଆକାର:
+ GPT-5, Claude, Gemini
Animate any portrait photo to speak. Drop a face image + an audio file (or paste TTS text), AI generates a video of the face talking with synchronized lip movements. Powered by SadTalker — fast and reliable for professional talking-head explainer videos.

PNG/JPG — ଆଗକୁ ମୁହାଁଇଥିବା ପ୍ରତିଛବି, ସଫା ମୁହଁ

MP3/WAV — କିମ୍ବା ଖାଲି ଛାଡ଼ନ୍ତୁ + TTS ତଳେ ବ୍ୟବହାର କରନ୍ତୁ

ଯଦି ଆପଣ ଉପର ଧ୍ୱନି ପ୍ରଦାନ କରନ୍ତି, ତେବେ ଏହି ପାଠ୍ୟକୁ ଅଣଦେଖା କରାଯାଏ। ସର୍ବାଧିକ 1,000 ଅକ୍ଷର।
~6,000 ଟୋକନ ପ୍ରତି କଲିପ (ମୁକ୍ତ); ଲମ୍ବ ଦ୍ୱାରା ପ୍ରିମିଆ ମାପ
ଆହରଣ କରନ୍ତୁ
ଉନ୍ନତ ବିକଳ୍ପଗୁଡ଼ିକ
ଫଳାଫଳ
ଟୋକନଗୁଡିକ କମ୍‌ ହୋଇଯାଉଛି। ଅଧିକ ଟୋକନଗୁଡ଼ିକୁ ଗ୍ରହଣ କରନ୍ତୁ
ଭଲ ଫଳାଫଳ ଚାହୁଁଛନ୍ତି କି? ପ୍ରୀମିୟମ ମଡେଲଗୁଡ଼ିକ (GPT-5, Claude, Gemini) ଉଚ୍ଚ ଗୁଣବତ୍ତା ପ୍ରଦାନ କରିଥାଏ। ଯୋଜନାଗୁଡ଼ିକୁ ଦେଖନ୍ତୁ

❤️ Free.aiକୁ ଭଲପାଆନ୍ତି କି? ଆପଣଙ୍କ ବନ୍ଧୁମାନଙ୍କୁ ଜଣାଇ ଦିଅନ୍ତୁ!

ସଂଯୋଗ ପଠାଇବା ପାଇଁ ସଦସ୍ୟ ହୁଅନ୍ତୁ ଏବଂ ପ୍ରତି ବନ୍ଧୁ ପାଇଁ 25,000 ଟୋକନ ଆୟ କରନ୍ତୁ।

ଅଧିକ ଚାହୁଁଛନ୍ତି କି? 30K ଟୋକନ/ଦିନ + 10K ବନାମ ପାଇଁ ମୁକ୍ତ ଭାବେ ପଞ୍ଜୀକରଣ କରନ୍ତୁ
ମୁକ୍ତ ଭାବରେ ପଞ୍ଜୀକୃତ ହୁଅନ୍ତୁ

ଆପଣଙ୍କର ଅନୁରୋଧକୁ ପ୍ରକ୍ରିୟାକରଣ କରୁଅଛି...

କଥାବାର୍ତ୍ତା କରିବା ପାଇଁ କୌଣସି ପୋର୍ଟରେଟ ଫଟୋକୁ ସଜାଇଟ କରନ୍ତୁ। ମୁକ୍ତ SadTalker (ସ୍ଵୟଂ-ହୋଷ୍ଟ) କିମ୍ବା ପ୍ରୀମିୟମ lipsync - ଗୋଟିଏ ମୁଖ ପ୍ରତିଛବି + ଧ୍ୱନିକୁ ଛାଡିଦିଅନ୍ତୁ, ଗୋଟିଏ ଲିପ-ସଂଯୋଜିତ କଥାବାର୍ତ୍ତା-ମସ୍ତକ ଭିଡିଓକୁ ଫେରାଇ ନିଅନ୍ତୁ। ବର୍ଣ୍ଣନାକାରୀ, ଆଭାର, ଭିଡିଓକୁ ସ୍ୱର-ଓଭର ପାଇଁ ଆଦର୍ଶ।

କିପରି ବ୍ୟବହାର କରିବେ AI କଥାବାର୍ତ୍ତା ମଥାName

1
ଆପଣଙ୍କର ନିବେଶ ଭରଣ କରନ୍ତୁ

ପାଠ୍ୟ ଟାଇପ କରନ୍ତୁ, ଗୋଟିଏ ଫାଇଲକୁ ଅଦ୍ୟତନ କରନ୍ତୁ, କିମ୍ବା ଆପଣ ଯାହା ଚାହୁଁଛନ୍ତି ତାହା ବର୍ଣ୍ଣନା କରନ୍ତୁ। କୌଣସି ଖାତା ଆବଶ୍ୟକ ନାହିଁ।

2
ନିର୍ମାଣ କରନ୍ତୁ

ଆମର ଏଆଇ ଶ୍ରେଷ୍ଠ ମୁକ୍ତ ଉତ୍ସ ମଡେଲ ବ୍ୟବହାର କରି ଆପଣଙ୍କ ଅନୁରୋଧକୁ ସେକେଣ୍ଡରେ ପ୍ରକ୍ରିୟା କରିଥାଏ ।

3
ଆହରଣ କରନ୍ତୁ ଏବଂ ଭାଗିଦାରୀ କରନ୍ତୁ

ଆପଣଙ୍କର ଫଳାଫଳକୁ ଆହରଣ କରନ୍ତୁ, ନକଲ କରନ୍ତୁ, କିମ୍ବା ବଣ୍ଟନ କରନ୍ତୁ । ବ୍ୟକ୍ତିଗତ ଏବଂ ବାଣିଜ୍ୟିକ ବ୍ୟବହାର ପାଇଁ ମୁକ୍ତ ।

API ମାଧ୍ୟମରେ ଏହି ସାଧନକୁ ବ୍ୟବହାର କରନ୍ତୁ

ଏହି ସାଧନକୁ ଆପଣଙ୍କର ନିଜ କୋଡରୁ ସ୍ୱୟଂଚାଳିତ କରନ୍ତୁ। OpenAI-ସଂଗତି REST ଶେଷ ବିନ୍ଦୁ, ଧାରକ-ଟୋକେନ ପ୍ରମାଣପତ୍ର, କୌଣସି ଅତିରିକ୍ତ SDK ଆବଶ୍ୟକ ନାହିଁ। ଟୋକେନ ମୂଲ୍ୟ ୱେବ ଅନ୍ତରାପୃଷ୍ଠ ସହିତ ମେଳ ଖାଉଛି।

curl -X POST https://api.free.ai/v1/video/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"prompt": "A cat playing piano", "duration": 4}'

AI କଥାବାର୍ତ୍ତା ମଥାName — FAQ

ଗୋଟିଏ ପୋର୍ଟରେଟ ଫଟୋ + ଗୋଟିଏ ଧ୍ୱନି କଲିପ (ଅଥବା ଭାଷଣ ଫାଇଲ)କୁ ଅପଲୋଡ କରନ୍ତୁ, AI ଧ୍ୱନିକୁ ଲିପ-ସଂଯୋଜିତ କରିବା ପାଇଁ ମୁଖକୁ ସଜାଇଥାଏ। ନିର୍ଗମ ଫଟୋର ଗୋଟିଏ MP4 ଭିଡିଓ "ବାଚୁଥିବା" ଧ୍ୱନି ସହିତ ବାସ୍ତବ ମୁହଁ ଗତି, ମସ୍ତକ ସାଇକେଲ, ଏବଂ ବ୍ଲିଙ୍କ୍ସ। ଦୁଇଟି ମଡେଲ: ମୁକ୍ତ SadTalker (ସ୍ୱୟଂ-ହୋଷ୍ଟ, MIT) କିମ୍ବା ପ୍ରୀମିୟମ lipsync (ଶକ୍ତ ମୁହଁ, ଦ୍ରୁତ)।

ହଁ — SadTalker ଆମର ସ୍ୱୟଂ-ହୋଷ୍ଟ GPUs ରେ ଚାଲୁଛି, ଦୈନିକ ଟୋକନ ପୁଲରେ ମୁକ୍ତ। ପ୍ରତ୍ୟେକ କଲିପ ପାଇଁ ~6,000 ଟୋକନ ଆଧାର + 800 ଟୋକନ ପ୍ରତି ସେକେଣ୍ଡ ଧ୍ୱନିର ଖର୍ଚ୍ଚ ହୋଇଥାଏ। ତେଣୁ ଗୋଟିଏ 10-ସେକେଣ୍ଡ କଲିପ ପାଇଁ ~14,000 ଟୋକନ ଖର୍ଚ୍ଚ ହୋଇଥାଏ। ବେନାମି 2,500/ଦିନ ପାଇଥାଏ, ଲଗଇନ ହୋଇଥିବା 10,000/ଦିନ ପାଇଥାଏ। ପ୍ରିମିଆ ମଧ୍ୟ ଲମ୍ବ ଅନୁସାରେ ମାପ ହୋଇଥାଏ କିନ୍ତୁ ତୀକ୍ଷ୍ଣ ଆଉଟପୁଟ ସହିତ।

SadTalker ( ପୂର୍ବନିର୍ଦ୍ଧାରିତ) ମୁକ୍ତ ଏବଂ ଏକ ପ୍ରାକୃତିକ କଥାବାର୍ତ୍ତା-ମସ୍ତକକୁ ସଫା ମସ୍ତକ ଗତି + ବ୍ଲିଙ୍କ ସହିତ ଉତ୍ପାଦନ କରେ। ପ୍ରୀମିୟମ ଲିପସାଇନ୍କ୍ ରେ ତୀକ୍ଷ୍ଣ ମୁହଁ ଆକାର ଅଛି (ବିଶେଷକରି "p", "b", "m" ଭଳି plosives ଏବଂ bilabials ପାଇଁ) ଏବଂ ଦୀର୍ଘ ଧ୍ୱନିରେ 2-3x ଦ୍ରୁତ ରେଣ୍ଡର କରେ। ସାମାଜିକ-ମଧ୍ୟମ ବର୍ଣ୍ଣନାକାରୀ ଏବଂ ଆବତାର ପାଇଁ, SadTalker ବହୁତ ଭଲ। ଉଚ୍ଚ-ସତ୍ୟତା ଦ୍ବାରା ଦ୍ବାରା ଏବଂ ଲିପ-ସିଙ୍କ-କରିଟିକାଲ ବିଷୟବସ୍ତୁ ପାଇଁ, ପ୍ରୀମିୟମକୁ ପରିବର୍ତ୍ତନ କରନ୍ତୁ।

ଆଗକୁ ମୁହଁ କରି ପୋଟୋ, ସଫା ମୁଖ, ସମାନ ଆଲୋକ, ନିରପେକ୍ଷ ଅଭିବ୍ୟକ୍ତି। ମୁଖ ଅତିକମରେ 30% ଫ୍ରେମ ଭରିବା ଉଚିତ। ଭାରି ସୂର୍ଯ୍ୟକାନ୍ତକ (ସେଗୁଡ଼ିକ ଆଖି ଅନୁସରଣକୁ ଭାଙ୍ଗନ୍ତି), ପ୍ରୋଫାଇଲ ଫଟୋ (ମଡେଲକୁ ଦୁଇଟି ଆଖି ଦୃଶ୍ୟମାନ ହେବା ଆବଶ୍ୟକ), ଏବଂ ଅତ୍ୟଧିକ ଅଭିବ୍ୟକ୍ତିକୁ ବନ୍ଦ କରନ୍ତୁ। ଷ୍ଟୁଡିଓ ହ୍ୟାଣ୍ଡସଟ ଏବଂ ଭଲ ସେଲଫିଗୁଡ଼ିକ ଭଲ ଭାବରେ କାମ କରିଥାଏ।

ସ୍ୱଚ୍ଛ ଭାଷାର WAV କିମ୍ବା MP3। SadTalker 1-30 ସେକଣ୍ଡର କ୍ଲପଗୁଡ଼ିକୁ ବିଶ୍ୱସ୍ତ ଭାବରେ ପରିଚାଳନା କରିଥାଏ, ଅଧିକ ସମର୍ଥିତ କିନ୍ତୁ ଧିରେ। ଶ୍ରେଷ୍ଠ ଲିପ-ସଂଯୋଜକତା ପାଇଁ, ଗୋଟିଏ ସ୍ଵରକକୁ ବ୍ୟବହାର କରନ୍ତୁ, କମ ପୃଷ୍ଠଭୂମି ଶବ୍ଦ, ଏବଂ ସ୍ପଷ୍ଟ ଭାବରେ ଉଚ୍ଚାରଣ କରାଯାଇଥିବା ଭାଷା। ଯଦି ଆପଣ କଥାବାର୍ତ୍ତା ମଥାକୁ ସ୍କ୍ରିପ୍ଟ କରିବାକୁ ଚାହୁଁଛନ୍ତି ତେବେ /tts/ ମାଧ୍ୟମରେ ଧ୍ୱନିକୁ ପ୍ରଥମେ ସୃଷ୍ଟି କରନ୍ତୁ।

SadTalker ପ୍ରତି ସେକେଣ୍ଡରେ ଧ୍ୱନି ପାଇଁ GPU ସମୟର ପ୍ରାୟ 10 ସେକେଣ୍ଡ ଗ୍ରହଣ କରେ। ତେଣୁ ଗୋଟିଏ 10-ସେକେଣ୍ଡର କଥାବାର୍ତ୍ତା ମୂଳ ~100 ସେକେଣ୍ଡ ଗ୍ରହଣ କରେ। ପ୍ରିମିଆ ଲିପସାଇନ୍ ଦ୍ରୁତ (~3-5 ସେକେଣ୍ଡ ପ୍ରତି ସେକେଣ୍ଡ ଧ୍ୱନି) କିନ୍ତୁ ଅଧିକ ଖର୍ଚ୍ଚ ହୋଇଥାଏ। ଉଭୟ ଆମର A100s ଉପରେ ଚାଲନ୍ତି - ଆପଣ ଟ୍ୟାବକୁ ବନ୍ଦ କରିପାରିବେ ଏବଂ ଫଳାଫଳ ଆପଣଙ୍କ ଡେସ୍କଟପରେ ପଡ଼ିବ।

D-ID5ମିନିଟ ଭିଡିଓ ପାଇଁ ମାସକୁ $5.99 ଦାବି କରେ। HeyGen $24/ମାସ। Synthesia $30/ମାସ। ଆମେ ଆପଣଙ୍କୁ ଦୈନିକ ପୁଲରେ SadTalkerକୁ ମୁକ୍ତରେ ଦେଉଛୁ - ବର୍ଣ୍ଣନାକାରୀ/ଅଭିନୟ ଭିଡିଓ ପାଇଁ ତୁଳନାତ୍ମକ ଗୁଣବତ୍ତା। Premium lipsync D-ID ଷ୍ଟୁଡିଓ ଗୁଣବତ୍ତା ସହିତ ମେଳ ଖାଉଛି। ମୁକ୍ତ ବିକଳ୍ପ ଅଧିକାଂଶ TikTok/YouTube ସୀମିତ ବ୍ୟବହାର ମାମଲା ପାଇଁ ସତ୍ୟବାଦୀ ଭାବେ ଭଲ।

ହଁ — /image/avatar/ କିମ୍ବା /image/generate/ ମାଧ୍ୟମରେ ଗୋଟିଏ ମୁଖ ସୃଷ୍ଟି କରନ୍ତୁ, ତାପରେ ଏହାକୁ ଏଠାରେ ଭରଣ କରନ୍ତୁ। ନମୂନାଟି ଯେକୌଣସି ଆଗକୁ ମୁହଁ କରିଥିବା ଚିତ୍ରକୁ ସମାନ ଭାବରେ ବ୍ୟବହାର କରିଥାଏ। ସାଧାରଣ ଶୃଙ୍ଖଳ: ପ୍ରୋମୋଟ → SDXL ଚିତ୍ରକୁ → SadTalker ଜୀବନାୟନ କରିଥାଏ → /tts/ ଧ୍ୱନି ପାଇଁ → ଶେଷ ହୋଇଛି।

SadTalker ଚେହେରା କ୍ଷେତ୍ରକୁ ସଜାଇମ କରେ (ମୁହଁ, ଆଖି, ମଥା ଘୁରି ବୁଲୁଛି, ଲୁହ ପୋଛିଥାଏ)। କାନ୍ଧ, ବସ୍ତ୍ର, ଏବଂ ପୃଷ୍ଠଭୂମି ପ୍ରାୟ ସ୍ଥିର ରହିଥାଏ। ଶରୀରର ଗତି ସହିତ ସମ୍ପୂର୍ଣ୍ଣ ଶରୀରର କଥାବାର୍ତ୍ତା-ମଥା ପାଇଁ, ବୃହତ କାଟ ସହିତ ପ୍ରୀମିୟମ ଲିପସାଇନ୍କ ମଡେଲକୁ ବ୍ୟବହାର କରନ୍ତୁ।

ହଁ - /v1/video/talking-head/ କୁ ବହୁଭାଗୀ `ଚିତ୍ର` + `ଧ୍ୱନି` ସହିତ POST କରନ୍ତୁ। କିମ୍ବା ଅନେକ ଚଳାଇବାକୁ ଧାଡ଼ିରେ ରଖିବା ପାଇଁ /scheduled/ କୁ ବ୍ୟବହାର କରନ୍ତୁ। /batch/ ମଧ୍ୟ CSV ପ୍ରତିଛବି-URL + ଧ୍ୱନି-URL ଯୋଡିଗୁଡ଼ିକୁ ଗ୍ରହଣ କରିଥାଏ।

ହଁ — api.free.ai ରେ /v1/video/talking-head/ କୁ ବହୁବିଧ `ଚିତ୍ର` + `ଧ୍ୱନି` କୁ POST କରନ୍ତୁ। ଧାରକ ପ୍ରାଧିକରଣ। `video_url` + `share_token` ସହିତ JSON ଫେରାଇଥାଏ। 10,000 ଟୋକନ/ମାସ ମୁକ୍ତ। ପ୍ରୀମିୟମ ଧ୍ୱନି ଅବଧି ସହିତ ରେଖାଗତ ଭାବରେ ମାପ ହୋଇଥାଏ। /api/ ରେ କର୍ଲ ଉଦାହରଣ ଅଛି।

ଫଟୋ ଏବଂ ଧ୍ୱନିକୁ ନିର୍ମାଣର 24 ଘଣ୍ଟା ମଧ୍ୟରେ ଅପସାରଣ କରାଯାଏ। ନିର୍ଗମ ଭିଡିଓଗୁଡ଼ିକ ଆମ CDN ରେ 24 ଘଣ୍ଟା ପାଇଁ ରହିଥାଏ (ପଇସା ଦେଇ ଚାଳକମାନଙ୍କ ପାଇଁ7ଦିନ) ତେଣୁ ଆପଣ /account/?tab=history ରୁ ପୁନଃ-ଡାଉନଲୋଡ କରିପାରିବେ। ପ୍ରଶିକ୍ଷଣ ପାଇଁ କେବେବି ବ୍ୟବହାର କରନ୍ତୁ ନାହିଁ। ସମ୍ପୂର୍ଣ୍ଣ ଗୋପନୀୟତା ନୀତି /privacy/ ରେ ଅଛି।

30,000 ଟୋକନ ପାଇଁ ମୁକ୍ତ ଭାବେ ଯୋଗଦାନ କରନ୍ତୁ

ଖାତା ନିର୍ମାଣ କରନ୍ତୁ

କୌଣସି କ୍ରେଡିଟ କାର୍ଡ ଆବଶ୍ୟକ ନାହିଁ

ଆପଣ ଏହି ଉପକରଣକୁ କିପରି ମାନ ଦେବେ?

Free.aiକୁ ଭଲପାଆନ୍ତି କି? ଆପଣଙ୍କ ବନ୍ଧୁମାନଙ୍କୁ ଜଣାଇ ଦିଅନ୍ତୁ!