AI ଭିଡ଼ିଓ ନିର୍ମାତା AI ଭିଡ଼ିଓ ସମ୍ପାଦକ AI ଭିଡ଼ିଓ ବଢ଼ାଉଥିବାName AI ଭିଡ଼ିଓ ଡବିଂ ଷ୍ଟୁଡିଓName AI କାର୍ଯ୍ୟଦକ୍ଷତା ଗ୍ରହଣ (ରନୱେ କାର୍ଯ୍ୟ-ଦୁଇ) AI ଭିଡିଓ ଅନୁବାଦକName AI ଭିଡ଼ିଓ ପ୍ରଭାବ - Pikaffects-style AI ଭିଡ଼ିଓ ଉନ୍ନତିକାରୀ ଅଧିକ →

AI କଥାବାର୍ତ୍ତା ମଥାName

ବାଣିଜ୍ୟିକ ବ୍ୟବହାର ଠିକ ଅଛି 380+ ନମୁନା କୌଣସି ପାନୀୟ ଚିହ୍ନ ନାହିଁ କୌଣସି ସଦସ୍ୟତା ଆବଶ୍ୟକ ନାହିଁ

Animate any portrait photo to speak. Drop a face image + an audio file (or paste TTS text), AI generates a video of the face talking with synchronized lip movements. Powered by SadTalker — fast and reliable for professional talking-head explainer videos.

ମୁଖ ପ୍ରତିଛବି

PNG/JPG — ଆଗକୁ ମୁହାଁଇଥିବା ପ୍ରତିଛବି, ସଫା ମୁହଁ

ଧ୍ୱନି (ବୈକଳ୍ପିକ)

MP3/WAV — କିମ୍ବା ଖାଲି ଛାଡ଼ନ୍ତୁ + TTS ତଳେ ବ୍ୟବହାର କରନ୍ତୁ

କିମ୍ବା ସ୍କ୍ରିପ୍ଟକୁ ଟାଇପ କରନ୍ତୁ (Kokoro TTS ବ୍ୟବହାର କରି)

ଯଦି ଆପଣ ଉପର ଧ୍ୱନି ପ୍ରଦାନ କରନ୍ତି, ତେବେ ଏହି ପାଠ୍ୟକୁ ଅଣଦେଖା କରାଯାଏ। ସର୍ବାଧିକ 1,000 ଅକ୍ଷର।

Model

~6,000 ଟୋକନ ପ୍ରତି କଲିପ (ମୁକ୍ତ); ଲମ୍ବ ଦ୍ୱାରା ପ୍ରିମିଆ ମାପ

କଥାବାର୍ତ୍ତା କରିବା ପାଇଁ କୌଣସି ପୋର୍ଟରେଟ ଫଟୋକୁ ସଜାଇଟ କରନ୍ତୁ। ମୁକ୍ତ SadTalker (ସ୍ଵୟଂ-ହୋଷ୍ଟ) କିମ୍ବା ପ୍ରୀମିୟମ lipsync - ଗୋଟିଏ ମୁଖ ପ୍ରତିଛବି + ଧ୍ୱନିକୁ ଛାଡିଦିଅନ୍ତୁ, ଗୋଟିଏ ଲିପ-ସଂଯୋଜିତ କଥାବାର୍ତ୍ତା-ମସ୍ତକ ଭିଡିଓକୁ ଫେରାଇ ନିଅନ୍ତୁ। ବର୍ଣ୍ଣନାକାରୀ, ଆଭାର, ଭିଡିଓକୁ ସ୍ୱର-ଓଭର ପାଇଁ ଆଦର୍ଶ।

କିପରି ବ୍ୟବହାର କରିବେ AI କଥାବାର୍ତ୍ତା ମଥାName

ଆପଣଙ୍କର ନିବେଶ ଭରଣ କରନ୍ତୁ

ପାଠ୍ୟ ଟାଇପ କରନ୍ତୁ, ଗୋଟିଏ ଫାଇଲକୁ ଅଦ୍ୟତନ କରନ୍ତୁ, କିମ୍ବା ଆପଣ ଯାହା ଚାହୁଁଛନ୍ତି ତାହା ବର୍ଣ୍ଣନା କରନ୍ତୁ। କୌଣସି ଖାତା ଆବଶ୍ୟକ ନାହିଁ।

ନିର୍ମାଣ କରନ୍ତୁ

ଆମର ଏଆଇ ଶ୍ରେଷ୍ଠ ମୁକ୍ତ ଉତ୍ସ ମଡେଲ ବ୍ୟବହାର କରି ଆପଣଙ୍କ ଅନୁରୋଧକୁ ସେକେଣ୍ଡରେ ପ୍ରକ୍ରିୟା କରିଥାଏ ।

ଆହରଣ କରନ୍ତୁ ଏବଂ ଭାଗିଦାରୀ କରନ୍ତୁ

ଆପଣଙ୍କର ଫଳାଫଳକୁ ଆହରଣ କରନ୍ତୁ, ନକଲ କରନ୍ତୁ, କିମ୍ବା ବଣ୍ଟନ କରନ୍ତୁ । ବ୍ୟକ୍ତିଗତ ଏବଂ ବାଣିଜ୍ୟିକ ବ୍ୟବହାର ପାଇଁ ମୁକ୍ତ ।

API ମାଧ୍ୟମରେ ଏହି ସାଧନକୁ ବ୍ୟବହାର କରନ୍ତୁ

ଏହି ସାଧନକୁ ଆପଣଙ୍କର ନିଜ କୋଡରୁ ସ୍ୱୟଂଚାଳିତ କରନ୍ତୁ। OpenAI-ସଂଗତି REST ଶେଷ ବିନ୍ଦୁ, ଧାରକ-ଟୋକେନ ପ୍ରମାଣପତ୍ର, କୌଣସି ଅତିରିକ୍ତ SDK ଆବଶ୍ୟକ ନାହିଁ। ଟୋକେନ ମୂଲ୍ୟ ୱେବ ଅନ୍ତରାପୃଷ୍ଠ ସହିତ ମେଳ ଖାଉଛି।

API ଦଲିଲିକରଣ API କି ଗ୍ରହଣ କରନ୍ତୁ

curl -X POST https://api.free.ai/v1/video/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"prompt": "A cat playing piano", "duration": 4}'

ସମ୍ବନ୍ଧିତ ମୁକ୍ତ AI ସାଧନଗୁଡ଼ିକName

AI ଭିଡ଼ିଓ ନିର୍ମାତା

AI ଭିଡ଼ିଓ ସମ୍ପାଦକ

AI ଭିଡ଼ିଓ ବଢ଼ାଉଥିବାName

AI ଭିଡ଼ିଓ ଡବିଂ ଷ୍ଟୁଡିଓName

AI କାର୍ଯ୍ୟଦକ୍ଷତା ଗ୍ରହଣ (ରନୱେ କାର୍ଯ୍ୟ-ଦୁଇ)

AI ଭିଡିଓ ଅନୁବାଦକName

AI ଭିଡ଼ିଓ ପ୍ରଭାବ - Pikaffects-style

AI ଭିଡ଼ିଓ ଉନ୍ନତିକାରୀ

AI କଥାବାର୍ତ୍ତା ମଥାName — FAQ

ଗୋଟିଏ ପୋର୍ଟରେଟ ଫଟୋ + ଗୋଟିଏ ଧ୍ୱନି କଲିପ (ଅଥବା ଭାଷଣ ଫାଇଲ)କୁ ଅପଲୋଡ କରନ୍ତୁ, AI ଧ୍ୱନିକୁ ଲିପ-ସଂଯୋଜିତ କରିବା ପାଇଁ ମୁଖକୁ ସଜାଇଥାଏ। ନିର୍ଗମ ଫଟୋର ଗୋଟିଏ MP4 ଭିଡିଓ "ବାଚୁଥିବା" ଧ୍ୱନି ସହିତ ବାସ୍ତବ ମୁହଁ ଗତି, ମସ୍ତକ ସାଇକେଲ, ଏବଂ ବ୍ଲିଙ୍କ୍ସ। ଦୁଇଟି ମଡେଲ: ମୁକ୍ତ SadTalker (ସ୍ୱୟଂ-ହୋଷ୍ଟ, MIT) କିମ୍ବା ପ୍ରୀମିୟମ lipsync (ଶକ୍ତ ମୁହଁ, ଦ୍ରୁତ)।

ହଁ — SadTalker ଆମର ସ୍ୱୟଂ-ହୋଷ୍ଟ GPUs ରେ ଚାଲୁଛି, ଦୈନିକ ଟୋକନ ପୁଲରେ ମୁକ୍ତ। ପ୍ରତ୍ୟେକ କଲିପ ପାଇଁ ~6,000 ଟୋକନ ଆଧାର + 800 ଟୋକନ ପ୍ରତି ସେକେଣ୍ଡ ଧ୍ୱନିର ଖର୍ଚ୍ଚ ହୋଇଥାଏ। ତେଣୁ ଗୋଟିଏ 10-ସେକେଣ୍ଡ କଲିପ ପାଇଁ ~14,000 ଟୋକନ ଖର୍ଚ୍ଚ ହୋଇଥାଏ। ବେନାମି 2,500/ଦିନ ପାଇଥାଏ, ଲଗଇନ ହୋଇଥିବା 10,000/ଦିନ ପାଇଥାଏ। ପ୍ରିମିଆ ମଧ୍ୟ ଲମ୍ବ ଅନୁସାରେ ମାପ ହୋଇଥାଏ କିନ୍ତୁ ତୀକ୍ଷ୍ଣ ଆଉଟପୁଟ ସହିତ।

SadTalker ( ପୂର୍ବନିର୍ଦ୍ଧାରିତ) ମୁକ୍ତ ଏବଂ ଏକ ପ୍ରାକୃତିକ କଥାବାର୍ତ୍ତା-ମସ୍ତକକୁ ସଫା ମସ୍ତକ ଗତି + ବ୍ଲିଙ୍କ ସହିତ ଉତ୍ପାଦନ କରେ। ପ୍ରୀମିୟମ ଲିପସାଇନ୍କ୍ ରେ ତୀକ୍ଷ୍ଣ ମୁହଁ ଆକାର ଅଛି (ବିଶେଷକରି "p", "b", "m" ଭଳି plosives ଏବଂ bilabials ପାଇଁ) ଏବଂ ଦୀର୍ଘ ଧ୍ୱନିରେ 2-3x ଦ୍ରୁତ ରେଣ୍ଡର କରେ। ସାମାଜିକ-ମଧ୍ୟମ ବର୍ଣ୍ଣନାକାରୀ ଏବଂ ଆବତାର ପାଇଁ, SadTalker ବହୁତ ଭଲ। ଉଚ୍ଚ-ସତ୍ୟତା ଦ୍ବାରା ଦ୍ବାରା ଏବଂ ଲିପ-ସିଙ୍କ-କରିଟିକାଲ ବିଷୟବସ୍ତୁ ପାଇଁ, ପ୍ରୀମିୟମକୁ ପରିବର୍ତ୍ତନ କରନ୍ତୁ।

ଆଗକୁ ମୁହଁ କରି ପୋଟୋ, ସଫା ମୁଖ, ସମାନ ଆଲୋକ, ନିରପେକ୍ଷ ଅଭିବ୍ୟକ୍ତି। ମୁଖ ଅତିକମରେ 30% ଫ୍ରେମ ଭରିବା ଉଚିତ। ଭାରି ସୂର୍ଯ୍ୟକାନ୍ତକ (ସେଗୁଡ଼ିକ ଆଖି ଅନୁସରଣକୁ ଭାଙ୍ଗନ୍ତି), ପ୍ରୋଫାଇଲ ଫଟୋ (ମଡେଲକୁ ଦୁଇଟି ଆଖି ଦୃଶ୍ୟମାନ ହେବା ଆବଶ୍ୟକ), ଏବଂ ଅତ୍ୟଧିକ ଅଭିବ୍ୟକ୍ତିକୁ ବନ୍ଦ କରନ୍ତୁ। ଷ୍ଟୁଡିଓ ହ୍ୟାଣ୍ଡସଟ ଏବଂ ଭଲ ସେଲଫିଗୁଡ଼ିକ ଭଲ ଭାବରେ କାମ କରିଥାଏ।

ସ୍ୱଚ୍ଛ ଭାଷାର WAV କିମ୍ବା MP3। SadTalker 1-30 ସେକଣ୍ଡର କ୍ଲପଗୁଡ଼ିକୁ ବିଶ୍ୱସ୍ତ ଭାବରେ ପରିଚାଳନା କରିଥାଏ, ଅଧିକ ସମର୍ଥିତ କିନ୍ତୁ ଧିରେ। ଶ୍ରେଷ୍ଠ ଲିପ-ସଂଯୋଜକତା ପାଇଁ, ଗୋଟିଏ ସ୍ଵରକକୁ ବ୍ୟବହାର କରନ୍ତୁ, କମ ପୃଷ୍ଠଭୂମି ଶବ୍ଦ, ଏବଂ ସ୍ପଷ୍ଟ ଭାବରେ ଉଚ୍ଚାରଣ କରାଯାଇଥିବା ଭାଷା। ଯଦି ଆପଣ କଥାବାର୍ତ୍ତା ମଥାକୁ ସ୍କ୍ରିପ୍ଟ କରିବାକୁ ଚାହୁଁଛନ୍ତି ତେବେ /tts/ ମାଧ୍ୟମରେ ଧ୍ୱନିକୁ ପ୍ରଥମେ ସୃଷ୍ଟି କରନ୍ତୁ।

SadTalker ପ୍ରତି ସେକେଣ୍ଡରେ ଧ୍ୱନି ପାଇଁ GPU ସମୟର ପ୍ରାୟ 10 ସେକେଣ୍ଡ ଗ୍ରହଣ କରେ। ତେଣୁ ଗୋଟିଏ 10-ସେକେଣ୍ଡର କଥାବାର୍ତ୍ତା ମୂଳ ~100 ସେକେଣ୍ଡ ଗ୍ରହଣ କରେ। ପ୍ରିମିଆ ଲିପସାଇନ୍ ଦ୍ରୁତ (~3-5 ସେକେଣ୍ଡ ପ୍ରତି ସେକେଣ୍ଡ ଧ୍ୱନି) କିନ୍ତୁ ଅଧିକ ଖର୍ଚ୍ଚ ହୋଇଥାଏ। ଉଭୟ ଆମର A100s ଉପରେ ଚାଲନ୍ତି - ଆପଣ ଟ୍ୟାବକୁ ବନ୍ଦ କରିପାରିବେ ଏବଂ ଫଳାଫଳ ଆପଣଙ୍କ ଡେସ୍କଟପରେ ପଡ଼ିବ।

D-ID5ମିନିଟ ଭିଡିଓ ପାଇଁ ମାସକୁ $5.99 ଦାବି କରେ। HeyGen $24/ମାସ। Synthesia $30/ମାସ। ଆମେ ଆପଣଙ୍କୁ ଦୈନିକ ପୁଲରେ SadTalkerକୁ ମୁକ୍ତରେ ଦେଉଛୁ - ବର୍ଣ୍ଣନାକାରୀ/ଅଭିନୟ ଭିଡିଓ ପାଇଁ ତୁଳନାତ୍ମକ ଗୁଣବତ୍ତା। Premium lipsync D-ID ଷ୍ଟୁଡିଓ ଗୁଣବତ୍ତା ସହିତ ମେଳ ଖାଉଛି। ମୁକ୍ତ ବିକଳ୍ପ ଅଧିକାଂଶ TikTok/YouTube ସୀମିତ ବ୍ୟବହାର ମାମଲା ପାଇଁ ସତ୍ୟବାଦୀ ଭାବେ ଭଲ।

ହଁ — /image/avatar/ କିମ୍ବା /image/generate/ ମାଧ୍ୟମରେ ଗୋଟିଏ ମୁଖ ସୃଷ୍ଟି କରନ୍ତୁ, ତାପରେ ଏହାକୁ ଏଠାରେ ଭରଣ କରନ୍ତୁ। ନମୂନାଟି ଯେକୌଣସି ଆଗକୁ ମୁହଁ କରିଥିବା ଚିତ୍ରକୁ ସମାନ ଭାବରେ ବ୍ୟବହାର କରିଥାଏ। ସାଧାରଣ ଶୃଙ୍ଖଳ: ପ୍ରୋମୋଟ → SDXL ଚିତ୍ରକୁ → SadTalker ଜୀବନାୟନ କରିଥାଏ → /tts/ ଧ୍ୱନି ପାଇଁ → ଶେଷ ହୋଇଛି।

SadTalker ଚେହେରା କ୍ଷେତ୍ରକୁ ସଜାଇମ କରେ (ମୁହଁ, ଆଖି, ମଥା ଘୁରି ବୁଲୁଛି, ଲୁହ ପୋଛିଥାଏ)। କାନ୍ଧ, ବସ୍ତ୍ର, ଏବଂ ପୃଷ୍ଠଭୂମି ପ୍ରାୟ ସ୍ଥିର ରହିଥାଏ। ଶରୀରର ଗତି ସହିତ ସମ୍ପୂର୍ଣ୍ଣ ଶରୀରର କଥାବାର୍ତ୍ତା-ମଥା ପାଇଁ, ବୃହତ କାଟ ସହିତ ପ୍ରୀମିୟମ ଲିପସାଇନ୍କ ମଡେଲକୁ ବ୍ୟବହାର କରନ୍ତୁ।

ହଁ - /v1/video/talking-head/ କୁ ବହୁଭାଗୀ `ଚିତ୍ର` + `ଧ୍ୱନି` ସହିତ POST କରନ୍ତୁ। କିମ୍ବା ଅନେକ ଚଳାଇବାକୁ ଧାଡ଼ିରେ ରଖିବା ପାଇଁ /scheduled/ କୁ ବ୍ୟବହାର କରନ୍ତୁ। /batch/ ମଧ୍ୟ CSV ପ୍ରତିଛବି-URL + ଧ୍ୱନି-URL ଯୋଡିଗୁଡ଼ିକୁ ଗ୍ରହଣ କରିଥାଏ।

ହଁ — api.free.ai ରେ /v1/video/talking-head/ କୁ ବହୁବିଧ `ଚିତ୍ର` + `ଧ୍ୱନି` କୁ POST କରନ୍ତୁ। ଧାରକ ପ୍ରାଧିକରଣ। `video_url` + `share_token` ସହିତ JSON ଫେରାଇଥାଏ। 10,000 ଟୋକନ/ମାସ ମୁକ୍ତ। ପ୍ରୀମିୟମ ଧ୍ୱନି ଅବଧି ସହିତ ରେଖାଗତ ଭାବରେ ମାପ ହୋଇଥାଏ। /api/ ରେ କର୍ଲ ଉଦାହରଣ ଅଛି।

ଫଟୋ ଏବଂ ଧ୍ୱନିକୁ ନିର୍ମାଣର 24 ଘଣ୍ଟା ମଧ୍ୟରେ ଅପସାରଣ କରାଯାଏ। ନିର୍ଗମ ଭିଡିଓଗୁଡ଼ିକ ଆମ CDN ରେ 24 ଘଣ୍ଟା ପାଇଁ ରହିଥାଏ (ପଇସା ଦେଇ ଚାଳକମାନଙ୍କ ପାଇଁ7ଦିନ) ତେଣୁ ଆପଣ /account/?tab=history ରୁ ପୁନଃ-ଡାଉନଲୋଡ କରିପାରିବେ। ପ୍ରଶିକ୍ଷଣ ପାଇଁ କେବେବି ବ୍ୟବହାର କରନ୍ତୁ ନାହିଁ। ସମ୍ପୂର୍ଣ୍ଣ ଗୋପନୀୟତା ନୀତି /privacy/ ରେ ଅଛି।

30,000 ଟୋକନ ପାଇଁ ମୁକ୍ତ ଭାବେ ଯୋଗଦାନ କରନ୍ତୁ

ଖାତା ନିର୍ମାଣ କରନ୍ତୁ

କୌଣସି କ୍ରେଡିଟ କାର୍ଡ ଆବଶ୍ୟକ ନାହିଁ

ଆପଣ ଏହି ଉପକରଣକୁ କିପରି ମାନ ଦେବେ?

AI କଥାବାର୍ତ୍ତା ମଥାName

ଫଳାଫଳ

କିପରି ବ୍ୟବହାର କରିବେ AI କଥାବାର୍ତ୍ତା ମଥାName

ଆପଣଙ୍କର ନିବେଶ ଭରଣ କରନ୍ତୁ

ନିର୍ମାଣ କରନ୍ତୁ

ଆହରଣ କରନ୍ତୁ ଏବଂ ଭାଗିଦାରୀ କରନ୍ତୁ

API ମାଧ୍ୟମରେ ଏହି ସାଧନକୁ ବ୍ୟବହାର କରନ୍ତୁ

ସମ୍ବନ୍ଧିତ ମୁକ୍ତ AI ସାଧନଗୁଡ଼ିକName

AI କଥାବାର୍ତ୍ତା ମଥାName — FAQ

Free.ai AI ଟୋକିଂ ହେଡ ଜେନେରେଟର କଣ?

ଏହା କଣ ନିଶ୍ଚିତ ଭାବେ ମୁକ୍ତ?

SadTalker ବିରୁଦ୍ଧରେ ପ୍ରୀମିୟମ lipsync — ମୁଁ କେଉଁଟିକୁ ବାଛିବା ଉଚିତ?

କେଉଁ ପ୍ରକାର ଫଟୋ ସବୁଠାରୁ ଭଲ କାମ କରେ?

କେଉଁ ପ୍ରକାର ଧ୍ୱନି କାର୍ଯ୍ୟ କରୁଅଛି?

ପ୍ରତିଟି କ୍ଲିପକୁ ସୃଷ୍ଟି କରିବା ପାଇଁ କେତେ ସମୟ ଲାଗେ?

ଏହା ଡି-ଆଇଡି/ହେୟଜେନ/ସିଂଥେସିଆର ତୁଳନାରେ କିପରି?

ମୁଁ ଗୋଟିଏ ନିର୍ମିତ ମୁଖ ବ୍ୟବହାର କରିପାରିବି କି?

ପୃଷ୍ଠଭୂମି ଏବଂ ବସ୍ତ୍ର ବିଷୟରେ କଣ – ଫଟୋର ବାକି ଅଂଶ ଗତି କରୁଛି କି?

ମୁଁ ଅନେକ ଭିଡିଓକୁ ବ୍ୟାଚ-ଉତ୍ପାଦନ କରିପାରିବି କି?

API ମୁକ୍ତ କି?

ମୋର ଅଦ୍ୟତନଗୁଡ଼ିକ ସଂରକ୍ଷିତ ଅଛି କି ନାହଁ କିମ୍ବା ପ୍ରଶିକ୍ଷଣ ପାଇଁ ବ୍ୟବହାର ହେଉଛି କି?

10,000 ମୁକ୍ତ ଟୋକନ ପାଇବେ

ଅପେକ୍ଷା କରନ୍ତୁ — 10K ମୁକ୍ତ ଟୋକନ ପାଇବେ!

ଅଧିକ ଚାହୁଁଛନ୍ତି କି?