এআই ভিডিও ডুবিং স্টুডিও

বাণিজ্যিক ব্যবহার ঠিক আছে ৩৮০+ মডেল কোন ওয়াটারমার্ক নেই কোন সাইন-আপ প্রয়োজন নেই
মডেল:
+ GPT-5, Claude, Gemini
একটি কথা বলা মাথার ক্লিপ আপলোড করুন এবং লিপ-সিনকেড মুখের নড়াচড়ার মাধ্যমে অন্য ভাষায় তা অনুবাদ করুন। হুইস্পার অনুবাদ করে, মাডলাড অনুবাদ করে, কোকোরো ৩৭টি ভাষায় ১৭৪টি ভাষায় কথা বলে, এবং সিঙ্ক লিপসিনক ভি২ মুখের পুনঃপ্রদর্শন করে। ৯৯% ক্লিপ স্বয়ংক্রিয়ভাবে উৎস ভাষা সনাক্ত করে।

এখানে একটি ভিডিও টেনে আনুন অথবা আপলোড করতে ক্লিক করুন

MP4, MOV, WebM ১০০ মেগাবাইট পর্যন্ত · একক স্পিকারের কথা বলার মাথা সবচেয়ে ভালো কাজ করে

Whisper ৯৯% ক্লিপের ক্ষেত্রে উৎস ভাষা সনাক্ত করে। শুধুমাত্র স্বয়ংক্রিয়ভাবে সনাক্ত করা ভুল অনুমানের ক্ষেত্রে অগ্রাহ্য করা হবে।
পুরো ক্লিপটি ডাব করার আগে আপনার লক্ষ্য ভাষায় একটি সংক্ষিপ্ত বাক্যাংশ বলার জন্য প্রাকদর্শন ক্লিক করুন ।
ভিডিওতে সঙ্গীত অথবা শব্দ FX থাকলে নতুন কণ্ঠের নিচে সংরক্ষণ করতে হলে এটি ব্যবহার করা যেতে পারে। বন্ধ = একক কণ্ঠের ডাব পরিষ্কার করা হবে।
আপনার ক্লিপের জন্য টোকেন অনুমান
আপনার ভিডিও ক্লিপের সঠিক মূল্য দেখতে ভিডিও আপলোড করুন।
দ্বৈত পাইপলাইন
মূল অনুলিপি
অনুবাদ করা হয়েছে
ডাউনলোড

যেখানে এআই ভিডিও ডাবিং নিজেই খরচ করে

ইউটিউব চ্যানেল স্থানীয়করণ করুন

একই দিনে ইংরেজি ভিডিওকে স্প্যানিশ, পর্তুগিজ এবং হিন্দিতে রূপান্তর করা যায়। ইউটিউবে অডিও ট্র্যাকের বিনিময়ে একবার আপলোড করলেই দর্শকদের মুখের ভাষার সাথে মিলে যাওয়া তিনগুণ ভিডিও দেখানো যায়।

গ্লোবাল বিজ্ঞাপন বিন্যাস

এক বিজ্ঞাপন বানানো, ২০টি ভাষায় অনুবাদ করা এবং এক সপ্তাহের এ/বি পরীক্ষা করা।

E-learning + corporate training

স্টুডিও বাজেট ছাড়াই এক ডজন ভাষায় ভিডিও তৈরির জন্য প্রয়োজনীয় নিয়ম মেনে চলা, প্রশিক্ষণ এবং পণ্য প্রশিক্ষণ।

দ্বৈত ধাতুর গঠন

১ম ধাপ

অনুলিপি (Whisper large-v3)

ভিডিও অডিও এক্সট্র্যাক্ট করা হয় এবং শব্দ-স্তরের সময়ের সাথে অনুবাদ করা হয়। উৎস ভাষা স্বয়ংক্রিয়ভাবে ৯৯% সঠিকতার সাথে সনাক্ত করা হয়।

২য় ধাপ

অনুবাদ (MadLAD-400)

3B-প্যারামিটার মডেল ব্যবহার করে, যেটি স্বাভাবিকভাবে কথা বলার জন্য তৈরী করা হয়েছে, শব্দের জন্য শব্দ নয়, অনুবাদটি লক্ষ্য ভাষায় অনুবাদ করা হয়।

৩য় ধাপ

কথা বলুন (কোকোরো — ১৭৪টি শব্দ)

লক্ষ্য ভাষার একটি স্বাভাবিক কন্ঠ অনুবাদ পড়ে। ৩৭টি ভাষার ১৭৪টি কন্ঠ - একটি বেছে নিন এবং প্রথমে একটি প্রাকদর্শন শুনুন।

৪র্থ ধাপ

লিপ-সিনক (Sync Lipsync v2)

মুখের প্রতিটি ফ্রেমকে নতুন অডিওতে মেলাতে পুনরায় রেন্ডার করা হয়েছে। একক স্পিকারের সামনের দিকে তাকানো শ্যুটিংয়ের জন্য সর্বশেষ প্রযুক্তি।

কেন রাস্ক, পেপারকাপ, অথবা হেইজেন না?

রাস্ক ১০০ মিনিটের আউটপুট এবং ১৩০টি উৎস ভাষার জন্য প্রতি মাসে ২৪ ডলার চার্জ করে। পেপারকাপ শুধুমাত্র ব্যবসার জন্য (কল বিক্রয়, ৪-আঙ্কের বিল আশা করা যায়)। হেইজেনের ডাবিং স্তর শুরু হয় ৫ মিনিটের কোটা সহ প্রতি মাসে ২৯ ডলার দিয়ে। এই টুল একই পাইপলাইন উপাদান ব্যবহার করে - এসটিটি-র জন্য হুইস্পার, অনুবাদ করার জন্য মাডলাড, টিটিএস-এর জন্য কোকোরো, মুখের পুনঃপ্রদর্শনের জন্য সিঙ্ক লিপসিঙ্ক ভি২ - কোন সাবস্ক্রিপশন, কোন ওয়াটারমার্ক, কোন মাসিক কোটা ছাড়াই। আপনি আপনার ইতোমধ্যে থাকা পুলে থেকে টোকেন পরিশোধ করেন।

অগ্রসর অপশন
ফলাফল
টোকেন কমে যাচ্ছে। আরো ট্যাব পাওয়া যাচ্ছে না
ভাল ফলাফল চান? প্রাইম মডেল (GPT-5, Claude, Gemini) উচ্চমানের প্রদান করে। পরিকল্পনা প্রদর্শন করো

❤️ Free.ai ভালোবাসো?

সাবস্ক্রাইব করুন একটি রিফারেন্স লিংক পেতে এবং প্রতি বন্ধুর জন্য ২৫,০০০ টোকেন অর্জন করতে।

আরো চাও? ৩০K টোকেন/দিন + ১০K বোনাস এর জন্য বিনামূল্যে নিবন্ধন করুন
নিবন্ধন করুন

আপনার অনুরোধ প্রসেস করা হচ্ছে...

কোন ভিডিও ২০+ ভাষায় দ্বিভাষিক করুন, লিপস ইনপুট সহ। হুইস্পার অনুবাদ করে, MadLAD অনুবাদ করে, Kokoro কথা বলে, Sync Lipsync v2 মুখের সাথে মিল রেখে।

ব্যবহারের নিয়ম এআই ভিডিও ডুবিং স্টুডিও

1
আপনার ইনপুট লিখুন

টেক্সট টাইপ করুন, একটি ফাইল আপলোড করুন, অথবা আপনি যা চান তা বর্ণনা করুন। কোন অ্যাকাউন্টের প্রয়োজন নেই।

2
ক্লিক করে তৈরি করুন

আমাদের এআই সেকেন্ডের মধ্যেই আপনার আবেদনের প্রক্রিয়া সম্পন্ন করে, সে জন্য সেরা উন্মুক্ত উৎস মডেল ব্যবহার করে।

3
ডাউনলোড এবং শেয়ার

আপনার ফলাফল ডাউনলোড, অনুলিপি অথবা শেয়ার করুন। ব্যক্তিগত এবং বাণিজ্যিক ব্যবহারের জন্য বিনামূল্যে।

API-র মাধ্যমে এই টুলটি ব্যবহার করুন

আপনার নিজের কোড থেকে এই টুলটি স্বয়ংক্রিয় করুন। OpenAI-সমর্থিত REST এন্ডপয়েন্ট, Bearer-token auth, কোন অতিরিক্ত SDK প্রয়োজন নেই। টোকেন খরচ ওয়েব ইন্টারফেসের সাথে মিলবে।

curl -X POST https://api.free.ai/v1/video/generate/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"prompt": "A cat playing piano", "duration": 4}'

এআই ভিডিও ডুবিং স্টুডিও — FAQ

একটি ভিডিও আপলোড করুন, লক্ষ্য ভাষা বেছে নিন এবং সেই ভাষায় পুনরায় ভিডিওটি ডাব করে নিন। নতুন অডিওটির সাথে সঙ্গতি রেখে বক্তার মুখের ভাষা পুনরায় সিঙ্ক্রোনাইজ করা হয়েছে। ইংরেজি ইউটিউব বিষয়বস্তুকে স্প্যানিশ, ফরাসি, চীনা ইত্যাদি ভাষায় রূপান্তর করার জন্য এটি খুবই উপযোগী।

সার্ভার-পাশে চারটি ধাপ পরপর চলছে: (১) হুইস্পার মূল অডিওটি অনুবাদ করে, (২) ম্যাডএলএডি অনুবাদটি আপনার লক্ষ্য ভাষায় অনুবাদ করে, (৩) কোকোরো সেই ভাষায় স্বাভাবিক কথাবার্তা তৈরি করে, (৪) লিপসিনক সিঙ্ক v2 নতুন কন্ঠের সাথে মিলে যাওয়ার জন্য বক্তার মুখের পুনঃম্যাপ করে। সবকিছু একই অনুরোধের মাধ্যমে করা হয় - নিজে নিজে কোন জাগিং টুলস ব্যবহার করবেন না।

ড্রপডাউনে ২০টি সর্বাধিক চাহিদার ভাষা (স্পেনীয়, ফরাসি, জার্মান, পর্তুগিজ, ইতালীয়, চীনা, জাপানি, কোরীয়, আরবি, হিন্দি, তুর্কি, রুশ, ডাচ, পোলিশ, ভিয়েতনামী, ইন্দোনেশিয়ান, থাই, হিব্রু, সুইডিশ, ইংরেজি) রয়েছে।

ডাবিং শুধুমাত্র পরিশোধিত টোকেন ব্যবহার করে (প্রতিটি ক্লিপে ~১০০,০০০)। Sync Lipsync v২ হল ব্যয়বহুল পদক্ষেপ - প্রথম তিনটি বিনামূল্যে স্ব-হোস্ট করা হয়। নিবন্ধন বোনাস ক্রেডিট এআই ভিডিও ডুবিং স্টুডিওটি আনলক করে না।

৩০ সেকেন্ডের কম সময়ের ভিডিওগুলো ১-৩ মিনিটে ডাব করা হয়। দীর্ঘ ভিডিওগুলো আনুপাতিকভাবে বেশি সময় নেয়। হার্ড ক্যাপ ১০০ মেগাবাইট আপলোড করা হয়। দীর্ঘ ভিডিওগুলোর জন্য, দৃশ্যগুলোকে বিভক্ত করে প্রতিটিকে ডাব করা হয়।

না — কোকোরো ১৭৪টি অভ্যন্তরীণ কন্ঠের (৩৭টি ভাষা) একটি ব্যবহার করে, মূল স্পিকারের ক্লোন সংস্করণ নয়। পরিচয় সংরক্ষণের জন্য আপনার আমাদের পৃথক /voice/clone/ টুল এবং একটি স্বনির্ধারিত পাইপলাইনের প্রয়োজন হবে।

লিপসিনক সিঙ্ক v2 একক স্পিকারের সামনের দিকের শ্যুটিংয়ের জন্য আধুনিক। বহু স্পিকারের দৃশ্য বা প্রোফাইল-ভিউ ক্লিপ ড্রিফট হতে পারে। সবচেয়ে ভালো ফলাফল আসে কাছাকাছি কথা বলা মাথার ফুটেজ থেকে।

সহজ পছন্দকারী স্বয়ংক্রিয় / পুরুষ / মহিলা প্রদান করে। সুনির্দিষ্ট ভয়েস নির্বাচনের জন্য, প্রথমে প্রাকদর্শন এবং ভয়েস আইডি অনুলিপি করতে /voice/tts/ ব্যবহার করুন, তারপর আমরা তা প্রবাহিত করতে পারি। শীঘ্রই ইউআই-এ আসছে।

না, আপলোড করা ভিডিওটি প্রসেস করার কয়েক মিনিটের মধ্যেই মুছে ফেলা হয়। আউটপুটটি আমাদের সিডিএন-এ ২৪ ঘণ্টা (পেইড ব্যবহারকারীদের জন্য ৭ দিন) শেয়ার লিঙ্কে রাখা হয়।

হ্যাঁ — এই পরিষ্কার লিপ-সিনক কর্মপ্রবাহের জন্য (আপনার ভিডিও + পূর্বে রেকর্ডকৃত অডিও), নিম্নলিখিত /v1/image/edit/ অথবা স্বনির্বাচিত একটি শেষ বিন্দু ব্যবহার করুন। দ্বৈতকরণ স্বয়ংক্রিয়ভাবে চারটি পদক্ষেপকে একত্রিত করে।

সাবটাইটেল ফাইল (SRT/VTT) এর জন্য /transcribe/ ব্যবহার করুন, অথবা /translate/subtitle/ ব্যবহার করে একটি বিদ্যমান SRT অনুবাদ করুন। ডুবিং অডিও প্রতিস্থাপন করে; সাবটাইটেল টেক্সট ওভারলে করে - ভিন্ন আউটপুট।

হ্যাঁ — target_lang সহযোগে /v1/video/dubbing/ এ বহু-অংশের ভিডিও POST করুন। ফলাফল {output_url, transcript, translated_text}। ডকুমেন্টেশনের জন্য /api/ দেখুন।

১০,০০০ টোকেন এর জন্য বিনামূল্যে নিবন্ধন করুন

ফ্রি অ্যাকাউন্ট তৈরি করুন

কোন ক্রেডিট কার্ডের প্রয়োজন নেই

আপনি কিভাবে এই টুলটি রেটিং করবেন?

Free.ai ভালোবাসো?