বসনীয় বিনামূল্যে অনুবাদ

AI ব্যবহার করে বসনীয় অডিও এবং ভিডিওকে টেক্সটে রূপান্তর করুন। দ্রুত, সঠিক এবং বিনামূল্যে।

কিভাবে কাজ করে

  1. এই ফোল্ডারে যাও Free.ai ট্রান্সক্রিপ্টার
  2. আপনার বসনীয় অডিও অথবা ভিডিও ফাইল আপলোড করুন
  3. আমাদের AI স্বয়ংক্রিয়ভাবে বসনীয় সনাক্ত করে এবং এটি অনুলিপি করে
  4. আপনার ট্রান্সক্রিপ্ট টেক্সট বা SRT সাবটাইটেল হিসাবে ডাউনলোড করুন

বসনীয় অনুবাদ বৈশিষ্ট্য

  • ফ্যাস্টার- উইস্পারের দ্বারা চালিত (এমআইটি লাইসেন্সপ্রাপ্ত)
  • বসনীয় ভাষা স্বয়ংক্রিয়ভাবে সনাক্ত করা হবে
  • MP3, WAV, MP4, M4A, FLAC এবং আরও সমর্থন করে
  • টাইমসটেম্প এবং সাবটাইটেল রপ্তানি (SRT)
  • কোন ফাইল মাপের সীমা নেই
  • গোপনীয় এবং নিরাপদ -- ফাইল প্রক্রিয়াকরণের পর মুছে ফেলা হয়

ভাষার বিবরণ

ভাষাবসনীয়
আইএসও কোডbs
এআই মডেলদ্রুত-উৎকণ্ঠা
মূল্যমুক্ত

আরো ভাষা

সব ভাষা দেখাও

ফ্যাক্টর

বসনীয় Whisper-এর জন্য একটি কম-সম্পদ ভাষা — large-v3-turbo ২৫% শব্দের ভুল হারের উপরে, কখনও কখনও অনেক উপরে থাকে। ট্রান্সক্রিপ্টটি অনুসন্ধান এবং গিষ্টের জন্য উপকারী কিন্তু প্রকাশনা-সক্ষম হিসাবে বিবেচনা করা উচিত নয়। যদি বসনীয়-এর জন্য একটি উচ্চ-সঠিকতা ইঞ্জিন উপলব্ধ হয় তবে আমরা এটি স্বয়ংক্রিয়ভাবে সংযুক্ত করি।(বিশেষ স্তর D, over 25% word error rate বেঞ্চমার্ক সেট- আমরা বিজ্ঞাপন দাবী ছাড়াই সৎ ওয়ার স্তর প্রকাশ করি।)

হ্যাঁ — বসনীয় ট্রান্সক্রিপশন আপনার দৈনিক বিনামূল্যে টোকেন পুল থেকে প্রথমে নেয়। অডিও প্রতি মিনিটে ৫০ টোকেন খরচ হয়, তাই বেনামী দৈনিক পুল প্রতিদিন কয়েক ঘণ্টা অডিও প্রদান করে। লগ-ইন করা অ্যাকাউন্টগুলো বড় পুল এবং ১০,০০০ সাইনআপ টোকেন পাবে। এরপর, $১ দিয়ে ৭৫০,০০০ টোকেন কিনতে পারবেন (~২৫০ ঘণ্টা অডিও)।

বসনীয় ট্রান্সক্রিপশনগুলি ভাষার স্বাভাবিক বানান সহ আদর্শ UTF-8-এ ফিরিয়ে আনা হয়।

MP3, WAV, M4A, FLAC, OGG, OPUS, এবং WEBM সরাসরি গ্রহণ করা হয়। ভিডিও (MP4, MOV, MKV) এর জন্য আমরা সার্ভার-সাইড অডিও ট্র্যাক এক্সট্র্যাক্ট করি তা উইস্পারে পাঠানোর আগে - আপনার নিজের কোন কিছু রূপান্তর করার প্রয়োজন নেই। উৎস ভাষার উপর নির্ভর না করে একই পাইপলাইন, বসনীয় সহ।

বেনামী আপলোডের সীমা প্রতি ফাইলে প্রায় ৫০০ মেগাবাইট। লগ-ইন করা অ্যাকাউন্ট ২ জিবি পর্যন্ত যেতে পারে। সময়সীমা কঠিন সীমা নয় - দীর্ঘ ফাইলগুলি স্বয়ংক্রিয়ভাবে চ্যাঙ্ক করা হয় (৩০ সেকেন্ডের উইন্ডোগুলির সাথে ওভারলেপ) এবং একটি একক ট্রান্সক্রিপ্ট হিসাবে পুনরায় স্টাইল করা হয় যা অবিরাম টাইমস্ট্যাম্প সহ। বহু ঘণ্টার বসনীয় রেকর্ডিং (পডকাস্ট, পূর্ণ লেকচার, সভা) ভালভাবে কাজ করে।

হ্যাঁ — প্রত্যেক বসনীয় ট্রান্সক্রিপ্ট-এর জন্য ডিফল্টভাবে স্পিকারের ডায়ারিজম সক্রিয় করা হয়। আউটপুটটি স্পিকার ১ / স্পিকার ২ / স্পিকার ৩ হিসাবে ভাগ করা হয় এবং সময়সূচীর সাথে, তাই সাক্ষাৎকার, প্যানেল আলোচনা এবং বহু-পক্ষীয় সভাগুলি লেবেলযুক্তভাবে ফিরে আসে। ডায়ারিজম একটি পৃথক মডেলে চলতে থাকে এবং আমরা সমর্থন করা সমস্ত ভাষার জন্য একইভাবে কাজ করে।

হ্যাঁ - ইউটিউব এর জন্য /transcribe/youtube/ এ ইউআরএল পেস্ট করুন অথবা পডকাস্ট ফিডের জন্য /transcribe/podcast/ এ পেস্ট করুন (অ্যাপল, স্পটিফাই, আরএসএস)। আমরা অডিও ডাউনলোড করি, এটি উইস্পারের মাধ্যমে language=bs এর মাধ্যমে চালানো হয়, এবং টাইমসটাম্প এবং স্পিকার লেবেল সহকারে ট্রান্সক্রিপ্ট ফিরিয়ে দেওয়া হয়। সাধারণ বসনীয় উপাদান: বসনীয়-এ বক্তৃতা, সাক্ষাৎকার, ভয়েস নোট এবং ইউটিউব বিষয়বস্তু সবই কাজ করে - ইউআরএল /transcribe/youtube/-এ পেস্ট করুন অথবা সরাসরি ফাইল আপলোড করুন।।

উইস্পারের প্রতি মিনিটে অডিও রেকর্ড করার জন্য ৫০ টোকেন খরচ হয়, তাই এক ঘণ্টার রেকর্ডিংয়ের জন্য খরচ হয় ~৩,০০০ টোকেন। ১ ডলার দিয়ে ৭৫০,০০০ টোকেন কিনতে হয়, যা প্রতি ডলারে প্রায় ২৫০ ঘণ্টা অডিও রেকর্ডিংয়ের সমান। বেশিরভাগ ব্যবহারকারী কখনো কিছু খরচ করে না- বিনামূল্যে প্রতিদিনের পুল ছোট ছোট ক্লিপ, ভয়েস নোট এবং একবার ব্যবহারের পডকাস্টের জন্য ব্যয় করে।

হ্যাঁ — সেগমেন্ট-স্তর (প্রতি ~১০-৩০ সেকেন্ডে) এবং শব্দ-স্তর উভয় পর্যায়ের সময়সূচক উপস্থিত রয়েছে। VTT/SRT সাবটাইটেল রপ্তানির ক্ষেত্রে শব্দ-স্তর ডিফল্ট, ফলে উপশীর্ষক লাইন-বিশেষে সুসংগত হবে। অনুরোধের মূল অংশে API-তে timestamps="word" নির্ধারণ করুন। বসনীয় ট্রান্সক্রিপশনগুলি ভাষার স্বাভাবিক বানান সহ আদর্শ UTF-8-এ ফিরিয়ে আনা হয়।

হ্যাঁ। /v1/transcribe/-এ language=bs সহযোগে অডিও (মাল্টিপার্শ্ব/ফর্ম-ডাটা, ক্ষেত্র নাম "ফাইল") POST করুন — অথবা Whisper-কে স্বয়ংক্রিয়ভাবে সনাক্ত করতে ভাষা পরামিতিটি অগ্রাহ্য করুন। ট্রান্সক্রিপ্ট, সেগমেন্ট, টাইমসটাম্প এবং স্পিকার লেবেল সহ JSON ফিরিয়ে দেয়। /api/-এ সম্পূর্ণ রেফারেন্স এবং SDK স্নিপেট রয়েছে।

হ্যাঁ — অনুবাদ শেষ হলে, অনুবাদ বাটন ক্লিক করুন অথবা টেক্সটটি /translate/ এ পেস্ট করুন। বসনীয় আমাদের সমর্থিত অন্যান্য সকল ভাষার সাথে জুটি বেঁধে কাজ করে (২০০+)। সভায় অংশগ্রহণের জন্য অনুবাদ /summarize/ এর মাধ্যমে পাঠানো উচিত; অনুবাদ করার জন্য এটি /voice/tts/ এ পাঠানো উচিত যাতে লক্ষ্য ভাষায় অডিও প্রদর্শন করা যায়।

Whisper-এর ঝগড়া প্রশিক্ষণ এই স্তরে কম সাহায্য করে - বোতলনেক হচ্ছে বসনীয় অডিও Whisper প্রশিক্ষণের সময় দেখেছে, ঝগড়া নয়। পরিষ্কার স্টুডিও অডিও এখনও ঝগড়া অডিওকে হারায়, কিন্তু উভয়ই সঠিকতা পেতে পারবে না আপনি উচ্চ-সম্পদ ভাষায় পেতে পারেন।যদি কোন ট্রান্সক্রিপ্ট ব্যবহারযোগ্য না হয়, তাহলে ফাইলটি নিয়ে contact@free.ai এ ই-মেইল করুন। আমরা টোকেন ফিরিয়ে দেব এবং দেখব কোন ভিন্ন ইঞ্জিন আপনার অডিওকে ভালোভাবে পরিচালনা করতে পারে কিনা।

Free.ai ভালোবাসো?

এই পাতাটি রেটিং দিন