Free Vietnamese Transcription

Transcribe Vietnamese audio and video to text with AI. Fast, accurate, and free.

কিভাবে কাজ করে

  1. Go to the Free.ai Transcriber
  2. Upload your Vietnamese audio or video file
  3. Our AI automatically detects Vietnamese and transcribes it
  4. আপনার ট্রান্সক্রিপ্ট টেক্সট বা SRT সাবটাইটেল হিসাবে ডাউনলোড করুন

Vietnamese Transcription Features

  • ফ্যাস্টার- উইস্পারের দ্বারা চালিত (এমআইটি লাইসেন্সপ্রাপ্ত)
  • Automatic Vietnamese language detection
  • MP3, WAV, MP4, M4A, FLAC এবং আরও সমর্থন করে
  • টাইমসটেম্প এবং সাবটাইটেল রপ্তানি (SRT)
  • কোন ফাইল মাপের সীমা নেই
  • গোপনীয় এবং নিরাপদ -- ফাইল প্রক্রিয়াকরণের পর মুছে ফেলা হয়

ভাষার বিবরণ

ভাষাVietnamese
আইএসও কোডvi
এআই মডেলদ্রুত-উৎকণ্ঠা
মূল্যমুক্ত

আরো ভাষা

সব ভাষা দেখাও

ফ্যাক্টর

Whisper large-v3-turbo Vietnamese সঠিকভাবে পরিচালনা করে — বেঞ্চমার্ক অডিওতে ৭-১৫% শব্দের ভুল হার। নামকরণকৃত বস্তু, সংখ্যা এবং ঘন প্রযুক্তিগত শব্দভাণ্ডারের ক্ষেত্রে মাঝে মাঝে প্রতিস্থাপনের আশা রাখুন; ট্রান্সক্রিপ্টটির বেশিরভাগ অংশ সঠিক হবে।(বিশেষ স্তর B, 7-15% word error rate বেঞ্চমার্ক সেট- আমরা বিজ্ঞাপন দাবী ছাড়াই সৎ ওয়ার স্তর প্রকাশ করি।)

হ্যাঁ — Vietnamese ট্রান্সক্রিপশন আপনার দৈনিক বিনামূল্যে টোকেন পুল থেকে প্রথমে নেয়। অডিও প্রতি মিনিটে ৫০ টোকেন খরচ হয়, তাই বেনামী দৈনিক পুল প্রতিদিন কয়েক ঘণ্টা অডিও প্রদান করে। লগ-ইন করা অ্যাকাউন্টগুলো বড় পুল এবং ১০,০০০ সাইনআপ টোকেন পাবে। এরপর, $১ দিয়ে ৭৫০,০০০ টোকেন কিনতে পারবেন (~২৫০ ঘণ্টা অডিও)।

Vietnamese ট্রান্সক্রিপশনগুলি ভাষার স্বাভাবিক বানান সহ আদর্শ UTF-8-এ ফিরিয়ে আনা হয়।

MP3, WAV, M4A, FLAC, OGG, OPUS, এবং WEBM সরাসরি গ্রহণ করা হয়। ভিডিও (MP4, MOV, MKV) এর জন্য আমরা সার্ভার-সাইড অডিও ট্র্যাক এক্সট্র্যাক্ট করি তা উইস্পারে পাঠানোর আগে - আপনার নিজের কোন কিছু রূপান্তর করার প্রয়োজন নেই। উৎস ভাষার উপর নির্ভর না করে একই পাইপলাইন, Vietnamese সহ।

বেনামী আপলোডের সীমা প্রতি ফাইলে প্রায় ৫০০ মেগাবাইট। লগ-ইন করা অ্যাকাউন্ট ২ জিবি পর্যন্ত যেতে পারে। সময়সীমা কঠিন সীমা নয় - দীর্ঘ ফাইলগুলি স্বয়ংক্রিয়ভাবে চ্যাঙ্ক করা হয় (৩০ সেকেন্ডের উইন্ডোগুলির সাথে ওভারলেপ) এবং একটি একক ট্রান্সক্রিপ্ট হিসাবে পুনরায় স্টাইল করা হয় যা অবিরাম টাইমস্ট্যাম্প সহ। বহু ঘণ্টার Vietnamese রেকর্ডিং (পডকাস্ট, পূর্ণ লেকচার, সভা) ভালভাবে কাজ করে।

হ্যাঁ — প্রত্যেক Vietnamese ট্রান্সক্রিপ্ট-এর জন্য ডিফল্টভাবে স্পিকারের ডায়ারিজম সক্রিয় করা হয়। আউটপুটটি স্পিকার ১ / স্পিকার ২ / স্পিকার ৩ হিসাবে ভাগ করা হয় এবং সময়সূচীর সাথে, তাই সাক্ষাৎকার, প্যানেল আলোচনা এবং বহু-পক্ষীয় সভাগুলি লেবেলযুক্তভাবে ফিরে আসে। ডায়ারিজম একটি পৃথক মডেলে চলতে থাকে এবং আমরা সমর্থন করা সমস্ত ভাষার জন্য একইভাবে কাজ করে।

হ্যাঁ - ইউটিউব এর জন্য /transcribe/youtube/ এ ইউআরএল পেস্ট করুন অথবা পডকাস্ট ফিডের জন্য /transcribe/podcast/ এ পেস্ট করুন (অ্যাপল, স্পটিফাই, আরএসএস)। আমরা অডিও ডাউনলোড করি, এটি উইস্পারের মাধ্যমে language=vi এর মাধ্যমে চালানো হয়, এবং টাইমসটাম্প এবং স্পিকার লেবেল সহকারে ট্রান্সক্রিপ্ট ফিরিয়ে দেওয়া হয়। সাধারণ Vietnamese উপাদান: হোয়াটসঅ্যাপ ভয়েস নোট, ইউটিউব ভলোগ এবং সংক্ষিপ্ত ভিডিও সবচেয়ে সাধারণ Vietnamese কাজের কাজ – ইউআরএল /transcribe/youtube/ এ পেস্ট করা অথবা সরাসরি অডিও আপলোড করা।।

উইস্পারের প্রতি মিনিটে অডিও রেকর্ড করার জন্য ৫০ টোকেন খরচ হয়, তাই এক ঘণ্টার রেকর্ডিংয়ের জন্য খরচ হয় ~৩,০০০ টোকেন। ১ ডলার দিয়ে ৭৫০,০০০ টোকেন কিনতে হয়, যা প্রতি ডলারে প্রায় ২৫০ ঘণ্টা অডিও রেকর্ডিংয়ের সমান। বেশিরভাগ ব্যবহারকারী কখনো কিছু খরচ করে না- বিনামূল্যে প্রতিদিনের পুল ছোট ছোট ক্লিপ, ভয়েস নোট এবং একবার ব্যবহারের পডকাস্টের জন্য ব্যয় করে।

হ্যাঁ — উভয় সেগমেন্ট-স্তর (প্রতি ~১০-৩০ সেকেন্ডে) এবং শব্দ-স্তরের সময়সূচী উপলব্ধ। VTT/SRT সাবটাইটেল রপ্তানির জন্য শব্দ-স্তর ডিফল্ট, তাই শিরোনাম লাইন-বিশিষ্টভাবে সুসংগত করা হয়। অনুরোধের মূল অংশে API-তে timestamps="word" নির্ধারণ করুন।

হ্যাঁ। /v1/transcribe/-এ language=vi সহযোগে অডিও (মাল্টিপার্শ্ব/ফর্ম-ডাটা, ক্ষেত্র নাম "ফাইল") POST করুন — অথবা Whisper-কে স্বয়ংক্রিয়ভাবে সনাক্ত করতে ভাষা পরামিতিটি অগ্রাহ্য করুন। ট্রান্সক্রিপ্ট, সেগমেন্ট, টাইমসটাম্প এবং স্পিকার লেবেল সহ JSON ফিরিয়ে দেয়। /api/-এ সম্পূর্ণ রেফারেন্স এবং SDK স্নিপেট রয়েছে।

হ্যাঁ — অনুবাদ শেষ হলে, অনুবাদ বাটন ক্লিক করুন অথবা টেক্সটটি /translate/ এ পেস্ট করুন। Vietnamese আমাদের সমর্থিত অন্যান্য সকল ভাষার সাথে জুটি বেঁধে কাজ করে (২০০+)। সভায় অংশগ্রহণের জন্য অনুবাদ /summarize/ এর মাধ্যমে পাঠানো উচিত; অনুবাদ করার জন্য এটি /voice/tts/ এ পাঠানো উচিত যাতে লক্ষ্য ভাষায় অডিও প্রদর্শন করা যায়।

হুইসপারকে শত হাজার ঘণ্টার বাস্তব অডিও থেকে প্রশিক্ষণ দেয়া হয়েছে, তাই এটি পটভূমির শব্দ এবং Vietnamese-এ ফোন-গুণমানের রেকর্ডিং সহ্য করে। সর্বোত্তম ফলাফল পেতে পরিষ্কার অডিও (হেডসেট মাইক, কোন সঙ্গীত রুম) প্রদান করুন - এই স্তরে শব্দ বেসলাইন ত্রুটি হারকে বৃদ্ধি করে।যদি কোন ট্রান্সক্রিপ্ট ব্যবহারযোগ্য না হয়, তাহলে ফাইলটি নিয়ে contact@free.ai এ ই-মেইল করুন। আমরা টোকেন ফিরিয়ে দেব এবং দেখব কোন ভিন্ন ইঞ্জিন আপনার অডিওকে ভালোভাবে পরিচালনা করতে পারে কিনা।

Free.ai ভালোবাসো?

এই পাতাটি রেটিং দিন