Question 1

বসনীয় এর জন্য উইস্পার ট্রান্সক্রিপশন কতটা সঠিক?

Accepted Answer

বসনীয় Whisper-এর জন্য একটি কম-সম্পদ ভাষা — large-v3-turbo ২৫% শব্দের ভুল হারের উপরে, কখনও কখনও অনেক উপরে থাকে। ট্রান্সক্রিপ্টটি অনুসন্ধান এবং গিষ্টের জন্য উপকারী কিন্তু প্রকাশনা-সক্ষম হিসাবে বিবেচনা করা উচিত নয়। যদি বসনীয়-এর জন্য একটি উচ্চ-সঠিকতা ইঞ্জিন উপলব্ধ হয় তবে আমরা এটি স্বয়ংক্রিয়ভাবে সংযুক্ত করি।(বিশেষ স্তর D, over 25% word error rate বেঞ্চমার্ক সেট- আমরা বিজ্ঞাপন দাবী ছাড়াই সৎ ওয়ার স্তর প্রকাশ করি।)

Question 2

বসনীয় অডিও থেকে টেক্সট অনুবাদ কি বিনামূল্যে?

Accepted Answer

হ্যাঁ — বসনীয় ট্রান্সক্রিপশন আপনার দৈনিক বিনামূল্যে টোকেন পুল থেকে প্রথমে নেয়। অডিও প্রতি মিনিটে ৫০ টোকেন খরচ হয়, তাই বেনামী দৈনিক পুল প্রতিদিন কয়েক ঘণ্টা অডিও প্রদান করে। লগ-ইন করা অ্যাকাউন্টগুলো বড় পুল এবং ১০,০০০ সাইনআপ টোকেন পাবে। এরপর, $১ দিয়ে ৭৫০,০০০ টোকেন কিনতে পারবেন (~২৫০ ঘণ্টা অডিও)।

Question 3

বসনীয় ট্রান্সক্রিপ্ট কোন স্ক্রিপ্ট এবং বানান ব্যবহার করে?

Accepted Answer

বসনীয় ট্রান্সক্রিপশনগুলি ভাষার স্বাভাবিক বানান সহ আদর্শ UTF-8-এ ফিরিয়ে আনা হয়।

Question 4

বসনীয় অনুবাদ করার জন্য কোন অডিও ফরম্যাট সমর্থিত?

Accepted Answer

MP3, WAV, M4A, FLAC, OGG, OPUS, এবং WEBM সরাসরি গ্রহণ করা হয়। ভিডিও (MP4, MOV, MKV) এর জন্য আমরা সার্ভার-সাইড অডিও ট্র্যাক এক্সট্র্যাক্ট করি তা উইস্পারে পাঠানোর আগে - আপনার নিজের কোন কিছু রূপান্তর করার প্রয়োজন নেই। উৎস ভাষার উপর নির্ভর না করে একই পাইপলাইন, বসনীয় সহ।

Question 5

বসনীয় অডিও ফাইল কত বড় হতে পারে?

Accepted Answer

বেনামী আপলোডের সীমা প্রতি ফাইলে প্রায় ৫০০ মেগাবাইট। লগ-ইন করা অ্যাকাউন্ট ২ জিবি পর্যন্ত যেতে পারে। সময়সীমা কঠিন সীমা নয় - দীর্ঘ ফাইলগুলি স্বয়ংক্রিয়ভাবে চ্যাঙ্ক করা হয় (৩০ সেকেন্ডের উইন্ডোগুলির সাথে ওভারলেপ) এবং একটি একক ট্রান্সক্রিপ্ট হিসাবে পুনরায় স্টাইল করা হয় যা অবিরাম টাইমস্ট্যাম্প সহ। বহু ঘণ্টার বসনীয় রেকর্ডিং (পডকাস্ট, পূর্ণ লেকচার, সভা) ভালভাবে কাজ করে।

Question 6

বসনীয় ট্রান্সক্রিপ্ট কি বিভিন্ন বক্তাদের চিহ্নিত করে?

Accepted Answer

হ্যাঁ — প্রত্যেক বসনীয় ট্রান্সক্রিপ্ট-এর জন্য ডিফল্টভাবে স্পিকারের ডায়ারিজম সক্রিয় করা হয়। আউটপুটটি স্পিকার ১ / স্পিকার ২ / স্পিকার ৩ হিসাবে ভাগ করা হয় এবং সময়সূচীর সাথে, তাই সাক্ষাৎকার, প্যানেল আলোচনা এবং বহু-পক্ষীয় সভাগুলি লেবেলযুক্তভাবে ফিরে আসে। ডায়ারিজম একটি পৃথক মডেলে চলতে থাকে এবং আমরা সমর্থন করা সমস্ত ভাষার জন্য একইভাবে কাজ করে।

Question 7

আমি কি বসনীয় ইউটিউব ভিডিও বা পডকাস্টের অনুবাদ করতে পারি?

Accepted Answer

হ্যাঁ - ইউটিউব এর জন্য /transcribe/youtube/ এ ইউআরএল পেস্ট করুন অথবা পডকাস্ট ফিডের জন্য /transcribe/podcast/ এ পেস্ট করুন (অ্যাপল, স্পটিফাই, আরএসএস)। আমরা অডিও ডাউনলোড করি, এটি উইস্পারের মাধ্যমে language=bs এর মাধ্যমে চালানো হয়, এবং টাইমসটাম্প এবং স্পিকার লেবেল সহকারে ট্রান্সক্রিপ্ট ফিরিয়ে দেওয়া হয়। সাধারণ বসনীয় উপাদান: বসনীয়-এ বক্তৃতা, সাক্ষাৎকার, ভয়েস নোট এবং ইউটিউব বিষয়বস্তু সবই কাজ করে - ইউআরএল /transcribe/youtube/-এ পেস্ট করুন অথবা সরাসরি ফাইল আপলোড করুন।।

Question 8

বসনীয় অডিও এর এক ঘণ্টার জন্য কতটুকু টোকেন খরচ হয়?

Accepted Answer

উইস্পারের প্রতি মিনিটে অডিও রেকর্ড করার জন্য ৫০ টোকেন খরচ হয়, তাই এক ঘণ্টার রেকর্ডিংয়ের জন্য খরচ হয় ~৩,০০০ টোকেন। ১ ডলার দিয়ে ৭৫০,০০০ টোকেন কিনতে হয়, যা প্রতি ডলারে প্রায় ২৫০ ঘণ্টা অডিও রেকর্ডিংয়ের সমান। বেশিরভাগ ব্যবহারকারী কখনো কিছু খরচ করে না- বিনামূল্যে প্রতিদিনের পুল ছোট ছোট ক্লিপ, ভয়েস নোট এবং একবার ব্যবহারের পডকাস্টের জন্য ব্যয় করে।

Question 9

বসনীয় অডিও'র জন্য শব্দ-স্তরের সময়সূচী কি পাওয়া যাবে?

Accepted Answer

হ্যাঁ — সেগমেন্ট-স্তর (প্রতি ~১০-৩০ সেকেন্ডে) এবং শব্দ-স্তর উভয় পর্যায়ের সময়সূচক উপস্থিত রয়েছে। VTT/SRT সাবটাইটেল রপ্তানির ক্ষেত্রে শব্দ-স্তর ডিফল্ট, ফলে উপশীর্ষক লাইন-বিশেষে সুসংগত হবে। অনুরোধের মূল অংশে API-তে timestamps="word" নির্ধারণ করুন। বসনীয় ট্রান্সক্রিপশনগুলি ভাষার স্বাভাবিক বানান সহ আদর্শ UTF-8-এ ফিরিয়ে আনা হয়।

Question 10

বসনীয় অনুবাদ করার জন্য কি কোন API আছে?

Accepted Answer

হ্যাঁ। /v1/transcribe/-এ language=bs সহযোগে অডিও (মাল্টিপার্শ্ব/ফর্ম-ডাটা, ক্ষেত্র নাম "ফাইল") POST করুন — অথবা Whisper-কে স্বয়ংক্রিয়ভাবে সনাক্ত করতে ভাষা পরামিতিটি অগ্রাহ্য করুন। ট্রান্সক্রিপ্ট, সেগমেন্ট, টাইমসটাম্প এবং স্পিকার লেবেল সহ JSON ফিরিয়ে দেয়। /api/-এ সম্পূর্ণ রেফারেন্স এবং SDK স্নিপেট রয়েছে।

Question 11

আমি কি বসনীয় এর অনুবাদ অন্য ভাষায় অনুবাদ করতে পারি?

Accepted Answer

হ্যাঁ — অনুবাদ শেষ হলে, অনুবাদ বাটন ক্লিক করুন অথবা টেক্সটটি /translate/ এ পেস্ট করুন। বসনীয় আমাদের সমর্থিত অন্যান্য সকল ভাষার সাথে জুটি বেঁধে কাজ করে (২০০+)। সভায় অংশগ্রহণের জন্য অনুবাদ /summarize/ এর মাধ্যমে পাঠানো উচিত; অনুবাদ করার জন্য এটি /voice/tts/ এ পাঠানো উচিত যাতে লক্ষ্য ভাষায় অডিও প্রদর্শন করা যায়।

Question 12

বসনীয় অডিওটি যদি ধ্বনিময় অথবা কম গুণমানের হয় তাহলে কি হবে?

Accepted Answer

Whisper-এর ঝগড়া প্রশিক্ষণ এই স্তরে কম সাহায্য করে - বোতলনেক হচ্ছে বসনীয় অডিও Whisper প্রশিক্ষণের সময় দেখেছে, ঝগড়া নয়। পরিষ্কার স্টুডিও অডিও এখনও ঝগড়া অডিওকে হারায়, কিন্তু উভয়ই সঠিকতা পেতে পারবে না আপনি উচ্চ-সম্পদ ভাষায় পেতে পারেন।যদি কোন ট্রান্সক্রিপ্ট ব্যবহারযোগ্য না হয়, তাহলে ফাইলটি নিয়ে contact@free.ai এ ই-মেইল করুন। আমরা টোকেন ফিরিয়ে দেব এবং দেখব কোন ভিন্ন ইঞ্জিন আপনার অডিওকে ভালোভাবে পরিচালনা করতে পারে কিনা।

ভাষা	বসনীয়
আইএসও কোড	`bs`
এআই মডেল	দ্রুত-উৎকণ্ঠা
মূল্য	মুক্ত

বসনীয় বিনামূল্যে অনুবাদ

কিভাবে কাজ করে

বসনীয় অনুবাদ বৈশিষ্ট্য

ভাষার বিবরণ

আরো ভাষা

ফ্যাক্টর