Question 1

ElevenLabs STT কি করে?

Accepted Answer

ElevenLabs STT উচ্চারিত অডিওকে টেক্সটে রূপান্তর করে। MP3, WAV, M4A, অথবা ভিডিও ফাইল আপলোড করুন এবং ElevenLabs STT টাইমসটেম্প সহযোগে সম্পূর্ণ ট্রান্সক্রিপশন এবং বৈকল্পিক SRT/VTT সাবটাইটেল ফিরিয়ে দেবে।

Question 2

ElevenLabs STT কতটি ভাষা সমর্থন করে?

Accepted Answer

ElevenLabs STT ডজনখানেক ভাষার ব্যবস্থা করে — Whisper-পরিবার মডেল ৯০+, Parakeet ~২৫, অন্যান্যদের মধ্যে পার্থক্য করে। সর্বোচ্চ সঠিকতার জন্য "স্বয়ংক্রিয়ভাবে সনাক্ত করুন" বা ভাষা নির্ধারণ করুন।

Question 3

ElevenLabs STT কতটা সঠিক?

Accepted Answer

শব্দ-ত্রুটির হার পরিষ্কার ইংরেজি অডিওতে ৫-১০%, ঝামেলাপূর্ণ অথবা উচ্চারিত অডিওতে ১০-২০%। একই স্থাপত্যের বড় ধরনের বৈচিত্র্য কঠিন ক্ষেত্রে অর্থপূর্ণভাবে ভাল কাজ করে - অডিওটি রুক্ষ হলে বড় ধরনের বেছে নিন।

Question 4

ElevenLabs STT-এ কি টাইমসম্যাপ অন্তর্ভুক্ত আছে?

Accepted Answer

হ্যাঁ — প্রতিটি সেগমেন্টে শুরু/শেষ সময়সূচী অন্তর্ভুক্ত রয়েছে। SRT অথবা VTT হিসাবে রপ্তানি করুন এবং সময়সূচী সরাসরি আপনার ভিডিওতে ম্যাপ করুন।

Question 5

ElevenLabs STT এর প্রতি মিনিটে খরচ কত?

Accepted Answer

ElevenLabs STT একটি প্রিমিয়াম ট্রান্সক্রিপশন ইঞ্জিন। প্রতি মিনিটে অডিওতে প্রায় ~৫০০-১,৫০০ টোকেন। $১ = ৭৫০,০০০ টোকেন।

Question 6

ElevenLabs STT এ আমি কি ধরনের অডিও ফাইল আপলোড করতে পারি?

Accepted Answer

MP3, WAV, M4A, FLAC, OGG, এবং ভিডিও (MP4, MOV, WebM) — আমরা অডিও এক্সট্র্যাক্ট করব। প্রতি আপলোডে সর্বোচ্চ ৫০০ মেগাবাইট। দীর্ঘ ফাইল? /audio/cut/ ব্যবহার করে বিভক্ত করুন অথবা /v1/stt/batch/ ব্যবহার করুন।

Question 7

ElevenLabs STT কি বিভিন্ন বক্তাদের চিহ্নিত করতে পারে?

Accepted Answer

স্পিকারের ডায়ারিজম একটি আলাদা পাস — /transcribe/ এ "diarize" টগল করুন। ElevenLabs STT অনুবাদ ব্যবস্থাপনা করে; ডায়ারিজম প্রত্যেকটি অংশকে স্পিকার ১ / স্পিকার ২ / ইত্যাদির সাথে লেবেল করে।

Question 8

আমি কি ElevenLabs STT এর সাথে ব্যাচ ট্রান্সক্রিপ্ট করতে পারি?

Accepted Answer

হ্যাঁ — /batch/ অডিও ফাইলের ফোল্ডার গ্রহণ করে। প্রত্যেকটি ট্রান্সক্রিপ্ট মূল ফাইলের নাম সহ /account/?tab=history এ অবস্থিত হয়। ফোল্ডার-ট্রী সংরক্ষণের জন্য API ব্যবহার করুন।

Question 9

ElevenLabs STT-এর জন্য কি কোনো API আছে?

Accepted Answer

হ্যাঁ — আপনার অডিও /v1/stt/transcribe/ এ POST করুন, যার মডেল হল "ElevenLabs STT"। JSON ফিরিয়ে আনে, যাতে আছে টেক্সট + সেগমেন্ট + শব্দ-স্তরের সময়সূচী। /api/-এ সম্পূর্ণ রেফারেন্স রয়েছে।

Question 10

আমি যখন ElevenLabs STT ব্যবহার করে লেখা লিখব তখন আমার গোপনীয়তা নিয়ে কি হবে?

Accepted Answer

স্ব-হোস্টকৃত মডেলগুলি আমাদের GPU-তে অডিও সংরক্ষণ করে; প্রাইম একটি DPA-র মাধ্যমে প্রবেশ করে। শেয়ার-উইন্ডোর পরে অডিও মুছে ফেলা হয় (২৪ ঘন্টা অবৈধ, ৭ দিন লগ-ইন)। আমরা আপনার ইনপুটগুলিতে প্রশিক্ষণ দিই না।

Question 11

ElevenLabs STT আউটপুট কি বাণিজ্যিক ব্যবহারের জন্য নিরাপদ?

Accepted Answer

Yes — Free.ai grants commercial use of transcripts. You need rights to the audio you uploaded (your own recording, licensed material, or content with consent).

Question 12

ElevenLabs STT কতক্ষণ লাগবে?

Accepted Answer

বাস্তব সময়ের ফ্যাক্টর হল প্রায় ০.০৫–০.২× — ৬০ মিনিটের একটি পডকাস্ট ৩–১২ মিনিটে অনুবাদ করা হয়। প্রাইম মডেলগুলি সাধারণত দ্রুত শেষ হয়। ট্যাবটি বন্ধ করতে লাইন বাটন ব্যবহার করুন।

ElevenLabs STT

API ব্যবহার করো

একই ধরনের মডেল

প্রায়শই জিজ্ঞাসিত প্রশ্ন