STT Online

বাণিজ্যিক ব্যবহার ঠিক আছে ৩৮০+ মডেল কোন ওয়াটারমার্ক নেই কোন সাইন-আপ প্রয়োজন নেই
মডেল:
+ GPT-5, Claude, Gemini
একটি অডিও অথবা ভিডিও ফাইল আপলোড করুন - অথবা একটি ইউআরএল পেস্ট করুন - এবং একটি পরিষ্কার ট্রান্সক্রিপ্ট টাইমস্ট্যাম্প সহ পাবেন। স্পিকার ডায়ারাইজেশন, SRT/VTT সাবটাইটেল রপ্তানি, স্বয়ংক্রিয়ভাবে সনাক্তকরণ সহ ১০০+ ভাষা। ক্লিপ দৈর্ঘ্যের সাথে সঠিকভাবে মূল্য স্কেল। Whisper large-v3 এবং Parakeet (স্বয়ং-হোস্ট করা), এবং প্রাইম Wizper এবং ElevenLabs STT দ্বারা চালিত।

অডিও/ভিডিও টেনে নিয়ে যান অথবা ব্রাউজ করতে ক্লিক করুন

MP3, WAV, MP4, WebM, M4A — ৫০০ মেগাবাইট পর্যন্ত

উইস্পার লম্বা-ভি৩ — ৯৯টি ভাষা, শ্রেণীতে সেরা সঠিকতা।
এই ক্লিপের জন্য ট্যাগ অনুমান
ইউটিউব, ইনস্টাগ্রাম, টিকটক, স্পটিফাই এবং ১৩০০+ প্লাটফর্ম
ইউআরএল ট্রান্সক্রিপশনের খরচ ক্লিপের প্রকৃত সময়ের উপর ভিত্তি করে নির্ধারিত হয় - ডাউনলোডের পর আমরা মূল্য নির্ধারণ করি। উইস্পারের ক্ষেত্রে ~৫০০ টোকেন/মিনিট আশা করা যায়।
রেকর্ডিং: 0:00

আপনার মাইক্রোফোন ব্যবহার করে বাস্তব-সময়ের অনুবাদ

ট্রান্সক্রিপশন

আপনার অডিও অনুবাদ করা হচ্ছে...

দীর্ঘ ফাইল থাকলে কিছুক্ষণ সময় লাগতে পারে।

Free.ai এর সাথে মানুষ কি অনুবাদ করে

Interviews + podcasts

প্রত্যেক স্পিকারকে ডিয়ারাইজেশন লেবেল করে। SRT সরাসরি আপনার ভিডিও সম্পাদকে রপ্তানি করুন, অথবা একটি প্রবন্ধ লিখতে প্লেইন টেক্সট।

Auto captions + subtitles

ইউটিউবে আপলোড করা ভিডিও বা টিকটক আপলোড করুন, এসআরটি বা ওয়েবভিটিটি বেছে নিন এবং / ভিডিও/সাবটাইটেল/ এর মাধ্যমে সাবটাইটেল বার্ন করুন। একই সাথে সাবটাইটেল তৈরি করা যায়।

সভা নোট

Upload a Zoom/Teams recording — get transcript + speaker labels. Pair with /write/summarize/ for bullet-point minutes.

Lectures + lessons

৯০ মিনিটের একটি বক্তৃতা অনুলিপি করুন, তারপর /স্টাডি/ফ্ল্যাশকার্ড/ অথবা /রাইট/সামাজিক/ ব্যবহার করে তাকে পাঠ্যবইতে পরিণত করুন।

বিদেশী ভাষার অডিও

হুইস্পার স্বয়ংক্রিয়ভাবে ৯৯টি ভাষা সনাক্ত করে। মূল ভাষায় অনুবাদ করুন, তারপর /translate/ এর মাধ্যমে পাঠান।

Legal + medical

টাইমসটাম্প, স্পিকার লেবেল, প্রতিটি শব্দের শুরু/শেষ সময়ের সাথে জেএসওএন রপ্তানি - সঠিক আদালত-রিপোর্টার বা ক্লিনিক্যাল-নোট প্রস্তুতি।

Free.ai অনুবাদ কিভাবে তুলনা

তুমি কি পাবে Free.ai Otter.ai Descript Rev.com
বিনামূল্যে দৈনিক ব্যবহার5K+ tokens/day300 minutes/mo1 hr/month
ইঞ্জিনWhisper large-v3, ParakeetProprietaryProprietaryHuman + AI
ভাষা99English-focused2230+
স্পিকারের ডায়ারিাইজেশন
SRT / VTT রপ্তানিPaidPaid
পাবলিক APILimitedLimited
সরাসরি স্ট্রিমিং STT (মুক্ত) Paid
সাইন-আপ আবশ্যকনাYesYesYes
প্রতিযোগিতামূলক সংখ্যা জনসাধারণের তালিকাভুক্ত বিনামূল্যে স্তরের প্রতিফলন করে ২০২৬ সাল পর্যন্ত। বর্তমান পরিকল্পনার জন্য প্রত্যেক প্রদানকারীকে পরীক্ষা করুন।
অগ্রসর অপশন
ফলাফল
টোকেন কমে যাচ্ছে। Get More Tokens
Want better results? প্রাইম মডেল (GPT-5, Claude, Gemini) deliver higher quality. View Plans

❤️ Free.ai ভালোবাসো?

সাবস্ক্রাইব করুন একটি রিফারেন্স লিংক পেতে এবং প্রতি বন্ধুর জন্য ২৫,০০০ টোকেন অর্জন করতে।

আরো চাও? ৫K টোকেন/দিন + ১০K বোনাস এর জন্য বিনামূল্যে নিবন্ধন করুন
নিবন্ধন করুন

আপনার অনুরোধ প্রসেস করা হচ্ছে...

Free STT tool powered by Whisper large-v3. Upload audio/video, get accurate speech recognition. Export SRT, VTT, TXT. 99 languages.

ব্যবহারের নিয়ম STT Online

1
আপনার ইনপুট লিখুন

টেক্সট টাইপ করুন, একটি ফাইল আপলোড করুন, অথবা আপনি যা চান তা বর্ণনা করুন। কোন অ্যাকাউন্টের প্রয়োজন নেই।

2
ক্লিক করে তৈরি করুন

আমাদের এআই সেকেন্ডের মধ্যেই আপনার আবেদনের প্রক্রিয়া সম্পন্ন করে, সে জন্য সেরা উন্মুক্ত উৎস মডেল ব্যবহার করে।

3
ডাউনলোড এবং শেয়ার

আপনার ফলাফল ডাউনলোড, অনুলিপি অথবা শেয়ার করুন। ব্যক্তিগত এবং বাণিজ্যিক ব্যবহারের জন্য বিনামূল্যে।

API-র মাধ্যমে এই টুলটি ব্যবহার করুন

আপনার নিজের কোড থেকে এই টুলটি স্বয়ংক্রিয় করুন। OpenAI-সমর্থিত REST এন্ডপয়েন্ট, Bearer-token auth, কোন অতিরিক্ত SDK প্রয়োজন নেই। টোকেন খরচ ওয়েব ইন্টারফেসের সাথে মিলবে।

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

STT Online — FAQ

STT (Speech-to-Text) converts spoken audio into written text using AI. Free.ai runs Whisper large-v3 — the most accurate open-source speech recognition model — on our own GPUs.

হ্যাঁ। ৫০০ মেগাবাইট পর্যন্ত অডিও ফাইল আপলোড করুন। STT-এর খরচ প্রতি মিনিটে ~৫০০ টোকেন। আপনি প্রতিদিন ২,৫০০-৫,০০০ বিনামূল্যে টোকেন পাবেন - প্রতিদিন একাধিক ফাইল বিনামূল্যে।

এসটিটি এমপি৩, ওয়াইভি, এমপি৪, ওয়েবএম, এম৪এ, ওজিজি, ফ্লাক গ্রহণ করে। প্রায় সব ধরনের অডিও বা ভিডিও ফরম্যাট গ্রহণ করে।

হ্যাঁ। STT ফলাফল TXT, SRT (সাবটাইটেল), অথবা VTT (ওয়েব সাবটাইটেল) হিসাবে রপ্তানি করা হবে। ইউটিউব সাবটাইটেল এবং ভিডিও সাবটাইটেলের জন্য এটি খুবই উপযুক্ত।

আমাদের এসটিটি উইস্পার লম্বা-ভি৩ ব্যবহার করে - সাধারণত ৯৫%+ শব্দের সঠিকতা পরিষ্কার ইংরেজি এবং ৯৯টি ভাষার জন্যে অসাধারণ গুণমান। পটভূমির শব্দ এবং ভারী উচ্চারণ সঠিকতা কমায়।

হ্যাঁ। STT অপশনে স্পিকার ডায়ারাইজেশন সক্রিয় করুন এবং AI সেগমেন্টগুলোকে স্পিকার ১, স্পিকার ২, ইত্যাদি হিসাবে লেবেল করবে। ৫০% বেশি টোকেন খরচ হবে।

হ্যাঁ। STT API OpenAI-র সাথে সামঞ্জস্যপূর্ণ — /v1/audio/transcriptions এ অডিও পোস্ট করুন এবং JSON গ্রহণ করুন। যেকোন ভাষা থেকে কাজ করে যা HTTP অনুরোধ পাঠাতে পারে।

হ্যাঁ। লাইভ ট্যাব আপনার মাইক্রোফোন ধারণ করে এবং STT-এর মাধ্যমে তা বাস্তব সময়ে সর্বনিম্ন বিলম্বের সাথে স্ট্রিম করে।

হ্যাঁ। ইউটিউব, টিকটক, ইনস্টাগ্রাম, স্পোটিফাই, অথবা ভিমিও ইউআরএল পেস্ট করুন এবং এসটিটি অডিওটি বের করে এবং তা অনুবাদ করে। ১৩০০+ প্ল্যাটফর্ম সমর্থিত।

দ্রুত — ১ মিনিটের একটি ক্লিপ সেকেন্ডের মধ্যে শেষ হয়, ৩০ মিনিটের একটি রেকর্ডিং প্রায় এক মিনিটে, ১ ঘণ্টার একটি ফাইল প্রায় ২ মিনিটে। হুইস্পার আমাদের GPU ক্লাস্টারে চলছে।

হ্যাঁ। অডিও আমাদের নিজস্ব GPU-তে প্রসেস করা হয় এবং STT সম্পন্ন হওয়ার পর মুছে ফেলা হয়। এটি কখনো দীর্ঘমেয়াদে সংরক্ষিত হয় না, কখনো শেয়ার করা হয় না এবং কখনো মডেল প্রশিক্ষণের জন্য ব্যবহার করা হয় না।

Whisper large-v3 — বৃহত্তম, সবচেয়ে সঠিক Whisper মডেল (১.৫৫ বিলিয়ন প্যারামিটার)। আমরা এটিকে A100 GPUs-এ স্ব-হোস্ট করেছি, যাতে এটি দ্রুত এবং গোপনীয়তাপূর্ণ হয়।

১০,০০০ টোকেন এর জন্য বিনামূল্যে নিবন্ধন করুন

ফ্রি অ্যাকাউন্ট তৈরি করুন

কোন ক্রেডিট কার্ডের প্রয়োজন নেই

আপনি কিভাবে এই টুলটি রেটিং করবেন?

Free.ai ভালোবাসো?