Question 1

Fal Speech-to-Text কি করে?

Accepted Answer

Fal Speech-to-Text উচ্চারিত অডিওকে টেক্সটে রূপান্তর করে। MP3, WAV, M4A, অথবা ভিডিও ফাইল আপলোড করুন এবং Fal Speech-to-Text টাইমসটেম্প সহযোগে সম্পূর্ণ ট্রান্সক্রিপশন এবং বৈকল্পিক SRT/VTT সাবটাইটেল ফিরিয়ে দেবে।

Question 2

Fal Speech-to-Text কতটি ভাষা সমর্থন করে?

Accepted Answer

Fal Speech-to-Text ডজনখানেক ভাষার ব্যবস্থা করে — Whisper-পরিবার মডেল ৯০+, Parakeet ~২৫, অন্যান্যদের মধ্যে পার্থক্য করে। সর্বোচ্চ সঠিকতার জন্য "স্বয়ংক্রিয়ভাবে সনাক্ত করুন" বা ভাষা নির্ধারণ করুন।

Question 3

Fal Speech-to-Text কতটা সঠিক?

Accepted Answer

শব্দ-ত্রুটির হার পরিষ্কার ইংরেজি অডিওতে ৫-১০%, ঝামেলাপূর্ণ অথবা উচ্চারিত অডিওতে ১০-২০%। একই স্থাপত্যের বড় ধরনের বৈচিত্র্য কঠিন ক্ষেত্রে অর্থপূর্ণভাবে ভাল কাজ করে - অডিওটি রুক্ষ হলে বড় ধরনের বেছে নিন।

Question 4

Fal Speech-to-Text-এ কি টাইমসম্যাপ অন্তর্ভুক্ত আছে?

Accepted Answer

হ্যাঁ — প্রতিটি সেগমেন্টে শুরু/শেষ সময়সূচী অন্তর্ভুক্ত রয়েছে। SRT অথবা VTT হিসাবে রপ্তানি করুন এবং সময়সূচী সরাসরি আপনার ভিডিওতে ম্যাপ করুন।

Question 5

Fal Speech-to-Text এর প্রতি মিনিটে খরচ কত?

Accepted Answer

Fal Speech-to-Text একটি প্রিমিয়াম ট্রান্সক্রিপশন ইঞ্জিন। প্রতি মিনিটে অডিওতে প্রায় ~৫০০-১,৫০০ টোকেন। $১ = ৭৫০,০০০ টোকেন।

Question 6

Fal Speech-to-Text এ আমি কি ধরনের অডিও ফাইল আপলোড করতে পারি?

Accepted Answer

MP3, WAV, M4A, FLAC, OGG, এবং ভিডিও (MP4, MOV, WebM) — আমরা অডিও এক্সট্র্যাক্ট করব। প্রতি আপলোডে সর্বোচ্চ ৫০০ মেগাবাইট। দীর্ঘ ফাইল? /audio/cut/ ব্যবহার করে বিভক্ত করুন অথবা /v1/stt/batch/ ব্যবহার করুন।

Question 7

Fal Speech-to-Text কি বিভিন্ন বক্তাদের চিহ্নিত করতে পারে?

Accepted Answer

স্পিকারের ডায়ারিজম একটি আলাদা পাস — /transcribe/ এ "diarize" টগল করুন। Fal Speech-to-Text অনুবাদ ব্যবস্থাপনা করে; ডায়ারিজম প্রত্যেকটি অংশকে স্পিকার ১ / স্পিকার ২ / ইত্যাদির সাথে লেবেল করে।

Question 8

আমি কি Fal Speech-to-Text এর সাথে ব্যাচ ট্রান্সক্রিপ্ট করতে পারি?

Accepted Answer

হ্যাঁ — /batch/ অডিও ফাইলের ফোল্ডার গ্রহণ করে। প্রত্যেকটি ট্রান্সক্রিপ্ট মূল ফাইলের নাম সহ /account/?tab=history এ অবস্থিত হয়। ফোল্ডার-ট্রী সংরক্ষণের জন্য API ব্যবহার করুন।

Question 9

Fal Speech-to-Text-এর জন্য কি কোনো API আছে?

Accepted Answer

হ্যাঁ — আপনার অডিও /v1/stt/transcribe/ এ POST করুন, যার মডেল হল "Fal Speech-to-Text"। JSON ফিরিয়ে আনে, যাতে আছে টেক্সট + সেগমেন্ট + শব্দ-স্তরের সময়সূচী। /api/-এ সম্পূর্ণ রেফারেন্স রয়েছে।

Question 10

আমি যখন Fal Speech-to-Text ব্যবহার করে লেখা লিখব তখন আমার গোপনীয়তা নিয়ে কি হবে?

Accepted Answer

স্ব-হোস্টকৃত মডেলগুলি আমাদের GPU-তে অডিও সংরক্ষণ করে; প্রাইম একটি DPA-র মাধ্যমে প্রবেশ করে। শেয়ার-উইন্ডোর পরে অডিও মুছে ফেলা হয় (২৪ ঘন্টা অবৈধ, ৭ দিন লগ-ইন)। আমরা আপনার ইনপুটগুলিতে প্রশিক্ষণ দিই না।

Question 11

Fal Speech-to-Text আউটপুট কি বাণিজ্যিক ব্যবহারের জন্য নিরাপদ?

Accepted Answer

Yes — Free.ai grants commercial use of transcripts. You need rights to the audio you uploaded (your own recording, licensed material, or content with consent).

Question 12

Fal Speech-to-Text কতক্ষণ লাগবে?

Accepted Answer

বাস্তব সময়ের ফ্যাক্টর হল প্রায় ০.০৫–০.২× — ৬০ মিনিটের একটি পডকাস্ট ৩–১২ মিনিটে অনুবাদ করা হয়। প্রাইম মডেলগুলি সাধারণত দ্রুত শেষ হয়। ট্যাবটি বন্ধ করতে লাইন বাটন ব্যবহার করুন।

Fal Speech-to-Text

API ব্যবহার করো

একই ধরনের মডেল

প্রায়শই জিজ্ঞাসিত প্রশ্ন

Fal Speech-to-Text

API ব্যবহার করো

একই ধরনের মডেল

প্রায়শই জিজ্ঞাসিত প্রশ্ন