رونوشت تبتی آزاد

رونوشت تبتی صدا و ویدئوی به متن با هوش مصنوعی. سریع، دقیق و رایگان.

چطور کار میکنه

  1. برو به Free.ai رونوشت‌کننده
  2. پرونده‌ی صوتی یا ویدئویی تبتی خود را بارگذاری کنید
  3. هوش مصنوعی ما تبتی را به طور خودکار تشخیص می‌دهد و آن را رونوشت می‌کند
  4. بارگیری رونوشت خود به عنوان متن یا زیرنویس SRT

تبتی ویژگی‌های رونوشت

  • با سرعت ویشیپر (مجوز ام‌آی‌تی)
  • تشخیص خودکار زبان تبتی
  • پشتیبانی از MP3، WAV، MP4، M4A، FLAC و بیشتر
  • صادرات مهرهای زمانی و زیرنویس) SRT (
  • محدودیت اندازۀ پرونده در برنامه‌های پرداختی وجود ندارد
  • خصوصی و امن -- پرونده‌ها پس از پردازش حذف می‌شوند

جزئیات زبان

زبانتبتی
کد ISObo
مدلآهسته تر زمزمه کن
قیمتآزاد

زبانهای بیشتری

نمایش همۀ زبانها

پرسش و پاسخ

تبتی is a less-resourced language for Whisper — large-v3-turbo sits above 25% word error rate, sometimes well above. The transcript is useful for search and gist but should not be treated as publication-ready. If a higher-accuracy engine becomes available for تبتی we wire it in automatically.(Tier D, over 25% word error rate on benchmark sets — ما سطوح صادق WER را به جای ادعاهای بازاریابی منتشر می‌کنیم.)

بله — تبتی رونوشت از توکن روزانه رایگان شما اول استفاده می‌کند. صدا حدود ۵۰ توکن در دقیقه هزینه دارد، بنابراین توکن روزانه ناشناس چند ساعت صدا در روز را پوشش می‌دهد. حساب‌های ثبت‌نام شده یک توکن بزرگتر به علاوه ۱۰۰۰۰ توکن ثبت‌نام دریافت می‌کنند. پس از آن، ۱ دلار ۷۵۰۰۰۰ توکن (~۲۵۰ ساعت صدا) می‌خرد.

تبتی رونوشت‌ها در استاندارد UTF-8 با املای عادی زبان برگردانده می‌شوند.

MP3, WAV, M4A, FLAC, OGG, OPUS, و WEBM مستقیماً پذیرفته می‌شوند. برای ویدئو (MP4, MOV, MKV) ما شیار صوتی را قبل از ارسال آن به Whisper در سمت کارساز استخراج می‌کنیم — نیازی نیست که خودتان چیزی را تبدیل کنید. خط لوله یکسان بدون توجه به زبان منبع، از جمله تبتی.

حد بارگذاری ناشناس در حدود ۵۰۰ مگابایت برای هر پرونده است. حساب‌های ثبت شده تا ۲ گیگابایت می‌روند. طول مدت محدودیت سختی نیست — پرونده‌های طولانی به صورت خودکار به قطعات تقسیم می‌شوند (پنجره ۳۰ ثانیه‌ای با همپوشانی) و به یک رونوشت واحد با مهره‌های زمانی پیوسته دوخت می‌شوند. ضبط‌های چند ساعته تبتی (پادکاست‌ها، سخنرانی‌های کامل، جلسات) خوب کار می‌کنند.

بله — به صورت پیش‌فرض ، نگارش روزنامه سخنران برای هر رونوشت تبتی فعال است. خروجی به عنوان سخنران ۱ / سخنران ۲ / سخنران ۳ با مهرهای زمانی تقسیم می‌شود ، بنابراین مصاحبه‌ها ، بحثهای گروهی و جلسات چند نفره برچسب‌دار برمی‌گردند. نگارش روزنامه بر روی یک مدل جداگانه اجرا می‌شود و در تمام زبان‌هایی که پشتیبانی می‌کنیم ، یکسان کار می‌کند.

بله — آدرس را در /transcribe/youtube/ برای یوتیوب یا /transcribe/podcast/ برای پادکست‌های (Apple، Spotify، RSS) کپی کنید. ما صدا را دانلود می‌کنیم، آن را از طریق Whisper با language=bo اجرا می‌کنیم، و رونوشت را با مهر زمان و برچسب‌های سخنران برمی‌گردانیم. محتوای معمول تبتی: سخنرانی‌ها، مصاحبه‌ها، یادداشت‌های صوتی و محتوای یوتیوب در تبتی همه کار می‌کنند — یک آدرس را به /transcribe/youtube/ بچسبانید یا مستقیماً پرونده را آپلود کنید.

یک دلار ۷۵۰۰۰۰ توکن می‌خرد که معادل ۲۵۰ ساعت صدا در هر دلار است. بیشتر کاربران هیچ وقت چیزی خرج نمی‌کنند - مجموعه روزانه رایگان کلیپ‌های کوتاه، یادداشت‌های صوتی و پادکست‌های یکبار مصرف را پوشش می‌دهد.

بله — هر دو مهر زمان سطح بخش (هر ~۱۰-۳۰ ثانیه) و سطح کلمه در دسترس هستند. سطح کلمه پیش‌فرض برای صادرات زیرنویس VTT/SRT است، بنابراین زیرنویس‌ها خط به خط همگام‌سازی می‌شوند. در API، timestamps="word" را در بدنه درخواست تنظیم کنید. تبتی رونوشت‌ها در استاندارد UTF-8 با املای عادی زبان برگردانده می‌شوند.

بله. ارسال صدا (مختلف/داده‌های فرم، نام حوزه "پرونده") به /v1/transcribe/ با language=bo — یا پارامتر زبان را حذف کنید تا Whisper خودکار تشخیص دهد. JSON را با رونوشت، بخش‌ها، مهرهای زمانی و برچسب‌های بلندگو برمی‌گرداند. مرجع کامل و قطعه‌های SDK در /api/.

بله — هنگامی که رونوشت تمام شد، بر روی ترجمه کلیک کنید یا متن را در /translate/ بچسبانید. تبتی با هر زبان دیگری که پشتیبانی می‌کنیم (۲۰۰+) جفت می‌شود. برای جلسات جلسات رونوشت را از طریق /summarize/ لوله کنید؛ برای دوبلاژ آن را به /voice/tts/ بفرستید تا صدا را در زبان هدف بازسازی کنید.

آموزش نویز Whisper در این سطح کمک کمتری می‌کند — تنگنا مقدار صدای تبتی است که Whisper در طول آموزش دیده‌است، نه نویز. صدای استودیوی تمیز هنوز از صدای پر سر و صدا پیشی می‌گیرد، اما هر دو به دقت دست نمی‌یابند که در یک زبان منابع بالا به دست می‌آید.اگر یک رونوشت غیرقابل استفاده برگردد، با فایل به contact@free.ai ایمیل بزنید — ما توکن‌ها را بازگردانده و بررسی می‌کنیم که آیا موتور دیگری صدای شما را بهتر مدیریت می‌کند.

دوست Free.ai رو به دوستانت بگو

رتبه بندی این صفحه