رونوشت ژاپنی آزاد
رونوشت ژاپنی صدا و ویدئوی به متن با هوش مصنوعی. سریع، دقیق و رایگان.
چطور کار میکنه
- برو به Free.ai رونوشتکننده
- پروندهی صوتی یا ویدئویی ژاپنی خود را بارگذاری کنید
- هوش مصنوعی ما ژاپنی را به طور خودکار تشخیص میدهد و آن را رونوشت میکند
- بارگیری رونوشت خود به عنوان متن یا زیرنویس SRT
ژاپنی ویژگیهای رونوشت
- ✓با سرعت ویشیپر (مجوز امآیتی)
- ✓تشخیص خودکار زبان ژاپنی
- ✓پشتیبانی از MP3، WAV، MP4، M4A، FLAC و بیشتر
- ✓صادرات مهرهای زمانی و زیرنویس) SRT (
- ✓محدودیت اندازۀ پرونده در برنامههای پرداختی وجود ندارد
- ✓خصوصی و امن -- پروندهها پس از پردازش حذف میشوند
جزئیات زبان
| زبان | ژاپنی |
| کد ISO | ja |
| مدل | آهسته تر زمزمه کن |
| قیمت | آزاد |
زبانهای بیشتری
نمایش همۀ زبانهاپرسش و پاسخ
Whisper large-v3-turbo در سطح دقت بالایی در ژاپنی قرار دارد - کمتر از ۷٪ نرخ خطای کلمه در معیارهای استاندارد. در عمل این به این معنی است که صدای استودیوی تمیز تقریباً کامل برمیگردد، و صدای مکالمه با تمیز کردن حداقل قابل استفاده است.(Tier A, under 7% word error rate on benchmark sets — ما سطوح صادق WER را به جای ادعاهای بازاریابی منتشر میکنیم.)
بله — ژاپنی رونوشت از توکن روزانه رایگان شما اول استفاده میکند. صدا حدود ۵۰ توکن در دقیقه هزینه دارد، بنابراین توکن روزانه ناشناس چند ساعت صدا در روز را پوشش میدهد. حسابهای ثبتنام شده یک توکن بزرگتر به علاوه ۱۰۰۰۰ توکن ثبتنام دریافت میکنند. پس از آن، ۱ دلار ۷۵۰۰۰۰ توکن (~۲۵۰ ساعت صدا) میخرد.
ژاپنی رونوشتها در اسکریپت بومی (UTF-8) بازگردانده میشوند. ژاپنی متن هیچ فضایی بین کلمات ندارد؛ مهرهای زمانی دیاریزاسیون، وقفههای طبیعی را در نوبتهای سخنرانان اضافه میکنند.
MP3, WAV, M4A, FLAC, OGG, OPUS, و WEBM مستقیماً پذیرفته میشوند. برای ویدئو (MP4, MOV, MKV) ما شیار صوتی را قبل از ارسال آن به Whisper در سمت کارساز استخراج میکنیم — نیازی نیست که خودتان چیزی را تبدیل کنید. خط لوله یکسان بدون توجه به زبان منبع، از جمله ژاپنی.
حد بارگذاری ناشناس در حدود ۵۰۰ مگابایت برای هر پرونده است. حسابهای ثبت شده تا ۲ گیگابایت میروند. طول مدت محدودیت سختی نیست — پروندههای طولانی به صورت خودکار به قطعات تقسیم میشوند (پنجره ۳۰ ثانیهای با همپوشانی) و به یک رونوشت واحد با مهرههای زمانی پیوسته دوخت میشوند. ضبطهای چند ساعته ژاپنی (پادکاستها، سخنرانیهای کامل، جلسات) خوب کار میکنند.
بله — به صورت پیشفرض ، نگارش روزنامه سخنران برای هر رونوشت ژاپنی فعال است. خروجی به عنوان سخنران ۱ / سخنران ۲ / سخنران ۳ با مهرهای زمانی تقسیم میشود ، بنابراین مصاحبهها ، بحثهای گروهی و جلسات چند نفره برچسبدار برمیگردند. نگارش روزنامه بر روی یک مدل جداگانه اجرا میشود و در تمام زبانهایی که پشتیبانی میکنیم ، یکسان کار میکند.
بله — آدرس را در /transcribe/youtube/ برای یوتیوب یا /transcribe/podcast/ برای پادکستهای (Apple، Spotify، RSS) کپی کنید. ما صدا را دانلود میکنیم، آن را از طریق Whisper با language=ja اجرا میکنیم، و رونوشت را با مهر زمان و برچسبهای سخنران برمیگردانیم. محتوای معمول ژاپنی: پادکستها، سخنرانیها، مصاحبهها و محتوای طولانی یوتیوب در ژاپنی رایجترین کارهایی هستند که ما میبینیم.
یک دلار ۷۵۰۰۰۰ توکن میخرد که معادل ۲۵۰ ساعت صدا در هر دلار است. بیشتر کاربران هیچ وقت چیزی خرج نمیکنند - مجموعه روزانه رایگان کلیپهای کوتاه، یادداشتهای صوتی و پادکستهای یکبار مصرف را پوشش میدهد.
بله — هر دو مهر زمان سطح بخش (هر ~۱۰-۳۰ ثانیه) و سطح کلمه در دسترس هستند. سطح کلمه پیشفرض برای صادرات زیرنویس VTT/SRT است، بنابراین زیرنویسها خط به خط همگامسازی میشوند. در API، timestamps="word" را در بدنه درخواست تنظیم کنید. ژاپنی رونوشتها در اسکریپت بومی (UTF-8) بازگردانده میشوند. ژاپنی متن هیچ فضایی بین کلمات ندارد؛ مهرهای زمانی دیاریزاسیون، وقفههای طبیعی را در نوبتهای سخنرانان اضافه میکنند.
بله. ارسال صدا (مختلف/دادههای فرم، نام حوزه "پرونده") به /v1/transcribe/ با language=ja — یا پارامتر زبان را حذف کنید تا Whisper خودکار تشخیص دهد. JSON را با رونوشت، بخشها، مهرهای زمانی و برچسبهای بلندگو برمیگرداند. مرجع کامل و قطعههای SDK در /api/.
بله — هنگامی که رونوشت تمام شد، بر روی ترجمه کلیک کنید یا متن را در /translate/ بچسبانید. ژاپنی با هر زبان دیگری که پشتیبانی میکنیم (۲۰۰+) جفت میشود. برای جلسات جلسات رونوشت را از طریق /summarize/ لوله کنید؛ برای دوبلاژ آن را به /voice/tts/ بفرستید تا صدا را در زبان هدف بازسازی کنید.
Whisper بر روی ۶۸۰K ساعت صدای پر سر و صدای واقعی آموزش داده شده است، بنابراین رونویسی ژاپنی در برابر سر و صدای پس زمینه، تختهای موسیقی و ضبطهای با کیفیت تلفنی مقاوم است. قطع شدید یا بلندگوهای چند گانه همپوشانی همچنان دقت را مختل میکند.اگر یک رونوشت غیرقابل استفاده برگردد، با فایل به contact@free.ai ایمیل بزنید — ما توکنها را بازگردانده و بررسی میکنیم که آیا موتور دیگری صدای شما را بهتر مدیریت میکند.