Q: آیا ژاپنی رونوشت صوتی به متن رایگان است؟

بله — ژاپنی رونوشت از توکن روزانه رایگان شما اول استفاده میکند. صدا حدود ۵۰ توکن در دقیقه هزینه دارد، بنابراین توکن روزانه ناشناس چند ساعت صدا در روز را پوشش میدهد. حسابهای ثبتنام شده یک توکن بزرگتر به علاوه ۱۰۰۰۰ توکن ثبتنام دریافت میکنند. پس از آن، ۱ دلار ۷۵۰۰۰۰ توکن (~۲۵۰ ساعت صدا) میخرد.

Q: چه اسکریپت و املایی ژاپنی رونوشت استفاده میکند؟

ژاپنی رونوشتها در اسکریپت بومی (UTF-8) بازگردانده میشوند. ژاپنی متن هیچ فضایی بین کلمات ندارد؛ مهرهای زمانی دیاریزاسیون، وقفههای طبیعی را در نوبتهای سخنرانان اضافه میکنند.

Q: چه قالبهای صوتی برای رونویسی ژاپنی پشتیبانی میشوند؟

MP3, WAV, M4A, FLAC, OGG, OPUS, و WEBM مستقیماً پذیرفته میشوند. برای ویدئو (MP4, MOV, MKV) ما شیار صوتی را قبل از ارسال آن به Whisper در سمت کارساز استخراج میکنیم — نیازی نیست که خودتان چیزی را تبدیل کنید. خط لوله یکسان بدون توجه به زبان منبع، از جمله ژاپنی.

Q: آیا ژاپنی رونوشت گویندگان مختلف را شناسایی میکند؟

بله — به صورت پیشفرض ، نگارش روزنامه سخنران برای هر رونوشت ژاپنی فعال است. خروجی به عنوان سخنران ۱ / سخنران ۲ / سخنران ۳ با مهرهای زمانی تقسیم میشود ، بنابراین مصاحبهها ، بحثهای گروهی و جلسات چند نفره برچسبدار برمیگردند. نگارش روزنامه بر روی یک مدل جداگانه اجرا میشود و در تمام زبانهایی که پشتیبانی میکنیم ، یکسان کار میکند.

Q: یک ساعت صدای ژاپنی چقدر به صورت توکن هزینه دارد؟

یک دلار ۷۵۰۰۰۰ توکن میخرد که معادل ۲۵۰ ساعت صدا در هر دلار است. بیشتر کاربران هیچ وقت چیزی خرج نمیکنند - مجموعه روزانه رایگان کلیپهای کوتاه، یادداشتهای صوتی و پادکستهای یکبار مصرف را پوشش میدهد.

Q: آیا یک API برای رونویسی ژاپنی وجود دارد؟

بله. ارسال صدا (مختلف/دادههای فرم، نام حوزه "پرونده") به /v1/transcribe/ با language=ja — یا پارامتر زبان را حذف کنید تا Whisper خودکار تشخیص دهد. JSON را با رونوشت، بخشها، مهرهای زمانی و برچسبهای بلندگو برمیگرداند. مرجع کامل و قطعههای SDK در /api/.

Question 1

رونوشت Whisper برای ژاپنی چقدر دقیق است؟

Accepted Answer

Whisper large-v3-turbo در سطح دقت بالایی در ژاپنی قرار دارد - کمتر از ۷٪ نرخ خطای کلمه در معیارهای استاندارد. در عمل این به این معنی است که صدای استودیوی تمیز تقریباً کامل برمی‌گردد، و صدای مکالمه با تمیز کردن حداقل قابل استفاده است.(Tier A, under 7% word error rate on benchmark sets — ما سطوح صادق WER را به جای ادعاهای بازاریابی منتشر می‌کنیم.)

Question 2

آیا ژاپنی رونوشت صوتی به متن رایگان است؟

Accepted Answer

بله — ژاپنی رونوشت از توکن روزانه رایگان شما اول استفاده می‌کند. صدا حدود ۵۰ توکن در دقیقه هزینه دارد، بنابراین توکن روزانه ناشناس چند ساعت صدا در روز را پوشش می‌دهد. حساب‌های ثبت‌نام شده یک توکن بزرگتر به علاوه ۱۰۰۰۰ توکن ثبت‌نام دریافت می‌کنند. پس از آن، ۱ دلار ۷۵۰۰۰۰ توکن (~۲۵۰ ساعت صدا) می‌خرد.

Question 3

چه اسکریپت و املایی ژاپنی رونوشت استفاده می‌کند؟

Accepted Answer

ژاپنی رونوشت‌ها در اسکریپت بومی (UTF-8) بازگردانده می‌شوند. ژاپنی متن هیچ فضایی بین کلمات ندارد؛ مهرهای زمانی دیاریزاسیون، وقفه‌های طبیعی را در نوبت‌های سخنرانان اضافه می‌کنند.

Question 4

چه قالب‌های صوتی برای رونویسی ژاپنی پشتیبانی می‌شوند؟

Accepted Answer

MP3, WAV, M4A, FLAC, OGG, OPUS, و WEBM مستقیماً پذیرفته می‌شوند. برای ویدئو (MP4, MOV, MKV) ما شیار صوتی را قبل از ارسال آن به Whisper در سمت کارساز استخراج می‌کنیم — نیازی نیست که خودتان چیزی را تبدیل کنید. خط لوله یکسان بدون توجه به زبان منبع، از جمله ژاپنی.

Question 5

چقدر طول یک پرونده صوتی ژاپنی می‌تواند داشته باشد؟

Accepted Answer

حد بارگذاری ناشناس در حدود ۵۰۰ مگابایت برای هر پرونده است. حساب‌های ثبت شده تا ۲ گیگابایت می‌روند. طول مدت محدودیت سختی نیست — پرونده‌های طولانی به صورت خودکار به قطعات تقسیم می‌شوند (پنجره ۳۰ ثانیه‌ای با همپوشانی) و به یک رونوشت واحد با مهره‌های زمانی پیوسته دوخت می‌شوند. ضبط‌های چند ساعته ژاپنی (پادکاست‌ها، سخنرانی‌های کامل، جلسات) خوب کار می‌کنند.

Question 6

آیا ژاپنی رونوشت گویندگان مختلف را شناسایی می‌کند؟

Accepted Answer

بله — به صورت پیش‌فرض ، نگارش روزنامه سخنران برای هر رونوشت ژاپنی فعال است. خروجی به عنوان سخنران ۱ / سخنران ۲ / سخنران ۳ با مهرهای زمانی تقسیم می‌شود ، بنابراین مصاحبه‌ها ، بحثهای گروهی و جلسات چند نفره برچسب‌دار برمی‌گردند. نگارش روزنامه بر روی یک مدل جداگانه اجرا می‌شود و در تمام زبان‌هایی که پشتیبانی می‌کنیم ، یکسان کار می‌کند.

Question 7

آیا می‌توانم یک ویدئوی یا پادکست ژاپنی یوتیوب را رونوشت کنم؟

Accepted Answer

بله — آدرس را در /transcribe/youtube/ برای یوتیوب یا /transcribe/podcast/ برای پادکست‌های (Apple، Spotify، RSS) کپی کنید. ما صدا را دانلود می‌کنیم، آن را از طریق Whisper با language=ja اجرا می‌کنیم، و رونوشت را با مهر زمان و برچسب‌های سخنران برمی‌گردانیم. محتوای معمول ژاپنی: پادکست‌ها، سخنرانی‌ها، مصاحبه‌ها و محتوای طولانی یوتیوب در ژاپنی رایج‌ترین کارهایی هستند که ما می‌بینیم.

Question 8

یک ساعت صدای ژاپنی چقدر به صورت توکن هزینه دارد؟

Accepted Answer

یک دلار ۷۵۰۰۰۰ توکن می‌خرد که معادل ۲۵۰ ساعت صدا در هر دلار است. بیشتر کاربران هیچ وقت چیزی خرج نمی‌کنند - مجموعه روزانه رایگان کلیپ‌های کوتاه، یادداشت‌های صوتی و پادکست‌های یکبار مصرف را پوشش می‌دهد.

Question 9

آیا می‌توانم مهر زمان سطح کلمه را برای صدای ژاپنی بدست آورم؟

Accepted Answer

بله — هر دو مهر زمان سطح بخش (هر ~۱۰-۳۰ ثانیه) و سطح کلمه در دسترس هستند. سطح کلمه پیش‌فرض برای صادرات زیرنویس VTT/SRT است، بنابراین زیرنویس‌ها خط به خط همگام‌سازی می‌شوند. در API، timestamps="word" را در بدنه درخواست تنظیم کنید. ژاپنی رونوشت‌ها در اسکریپت بومی (UTF-8) بازگردانده می‌شوند. ژاپنی متن هیچ فضایی بین کلمات ندارد؛ مهرهای زمانی دیاریزاسیون، وقفه‌های طبیعی را در نوبت‌های سخنرانان اضافه می‌کنند.

Question 10

آیا یک API برای رونویسی ژاپنی وجود دارد؟

Accepted Answer

بله. ارسال صدا (مختلف/داده‌های فرم، نام حوزه "پرونده") به /v1/transcribe/ با language=ja — یا پارامتر زبان را حذف کنید تا Whisper خودکار تشخیص دهد. JSON را با رونوشت، بخش‌ها، مهرهای زمانی و برچسب‌های بلندگو برمی‌گرداند. مرجع کامل و قطعه‌های SDK در /api/.

Question 11

میتونم متن ژاپنی رو به یه زبان دیگه ترجمه کنم؟

Accepted Answer

بله — هنگامی که رونوشت تمام شد، بر روی ترجمه کلیک کنید یا متن را در /translate/ بچسبانید. ژاپنی با هر زبان دیگری که پشتیبانی می‌کنیم (۲۰۰+) جفت می‌شود. برای جلسات جلسات رونوشت را از طریق /summarize/ لوله کنید؛ برای دوبلاژ آن را به /voice/tts/ بفرستید تا صدا را در زبان هدف بازسازی کنید.

Question 12

اگر صدای ژاپنی سر و صدا یا با کیفیت پایین باشد چه؟

Accepted Answer

Whisper بر روی ۶۸۰K ساعت صدای پر سر و صدای واقعی آموزش داده شده است، بنابراین رونویسی ژاپنی در برابر سر و صدای پس زمینه، تخت‌های موسیقی و ضبط‌های با کیفیت تلفنی مقاوم است. قطع شدید یا بلندگوهای چند گانه همپوشانی همچنان دقت را مختل می‌کند.اگر یک رونوشت غیرقابل استفاده برگردد، با فایل به contact@free.ai ایمیل بزنید — ما توکن‌ها را بازگردانده و بررسی می‌کنیم که آیا موتور دیگری صدای شما را بهتر مدیریت می‌کند.

زبان	ژاپنی
کد ISO	`ja`
مدل	آهسته تر زمزمه کن
قیمت	آزاد

رونوشت ژاپنی آزاد

چطور کار میکنه

ژاپنی ویژگی‌های رونوشت

جزئیات زبان

زبانهای بیشتری

پرسش و پاسخ