Wizper (Whisper v3)

Q: Wizper (Whisper v3) چيکار ميکنه؟

Wizper (Whisper v3) رونوشت صدای گفتار را به متن تبدیل میکند. یک MP3، WAV، M4A یا پرونده ویدئو را بارگذاری کنید و Wizper (Whisper v3) رونوشت کامل را به علاوه زیرنویسهای اختیاری SRT/VTT با مهرهای زمانی برمیگرداند.

Q: چند زبان را Wizper (Whisper v3) پشتیبانی میکند؟

Wizper (Whisper v3) دهها زبان را پشتیبانی میکند — مدلهای Whisper-family ۹۰+ را پوشش میدهند، Parakeet حدود ۲۵ زبان را پوشش میدهد، بقیه متفاوت هستند.

Q: آیا Wizper (Whisper v3) میتواند سخنرانان مختلف را شناسایی کند؟

Wizper (Whisper v3) رونویسی را انجام میدهد؛ دیاریزاسیون هر بخش را با برچسبهای Speaker 1 / Speaker 2 / و غیره برچسب میزند.

Q: میتونم با Wizper (Whisper v3) رونوشت کنم؟

بله — /batch/ یک پوشه پروندههای صوتی را میپذیرد. هر رونوشت در /account/?tab=history با نام پرونده اصلی قرار میگیرد. برای حفظ درخت پوشه از API استفاده کنید.

Q: وقتي با Wizper (Whisper v3) رونوشت ميکنم، خصوصيتم چطوره؟

مدلهای خود میزبانیکننده صدا را در GPUهای ما نگه میدارند؛ Premium با DPA از طریق آن عبور میکند. صدا پس از پنجره اشتراک حذف میشود (۲۴ ساعت بدون اطلاع، ۷ روز ثبت نام). ما ورودیهای شما را آموزش نمیدهیم.

Free.ai · stt · ~500 توکنها در هر minute

بارگذاری صدا

پروندۀ صوتی یا ویدئویی را رها کنید، یا نشانی وب را در زیر بچسبانید

~500 توکنها در هر minute

در پردازنده‌های گرافیکی ما آزادانه اجرا می‌شود. ارتقا برای Wizper (Whisper v3) →

Wizper (Whisper v3) is a مدل گفتار به متن. مسیریابی از طریق مدل‌های خارجی — ~500 tokens در دقیقه (۵۰٪ مارکاپ بر روی هزینه‌های بالادستی).

استفاده از طریق API

API REST سازگار با OpenAI. یک کلید تولید کنید و این مدل را در چند ثانیه فراخوانی کنید.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/wizper","audio_url":"https://..."}'

مستندات API دریافت کلید API

مدل‌های مشابه

ElevenLabs STT

Fal Speech-to-Text

مرور همۀ مدلها →

پرسشهای متداول

Wizper (Whisper v3) رونوشت صدای گفتار را به متن تبدیل می‌کند. یک MP3، WAV، M4A یا پرونده ویدئو را بارگذاری کنید و Wizper (Whisper v3) رونوشت کامل را به علاوه زیرنویس‌های اختیاری SRT/VTT با مهرهای زمانی برمی‌گرداند.

Wizper (Whisper v3) ده‌ها زبان را پشتیبانی می‌کند — مدل‌های Whisper-family ۹۰+ را پوشش می‌دهند، Parakeet حدود ۲۵ زبان را پوشش می‌دهد، بقیه متفاوت هستند.

نرخ خطای کلمه ۵–۱۰٪ در صدای انگلیسی تمیز، ۱۰–۲۰٪ در صدای پر سر و صدا یا با لهجه است.

بله — هر بخش شامل علامت زمان آغاز/پایان است. صادرات به عنوان SRT یا VTT و نقشه زمان مستقیماً روی ویدئو شما.

Wizper (Whisper v3) یک موتور رونویسی پرمیوم است. ~۵۰۰ تا ۱۵۰۰ توکن در دقیقه صدا. ۱ دلار = ۷۵۰۰۰۰ توکن.

MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) — ما صدا را استخراج می‌کنیم. حداکثر ۵۰۰ مگابایت در بارگذاری. پرونده‌های طولانی‌تر؟ با /audio/cut/ تقسیم کنید یا از /v1/stt/batch/ استفاده کنید.

Wizper (Whisper v3) رونویسی را انجام می‌دهد؛ دیاریزاسیون هر بخش را با برچسب‌های Speaker 1 / Speaker 2 / و غیره برچسب می‌زند.

بله — /batch/ یک پوشه پرونده‌های صوتی را می‌پذیرد. هر رونوشت در /account/?tab=history با نام پرونده اصلی قرار می‌گیرد. برای حفظ درخت پوشه از API استفاده کنید.

بله — POST audio خود را به /v1/stt/transcribe/ با model="Wizper (Whisper v3)". با متن + بخش‌ها + تایمز سطح کلمه JSON را برمی‌گرداند. /api/ دارای مرجع کامل است.

مدل‌های خود میزبانی‌کننده صدا را در GPUهای ما نگه می‌دارند؛ Premium با DPA از طریق آن عبور می‌کند. صدا پس از پنجره اشتراک حذف می‌شود (۲۴ ساعت بدون اطلاع، ۷ روز ثبت نام). ما ورودی‌های شما را آموزش نمی‌دهیم.

Yes — Free.ai grants commercial use of transcripts. You need rights to the audio you uploaded (your own recording, licensed material, or content with consent).

فاکتور زمان واقعی تقریباً ۰٫۰۵–۰٫۲× است — یک پادکست ۶۰ دقیقه ای در ۳–۱۲ دقیقه رونوشت می‌شود. مدل‌های پریمیوم اغلب سریعتر تمام می‌شوند.

Wizper (Whisper v3)

استفاده از طریق API

مدل‌های مشابه

پرسشهای متداول

Wizper (Whisper v3) چيکار ميکنه؟

چند زبان را Wizper (Whisper v3) پشتیبانی می‌کند؟

چقدر دقیقه Wizper (Whisper v3)؟

آیا Wizper (Whisper v3) شامل مهرهای زمانی است؟

هر دقیقه چقدر هزینه داره؟

چه قالب‌های صوتی را می‌توانم به Wizper (Whisper v3) بارگذاری کنم؟

آیا Wizper (Whisper v3) می‌تواند سخنرانان مختلف را شناسایی کند؟

میتونم با Wizper (Whisper v3) رونوشت کنم؟

آیا یک API برای Wizper (Whisper v3) وجود دارد؟

وقتي با Wizper (Whisper v3) رونوشت ميکنم، خصوصيتم چطوره؟

آیا خروجی Wizper (Whisper v3) برای استفاده تجاری امن است؟

چقدر طول ميکشه؟

10000 توکن رایگان دریافت کنید

صبر کن - 10K توکن رایگان دریافت کن!

بيشتر ميخواي؟