faster-whisper large-v3
Free.ai (self-hosted)
·
stt
·
~500 אסימונים לכל minute
faster-whisper large-v3 is a דגם דיבור אל טקסט built by OpenAI / SYSTRAN. החזק ביותר ב Accurate transcription. מארח את עצמו על Free.ai GPUS □ פועל חופשי נגד בריכת האסימון היומית שלך ( 500 אסימונים לדקה. Released under MIT — commercial use permitted on Free.ai.
השתמש באמצעות API
OpenAI-התאמה מנוחה API. ליצור מפתח ולקרוא מודל זה בשניות.
curl -X POST https://api.free.ai/v1/stt/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"faster-whisper-large-v3","audio_url":"https://..."}'
תיעוד API
קבל מפתח API
שאלות ששואלים לעתים קרובות
faster-whisper large-v3 transcribes spoken audio into text. Upload an MP3, WAV, M4A, or video file and faster-whisper large-v3 returns the full transcript plus optional SRT/VTT subtitles with timestamps.
faster-whisper large-v3 handles dozens of languages — Whisper-family models cover 90+, Parakeet covers ~25, others vary. Pick "auto-detect" or specify the language for highest accuracy.
שיעור המילים הוא 5°10% על אודיו אנגלי נקי, 10^20% על אודיו רועש או מבטא. גרסאות גדולות של אותה ארכיטקטורה משתפרות באופן משמעותי במקרים קשים □ לבחור גדול יותר כאשר האודיו הוא מחוספס.
כן, כל קטע כולל חותמת זמן התחלה/ סוף. יצוא כ- SRT או VTT ו- Timemap ישירות על גבי הווידאו שלך.
faster-whisper large-v3 runs on our own GPUs against your daily free pool first; $5 → 200,000 paid tokens after that. About ~500 tokens per minute.
MP3, WAV, M4A, FLAC, OGG, בתוספת וידאו (MP4, MOV, WebM) □ אנו לחלץ את האודיו. מקס 500 MB לטעינה. קבצים ארוכים יותר? פצל עם / audio/cut / או להשתמש /v1/st/batch/.
Diarization רמקולים (באנגלית: Speaker diarization) הוא מעבר נפרד, המייצג תוויות diarization כל קטע עם דובר 1 / יו"ר 2 / וכו'.
כל תמליל נוחת ב־ eccount/? tab=history with the original name. עבור שימור עץ התיקייה להשתמש ב־ API.
כן □ POST הקול שלך אל / v1/st/tranchive/ with model="faster-whisper large-v3." Returns JSON with text + pages + word-late timestamps. / Api / has the full reference.
מודלים מארחים עצמיים שומרים אודיו על GPUs שלנו; פרמיה עוברת עם DPA. שמע נמחק לאחר חלון שיתוף (24h Anon, 7d חתם ב). אנחנו לא מתאמנים על הקלטים שלך.
כן, Free.ai מענקים שימוש מסחרי בתעתיקים. אתה צריך זכויות על השמע שהעלית (הקלטה משלך, חומר מורשה, או תוכן בהסכמה).
גורם בזמן אמת הוא בערך 0.050. 2× podcast 60 דקות trancripts in 3×12 minutes. דגמי Premium לעתים קרובות לסיים מהר יותר. השתמש בכפתור התור כדי לסגור את הלשונית.