faster-whisper large-v3

Free.ai (self-hosted) · stt · ~500 אסימונים לכל minute

העלה שמע

זרוק קובץ שמע או וידאו, או הדבק כתובת למטה

~500 אסימונים לכל minute

faster-whisper large-v3 is a דגם דיבור אל טקסט built by OpenAI / SYSTRAN. החזק ביותר ב Accurate transcription. מארח את עצמו על Free.ai GPUS □ פועל חופשי נגד בריכת האסימון היומית שלך ( 500 אסימונים לדקה. Released under MIT — commercial use permitted on Free.ai.

השתמש באמצעות API

OpenAI-התאמה מנוחה API. ליצור מפתח ולקרוא מודל זה בשניות.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"faster-whisper-large-v3","audio_url":"https://..."}'

תיעוד API קבל מפתח API

מודלים דומים

ElevenLabs STT

Fal Speech-to-Text

Wizper (Whisper v3)

עיין בכל המודלים →

שאלות ששואלים לעתים קרובות

faster-whisper large-v3 transcribes spoken audio into text. Upload an MP3, WAV, M4A, or video file and faster-whisper large-v3 returns the full transcript plus optional SRT/VTT subtitles with timestamps.

faster-whisper large-v3 handles dozens of languages — Whisper-family models cover 90+, Parakeet covers ~25, others vary. Pick "auto-detect" or specify the language for highest accuracy.

שיעור המילים הוא 5°10% על אודיו אנגלי נקי, 10^20% על אודיו רועש או מבטא. גרסאות גדולות של אותה ארכיטקטורה משתפרות באופן משמעותי במקרים קשים □ לבחור גדול יותר כאשר האודיו הוא מחוספס.

כן, כל קטע כולל חותמת זמן התחלה/ סוף. יצוא כ- SRT או VTT ו- Timemap ישירות על גבי הווידאו שלך.

faster-whisper large-v3 runs on our own GPUs against your daily free pool first; $5 → 200,000 paid tokens after that. About ~500 tokens per minute.

MP3, WAV, M4A, FLAC, OGG, בתוספת וידאו (MP4, MOV, WebM) □ אנו לחלץ את האודיו. מקס 500 MB לטעינה. קבצים ארוכים יותר? פצל עם / audio/cut / או להשתמש /v1/st/batch/.

Diarization רמקולים (באנגלית: Speaker diarization) הוא מעבר נפרד, המייצג תוויות diarization כל קטע עם דובר 1 / יו"ר 2 / וכו'.

כל תמליל נוחת ב־ eccount/? tab=history with the original name. עבור שימור עץ התיקייה להשתמש ב־ API.

כן □ POST הקול שלך אל / v1/st/tranchive/ with model="faster-whisper large-v3." Returns JSON with text + pages + word-late timestamps. / Api / has the full reference.

מודלים מארחים עצמיים שומרים אודיו על GPUs שלנו; פרמיה עוברת עם DPA. שמע נמחק לאחר חלון שיתוף (24h Anon, 7d חתם ב). אנחנו לא מתאמנים על הקלטים שלך.

כן, Free.ai מענקים שימוש מסחרי בתעתיקים. אתה צריך זכויות על השמע שהעלית (הקלטה משלך, חומר מורשה, או תוכן בהסכמה).

גורם בזמן אמת הוא בערך 0.050. 2× podcast 60 דקות trancripts in 3×12 minutes. דגמי Premium לעתים קרובות לסיים מהר יותר. השתמש בכפתור התור כדי לסגור את הלשונית.

faster-whisper large-v3

השתמש באמצעות API

מודלים דומים

שאלות ששואלים לעתים קרובות

What does faster-whisper large-v3 do?

כמה שפות תומכות?

How accurate is faster-whisper large-v3?

Does faster-whisper large-v3 include timestamps?

כמה עולה כל דקה?

What audio formats can I upload to faster-whisper large-v3?

Can faster-whisper large-v3 identify different speakers?

Can I batch transcribe with faster-whisper large-v3?

האם יש API עבור faster-whisper large-v3?

מה לגבי פרטיות כאשר אני מתעתק עם faster-whisper large-v3?

Is faster-whisper large-v3 output safe for commercial use?

כמה זמן לוקח ל"פריי-איי-פי-אן"?

קבל 10,000 טוקנים חופשיים

חכו, קחו 10 אלף טוקנים חופשיים!

רוצה עוד?