Distil-Whisper large-v3

Free.ai (self-hosted) · stt · ~500 װײַז minute

קלײַב אױס אַ אודיו־ אָדער ווידעאָטעקע אױף, אָדער קלײַב אַ URL אױף אונטער

~500 װײַז minute

Distil-Whisper large-v3 איז a שפּראַך־צו־טעקסט מאָדעל געבויט דורך HuggingFace דער װײַטער װײַטער איז דער װײַטער. Free.ai GPUs — לויפט פריי קעגן דיין טעגלעך טיקען פּאָול (500 טיקען מינוט). דער אָריגינעלער טעקסט פֿון דער װײַטער־פֿאַרבינדונג איז װייטער צו געפֿינען אונטער Free.ai.

ניצן דורך API

OpenAI־צוגעפֿאַלענע REST API. שאַפֿן אַ קלײַב און װײַז דאָס מודל אין סעקונדעס

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"distil-whisper-large-v3","audio_url":"https://..."}'
API דאָקומענטאַציע אַרײַנשטעלן API־שריפֿטצײכן

פֿראַגעס

Distil-Whisper large-v3 טראַנסקריפּטירט געזאָגטע אודיו אין טעקסט. אַרײַנשטעלן אַ MP3, WAV, M4A אָדער ווידעאָ טעקע און Distil-Whisper large-v3 גיט צוריק די גאַנץ טראַנסקריפּט און װײַטער װײַטער SRT/VTT אונטערשריפֿטן מיט צײַט־סאַמעלס

Distil-Whisper large-v3 האַנדלט זיך מיט טויזנטער שפּראַכן — Whisper-פֿאַרשפּיל מאָדעלן דעקן 90+, Parakeet דעקן ~25, אנדערע װײַזן זיך. װײַז "אויטאָמאַטיש־צופֿירן" אָדער װײַז די שפּראַך פֿאַר העכסטן ריכטיקקײט

וואָרט־שטראָף איז 5–10% אויף קלאָרע ענגליש־אויער, 10–20% אויף לײַכטע אָדער אַרײַנגעפֿירטע אויער. גרעסערע װאַריאַנטן פֿון דער זעלבער אױספֿיר טאָן װײַטער בעסער אין שווערע קאַסעס — װײַל גרעסערע ווען דער אויער איז װײַטער

יָא — יעדער סעקטאָר כּולל אָנהײב/ענדיקן צײַט־סאַמעלס. אַרײַנשרײַבן װי SRT אָדער VTT און די צײַטן װעלן זיך צופּאַסן צום װידעאָ

Distil-Whisper large-v3 לײענט זיך אױף אונזערע אייגענע GPUס קעגן אייער טעגלעכן פריין פּאָל ערשטער; $5 → 200,000 באַצאָלטע טיקעטן דערנאָך. אַרום ~500 טיקעטן אַ מינוט

MP3, WAV, M4A, FLAC, OGG, און ווידיאָ (MP4, MOV, WebM) — מיר אַרײַנשטעלן די אודיו. מאַקסימום 500 מײַל בײַ אַ אָפּלאָדירן. לענגערע טעקע? צעטיילן מיט /audio/cut/ אָדער ניצן /v1/stt/batch/

די װײַזער־װײַז איז אַ באַזונדערע װײַז — װײַז "װײַז" אויף /transcribe/. Distil-Whisper large-v3 װײַזט די איבערזעצונג; די װײַז װײַזט אױף יעדן סעקטאָר מיט װײַזער 1 / װײַזער 2 / אױף דער װײַז

יָא — /batch/ לאָזט זיך אַ פּאַפּקע פֿון אוודיאָ טעקע. יעדער איבערזעצונג לאַנדט אין /account/?tab=history מיטן אָריגינעלן טעקע נאָמען. פֿאַר פּאַפּקע־בױם־באַהאַלט ניצט די API

יָא — פּאָסטן דיין אודיו צו /v1/stt/transcribe/ מיט מאָדעל="Distil-Whisper large-v3". גיט צוריק JSON מיט טעקסט + סעגמאַנץ + וואָרט־בײַטיקע צײַט־סאַמעלס. /api/ האָט די גאַנץ רעפֿערענץ

זיך־געװײנטלעכע מאָדעלן היטן אודיו אױף אונדזערע GPUס; פּרעמיום װײַזן אױף אַ DPA. אודיו ווערט אויסגעלײגט נאָך דעם צעשײד־פֿענצטער (24 שעה אַנאָנימירט, 7 טעג אױסגעלאָשן). מיר לערנען ניט אױף אייער אַרײַנשרײַבונג

יָה — Free.ai גיט אױס קעמפּערישע ניצן פֿון איבערזעצונגען. דו דאַרפֿסט רעכטן צום אודיו װאָס דו האָסט אױפֿגעלאָשן (דיינע אייגענע אױפֿזײַטונג, ליסענציירטע מאַטעריאַלן, אָדער אינהאַלט מיט דערלויבעניש)

דער אמת־צײַט־פֿאַקטאָר איז אַרום 0.05–0.2× — אַ 60־מיניוטיקער פּאָדקאַסט ווערט איבערגעשריבן אין 3–12 מינוט. פּרעמיום־מאָדלן ענדיקן זיך אָפֿט שנעלער. ניצ די שורה־קנעפּל צו פֿאַרמאַכן דעם הענטל

ליבע Free.ai? זאָגן דיין פריינט

קלײַב אַלץ אױס