Wizper (Whisper v3)

Free.ai · stt · ~500 _Göçür minute

Bir audio ýa-da video faýly düşür ýa-da bir URL'i şuňa goý

~500 _Göçür minute
Biziň GPUs-larda azat işleýär. Bu üçin täzele Wizper (Whisper v3) →

Wizper (Whisper v3) is a sözden-metine model. minutda (50% markup over upstream cost)

API arkaly ullan

OpenAI-compatible REST API. Generate a key and call this model in seconds.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/wizper","audio_url":"https://..."}'
Senedler API Adyny Al

Gynançly Soraglar

Wizper (Whisper v3) sözlenen sesleri metinlere geçirýär. Bir MP3, WAV, M4A ýa-da wideo faýly ýükläň we Wizper (Whisper v3) doly geçirmäni we opsion SRT/VTT subtitleleri wagt möhürleri bilen gaýtarýar.

Wizper (Whisper v3) onlaýn dilleri dolandyrýar — Whisper-family modelleri 90+, Parakeet ~25, beýlekiler üýtgeýär. "otomatik tap" saýla ýa-da iň ýokary dogrylyk üçin dili bellik et.

Söz-hata derejesi 5-10% arassa ingliz sesde, 10-20% gürleşikli ýa-da aksentli sesde. Aynı binagärligiň uly görnüşleri has gowy iş görýär - ses çylşyrymly bolsa ulysyny saýla.

Eý — her bir bölek başlan/son wagt möhürlerini içer. SRT ýa VTT olarak eksport et we wagtlar mapyny wideoňa dogrydan ýaz.

Wizper (Whisper v3) bir premium transkripsiýa enjamy. Bir minutda ~500-1,500 audio tokeni. $1 = 750,000 tokeni.

MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) — biz sesleri çykarýarys. Bir ýükleme üçin iň köp 500 MB. Uly faýllar? /audio/cut/ bilen böle ýa-da /v1/stt/batch/ ullan.

Sesçi diaryzasiýasy bir tapawutlanan geçişdir — /transcribe/-de "diarize"-i çalşyň. Wizper (Whisper v3) transkripsiýany dolandyrýar; diaryzasiýa her bir segmenti Sesçi 1 / Sesçi 2 / we ş.m. bilen etiketleýär

Eý — /batch/ ses faýllarynyň haltany kabul edýär. Her bir transkript /account/?tab=history'da orjinal faýl ad bilen galýar. Haltany-bakja saklamak üçin API'den ullan.

Eý — POST audiony /v1/stt/transcribe/ bilen model="Wizper (Whisper v3)". Metin + segmentler + söz derejeli wagt möhürleri bilen JSON'y gaýtarýar. /api/ doly salgy bar.

Öz-özüne hosturlanan modeller sesleri GPU-larda saklaýar; premium DPA bilen geçýär. Ses paýlaşma äpişgesinden soň pozylýar (24 sag anonim, 7 gün giren). Biz siziň girişleriňizi öwrenmänis.

Eý — Free.ai transkripleriň söwdaly ulanmak hukugyny berýär. Siz ýüklän ses haklarynyň (öz ýazgyňyz, lisenziyaly material ýa-da ygtyýar bilen mazmun) zerurlygyny duýýarsyňyz.

Raýat wagtyň faktory takmynan 0.05-0.2× — 60 minutlyk podkast 3-12 minutda transkribe bolýar. Premium modeller köplenç çalt tamamlanýar. Täbi ýapmak üçin nobat batlygyny ullan.

Free.ai-i söýýäňmi? Dostlaryňa aýt!

Bu sahypany bahala