Wizper (Whisper v3)
Free.ai
·
stt
·
~500 žetoni uz vienu minute
Wizper (Whisper v3) ir {da}ļiņu__ {kategorija}. Maršruts, izmantojot ārējos modeļus — ~{tpm_markes} minūtē(50 % atzīme virs iepriekšējā posma izmaksām).
Izmantošana caur API
OpenAI-compatible REST API. Generate a key and call this model in seconds.
curl -X POST https://api.free.ai/v1/stt/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/wizper","audio_url":"https://..."}'
API dokumentācija
Iegūst API atslēgu
Bieži uzdoti jautājumi
Wizper (Whisper v3) tranraksti skaļi audio tekstā. Ielādējiet MP3, WAV, M4A vai video failu un Wizper (Whisper v3) atgriež pilnu transkriptu plus izvēles SRT/VTT subtitrus ar laika zīmogiem.
Wizper (Whisper v3) hands desmiti valodu — Whisper-ģimenes modeļi aptver 90+, Parakeet cover ~25, citi atšķiras. Izvēlieties "auto-detektēšana" vai norādiet valodu, lai panāktu augstāko precizitāti.
Word-error ātrums ir 5-10% uz tīra angļu audio, 10-20% uz trokšņains vai izcelts audio. Lieli varianti tās pašas arhitektūras dara jēgpilni labāk par grūtiem gadījumiem — izvēlieties lielāku, kad audio ir raupja.
Jā — katrs segments ietver sākuma/gala laika zīmjus. Eksportēt kā SRT vai VTT un laika karti tieši uz jūsu video.
Wizper (Whisper v3) ir premium transkripcijas dzinējs. Par ~500-1 500 žetoni minūtē audio. $1 = 750,000 žetoni.
MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) — mēs iegūstam audio. Maksimāli 500 MB uz augšupielādi. Ilgāki faili? Split with /audio/cut/ or use /v1/stt/partch/.
Skaļruņa diarizācija ir atsevišķa caurlaide — pārslēdziet "dializējiet" par / transkripciju/. Wizper (Whisper v3) roku transkripciju; Diarizēšanas etiķetes katram segmentam ar Skaļruņu 1 / Skaļrunis 2 / uc
Jā — /partch/ pieņem audio failu mapi. Katra transkripcijas laukuma / konts /? tab=vēsture ar oriģinālo faila nosaukumu. Mapju koku saglabāšanai izmantojiet API.
Yes — POST your audio to /v1/stt/transcribe/ with model="Wizper (Whisper v3)". Returns JSON with text + segments + word-level timestamps. /api/ has the full reference.
Pašuzturēti modeļi saglabāt audio uz mūsu GPUs; premium iet cauri ar DPA. Audio tiek dzēsts pēc Share-window (24h anon, 7d pierakstīšanās). Mēs nemācāmies uz jūsu ievades.
Jā — Free.ai dod tiesības komerciāli izmantot transkriptus. Jums ir vajadzīgas tiesības uz jūsu augšupielādēto audio (savu ierakstu, licencēto materiālu vai saturu ar piekrišanu).
Reālā laika faktors ir aptuveni 0,05-0,2× — 60 minūšu podcast transkripcija 3–12 minūšu laikā. Premium modeļi bieži vien beidzas ātrāk. Izmantojiet rindas pogu, lai aizvērtu cilni.