Wizper (Whisper v3)
Free.ai
·
stt
·
~500 žetoni po minute
Wizper (Whisper v3) is a model govor-u-tekst. Putovanje kroz vanjske modele — ~500 tokeni po minuti (50% označavanje iznad troškova prijevoda).
Koristi preko API-ja
OpenAI-compatible REST API. Generate a key and call this model in seconds.
curl -X POST https://api.free.ai/v1/stt/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/wizper","audio_url":"https://..."}'
API dokumentacija
Dobavi API ključ
Česta pitanja
Wizper (Whisper v3) transcribes spoken audio into text. Upload an MP3, WAV, M4A, or video file and Wizper (Whisper v3) returns the full transcript plus optional SRT/VTT subtitles with timestamps.
Wizper (Whisper v3) rukovodi desetinama jezika — Whisper- obiteljski modeli pokrivaju 90+, Parakeet pokriva ~25, drugi variraju. Odaberite "autodetekciju" ili navedite jezik za najveću preciznost.
Brzina riječi-grebotina je 5-10% na čistom engleskom audio, 10-20% na bučnom ili naglaskom audio. Velike varijante iste arhitekture smisleno bolje na tvrde slučajeve — odaberite veći kada je zvuk grub.
Da — svaki segment uključuje start/kraj vremenskih oznaka. Izvezi kao SRT ili VTT i vremensku mapu ravno na vaš video.
Wizper (Whisper v3) je premium transkription motor. Oko ~500–1,500 žetona po minuti zvuka. $1 = 750.000 žetona.
MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) — izvlačimo zvuk. Max 500 MB po slanju. Duže datoteke? Split s /audio/cut/ ili koristiti /v1/stt/batch /.
Dijarizacija zvučnika je odvojena propusnica — uključi "diarise" na /transcribec /. Wizper (Whisper v3) rukovodi transkripcijom; dijarizacijska oznaka svaki segment sa zvučnikom 1 / Zvučnik 2 / itd.
Da — /batch / prihvaća mapu zvučnih datoteka. Svaki transkripti sleti u /account /?tab=history s originalnim imenom datoteke. Za očuvanje mape-tree koristite API.
Da — POST svoj zvuk na /v1/st/transcribe/ s modelom="Wizper (Whisper v3)". Vraća JSON s tekstom + segmenti + vremenske oznake na razini riječi. /api/ ima punu referencu.
Samostalni modeli čuvaju zvuk na našim GPU-ovima; premium prolazi s DPA-om. Audio se briše nakon dio-prozora (24h anon, 7d potpisivanje). Ne treniramo na Vašim ulazima.
Da — Free.ai dodjeljuje komercijalnu upotrebu transkripta. Potrebna su vam prava na zvuk koji ste upisali (vas vlastiti snimanje, licencirani materijal, ili sadržaj s pristankom).
Faktor u realnom vremenu je približno 0,05–0,2× — 60-minutni transkripti podcasta u 3–12 minuta. Premium modeli često završavaju brže. Koristite gumb reda da zatvorite karticu.