Wizper (Whisper v3)
Free.ai
·
stt
·
~500 tokens per minute
Wizper (Whisper v3) iku a model-to-text. Diwangun ku 100% bahan baku lokal, 50% bahan baku lokal (kajaba bahan baku olahan) diproduksi di pabrik.
Nggunakake liwat API
OpenAI-compatible REST API. Generate a key and call this model in seconds.
curl -X POST https://api.free.ai/v1/stt/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/wizper","audio_url":"https://..."}'
Dokumen
Muat Turun Kunci API
Takon-takon sing asring diajukake
Wizper (Whisper v3) ngatranskripsikeun audio anu diucapkeun jadi teks. Unggahkeun file MP3, WAV, M4A, atawa video sarta Wizper (Whisper v3) bakal ngabalikeun transkripsi pinuh plus subtitle SRT/VTT pilihan kalawan timestamp.
Wizper (Whisper v3) ngawengku loba basa — Whisper-keluarga model ngawengku 90+, Parakeet ngawengku ~25, anu séjénna béda. Pilih "auto-detect" atawa nyatet basa pikeun akurasi pangluhurna.
Tingkat kasalahan kecap nyaéta 5-10% dina audio Inggris anu bersih, 10-20% dina audio anu bising atanapi diaksés. Varian ageung tina arsitektur anu sami langkung saé dina kasus anu hadé - pilih anu langkung ageung nalika audiona kasar.
Ya — saben segmen ngandung tanda wektu wiwitan/akhiran. Eksport minangka SRT utawa VTT lan peta wektu langsung menyang video.
Wizper (Whisper v3) nyaéta mesin transkripsi premium. Kira-kira ~500–1,500 token per menit audio. $1 = 750,000 token.
MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) — kita extract audio. Max 500 MB per upload. Files luwih dawa? Split karo /audio/cut/ utawa nggunakake /v1/stt/batch/.
Diarisasi pangucapan nyaéta hiji pasagi terpisah — toggle "diarize" on /transcribe/. Wizper (Whisper v3) ngarawat transkripsi; diarisasi label saben segmen kalawan pangucap 1 / pangucap 2 / jsb.
Ya — /batch/ nampi folder berkas audio. Satiap transcript disimpen dina /account/?tab=history kalayan nami berkas aslina. Pikeun ngalestarikeun pohon folder, anggo API.
Ya — POST audio sampeyan menyang /v1/stt/transcribe/ karo model="Wizper (Whisper v3)". Ngabaliake JSON kanthi teks + segmen + timestamp tingkat tembung. /api/ duwe referensi lengkap.
Model self-hosted nyimpen audio dina GPU urang; premium ngaliwatan ku DPA. Audio dipaling saatos jendela babagi (24 jam anonim, 7 dinten ngadaptar). Kami henteu ngalatih kana input anjeun.
Ya — Free.ai ngawenangkeun panggunaan komersial tina transkripsi. Anjeun peryogi hak kana audio anu anjeun unggah (rekaman anjeun sorangan, bahan anu dilisensikan, atanapi isi anu disetujui).
Faktor waktu nyata kira-kira 0.05–0.2× — podcast 60 menit ditranskripsikeun dina 3–12 menit. Model Premium seringna réngsé langkung gancang. Gunakeun tombol baris pikeun nutup tab.