Wizper (Whisper v3)

Free.ai · stt · ~500 tokens per minute

Muat naik audio

Letakkan fail audio atau video, atau tampal URL di bawah

~500 tokens per minute

Berjalan percuma pada GPU kami. Naik taraf untuk Wizper (Whisper v3) →

Wizper (Whisper v3) adalah a model ucapan-ke-teks. Dilalui melalui model luaran — ~500 token setiap minit (50% markup melebihi kos aliran atas).

Guna melalui API

OpenAI-compatible REST API. Generate a key and call this model in seconds.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/wizper","audio_url":"https://..."}'

Dokumentasi API Dapatkan Kekunci API

Similar models

ElevenLabs STT

Fal Speech-to-Text

Browse all models →

Soalan Lazim

Wizper (Whisper v3) mentranskripsikan audio yang diucapkan ke dalam teks. Muat naik fail MP3, WAV, M4A, atau video dan Wizper (Whisper v3) mengembalikan transkripsi penuh plus subtitel SRT/VTT pilihan dengan setem masa.

Wizper (Whisper v3) mengendalikan berpuluh-puluh bahasa — Whisper-keluarga model meliputi 90+, Parakeet meliputi ~25, yang lain bervariasi. Pilih "auto-kesan" atau nyatakan bahasa untuk ketepatan tertinggi.

Kadar ralat perkataan ialah 5–10% pada audio Inggeris bersih, 10–20% pada audio bising atau beraksent. Varian besar dari arsitektur yang sama lebih baik pada kes sukar — pilih yang lebih besar apabila audio kasar.

Ya — setiap segmen termasuk setem masa mula/akhir. Eksport sebagai SRT atau VTT dan peta masa terus ke video anda.

Wizper (Whisper v3) adalah enjin transkripsi premium. Sekitar ~500–1,500 token per minit audio. $1 = 750,000 token.

MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) — kami mengekstrak audio. Maksimum 500 MB per muat naik. Fail lebih panjang? Pisahkan dengan /audio/cut/ atau gunakan /v1/stt/batch/.

Diarizasi pembicara adalah laluan berasingan — togol "diarize" pada /transcribe/. Wizper (Whisper v3) mengendalikan transkripsi; diarizasi melabel setiap segmen dengan Pembicara 1 / Pembicara 2 / dll.

Ya — /batch/ menerima folder fail audio. Setiap transkripsi akan berada dalam /account/?tab=history dengan nama fail asal. Untuk pemeliharaan pepohon folder gunakan API.

Ya — POST audio anda ke /v1/stt/transcribe/ dengan model="Wizper (Whisper v3)". Kembalikan JSON dengan teks + segmen + setem masa aras-perkataan. /api/ mempunyai rujukan penuh.

Model sendiri-hosting menyimpan audio pada GPU kami; premium lalu melalui dengan DPA. Audio dipadam selepas tetingkap-kongsi (24h anon, 7d log-in). Kami tidak melatih pada input anda.

Ya — Free.ai memberi kebenaran penggunaan komersial transkripsi. Anda perlukan hak audio yang anda muat naik (rekaman anda sendiri, bahan berlesen, atau kandungan dengan kebenaran).

Faktor masa nyata adalah kira-kira 0.05–0.2× — podcast 60 minit ditranskripsikan dalam 3–12 minit. Model premium biasanya selesai lebih cepat. Guna butang baris gilir untuk menutup tab.

Wizper (Whisper v3)

Guna melalui API

Similar models

Soalan Lazim

Apa yang Wizper (Whisper v3) lakukan?

Berapa banyak bahasa yang disokong oleh Wizper (Whisper v3)?

Berapa tepatnya Wizper (Whisper v3)?

Adakah Wizper (Whisper v3) termasuk setem masa?

Berapakah kos Wizper (Whisper v3) setiap minit?

Format audio apa yang boleh saya muat naik ke Wizper (Whisper v3)?

Bolehkah Wizper (Whisper v3) mengenalpasti pembicara yang berbeza?

Bolehkah saya transkripsi secara berkelompok dengan Wizper (Whisper v3)?

Adakah terdapat API untuk Wizper (Whisper v3)?

Bagaimana dengan privasi bila saya transkripsi dengan Wizper (Whisper v3)?

Adakah output Wizper (Whisper v3) selamat untuk kegunaan komersial?

Berapa lamakah Wizper (Whisper v3) mengambil masa?

Dapatkan 10,000 Token Percuma

Tunggu — Dapatkan 10K Token Percuma!

Nak lagi?