faster-whisper large-v3

Free.ai (self-hosted) · stt · ~500 token per minute

Jatuhkan berkas audio atau video, atau tempel URL di bawah ini

~500 token per minute

faster-whisper large-v3 adalah a model ucapan-ke-teks dibangun oleh OpenAI / SYSTRAN. Strongest at Accurate transcription. Self-hosted on Free.ai GPUs — runs free against your daily token pool (500 tokens per menit). Released under MIT — commercial use permitted on Free.ai.

Gunakan melalui API

API REST yang kompatibel dengan OpenAI. Hasilkan kunci dan panggil model ini dalam hitungan detik.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"faster-whisper-large-v3","audio_url":"https://..."}'
Dokumentasi API Dapatkan Kunci API

Pertanyaan yang Sering Diajukan

faster-whisper large-v3 transcribes spoken audio into text. Upload an MP3, WAV, M4A, or video file and faster-whisper large-v3 returns the full transcript plus optional SRT/VTT subtitles with timestamps.

faster-whisper large-v3 menangani puluhan bahasa ▪ Whisper-family model cover 90+, Parakeet covers ~25, others varients. Pick "auto-detect" atau spesifikasikan bahasa untuk akurasi tertinggi.

Tingkat Word-error adalah 5U10% pada audio bahasa Inggris bersih, 10°20% pada audio yang bising atau aksen. varian besar dari arsitektur yang sama melakukan lebih baik pada kasus-kasus keras memilih lebih besar ketika audio kasar.

Ekspor SRT atau VTT dan peta waktu langsung ke video Anda.

faster-whisper large-v3 runs on our own GPUs against your daily free pool first; $5 → 200,000 paid tokens after that. About ~500 tokens per minute.

MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) kita mengekstrak audio. Max 500 MB per upload.

Speaker diarization is a separate pass — toggle "diarize" on /transcribe/. faster-whisper large-v3 handles the transcription; diarization labels each segment with Speaker 1 / Speaker 2 / etc.

Ya /batch/menerima folder berkas audio. Setiap transkrip mendarat di /account/?tab=cerita dengan nama berkas asli. Untuk pelestarian folder-tree menggunakan API.

Ya POST audio Anda ke /v1/stttt/trancribe/ dengan model=faster-whisper large-v3". Mengembalikan JSON dengan teks + segmen + tanda waktu tingkat kata. /api/ memiliki referensi penuh.

Model berhost diri menjaga audio pada GPU kami; premium lulus melalui DPA. Audio dihapus setelah jendela berbagi (24h anon, 7d signed-in). Kami tidak melatih input anda.

Yes — Free.ai grants commercial use of transcripts. You need rights to the audio you uploaded (your own recording, licensed material, or content with consent).

Faktor real-time adalah kira-kira 0.05.2× ° 60 menit transncribes podcast dalam 31 menit. model Premium sering selesai lebih cepat. Gunakan tombol antrian untuk menutup tab.

Love this tool? Share it!

Laju halaman ini