faster-whisper large-v3

Free.ai (self-hosted) · stt · ~500 tokens per minute

Ses Yükle

Bir ses veya video dosyasını bırakın veya URL'yi aşağıya yapıştırın

~500 tokens per minute

faster-whisper large-v3 a konuşma-metinde model tarafından inşa edilmiştir. En güçlüsü Accurate transcription'de. Free.ai GPU'da kendi başına konumlandırılmış — günlük token havuzunuza karşı ücretsiz çalışır (500 tokens dakikada). MIT altında yayınlanmıştır — Free.ai üzerinde ticari kullanıma izin verilmiştir.

API üzerinden kullan

OpenAI uyumlu REST API. Bir anahtar oluştur ve bu modeli saniyeler içinde çağır.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"faster-whisper-large-v3","audio_url":"https://..."}'

API belgelendirmesi API Anahtarını Al

Benzer Modeller

ElevenLabs STT

Fal Speech-to-Text

Wizper (Whisper v3)

Tüm modelleri görüntüle →

Sıkça Sorulan Sorular

faster-whisper large-v3 sesli konuşmaları metin haline çevirir. Bir MP3, WAV, M4A veya video dosyası yükleyin ve faster-whisper large-v3 tam metin ve zaman damgalı seçenek SRT/VTT altyazılarını geri verir.

faster-whisper large-v3 düzinelerce dilde çalışabilir — Whisper-aile modelleri 90+, Parakeet ~25, diğerleri değişkendir. En yüksek doğruluk için "otomatik tespit"i seçin veya dili belirtin.

Sözcük hata oranı temiz İngilizce ses üzerinde %5-10, gürültülü veya aksanlı ses üzerinde %10-20'dir.Aynı mimarinin büyük varyantları sert durumlarda anlamlı şekilde daha iyidir - ses sert olduğunda daha büyük seç.

Evet — her bölüm başlangıç/son zaman damgalarını içerir. SRT veya VTT olarak ihraç edin ve zamanlar doğrudan videonuza kaydedilir.

faster-whisper large-v3 önce günlük ücretsiz havuzunuza karşı kendi GPU'larımızda çalışır; $5 → 200.000 ödenmiş token sonra. Dakikada ~500 token.

MP3, WAV, M4A, FLAC, OGG, video (MP4, MOV, WebM) — sesleri çıkarıyoruz. Yükleme başına en fazla 500 MB. Daha uzun dosyalar? /audio/cut/ ile bölün veya /v1/stt/batch/ kullanın.

Konuşmacı diarization ayrı bir geçiş — /transcribe/ üzerinde "diarize"yi değiştirin. faster-whisper large-v3 transkripi yönetir; diarization her segmenti Konuşmacı 1 / Konuşmacı 2 / vs ile etiketler.

Evet — /batch/ ses dosyalarının bir dizinini kabul eder. Her bir transkrip orijinal dosya adı ile /account/?tab=history'ye düşer. Dizin ağacının korunması için API'yi kullanın.

Evet — Sesinizi /v1/stt/transcribe/'e model="faster-whisper large-v3" ile POST edin. JSON ile metin + segmentler + kelime seviyesi zaman damgaları ile geri döndürür. /api/ tam referansa sahiptir.

Kendine hizmet veren modellerde ses GPU'larımızda kalır; premium modellerde DPA ile geçer. Ses paylaşma penceresinden sonra silinir (24 saat anon, 7 gün giriş). Girişleriniz üzerinde eğitim yapmayız.

Evet — Free.ai ticari kullanım için kopyaları kabul eder. Yüklediğiniz ses için haklara ihtiyacınız vardır (kendi kayıtlarınız, lisanslı materyaller veya rıza ile içerik).

Gerçek zaman faktörü yaklaşık 0.05–0.2× — 60 dakikalık bir podcast 3–12 dakikada transkribe edilir. Premium modelleri genellikle daha hızlı biter. Sekmeyi kapatmak için kuyruk düğmesini kullanın.

faster-whisper large-v3

API üzerinden kullan

Benzer Modeller

Sıkça Sorulan Sorular

faster-whisper large-v3 ne yapıyor?

faster-whisper large-v3 kaç dil destekliyor?

faster-whisper large-v3 ne kadar doğru?

faster-whisper large-v3 zaman damgaları içeriyor mu?

faster-whisper large-v3 dakika başına ne kadara mal oluyor?

faster-whisper large-v3'e hangi ses formatlarını yükleyebilirim?

faster-whisper large-v3 farklı konuşanları tanımlayabilir mi?

faster-whisper large-v3 ile grup olarak transkrip yapabilir miyim?

faster-whisper large-v3 için bir API var mı?

faster-whisper large-v3 ile yazdığımda mahremiyetime ne olacak?

faster-whisper large-v3 çıktısı ticari kullanım için güvenli mi?

faster-whisper large-v3 ne kadar sürer?

10.000 ücretsiz token al

Bekle — 10K Bedava Token Al!

Daha fazlasını ister misin?