Moonshine Base

Free.ai (self-hosted) · stt · ~500 tokens per minute

Ses Yükle

Bir ses veya video dosyasını bırakın veya URL'yi aşağıya yapıştırın

~500 tokens per minute

Moonshine Base a konuşma-metinde model tarafından inşa edilmiştir. En güçlüsü Low-latency live transcription, embedded devices.'de. Free.ai GPU'da kendi başına konumlandırılmış — günlük token havuzunuza karşı ücretsiz çalışır (500 tokens dakikada). MIT altında yayınlanmıştır — Free.ai üzerinde ticari kullanıma izin verilmiştir.

API üzerinden kullan

OpenAI uyumlu REST API. Bir anahtar oluştur ve bu modeli saniyeler içinde çağır.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"moonshine-base","audio_url":"https://..."}'

API belgelendirmesi API Anahtarını Al

Benzer Modeller

ElevenLabs STT

Fal Speech-to-Text

Wizper (Whisper v3)

Tüm modelleri görüntüle →

Sıkça Sorulan Sorular

Moonshine Base sesli konuşmaları metin haline çevirir. Bir MP3, WAV, M4A veya video dosyası yükleyin ve Moonshine Base tam metin ve zaman damgalı seçenek SRT/VTT altyazılarını geri verir.

Moonshine Base düzinelerce dilde çalışabilir — Whisper-aile modelleri 90+, Parakeet ~25, diğerleri değişkendir. En yüksek doğruluk için "otomatik tespit"i seçin veya dili belirtin.

Sözcük hata oranı temiz İngilizce ses üzerinde %5-10, gürültülü veya aksanlı ses üzerinde %10-20'dir.Aynı mimarinin büyük varyantları sert durumlarda anlamlı şekilde daha iyidir - ses sert olduğunda daha büyük seç.

Evet — her bölüm başlangıç/son zaman damgalarını içerir. SRT veya VTT olarak ihraç edin ve zamanlar doğrudan videonuza kaydedilir.

Moonshine Base önce günlük ücretsiz havuzunuza karşı kendi GPU'larımızda çalışır; $5 → 200.000 ödenmiş token sonra. Dakikada ~500 token.

MP3, WAV, M4A, FLAC, OGG, video (MP4, MOV, WebM) — sesleri çıkarıyoruz. Yükleme başına en fazla 500 MB. Daha uzun dosyalar? /audio/cut/ ile bölün veya /v1/stt/batch/ kullanın.

Konuşmacı diarization ayrı bir geçiş — /transcribe/ üzerinde "diarize"yi değiştirin. Moonshine Base transkripi yönetir; diarization her segmenti Konuşmacı 1 / Konuşmacı 2 / vs ile etiketler.

Evet — /batch/ ses dosyalarının bir dizinini kabul eder. Her bir transkrip orijinal dosya adı ile /account/?tab=history'ye düşer. Dizin ağacının korunması için API'yi kullanın.

Evet — Sesinizi /v1/stt/transcribe/'e model="Moonshine Base" ile POST edin. JSON ile metin + segmentler + kelime seviyesi zaman damgaları ile geri döndürür. /api/ tam referansa sahiptir.

Kendine hizmet veren modellerde ses GPU'larımızda kalır; premium modellerde DPA ile geçer. Ses paylaşma penceresinden sonra silinir (24 saat anon, 7 gün giriş). Girişleriniz üzerinde eğitim yapmayız.

Evet — Free.ai ticari kullanım için kopyaları kabul eder. Yüklediğiniz ses için haklara ihtiyacınız vardır (kendi kayıtlarınız, lisanslı materyaller veya rıza ile içerik).

Gerçek zaman faktörü yaklaşık 0.05–0.2× — 60 dakikalık bir podcast 3–12 dakikada transkribe edilir. Premium modelleri genellikle daha hızlı biter. Sekmeyi kapatmak için kuyruk düğmesini kullanın.

Moonshine Base

API üzerinden kullan

Benzer Modeller

Sıkça Sorulan Sorular

Moonshine Base ne yapıyor?

Moonshine Base kaç dil destekliyor?

Moonshine Base ne kadar doğru?

Moonshine Base zaman damgaları içeriyor mu?

Moonshine Base dakika başına ne kadara mal oluyor?

Moonshine Base'e hangi ses formatlarını yükleyebilirim?

Moonshine Base farklı konuşanları tanımlayabilir mi?

Moonshine Base ile grup olarak transkrip yapabilir miyim?

Moonshine Base için bir API var mı?

Moonshine Base ile yazdığımda mahremiyetime ne olacak?

Moonshine Base çıktısı ticari kullanım için güvenli mi?

Moonshine Base ne kadar sürer?

10.000 ücretsiz token al

Bekle — 10K Bedava Token Al!

Daha fazlasını ister misin?