Moonshine Base

Free.ai (self-hosted) · stt · ~500 token per minute

Jatuhkan berkas audio atau video, atau tempel URL di bawah ini

~500 token per minute

Moonshine Base adalah a model ucapan-ke-teks dibangun oleh Useful Sensors. Strongest at Low-latency live transcription, embedded devices.. Self-hosted on Free.ai GPUs — runs free against your daily token pool (500 tokens per menit). Released under MIT — commercial use permitted on Free.ai.

Gunakan melalui API

API REST yang kompatibel dengan OpenAI. Hasilkan kunci dan panggil model ini dalam hitungan detik.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"moonshine-base","audio_url":"https://..."}'
Dokumentasi API Dapatkan Kunci API

Pertanyaan yang Sering Diajukan

Moonshine Base transcribes spoken audio into text. Upload an MP3, WAV, M4A, or video file and Moonshine Base returns the full transcript plus optional SRT/VTT subtitles with timestamps.

Moonshine Base menangani puluhan bahasa ▪ Whisper-family model cover 90+, Parakeet covers ~25, others varients. Pick "auto-detect" atau spesifikasikan bahasa untuk akurasi tertinggi.

Tingkat Word-error adalah 5U10% pada audio bahasa Inggris bersih, 10°20% pada audio yang bising atau aksen. varian besar dari arsitektur yang sama melakukan lebih baik pada kasus-kasus keras memilih lebih besar ketika audio kasar.

Ekspor SRT atau VTT dan peta waktu langsung ke video Anda.

Moonshine Base runs on our own GPUs against your daily free pool first; $5 → 200,000 paid tokens after that. About ~500 tokens per minute.

MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) kita mengekstrak audio. Max 500 MB per upload.

Speaker diarization is a separate pass — toggle "diarize" on /transcribe/. Moonshine Base handles the transcription; diarization labels each segment with Speaker 1 / Speaker 2 / etc.

Ya /batch/menerima folder berkas audio. Setiap transkrip mendarat di /account/?tab=cerita dengan nama berkas asli. Untuk pelestarian folder-tree menggunakan API.

Ya POST audio Anda ke /v1/stttt/trancribe/ dengan model=Moonshine Base". Mengembalikan JSON dengan teks + segmen + tanda waktu tingkat kata. /api/ memiliki referensi penuh.

Model berhost diri menjaga audio pada GPU kami; premium lulus melalui DPA. Audio dihapus setelah jendela berbagi (24h anon, 7d signed-in). Kami tidak melatih input anda.

Yes — Free.ai grants commercial use of transcripts. You need rights to the audio you uploaded (your own recording, licensed material, or content with consent).

Faktor real-time adalah kira-kira 0.05.2× ° 60 menit transncribes podcast dalam 31 menit. model Premium sering selesai lebih cepat. Gunakan tombol antrian untuk menutup tab.

Love this tool? Share it!

Laju halaman ini