Moonshine Base

Free.ai (self-hosted) · stt · ~500 tokens per minute

Muat naik audio

Letakkan fail audio atau video, atau tampal URL di bawah

~500 tokens per minute

Moonshine Base adalah a model ucapan-ke-teks yang dibina oleh Useful Sensors. Terkuat di Low-latency live transcription, embedded devices.. Dihost sendiri pada Free.ai GPU — berjalan percuma terhadap kolam token harian anda (500 tokens setiap minit). Dikeluarkan di bawah MIT — penggunaan komersial dibenarkan pada Free.ai.

Guna melalui API

API REST serasi OpenAI. Janakan kekunci dan panggil model ini dalam beberapa saat.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"moonshine-base","audio_url":"https://..."}'

Dokumentasi API Dapatkan Kekunci API

Model serupa

ElevenLabs STT

Fal Speech-to-Text

Wizper (Whisper v3)

Layari semua model →

Soalan Lazim

Moonshine Base mentranskripsikan audio yang diucapkan ke dalam teks. Muat naik fail MP3, WAV, M4A, atau video dan Moonshine Base mengembalikan transkripsi penuh plus subtitel SRT/VTT pilihan dengan setem masa.

Moonshine Base mengendalikan berpuluh-puluh bahasa — Whisper-keluarga model meliputi 90+, Parakeet meliputi ~25, yang lain bervariasi. Pilih "auto-kesan" atau nyatakan bahasa untuk ketepatan tertinggi.

Kadar ralat perkataan ialah 5–10% pada audio Inggeris bersih, 10–20% pada audio bising atau beraksent. Varian besar dari arsitektur yang sama lebih baik pada kes sukar — pilih yang lebih besar apabila audio kasar.

Ya — setiap segmen termasuk setem masa mula/akhir. Eksport sebagai SRT atau VTT dan peta masa terus ke video anda.

Moonshine Base berjalan pada GPU kami sendiri terhadap kolam percuma harian anda pertama; $5 → 200,000 token dibayar selepas itu. Sekitar ~500 token per minit.

MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) — kami mengekstrak audio. Maksimum 500 MB per muat naik. Fail lebih panjang? Pisahkan dengan /audio/cut/ atau gunakan /v1/stt/batch/.

Diarizasi pembicara adalah laluan berasingan — togol "diarize" pada /transcribe/. Moonshine Base mengendalikan transkripsi; diarizasi melabel setiap segmen dengan Pembicara 1 / Pembicara 2 / dll.

Ya — /batch/ menerima folder fail audio. Setiap transkripsi akan berada dalam /account/?tab=history dengan nama fail asal. Untuk pemeliharaan pepohon folder gunakan API.

Ya — POST audio anda ke /v1/stt/transcribe/ dengan model="Moonshine Base". Kembalikan JSON dengan teks + segmen + setem masa aras-perkataan. /api/ mempunyai rujukan penuh.

Model sendiri-hosting menyimpan audio pada GPU kami; premium lalu melalui dengan DPA. Audio dipadam selepas tetingkap-kongsi (24h anon, 7d log-in). Kami tidak melatih pada input anda.

Ya — Free.ai memberi kebenaran penggunaan komersial transkripsi. Anda perlukan hak audio yang anda muat naik (rekaman anda sendiri, bahan berlesen, atau kandungan dengan kebenaran).

Faktor masa nyata adalah kira-kira 0.05–0.2× — podcast 60 minit ditranskripsikan dalam 3–12 minit. Model premium biasanya selesai lebih cepat. Guna butang baris gilir untuk menutup tab.

Moonshine Base

Guna melalui API

Model serupa

Soalan Lazim

Apa yang Moonshine Base lakukan?

Berapa banyak bahasa yang disokong oleh Moonshine Base?

Berapa tepatnya Moonshine Base?

Adakah Moonshine Base termasuk setem masa?

Berapakah kos Moonshine Base setiap minit?

Format audio apa yang boleh saya muat naik ke Moonshine Base?

Bolehkah Moonshine Base mengenalpasti pembicara yang berbeza?

Bolehkah saya transkripsi secara berkelompok dengan Moonshine Base?

Adakah terdapat API untuk Moonshine Base?

Bagaimana dengan privasi bila saya transkripsi dengan Moonshine Base?

Adakah output Moonshine Base selamat untuk kegunaan komersial?

Berapa lamakah Moonshine Base mengambil masa?

Dapatkan 10,000 Token Percuma

Tunggu — Dapatkan 10K Token Percuma!

Nak lagi?