Moonshine Base

Free.ai (self-hosted) · stt · ~500 tokenuri per minute

Încărcă audio

Aruncă un fișier audio sau video, sau cotează o URL de mai jos

~500 tokenuri per minute

_ Cel mai puternic la Low-latency live transcription, embedded devices.. Self-hosted pe Free.ai GPUs — rula gratuit împotriva poolului de token zilnic (500 tokens pe minut). Eliberat în MIT — utilizare comercială permisă la Free.ai.

Utilizare prin API

API REST compatible cu OpenAI. Generați o cheie și sunați acest model în secunde.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"moonshine-base","audio_url":"https://..."}'

Documentare API Obține cheie API

Modele similare

ElevenLabs STT

Fal Speech-to-Text

Wizper (Whisper v3)

Explorează toate modelele →

Întrebări frecvente

Moonshine Base transcrie audio vorbit în text. Încarcă un fișier MP3, WAV, M4A sau video și Moonshine Base returnează transcripția completă plus subtitrarea opțională SRT/VTT cu timelor.

Moonshine Base se ocupă de zeci de limbi — Whisper-familia modele acoperă 90+, Parakeet acoperă ~25, altele variază. Alegeți "auto-detectare" sau specificați limba pentru cea mai mare precizie.

Rata de eroare a cuvântului este de 5–100% pe audio curat englez, 10–20% pe audio zgomotos sau accentuat. Variante mari ale aceleiași arhitecturi fac în mod semnificativ mai bine pe cazurile grele — alege mai mare atunci când audio este dur.

Da — fiecare segment include start/end timelor. Export ca SRT sau VTT și harta de timpuri direct pe video.

Moonshine Base rula pe propriile noastre GPUs împotriva piscină gratuită zilnic mai întâi; $5 → 200.000 de jetonuri plătite după asta. Aproximativ ~500 jetonuri pe minut.

MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) - extragem audio. Max 500 MB pe încărcare. Fișiere mai lungi? Split cu /audio/cut/ sau folosirea /v1/stt/batch /.

Diarizarea speakerului este un pas separat — comutați "diarizarea" pe /transcribe /. Moonshine Base se ocupă de transcriere; etichete de diarizarea fiecare segment cu Speaker 1 / Speaker 2 / etc.

Da — /batch/ acceptă un dosar de fișiere audio. Fiecare transcriere de terenuri în /compte /?tab=historia cu numele de fișier original. Pentru conservarea dosarului-arbore utiliza API.

Da — POST audio dumneavoastră la /v1/stt/transcribe/ cu model="Moonshine Base". Returnează JSON cu text + segmente + fuste orare de word-level. /api/ are referință completă.

Modelele auto-gazdă păstrează audio pe GPU-urile noastre; premium trec prin cu un DPA. Audio este șterse după curent (24h anon, 7d semnat-in). Noi nu antrenăm pe intrarea dumneavoastră.

Da — Free.ai acordă utilizarea comercială a transcripcionelor. Ai nevoie de drepturi la audio pe care l-ai încărcat (înregistrarea propriu, material licențiat sau conținut cu consimțământul).

Factorul în timp real este de aproximativ 0,05–0.2× – un podcast de 60 de minute transcrie în 3–12 de minute. Modelele premium se termină adesea mai repede. Utilizați butonul de coadă pentru a închide tab.

Moonshine Base

Utilizare prin API

Modele similare

Întrebări frecvente

Ce face Moonshine Base?

Câte limbi suportă Moonshine Base?

Cât de precisă este Moonshine Base?

Are Moonshine Base include timurile de timp?

Cât costă Moonshine Base pe minut?

Ce formate audio pot încărca pe Moonshine Base?

Se poate identifica Moonshine Base diferite speakers?

Pot să transcriu pe lot cu Moonshine Base?

Există o API pentru Moonshine Base?

Cum rămâne cu intimitatea când transcriu cu Moonshine Base?

Moonshine Base ieșire sigură pentru utilizarea comercială?

Cât durează Moonshine Base?

Obţine 10.000 de token gratuit

Aşteaptă! Ia 10K tokens gratis!

Vrei mai mult?