Moonshine Base

Free.ai (self-hosted) · stt · ~500 tokenuri per minute

Aruncă un fișier audio sau video, sau cotează o URL de mai jos

~500 tokenuri per minute

_ Cel mai puternic la Low-latency live transcription, embedded devices.. Self-hosted pe Free.ai GPUs — rula gratuit împotriva poolului de token zilnic (500 tokens pe minut). Eliberat în MIT — utilizare comercială permisă la Free.ai.

Utilizare prin API

API REST compatible cu OpenAI. Generați o cheie și sunați acest model în secunde.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"moonshine-base","audio_url":"https://..."}'
Documentare API Obține cheie API

Întrebări frecvente

Moonshine Base transcrie audio vorbit în text. Încarcă un fișier MP3, WAV, M4A sau video și Moonshine Base returnează transcripția completă plus subtitrarea opțională SRT/VTT cu timelor.

Moonshine Base se ocupă de zeci de limbi — Whisper-familia modele acoperă 90+, Parakeet acoperă ~25, altele variază. Alegeți "auto-detectare" sau specificați limba pentru cea mai mare precizie.

Rata de eroare a cuvântului este de 5–100% pe audio curat englez, 10–20% pe audio zgomotos sau accentuat. Variante mari ale aceleiași arhitecturi fac în mod semnificativ mai bine pe cazurile grele — alege mai mare atunci când audio este dur.

Da — fiecare segment include start/end timelor. Export ca SRT sau VTT și harta de timpuri direct pe video.

Moonshine Base rula pe propriile noastre GPUs împotriva piscină gratuită zilnic mai întâi; $5 → 200.000 de jetonuri plătite după asta. Aproximativ ~500 jetonuri pe minut.

MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) - extragem audio. Max 500 MB pe încărcare. Fișiere mai lungi? Split cu /audio/cut/ sau folosirea /v1/stt/batch /.

Diarizarea speakerului este un pas separat — comutați "diarizarea" pe /transcribe /. Moonshine Base se ocupă de transcriere; etichete de diarizarea fiecare segment cu Speaker 1 / Speaker 2 / etc.

Da — /batch/ acceptă un dosar de fișiere audio. Fiecare transcriere de terenuri în /compte /?tab=historia cu numele de fișier original. Pentru conservarea dosarului-arbore utiliza API.

Da — POST audio dumneavoastră la /v1/stt/transcribe/ cu model="Moonshine Base". Returnează JSON cu text + segmente + fuste orare de word-level. /api/ are referință completă.

Modelele auto-gazdă păstrează audio pe GPU-urile noastre; premium trec prin cu un DPA. Audio este șterse după curent (24h anon, 7d semnat-in). Noi nu antrenăm pe intrarea dumneavoastră.

Da — Free.ai acordă utilizarea comercială a transcripcionelor. Ai nevoie de drepturi la audio pe care l-ai încărcat (înregistrarea propriu, material licențiat sau conținut cu consimțământul).

Factorul în timp real este de aproximativ 0,05–0.2× – un podcast de 60 de minute transcrie în 3–12 de minute. Modelele premium se termină adesea mai repede. Utilizați butonul de coadă pentru a închide tab.

Love this tool? Share it!

Ratați această pagină