Moonshine Base

Free.ai (self-hosted) · stt · ~500 100 žetónov na minute

Nahrať audio súbor

Umiestnite zvukový súbor alebo videosúbor alebo prilepte URL adresu nižšie

~500 100 žetónov na minute

Moonshine Base je a Model premeny reči na text vytvorený Useful Sensors. Najsilnejší na Low-latency live transcription, embedded devices.. Vlastné hosťovanie na Free.ai grafických procesoroch – beží bezplatne proti vášmu dennému fondu tokenov (500 tokenov za minútu). Vydané pod licenciou MIT — komerčné použitie povolené na Free.ai.

Použitie cez API

REST API kompatibilné s OpenAI. Generujte kľúč a zavolajte tento model v priebehu niekoľkých sekúnd.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"moonshine-base","audio_url":"https://..."}'

Dokumentácia API Získať API kľúč

Podobné modely

ElevenLabs STT

Fal Speech-to-Text

Wizper (Whisper v3)

Prehľadávať všetky modely →

Často kladené otázky

Moonshine Base transcribes spoken audio into text. Upload an MP3, WAV, M4A, or video file and Moonshine Base returns the full transcript plus optional SRT/VTT subtitles with timestamps.

Moonshine Base zvláda desiatky jazykov — modely Whisper pokrývajú 90+, Parakeet pokrýva ~25, ostatné sa líšia.Zvoľte "auto-detect" alebo zadajte jazyk pre najvyššiu presnosť.

Miera chýb slov je 5-10% na čistom anglickom zvuku, 10-20% na hlučnom alebo akcentovanom zvuku.Veľké varianty rovnakej architektúry fungujú výrazne lepšie na tvrdých prípadoch - vyberte väčšie, keď je zvuk drsný.

Áno, každý segment obsahuje časové značky začiatku a konca.Exportujte ako SRT alebo VTT a priraďte časy priamo do videa.

Moonshine Base beží na našich vlastných GPU proti vášmu dennému voľnému bazénu najprv; $5 → 200,000 platených žetónov potom.Okolo ~500 žetónov za minútu.

MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) — extrahujeme audio. Max 500 MB na upload. Dlhšie súbory? Rozdeliť pomocou /audio/cut/ alebo použite /v1/stt/batch/.

Diarizácia hovoriacich je samostatný priechod — prepnite "diarize" na /transcribe/. Moonshine Base sa stará o prepis; diarizácia označuje každý segment ako Rečník 1 / Rečník 2 / atď.

Áno — /batch/ prijíma priečinok so zvukovými súbormi. Každý prepis skončí v /account/?tab=history s pôvodným názvom súboru. Pre zachovanie stromu priečinkov použite API.

Áno — POST svoj zvuk do /v1/stt/transcribe/ s modelom "Moonshine Base". Vráti JSON s textom + segmenty + časové značky na úrovni slov. /api/ má úplný odkaz.

Samohostiteľské modely ukladajú zvuk na naše GPU; prémiové modely prechádzajú cez DPA. Zvuk sa po uplynutí okna zdieľania (24 hodín anon, 7 dní prihlásenia) vymaže.

Yes — Free.ai grants commercial use of transcripts. You need rights to the audio you uploaded (your own recording, licensed material, or content with consent).

Faktor reálneho času je približne 0,05 – 0,2× – 60-minútový podcast sa prepíše za 3 – 12 minút. Prémiové modely často dokončia prepis rýchlejšie.

Moonshine Base

Použitie cez API

Podobné modely

Často kladené otázky

Čo robí Moonshine Base?

Koľko jazykov podporuje Moonshine Base?

Ako presné je Moonshine Base?

Obsahuje Moonshine Base časové pečiatky?

Koľko stojí Moonshine Base za minútu?

Aké audio formáty môžem nahrať na Moonshine Base?

Môže Moonshine Base identifikovať rôznych rečníkov?

Môžem hromadne prepisovať s Moonshine Base?

Existuje API pre Moonshine Base?

A čo súkromie, keď prepisujem s Moonshine Base?

Je výstup Moonshine Base bezpečný pre komerčné použitie?

Ako dlho trvá Moonshine Base?

Získajte 10 000 žetónov zadarmo

Počkajte — Získajte 10K Žetónov zadarmo!

Chcete viac?