Moonshine Base

Free.ai (self-hosted) · stt · ~500 Токен minute

Аудио эсвэл видео файлыг буцаах эсвэл URL-ийг доошоо байрлуулах

~500 Токен minute

Moonshine Base нь a ярианаас-мэдээлэл-рүү загвар-ийн Useful Sensors-ээр бүтээсэн хэсэг юм. 1995 онд "Best of" цомог гаргажээ. Free.ai GPU дээр өөрийн хосттой — таны өдөр тутмын токен нөөц (500 токен минут)-ийн эсрэг үнэгүй ажиллана. MIT-ийн дор хэвлэгдсэн — Free.ai дээр худалдааны зорилгоор ашиглах зөвшөөрөлтэй.

API- ээр ашиглах

OpenAI-тай нийцтэй REST API. Алгаалгын түлхүүр үүсгэж секундэд энэ загварыг дуудна.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"moonshine-base","audio_url":"https://..."}'
Хяналт API түлхүүрийг авах

Заримдаа асуудаг асуултууд

Moonshine Base нь яриаг текст болгон хөрвүүлдэг. MP3, WAV, M4A, эсвэл видео файлыг татаж аваад Moonshine Base нь бүрэн хөрвүүлэлтийг болон сонгох боломжтой SRT/VTT субтитрүүдийг цагны тэмдэгтэй хамт буцаана.

Moonshine Base нь олон тооны хэлийг дэмждэг. Whisper-ийн төрөл нь 90+ хэлийг дэмждэг, Parakeet нь ~25 хэлийг дэмждэг, бусад нь өөр өөр байдаг. "авто-шинжилгээ"-г сонгох эсвэл хамгийн нарийн хэлийг заах.

Англи хэлний үгийн алдааны хувь нь цэвэр Англи хэлний аудиод 5-10%, чимээ ихтэй эсвэл өнгөлөг аудиод 10-20% байдаг. Ижил бүтэцтэй том хувилбарууд хатуу утгатай тохиолдолд илүү сайн ажилладаг - дууны чанар муутай үед том хувилбарыг сонгоно.

Тийм ээ — бүх хэсгүүд эхлэх/ дуусах цагийг агуулдаг. SRT эсвэл VTT хэлбэрээр экспортлох ба цагийг шууд видеонд оруулах.

Moonshine Base нь бидний өөрийн GPU дээр өдөр тутмын үнэгүй нөөцтэй тэмцэж эхлэх ба дараа нь $5 → 200,000 төлбөртэй жетоноор тоглоно. минутанд ~500 жетоноор тоглоно.

MP3, WAV, M4A, FLAC, OGG, мөн видео (MP4, MOV, WebM) — аудиог татаж авна. Нэг өргөтгөлд 500 МБ хүртэл. Хэт урт файлууд? /audio/cut/ эсвэл /v1/stt/batch/ ашиглан хуваана уу.

Хөгжмийн зохиолчдын диариз нь тусгай дамжуулалт юм — /transcribe/ дээр "diarize" -ийг идэвхжүүл. Moonshine Base нь орчуулгыг хариуцна; диариз нь бүрэлдэхүүн хэсгүүдийг 1-р хөгжимчин / 2-р хөгжимчин / гэх мэтээр тэмдэглэнэ.

Тийм ээ — /batch/ нь аудио файлын хавтсыг хүлээн авдаг. Бүх бичлэгүүд /account/?tab=history-д ордог. Бусад файлуудыг хадгалахдаа API-г ашиглана уу.

Тийм — Аудио файлаа /v1/stt/transcribe/ руу POST хийж "Moonshine Base" загварыг ашиглана. JSON текст + хэсгүүд + үгийн түвшний цаг хугацааны тэмдэглэгээг буцаана. /api/ нь бүрэн холбоостой.

Өөрийн сервертэй загварууд дууг GPU дээр хадгална; Premium нь DPA-г ашиглан дууг дамжуулна. Хөгжим хуваалцах цонхны дараа дууг устгана (24 цаг аноним, 7 хоног бүртгэлтэй). Бид таны оруулсан мэдээллийг ашиглахгүй.

Тийм — Free.ai нь бичлэгийг худалдааны зорилгоор ашиглах эрхийг олгоно. Та өөрийн өргөтгсөн аудио файлын эрхийг (өөрөө бичсэн, лицензтэй материал, эсвэл зөвшөөрөлтэй агуулга) авах шаардлагатай.

Үнэгүй хувилбар нь 60 минутын подкастыг 3-12 минутад бичнэ. Үнэтэй хувилбар нь илүү хурдан дуусна. Хуудасыг хаахын тулд хүлээх товчийг дарна уу.

Free.ai-ыг хайрладаг уу? Найзуудаа хэлж өгөөрэй!

Энэ хуудсыг үнэл