Moonshine Base

Free.ai (self-hosted) · stt · ~500 ටොකන minute

ශ්‍රව්‍ය හෝ වීඩියෝ ගොනුවක් පහතට දමන්න, හෝ URL ලිපිනයක් ඇලවීම

~500 ටොකන minute

Moonshine Base යනු a කථා-පෙළ ආකෘතිය විසින් Useful Sensors විසින් ඉදිකරන ලද කථා-පෙළ ආකෘතිය වේ. ෆ්‍රෙඩී Free.ai GPUs මත ස්වයං-සත්කාරක - ඔබේ දෛනික ටොකන් පූල් එරෙහිව නිදහස් ධාවනය (500 ටොකන් මිනිත්තුවට). MIT යටතේ නිදහස් කරන ලදී — වාණිජමය භාවිතය සඳහා Free.ai මත අවසර ලබා දී ඇත.

API හරහා භාවිත කරන්න

OpenAI අනුකූල REST API. යතුරක් ජනනය කර තත්පර කිහිපයකින් මෙම ආකෘතිය ඇමතීමට.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"moonshine-base","audio_url":"https://..."}'
API ලේඛන API යතුර ලබාගන්න

නිතර අසන ප්රශ්න

Moonshine Base පෙළ බවට කතා ශ්රව්ය පරිවර්තනය. MP3 එකක් උඩුගත, WAV, M4A, හෝ වීඩියෝ ගොනුවක් සහ Moonshine Base කාලය මුද්රා සමග විකල්ප SRT / VTT උපසිරැසි පූර්ණ පරිවර්තනය ප්ලස් ආපසු.

Moonshine Base භාෂා දස දහස් ගණනක් හැසිරවීම - Whisper-පවුලේ ආකෘති ආවරණය 90+, Parakeet ආවරණය ~25, අනෙක් අය වෙනස්. "ස්වයංක්රීයව හඳුනා" තෝරන්න හෝ ඉහළම නිරවද් යතාව සඳහා භාෂාව සඳහන් කරන්න.

වචන-දෝෂ අනුපාතය පිරිසිදු ඉංග්රීසි ශ්රව්ය මත 5-10% වේ, 10-20% ශබ්ද හෝ accented ශ්රව්ය මත. එම ගෘහ නිර්මාණ ශිල්පය විශාල විකල්ප අසීරු නඩු මත අර්ථවත් වඩා හොඳ කරන්නේ - ශ්රව්ය දෘඩ විට විශාල තෝරන්න.

ඔව් - සෑම කොටසක් ආරම්භ / අවසන් timestamps ඇතුළත් වේ. SRT හෝ VTT ලෙස අපනයනය සහ ඔබේ වීඩියෝව මත කෙලින්ම කාලය සිතියම.

Moonshine Base ඔබේ දෛනික නිදහස් පූල් පළමු එරෙහිව අපගේ ම GPUs මත ධාවනය; $5 → 200,000 ඒ පසු ගෙවනු ලබන ටොකන්. ~ මිනිත්තුවකට ටොකන් 500 ගැන.

MP3, WAV, M4A, FLAC, OGG, ප්ලස් වීඩියෝ (MP4, MOV, WebM) — අපි ශ්රව්ය උපුටා. මැක්ස් 500 MB එකකට. දිගු ගොනු? /audio/cut/ සමග බෙදා හෝ /v1/stt/batch/ භාවිතා කරන්න.

කථානායක diarization වෙනම අවසර - /transcribe/ මත "diarize" මාරු කරන්න. Moonshine Base පරිවර්තනය හැසිරවීම; diarization කථානායක 1 / කථානායක 2/ ආදිය සමග එක් එක් කොටස ලේබල්.

ඔව් — / කණ්ඩායම / ශ්රව්ය ගොනු බහාලුමක් පිළිගනී. එක් එක් පරිවර්තනය මුල් ගොනු නාමය සමග / ගිණුම /?tab = ඉතිහාසය ගොඩබිම්. බහාලුම්-ගස සංරක්ෂණය සඳහා API භාවිතා කරන්න.

ඔව් — ඔබේ ශ්රව්ය ප්රකාශනය /v1/stt/transcribe/ සමග ආකෘතිය සමග POST="Moonshine Base". පෙළ සමග JSON ආපසු + කොටස් + වචන මට්ටමේ timestamps. /api/ සම්පූර්ණ උපුටා දැක්වීම ඇත.

ස්වයං-සත්කාරක ආකෘති අපගේ GPUs මත ශ්රව්ය තබා; වට්ටම් DPA සමග හරහා ගමන්. ශ්රව්ය කොටස්-කවුළුව පසු මකා දමයි (24h anon, 7d සභාපති-in). අපි ඔබේ ආදාන පුහුණු නැහැ.

ඔව් - Free.ai පරිවර්තන වාණිජ භාවිතය ලබා දෙයි. ඔබ ඔබ උඩුගත ශ්රව්ය අයිතිවාසිකම් අවශ්ය (ඔබේම පටිගත, බලපත්ර ද්රව්ය, හෝ අනුමැතිය සමග අන්තර්ගතය).

තත්ත්ව සාධකය දළ වශයෙන් 0.05-0.2 × වේ - මිනිත්තු 60 ක පොඩ්කාස්ට් මිනිත්තු 3-12 ක් තුළ පරිවර්තනය කරයි. ප් රතිලාභ ආකෘති බොහෝ විට වේගයෙන් අවසන් වේ. ටැබය වසා දැමීමට පෝලිම් බොත්තම භාවිතා කරන්න.

Free.ai ආදරය? ඔබේ මිතුරන්ට කියන්න!

මෙම පිටුව අගය කරන්න