Moonshine Base

Free.ai (self-hosted) · stt · ~500 ટોકન પ્રતિ minute

ઓડિયો અથવા વિડિયો ફાઈલ મૂકો, અથવા નીચે URL ને ચોંટાડો

~500 ટોકન પ્રતિ minute

Moonshine Base એ a દ્રશ્ય-થી-લખાણ મોડેલ છે જે Useful Sensors દ્વારા બનાવવામાં આવ્યું છે. Low-latency live transcription, embedded devices. પર સૌથી મજબૂત. Free.ai GPUs પર સ્વયં-હોસ્ટ થયેલ — તમારા રોજિંદા ટોકન પુલ (500 ટોકન મિનિટ) સામે મુક્ત રીતે ચાલે છે. MIT હેઠળ બહાર પાડવામાં આવ્યું — વ્યાવસાયિક ઉપયોગ માટે Free.ai પર પરવાનગી આપવામાં આવી છે.

API મારફતે વાપરો

OpenAI-સુસંગત REST API. કી ઉત્પન્ન કરો અને સેકન્ડોમાં આ મોડેલને બોલાવો.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"moonshine-base","audio_url":"https://..."}'
API દસ્તાવેજ API કી મેળવો

વારંવાર પૂછાતા પ્રશ્નો

Moonshine Base બોલાયેલ ઓડિયો લખાણમાં રૂપાંતરિત કરે છે. MP3, WAV, M4A, અથવા વિડિયો ફાઈલ અપલોડ કરો અને Moonshine Base સમયમુદ્રાઓ સાથે વૈકલ્પિક SRT/VTT ઉપશીર્ષકો સાથે સંપૂર્ણ રૂપાંતરણ બરાબર પાછું આપે છે.

Moonshine Base ભાષાઓની ડઝનોને સંભાળે છે - Whisper-પરિવાર મોડેલો 90+, Parakeet ~25 ને કવર કરે છે, બીજાઓ બદલાય છે. "આપમેળે-શોધ" પસંદ કરો અથવા ઊંચી ચોકસાઈ માટે ભાષા સ્પષ્ટ કરો.

શબ્દ-ક્ષતિ દર સાફ અંગ્રેજી ઓડિયો પર 5–10% છે, ધુમાડાવાળા અથવા ભારિત ઓડિયો પર 10–20%. એ જ આર્કિટેક્ચરના મોટાં પ્રકારો કઠિન કેસોમાં અર્થપૂર્ણ રીતે સારાં કરે છે - જ્યારે ઓડિયો કઠિન હોય ત્યારે મોટું પસંદ કરો.

હા — દરેક સેગમેન્ટ શરૂઆત/અંત સમયસમાપ્તિઓ સમાવે છે. SRT અથવા VTT તરીકે નિકાસ કરો અને સમય નકશા સીધા તમારા વિડિયો પર.

Moonshine Base તમારા રોજના મુક્ત પુલ સામે પહેલા તમારા પોતાના GPUs પર ચલાવે છે; $5 → 200,000 ચૂકવેલ ટોકન પછી. ~500 ટોકન પ્રતિ મિનિટ વિશે.

MP3, WAV, M4A, FLAC, OGG, અને વીડિયો (MP4, MOV, WebM) — અમે ઓડિયો કાઢી નાંખીએ છીએ. મહત્તમ ૫૦૦ MB પ્રતિ અપલોડ. લાંબી ફાઈલો? /audio/cut/ સાથે વિભાજીત કરો અથવા /v1/stt/batch/ વાપરો.

સ્પીકર ડાયરીકરણ અલગ પાસવર્ડ છે - /transcribe/ પર "diarize" બદલો. Moonshine Base લખાણને સંભાળે છે; ડાયરીકરણ સ્પીકર ૧ / સ્પીકર ૨ / વગેરે સાથે દરેક સેગમેન્ટને લેબલ કરે છે.

હા — /batch/ ઓડિયો ફાઈલોનું ફોલ્ડર સ્વીકારે છે. દરેક ટ્રાન્સક્રિપ્ટ મૂળભૂત ફાઈલનામ સાથે /account/?tab=history માં સ્થિત થાય છે. ફોલ્ડર-ટ્રિ સંગ્રહ માટે API વાપરો.

હા — મોડેલ="Moonshine Base" સાથે /v1/stt/transcribe/ પર તમારું ઓડિયો POST કરો. લખાણ + સેગમેન્ટ્સ + શબ્દ-સ્તર સમયસૂચક સાથે JSON ને પાછું આપે છે. /api/ એ સંપૂર્ણ સંદર્ભ છે.

સ્વયં-હોસ્ટ થયેલ મોડેલો અમારા GPUs પર ઓડિયો રાખે છે; પ્રીમિયમ DPA સાથે પસાર થાય છે. ઓડિયો વહેંચણી-વિન્ડો પછી કાઢી નાંખવામાં આવે છે (24h ano, 7d પ્રવેશ-માં). અમે તમારા ઇનપુટ્સ પર તાલીમ આપતા નથી.

Yes — Free.ai grants commercial use of transcripts. You need rights to the audio you uploaded (your own recording, licensed material, or content with consent).

વાસ્તવિક સમય ઘટક લગભગ ૦.૦૫–૦.૨× છે — ૬૦-મિનિટની પોડકાસ્ટ ૩–૧૨ મિનિટમાં રૂપાંતરિત કરે છે. પ્રીમિયમ મોડેલો ઘણીવાર ઝડપથી સમાપ્ત થાય છે. ટેબને બંધ કરવા માટે કતાર બટનનો ઉપયોગ કરો.

Free.ai ને પ્રેમ છે? તમારા મિત્રોને કહો!

આ પાનાંને દર આપો