વાર્તાલાપો

પહેલાના સંવાદ નથી

Free.ai (self-hosted) ~100 ટોકન/msg
Lance 3B (unified)

હાય! હું છું Lance 3B (unified). મને કંઈપણ પૂછો.

~100 ટોકન/msg · દિવસભરનો પુલ મોકલવા માટે દાખલ કરો
મોડેલ વિગતો

મોડેલ વિગતો

પર યજમાન Free.ai (self-hosted)
આના દ્વારા બનાવેલ ByteDance
વર્ગ Multimodal
સંદર્ભ 32768 tokens
ખર્ચ ~100 ટોકન/msg · દિવસભરનો પુલ

વિશે

Lance 3B (unified) એ an AI મોડેલ છે જે ByteDance દ્વારા બનાવવામાં આવ્યું છે. Cross-task research, prototyping pipelines that need image + video + edit + VQA from one model, "one model, four tasks" demos. Apache 2.0, commercial use OK. પર સૌથી મજબૂત. Free.ai GPUs પર સ્વયં-હોસ્ટ થયેલ — તમારા રોજિંદા ટોકન પુલ (100 ટોકન વપરાશ પર) સામે મુક્ત રીતે ચાલે છે. Apache 2.0 હેઠળ બહાર પાડવામાં આવ્યું — વ્યાવસાયિક ઉપયોગ માટે Free.ai પર પરવાનગી આપવામાં આવી છે.

API મારફતે વાપરો

curl https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer YOUR_KEY" \
  -d '{"model":"lance-3b"}'
API દસ્તાવેજો

વારંવાર પૂછાતા પ્રશ્નો

Lance ByteDance નું 2025 નેટીવ યુનિફાઇડ મલ્ટીમોડલ મોડેલ છે - Apache 2.0 ની નીચે 3B સક્રિય પરિમાણો. વજનનો એક સમૂહ ચાર કાર્યો કવર કરે છે: લખાણ→ચિત્ર (768×768), ચિત્ર-સંપાદન (768×768), લખાણ→વિડિયો (480p, 121 ચોકઠાંઓ ≈5સેકન્ડો સુધી), અને ચિત્ર+વિડિયો સમજણ (VQA, કેપ્શનીંગ). Wan-વિડિયો VAE અને Qwen.5-VL ViT સાથે Qwen-ઉત્પન્ન LLM બેકબોન પર બનાવેલ છે. Free.ai ના H200 પર સ્વયં-હોસ્ટ થયેલ છે, કોઈ અપસ્ટ્રીમ પૂરૂં પાડનાર નથી, કોઈ API માર્કઅપ નથી, અને તમારા ટોકન બૅલન્સથી ઉપર કોઈ પ્રતિ-કોલ ફી નથી.

મોટાભાગના ખુલ્લા સ્ટેક દરેક સપાટી માટે શ્રેષ્ઠ વિશેષજ્ઞને પસંદ કરે છે - કાચા ચિત્ર ઉત્પન્ન કરવા માટે SDXL અથવા FLUX, ફેરફારો માટે Qwen-Image-Edit, વિડિયો માટે Wan 2.2, વિઝન-ભાષા ધારણા માટે Qwen.5-VL. Lance ક્રોસ-ભાષા સંકલિતતા માટે પ્રતિ-કાર્ય ગુણવત્તાનું થોડુંક વેચે છે: તે જ આંતરિક રજૂઆત દરેક આઉટપુટને ફીડ કરે છે, તેથી તમે ઉત્પન્ન કરેલ ચિત્ર અને પછી ફેરફાર તેની શૈલીને જાળવે છે, અને VQA મોડેલ વિડિયો વિશે આપે છે તે જ ચેકપોઈન્ટમાં ભાષા મોડેલને બંધબેસે છે. સંશોધન અને ડેમો માટે ઉપયોગી કે જે ચારની પાઇપલાઇનની જગ્યાએ એક સંતુલિત મોડેલમાંથી લાભ મેળવે છે.

જ્યારે: તમે એક મોડેલમાંથી ચિત્ર + સંપાદક + વિડિયો પર સંતુલિત શૈલી ઇચ્છો છો, તમે બહુ-કાર્ય પાઇપલાઇનનું પ્રોટોટાઇપિંગ કરી રહ્યા છો અને "એક મોડેલ" કોણ મહત્વનું છે, અથવા તમને એકીકૃત કાર્યપ્રવાહ પર પરવાનગી આપતી લાઇસન્સની જરૂર છે ત્યારે લેન્સ પસંદ કરો. જ્યારે: તમે ઊંચી ગુણવત્તાવાળા કાચા ચિત્રને ઇચ્છો છો (FLUX.2 Klein > Lance at >768²), લાંબા / ઊંચી ગુણવત્તાવાળા વિડિયો (Wan 2.2 TI2V-5B અથવા HunyuanVideo > Lance at >480p), અથવા વાતચીતમાં ઝડપી VQA (Qwen.5-VL હંમેશા H200 પર ગરમ છે, Lance એ કોલ્ડ-લોડ કરવાનું છે).

લખાણ→ચિત્ર અને ચિત્ર-સંપાદન: 5,000 ટોકન (FLUX-વર્ગ ચિત્ર જનને બંધબેસે છે). લખાણ→વિડિયો: 15,000 ટોકન (CogVideoX / Wan 5B વર્ગને બંધબેસે છે). ચિત્ર+વિડિયો VQA: 1,000 ટોકન. SDXL (1,000) ની સરખામણીમાં ઊંચો ખર્ચ Lance નું ભારે કોલ્ડ-લોડ પ્રતિબિંબિત કરે છે - દરેક કોલ ગરમ ફ્લિટના બાકીના ભાગને બહાર કાઢે છે અને વજનના 40 GB પુનઃલોડ કરે છે, જે 25-40 s ને અનુમાનની ઉપર જ ઉમેરે છે. અમે કુલ વોલ-કલોક GPU સમય માટે બિલિંગ કરી રહ્યા છીએ, માત્ર અનુમાન માટે નહિં.

કોલ્ડ-લોડ પછી (~25-40 s): ચિત્ર બનાવો ~12-20 s, ચિત્ર સંપાદિત કરો ~15-25 s, લખાણ→વિડિયો ~60-180 s (num_frames પર આધારિત), VQA ~3-8 s. દરેક Lance કોલ મોડેલને કોલ્ડ-લોડ કરે છે કારણ કે તે H200 પર ઉષ્ણ ફ્લિટના બાકીના ભાગ સાથે સહ-નિવાસી નથી, તેથી કોલ્ડ-લોડ વિલંબ દરેક કોલનો ભાગ છે, માત્ર પ્રથમનો નહીં.

ચિત્ર ઉત્પન્ન અને ચિત્ર સંપાદન 768×768 પર ચોક્કસ છે. વિડીયો ઉત્પન્ન 480p પર ચોક્કસ છે (સામાન્ય રીતે 480×848 આડું) અને 121 ચોકઠાંઓ પર ટોચ પર છે (~5 સેકન્ડો 24 fps પર). આ રીઝોલ્યુશન છે કે જેના પર લાન્સને તાલીમ આપવામાં આવી હતી; ઉંચું દબાણ કરવા માટે અલગ મોડેલ દ્વારા અપસ્કેલ કરવાની જરૂર છે (ચિત્રો માટે /image/upscaler/ અથવા વિડીયો માટે /video/upscaler/નો પ્રયત્ન કરો).

Janus (DeepSeek) અને Show-o સમજણ અને ઉત્પન્નને વહેંચાયેલ બેકબોન પર અલગ હેડમાં વિભાજીત કરે છે; Lance વધુ કડક રીતે એકીકૃત છે - સ્પષ્ટ કાર્ય ટોકન સાથે ઉત્પન્ન+ સમજણ હેડનું એક સમૂહ. Emu3 (BAAI) પિક્સેલ્સ સહિત વિશિષ્ટ ટોકન તરીકે બધું ટોકન કરે છે, જે તેને સ્વચ્છ ઓટોરેગ્રેસીવ ઉત્પન્ન આપે છે પરંતુ ચોક્કસ ગણતરીમાં નીચી ગુણવત્તા આપે છે. Lance નો પિટ્ટ 3B સક્રિય પરિમાણોમાં ચાર-કાર્ય કવરેજ છે તેમજ તેની Wan-ઉપજાવેલ VAE જે વીડિયોને સ્થાનિક રીતે સંભાળે છે (Janus અને Show-o માત્ર ચિત્ર-માત્ર છે).

Apache 2.0 — બંને વજન (huggingface.co/bytedance-research/Lance) અને GitHub repo (github.com/bytedance/Lance). કોઈ વિસ્તારીય પ્રતિબંધો નથી, કોઈ MAU કેપ નથી, કોઈ બિન-વાણિજ્યિક સવાર નથી, કોઈ સંશોધન-માત્ર કલમ નથી. આઉટપુટ્સ તમારા પોતાના છે, કોઈ રોયલટી અથવા પ્રમાણભૂત Apache 2.0 લાઇસન્સ લખાણથી આગળની જરૂરિયાતો વગર વાણિજ્યિક રીતે વાપરવા માટે.

ByteDance ની README પર 40 GB ઓછામાં ઓછું. 3B સક્રિય પરિમાણો છે - સંપૂર્ણ Qwen LLM + Wan VAE + Qwen.5-VL ViT બધા મેમરી સાથે બેસે છે. સ્વયં-હોસ્ટ કરવા માટે તમારે એક A100 80 GB, A6000 48 GB, અથવા H100/H200 ઓછામાં ઓછા 40 GB મુક્તની જરૂર પડશે. અમે તેને અમારા H200 (141 GB કુલ) પર ચલાવીશું પરંતુ તે હજુ પણ કોલ પર લોડ થયેલ મોડેલોના બાકીના ભાગને દૂર કરે છે કારણ કે તે બોક્સ પર સૌથી ભારે એક જ શૉટ છે.

હા — api.free.ai પર /v1/multimodal/lance/ પર POST JSON અથવા મલ્ટીપાર્ટ {task: "t2i" | "image_edit" | "t2v" | "vqa", prompt: "...", image: <upload> or image_url: "/static/outputs/..."} સાથે. વિકાસકર્તા API કીઓ મારફતે બેયરર સત્તાધિકરણ. જવાબમાં job_id, output URL, અને share_token સમાવેલ છે. /api/ પાસે કાર્ય પ્રતિ curl ઉદાહરણો છે.

અમે Lance ને પ્રયોગાત્મક તરીકે ચિહ્નિત કરીએ છીએ કારણ કે કોલ્ડ-લોડ લેટેન્સીનો અર્થ એ છે કે તે ઉચ્ચ-વોલ્યુમ ટ્રાફિક માટે સારો બંધબેસતો નથી - દરેક કોલ ગરમ જહાજને બહાર કાઢે છે અને પુનઃલોડ કરે છે. અમે "ગરમ Lance" સ્તરને પછીથી ઉમેરી શકીએ છીએ જો વપરાશ સ્લોટને સમર્પિત કરવા માટે યોગ્ય હોય, અથવા અમે એકીકૃત મોડેલો માટે ખાસ કરીને બીજું H200 ઉમેરી શકીએ છીએ. હવે તે Free.ai ના બાકીના સ્વયં-હોસ્ટ કરેલ મોડેલોની જેમ સમાન ટોકન અર્થતંત્ર પર ઉપલબ્ધ છે, કોઈ વધારાના ચાર્જ વિના, ફક્ત ઊંચો દર-કોલ ટોકન ખર્ચ વોલ-કલોક GPU સમયને પ્રતિબિંબિત કરે છે.

ચિત્ર-સંપાદન અને VQA માટે અપલોડ થયેલ ચિત્રો કાર્ય પૂર્ણ થયા પછી તરત જ કાઢી નાખવામાં આવે છે. ઉત્પન્ન થયેલ આઉટપુટ 24 કલાક માટે (પૈસા ચૂકવતા વપરાશકર્તાઓ માટે7દિવસ) અમારા CDN પર બેસે છે જેથી તમે /account/?tab=history માંથી પુનઃ-ડાઉનલોડ કરી શકો છો. ByteDance સાથે કંઈપણ વહેંચાયેલ નથી - વજનો અમારા હાર્ડવેરમાં સ્થાનિક રીતે ચલાવે છે. /privacy/ પર સંપૂર્ણ વિગતો.

Free.ai ને પ્રેમ છે? તમારા મિત્રોને કહો!

આ પાનાંને દર આપો