Question 1

લન્સ શું છે?

Accepted Answer

Lance ByteDance નું 2025 નેટીવ યુનિફાઇડ મલ્ટીમોડલ મોડેલ છે - Apache 2.0 ની નીચે 3B સક્રિય પરિમાણો. વજનનો એક સમૂહ ચાર કાર્યો કવર કરે છે: લખાણ→ચિત્ર (768×768), ચિત્ર-સંપાદન (768×768), લખાણ→વિડિયો (480p, 121 ચોકઠાંઓ ≈5સેકન્ડો સુધી), અને ચિત્ર+વિડિયો સમજણ (VQA, કેપ્શનીંગ). Wan-વિડિયો VAE અને Qwen.5-VL ViT સાથે Qwen-ઉત્પન્ન LLM બેકબોન પર બનાવેલ છે. Free.ai ના H200 પર સ્વયં-હોસ્ટ થયેલ છે, કોઈ અપસ્ટ્રીમ પૂરૂં પાડનાર નથી, કોઈ API માર્કઅપ નથી, અને તમારા ટોકન બૅલન્સથી ઉપર કોઈ પ્રતિ-કોલ ફી નથી.

Question 2

"સંયુક્ત" કેમ? SDXL + સંપાદક + Wan અલગથી ચલાવવાથી તે કેવી રીતે અલગ છે?

Accepted Answer

મોટાભાગના ખુલ્લા સ્ટેક દરેક સપાટી માટે શ્રેષ્ઠ વિશેષજ્ઞને પસંદ કરે છે - કાચા ચિત્ર ઉત્પન્ન કરવા માટે SDXL અથવા FLUX, ફેરફારો માટે Qwen-Image-Edit, વિડિયો માટે Wan 2.2, વિઝન-ભાષા ધારણા માટે Qwen.5-VL. Lance ક્રોસ-ભાષા સંકલિતતા માટે પ્રતિ-કાર્ય ગુણવત્તાનું થોડુંક વેચે છે: તે જ આંતરિક રજૂઆત દરેક આઉટપુટને ફીડ કરે છે, તેથી તમે ઉત્પન્ન કરેલ ચિત્ર અને પછી ફેરફાર તેની શૈલીને જાળવે છે, અને VQA મોડેલ વિડિયો વિશે આપે છે તે જ ચેકપોઈન્ટમાં ભાષા મોડેલને બંધબેસે છે. સંશોધન અને ડેમો માટે ઉપયોગી કે જે ચારની પાઇપલાઇનની જગ્યાએ એક સંતુલિત મોડેલમાંથી લાભ મેળવે છે.

Question 3

હું ક્યારે લન્સ વિરુદ્ધ વિશેષજ્ઞો પસંદ કરવો જોઈએ?

Accepted Answer

જ્યારે: તમે એક મોડેલમાંથી ચિત્ર + સંપાદક + વિડિયો પર સંતુલિત શૈલી ઇચ્છો છો, તમે બહુ-કાર્ય પાઇપલાઇનનું પ્રોટોટાઇપિંગ કરી રહ્યા છો અને "એક મોડેલ" કોણ મહત્વનું છે, અથવા તમને એકીકૃત કાર્યપ્રવાહ પર પરવાનગી આપતી લાઇસન્સની જરૂર છે ત્યારે લેન્સ પસંદ કરો. જ્યારે: તમે ઊંચી ગુણવત્તાવાળા કાચા ચિત્રને ઇચ્છો છો (FLUX.2 Klein > Lance at >768²), લાંબા / ઊંચી ગુણવત્તાવાળા વિડિયો (Wan 2.2 TI2V-5B અથવા HunyuanVideo > Lance at >480p), અથવા વાતચીતમાં ઝડપી VQA (Qwen.5-VL હંમેશા H200 પર ગરમ છે, Lance એ કોલ્ડ-લોડ કરવાનું છે).

Question 4

દરેક Lance કાર્યનો ખર્ચ કેટલો છે?

Accepted Answer

લખાણ→ચિત્ર અને ચિત્ર-સંપાદન: 5,000 ટોકન (FLUX-વર્ગ ચિત્ર જનને બંધબેસે છે). લખાણ→વિડિયો: 15,000 ટોકન (CogVideoX / Wan 5B વર્ગને બંધબેસે છે). ચિત્ર+વિડિયો VQA: 1,000 ટોકન. SDXL (1,000) ની સરખામણીમાં ઊંચો ખર્ચ Lance નું ભારે કોલ્ડ-લોડ પ્રતિબિંબિત કરે છે - દરેક કોલ ગરમ ફ્લિટના બાકીના ભાગને બહાર કાઢે છે અને વજનના 40 GB પુનઃલોડ કરે છે, જે 25-40 s ને અનુમાનની ઉપર જ ઉમેરે છે. અમે કુલ વોલ-કલોક GPU સમય માટે બિલિંગ કરી રહ્યા છીએ, માત્ર અનુમાન માટે નહિં.

Question 5

દરેક બાબત કેટલો સમય લે છે?

Accepted Answer

કોલ્ડ-લોડ પછી (~25-40 s): ચિત્ર બનાવો ~12-20 s, ચિત્ર સંપાદિત કરો ~15-25 s, લખાણ→વિડિયો ~60-180 s (num_frames પર આધારિત), VQA ~3-8 s. દરેક Lance કોલ મોડેલને કોલ્ડ-લોડ કરે છે કારણ કે તે H200 પર ઉષ્ણ ફ્લિટના બાકીના ભાગ સાથે સહ-નિવાસી નથી, તેથી કોલ્ડ-લોડ વિલંબ દરેક કોલનો ભાગ છે, માત્ર પ્રથમનો નહીં.

Question 6

મહત્તમ આઉટપુટ માપ / લંબાઈ શું છે?

Accepted Answer

ચિત્ર ઉત્પન્ન અને ચિત્ર સંપાદન 768×768 પર ચોક્કસ છે. વિડીયો ઉત્પન્ન 480p પર ચોક્કસ છે (સામાન્ય રીતે 480×848 આડું) અને 121 ચોકઠાંઓ પર ટોચ પર છે (~5 સેકન્ડો 24 fps પર). આ રીઝોલ્યુશન છે કે જેના પર લાન્સને તાલીમ આપવામાં આવી હતી; ઉંચું દબાણ કરવા માટે અલગ મોડેલ દ્વારા અપસ્કેલ કરવાની જરૂર છે (ચિત્રો માટે /image/upscaler/ અથવા વિડીયો માટે /video/upscaler/નો પ્રયત્ન કરો).

Question 7

Janus, Show-o, Emu3, અથવા અન્ય સંયુક્ત મલ્ટીમોડલ્સ સાથે Lance કેવી રીતે સરખામણી કરે છે?

Accepted Answer

Janus (DeepSeek) અને Show-o સમજણ અને ઉત્પન્નને વહેંચાયેલ બેકબોન પર અલગ હેડમાં વિભાજીત કરે છે; Lance વધુ કડક રીતે એકીકૃત છે - સ્પષ્ટ કાર્ય ટોકન સાથે ઉત્પન્ન+ સમજણ હેડનું એક સમૂહ. Emu3 (BAAI) પિક્સેલ્સ સહિત વિશિષ્ટ ટોકન તરીકે બધું ટોકન કરે છે, જે તેને સ્વચ્છ ઓટોરેગ્રેસીવ ઉત્પન્ન આપે છે પરંતુ ચોક્કસ ગણતરીમાં નીચી ગુણવત્તા આપે છે. Lance નો પિટ્ટ 3B સક્રિય પરિમાણોમાં ચાર-કાર્ય કવરેજ છે તેમજ તેની Wan-ઉપજાવેલ VAE જે વીડિયોને સ્થાનિક રીતે સંભાળે છે (Janus અને Show-o માત્ર ચિત્ર-માત્ર છે).

Question 8

લાન્સ કઈ લાઇસન્સ હેઠળ છે? શું હું તેને વ્યવસાયિક રીતે વાપરી શકું?

Accepted Answer

Apache 2.0 — બંને વજન (huggingface.co/bytedance-research/Lance) અને GitHub repo (github.com/bytedance/Lance). કોઈ વિસ્તારીય પ્રતિબંધો નથી, કોઈ MAU કેપ નથી, કોઈ બિન-વાણિજ્યિક સવાર નથી, કોઈ સંશોધન-માત્ર કલમ નથી. આઉટપુટ્સ તમારા પોતાના છે, કોઈ રોયલટી અથવા પ્રમાણભૂત Apache 2.0 લાઇસન્સ લખાણથી આગળની જરૂરિયાતો વગર વાણિજ્યિક રીતે વાપરવા માટે.

Question 9

શું VRAM અને હાર્ડવેર એને સ્વયં-યજમાન કરવા માટે જરૂરી છે?

Accepted Answer

ByteDance ની README પર 40 GB ઓછામાં ઓછું. 3B સક્રિય પરિમાણો છે - સંપૂર્ણ Qwen LLM + Wan VAE + Qwen.5-VL ViT બધા મેમરી સાથે બેસે છે. સ્વયં-હોસ્ટ કરવા માટે તમારે એક A100 80 GB, A6000 48 GB, અથવા H100/H200 ઓછામાં ઓછા 40 GB મુક્તની જરૂર પડશે. અમે તેને અમારા H200 (141 GB કુલ) પર ચલાવીશું પરંતુ તે હજુ પણ કોલ પર લોડ થયેલ મોડેલોના બાકીના ભાગને દૂર કરે છે કારણ કે તે બોક્સ પર સૌથી ભારે એક જ શૉટ છે.

Question 10

શું ત્યાં API છે?

Accepted Answer

હા — api.free.ai પર /v1/multimodal/lance/ પર POST JSON અથવા મલ્ટીપાર્ટ {task: "t2i" | "image_edit" | "t2v" | "vqa", prompt: "...", image: <upload> or image_url: "/static/outputs/..."} સાથે. વિકાસકર્તા API કીઓ મારફતે બેયરર સત્તાધિકરણ. જવાબમાં job_id, output URL, અને share_token સમાવેલ છે. /api/ પાસે કાર્ય પ્રતિ curl ઉદાહરણો છે.

Question 11

"પ્રયોગાત્મક" કેમ? શું આ મુક્ત રહેશે?

Accepted Answer

અમે Lance ને પ્રયોગાત્મક તરીકે ચિહ્નિત કરીએ છીએ કારણ કે કોલ્ડ-લોડ લેટેન્સીનો અર્થ એ છે કે તે ઉચ્ચ-વોલ્યુમ ટ્રાફિક માટે સારો બંધબેસતો નથી - દરેક કોલ ગરમ જહાજને બહાર કાઢે છે અને પુનઃલોડ કરે છે. અમે "ગરમ Lance" સ્તરને પછીથી ઉમેરી શકીએ છીએ જો વપરાશ સ્લોટને સમર્પિત કરવા માટે યોગ્ય હોય, અથવા અમે એકીકૃત મોડેલો માટે ખાસ કરીને બીજું H200 ઉમેરી શકીએ છીએ. હવે તે Free.ai ના બાકીના સ્વયં-હોસ્ટ કરેલ મોડેલોની જેમ સમાન ટોકન અર્થતંત્ર પર ઉપલબ્ધ છે, કોઈ વધારાના ચાર્જ વિના, ફક્ત ઊંચો દર-કોલ ટોકન ખર્ચ વોલ-કલોક GPU સમયને પ્રતિબિંબિત કરે છે.

Question 12

શું મારા પ્રશ્નો અને અપલોડ સંગ્રહાયેલ છે અથવા તાલીમ માટે વપરાય છે?

Accepted Answer

ચિત્ર-સંપાદન અને VQA માટે અપલોડ થયેલ ચિત્રો કાર્ય પૂર્ણ થયા પછી તરત જ કાઢી નાખવામાં આવે છે. ઉત્પન્ન થયેલ આઉટપુટ 24 કલાક માટે (પૈસા ચૂકવતા વપરાશકર્તાઓ માટે7દિવસ) અમારા CDN પર બેસે છે જેથી તમે /account/?tab=history માંથી પુનઃ-ડાઉનલોડ કરી શકો છો. ByteDance સાથે કંઈપણ વહેંચાયેલ નથી - વજનો અમારા હાર્ડવેરમાં સ્થાનિક રીતે ચલાવે છે. /privacy/ પર સંપૂર્ણ વિગતો.

મોડેલ વિગતો

વિશે

API મારફતે વાપરો

સરખાવો

વારંવાર પૂછાતા પ્રશ્નો

મોડેલ વિગતો

વિશે

API મારફતે વાપરો

સરખાવો

વારંવાર પૂછાતા પ્રશ્નો

10,000 મુક્ત ટોકન્સ મેળવો

રાહ જુઓ — 10K મુક્ત ટોકન મેળવો!

વધારે ઇચ્છો છો?