Question 1

Lance nədir?

Accepted Answer

Lance ByteDance'in 2025 yerli birləşdirilmiş multimodal modelidir - Apache 2.0 altında 3B aktiv parametrlər. Bir çəkilər dəstəsi dörd işi əhatə edir: text→image (768×768), image-edit (768×768), text→video (480p, 121 frame-ə qədər ≈ 5 saniyə), və image+video understanding (VQA, subtitling). Wan-Video VAE və Qwen.5-VL ViT ilə Qwen-dən alınan LLM backbone üzərində qurulub. Free.ai's H200-də öz-özünə host edilir, upstream provider, API markup və token balansınızdan artıq zəng haqqı yoxdur.

Question 2

Niyə "birləşmiş"? Bu SDXL + redaktor + Wan-ı ayrı-ayrı işlətməkdən necə fərqlənir?

Accepted Answer

Çox açıq stack hər bir səth üçün ən yaxşı mütəxəssisi seçir - SDXL və ya FLUX şəkil yaratmaq üçün, Qwen-Image-Edit redaktə etmək üçün, Wan 2.2 video üçün, Qwen.5-VL görmə dili fikirləşmək üçün. Lance bir az per-task keyfiyyətini cross-task ortaqlığı üçün dəyişir: eyni daxili təmsil hər bir çıxışı təmin edir, buna görə də şəkil yaratmaq və sonra redaktə etmək onun üslubunu saxlayır, və VQA modeli video haqqında eyni kontrol nöqtəsində dil modeli ilə uyğun gəlir. Dörddən çox boru kəmərinin əvəzinə bir konzistentli modeldən faydalanan araşdırmalar və demos üçün faydalıdır.

Question 3

Necə Lance seçməliyəm və ya mütəxəssisləri?

Accepted Answer

Lance-ni seç: bir modeldən şəkil + edit + video arasında davamlı üslub istəyirsiniz, çox işli boru kəməri prototipləşdirirsiniz və "bir model" açısı vacibdir, ya da birləşmiş iş axını üçün icazəli lisenziyaya ehtiyacınız var. Ekspertləri seç: ən yüksək keyfiyyətli raw şəkil gen (FLUX.2 Klein > Lance at >768²), ən uzun / ən yüksək keyfiyyətli video (Wan 2.2 TI2V-5B or HunyuanVideo > Lance at >480p), ya da söhbətdə ən sürətli VQA (Qwen.5-VL H200-də hər zaman istidir, Lance soyuq yükləməli) istəyirsiniz.

Question 4

Hər bir Lance işi nə qədərə başa gəlir?

Accepted Answer

Text→image and image-edit: 5,000 tokens (matches FLUX-class image gen). Text→video: 15,000 tokens (matches CogVideoX / Wan 5B class). Image+video VQA: 1,000 tokens. SDXL (1,000) ilə müqayisədə daha yüksək qiymət Lance'nin daha ağır soyuq yükünü əks etdirir - hər çağırış isti flotun qalan hissəsini çıxarır və 40 GB ağırlığı yenidən yükləyir, bu da inferencenin özünə 25-40 saniyə əlavə edir. Biz yalnız inference deyil, ümumi divar-saat GPU vaxtı üçün hesablayırıq.

Question 5

Hər bir iş nə qədər vaxt aparır?

Accepted Answer

Soyuq yükləmədən sonra (~25-40 s): image gen ~12-20 s, image edit ~15-25 s, text→video ~60-180 s (num_frames-dən asılı olaraq), VQA ~3-8 s. Hər Lance çağırışı modelin soyuq yüklənməsini təmin edir, çünki H200-də isti flotun qalan hissəsi ilə birgə yaşayış edə bilməz, buna görə də soyuq yükləmə gecikməsi hər çağırışın bir hissəsidir, yalnız ilk deyil.

Question 6

Çıxarış ölçüsünün maksimum uzunluğu nə qədərdir?

Accepted Answer

Rəsm yaradılması və rəsm redaktə edilməsi 768×768-də sabitdir. Video yaradılması 480p-də sabitdir (tipik olaraq 480×848 yarımtəsvir) və 121 çərçivədə (~5 saniyə 24 fps-də) məhdudlaşdırılır. Bunlar Lance-in təlim edilmiş həllediciləridir; daha yüksək bir həlledici üçün ayrı bir model vasitəsilə artırma tələb olunur (rəsmlər üçün /image/upscaler/ və videolar üçün /video/upscaler/ sınayın).

Question 7

Lance Janus, Show-o, Emu3 və ya digər birləşdirilmiş multimodallarla necə müqayisə olunur?

Accepted Answer

Janus (DeepSeek) və Show-o anlayışını və yaradılmasını paylaşılan bir arxaya ayrı başlıqlara bölür; Lance daha sıx birləşmişdir - açıq iş işarələrinə malik olan bir sıra istehsal+anlayışını başlıqlarından ibarətdir. Emu3 (BAAI) piksellər daxil olmaqla hər şeyi diskret iş işarələrinə çevirir, bu da ona daha təmiz autoreqresiv yaradılma verir, lakin sabit hesablamada daha aşağı keyfiyyətə malikdir. Lance'nin səsi 3B aktiv parametrlərdə dörd iş əhatəsidir və əlavə olaraq videonu yerli olaraq idarə edən Wan-dan götürülmüş VAE-dir (Janus və Show-o yalnız şəkildir).

Question 8

Lance hansı lisenziyaya malikdir? Mən onu kommersiya məqsədilə istifadə edə bilərəmmi?

Accepted Answer

Apache 2.0 — həm ağırlıq (huggingface.co/bytedance-research/Lance) həm də GitHub repo (github.com/bytedance/Lance). Yerli məhdudiyyətlər yoxdur, MAU limiti yoxdur, kommersiya olmayan sürücü yoxdur, yalnız tədqiqat şərti yoxdur. Çıxışlar standart Apache 2.0 lisenziyası mətnindən kənarda royalti və ya etibar tələbləri olmadan kommersiya olaraq istifadə etmək üçün sizindir.

Question 9

Özünü-məhsul etmək üçün hansı VRAM və hardverə ehtiyacı var?

Accepted Answer

ByteDance's README-də minimum 40 GB. 3B aktiv parametrləri aldatıcıdır - tam Qwen LLM + Wan VAE + Qwen.5-VL ViT hamısı yaddaşda birgə oturur. Öz-özünə host etmək üçün tək bir A100 80 GB, A6000 48 GB, ya da ən azı 40 GB boşluqla H100/H200 lazım olacaq. Biz onu H200-də (toplam 141 GB) işlədirik, amma hələ də çağırış başına yüklənmiş modellərin qalanını çıxarır, çünki qutudakı ən ağır single-shot-dur.

Question 10

API varmı?

Accepted Answer

Bəli — api.free.ai üzərindən {task: "t2i" | "image_edit" | "t2v" | "vqa", prompt: "...", image: <upload> or image_url: "/static/outputs/..."} ilə /v1/multimodal/lance/-ə JSON ya da multipart olaraq POST et. İstifadəçinin təsdiqi inkişaf etdirici API açarları vasitəsilə edilir. Cavab job_id, output URL və share_token-i ehtiva edir. /api/-də hər bir iş üçün curl nümunələri var.

Question 11

Niyə "eksperimental"? Bu pulsuz olacaqmı?

Accepted Answer

Lance-ni eksperimental olaraq qeyd edirik çünki soyuq yükləmə gecikməsi böyük həcmli trafik üçün uyğun deyil - hər zəng isti flotu çıxarır və yenidən yükləyir. Biz daha sonra istifadənin bir slot ayırmasını təqdir etdiyi təqdirdə "isti Lance" səviyyəsini əlavə edə bilərik, ya da ikinci H200-ü xüsusi olaraq birləşdirilmiş modellər üçün əlavə edə bilərik. İndilikcə bu Free.ai-in digər öz-özünə-hosting modelləri kimi eyni token iqtisadiyyatında əlavə ödənişsiz mövcuddur, yalnız divar-saat GPU vaxtını əks etdirən zəng başına daha yüksək token qiyməti.

Question 12

Mənim sorğu və yükləmələrim saxlanılırmı ya da təlim üçün istifadə olunurmu?

Accepted Answer

Rəsm-redaktə və VQA üçün yüklənmiş şəkillər iş bitdikdən sonra dərhal silinir. Yaratılan nəticələr CDN-də 24 saat (ödənişli istifadəçilər üçün 7 gün) saxlanılır, buna görə də /account/?tab=history-dən yenidən yükləyə bilərsiniz. ByteDance ilə heç nə paylaşılmır - çəkilər bizim avadanlıqda yerli olaraq işləyir. Bütün məlumatlar /privacy/-dədir.

Model Məlumatları

Bağlan

API vasitəsilə istifadə et

Müqayisə Et

FAQ

Model Məlumatları

Bağlan

API vasitəsilə istifadə et

Müqayisə Et

FAQ

10,000 Pulsuz Token

Wait — Get 10K Free Tokens!

Daha çox istəyirsiniz?