Model Məlumatları
Bağlan
Lance 3B (unified) an AI modeli tərəfindən yaradılmışdır. Ən yaxşısı isə "Freak" idi. Free.ai GPU-larda öz-özünə host edilmişdir — gündəlik token pulunuza qarşı pulsuz işləyir (100 tokens istifadə). Apache 2.0 altında buraxılmışdır — Free.ai-də kommersiya istifadəsi icazəlidir.
API vasitəsilə istifadə et
curl https://api.free.ai/v1/chat/ \
-H "Authorization: Bearer YOUR_KEY" \
-d '{"model":"lance-3b"}'
FAQ
Lance ByteDance'in 2025 yerli birləşdirilmiş multimodal modelidir - Apache 2.0 altında 3B aktiv parametrlər. Bir çəkilər dəstəsi dörd işi əhatə edir: text→image (768×768), image-edit (768×768), text→video (480p, 121 frame-ə qədər ≈ 5 saniyə), və image+video understanding (VQA, subtitling). Wan-Video VAE və Qwen.5-VL ViT ilə Qwen-dən alınan LLM backbone üzərində qurulub. Free.ai's H200-də öz-özünə host edilir, upstream provider, API markup və token balansınızdan artıq zəng haqqı yoxdur.
Çox açıq stack hər bir səth üçün ən yaxşı mütəxəssisi seçir - SDXL və ya FLUX şəkil yaratmaq üçün, Qwen-Image-Edit redaktə etmək üçün, Wan 2.2 video üçün, Qwen.5-VL görmə dili fikirləşmək üçün. Lance bir az per-task keyfiyyətini cross-task ortaqlığı üçün dəyişir: eyni daxili təmsil hər bir çıxışı təmin edir, buna görə də şəkil yaratmaq və sonra redaktə etmək onun üslubunu saxlayır, və VQA modeli video haqqında eyni kontrol nöqtəsində dil modeli ilə uyğun gəlir. Dörddən çox boru kəmərinin əvəzinə bir konzistentli modeldən faydalanan araşdırmalar və demos üçün faydalıdır.
Lance-ni seç: bir modeldən şəkil + edit + video arasında davamlı üslub istəyirsiniz, çox işli boru kəməri prototipləşdirirsiniz və "bir model" açısı vacibdir, ya da birləşmiş iş axını üçün icazəli lisenziyaya ehtiyacınız var. Ekspertləri seç: ən yüksək keyfiyyətli raw şəkil gen (FLUX.2 Klein > Lance at >768²), ən uzun / ən yüksək keyfiyyətli video (Wan 2.2 TI2V-5B or HunyuanVideo > Lance at >480p), ya da söhbətdə ən sürətli VQA (Qwen.5-VL H200-də hər zaman istidir, Lance soyuq yükləməli) istəyirsiniz.
Text→image and image-edit: 5,000 tokens (matches FLUX-class image gen). Text→video: 15,000 tokens (matches CogVideoX / Wan 5B class). Image+video VQA: 1,000 tokens. SDXL (1,000) ilə müqayisədə daha yüksək qiymət Lance'nin daha ağır soyuq yükünü əks etdirir - hər çağırış isti flotun qalan hissəsini çıxarır və 40 GB ağırlığı yenidən yükləyir, bu da inferencenin özünə 25-40 saniyə əlavə edir. Biz yalnız inference deyil, ümumi divar-saat GPU vaxtı üçün hesablayırıq.
Soyuq yükləmədən sonra (~25-40 s): image gen ~12-20 s, image edit ~15-25 s, text→video ~60-180 s (num_frames-dən asılı olaraq), VQA ~3-8 s. Hər Lance çağırışı modelin soyuq yüklənməsini təmin edir, çünki H200-də isti flotun qalan hissəsi ilə birgə yaşayış edə bilməz, buna görə də soyuq yükləmə gecikməsi hər çağırışın bir hissəsidir, yalnız ilk deyil.
Rəsm yaradılması və rəsm redaktə edilməsi 768×768-də sabitdir. Video yaradılması 480p-də sabitdir (tipik olaraq 480×848 yarımtəsvir) və 121 çərçivədə (~5 saniyə 24 fps-də) məhdudlaşdırılır. Bunlar Lance-in təlim edilmiş həllediciləridir; daha yüksək bir həlledici üçün ayrı bir model vasitəsilə artırma tələb olunur (rəsmlər üçün /image/upscaler/ və videolar üçün /video/upscaler/ sınayın).
Janus (DeepSeek) və Show-o anlayışını və yaradılmasını paylaşılan bir arxaya ayrı başlıqlara bölür; Lance daha sıx birləşmişdir - açıq iş işarələrinə malik olan bir sıra istehsal+anlayışını başlıqlarından ibarətdir. Emu3 (BAAI) piksellər daxil olmaqla hər şeyi diskret iş işarələrinə çevirir, bu da ona daha təmiz autoreqresiv yaradılma verir, lakin sabit hesablamada daha aşağı keyfiyyətə malikdir. Lance'nin səsi 3B aktiv parametrlərdə dörd iş əhatəsidir və əlavə olaraq videonu yerli olaraq idarə edən Wan-dan götürülmüş VAE-dir (Janus və Show-o yalnız şəkildir).
Apache 2.0 — həm ağırlıq (huggingface.co/bytedance-research/Lance) həm də GitHub repo (github.com/bytedance/Lance). Yerli məhdudiyyətlər yoxdur, MAU limiti yoxdur, kommersiya olmayan sürücü yoxdur, yalnız tədqiqat şərti yoxdur. Çıxışlar standart Apache 2.0 lisenziyası mətnindən kənarda royalti və ya etibar tələbləri olmadan kommersiya olaraq istifadə etmək üçün sizindir.
ByteDance's README-də minimum 40 GB. 3B aktiv parametrləri aldatıcıdır - tam Qwen LLM + Wan VAE + Qwen.5-VL ViT hamısı yaddaşda birgə oturur. Öz-özünə host etmək üçün tək bir A100 80 GB, A6000 48 GB, ya da ən azı 40 GB boşluqla H100/H200 lazım olacaq. Biz onu H200-də (toplam 141 GB) işlədirik, amma hələ də çağırış başına yüklənmiş modellərin qalanını çıxarır, çünki qutudakı ən ağır single-shot-dur.
Bəli — api.free.ai üzərindən {task: "t2i" | "image_edit" | "t2v" | "vqa", prompt: "...", image: <upload> or image_url: "/static/outputs/..."} ilə /v1/multimodal/lance/-ə JSON ya da multipart olaraq POST et. İstifadəçinin təsdiqi inkişaf etdirici API açarları vasitəsilə edilir. Cavab job_id, output URL və share_token-i ehtiva edir. /api/-də hər bir iş üçün curl nümunələri var.
Lance-ni eksperimental olaraq qeyd edirik çünki soyuq yükləmə gecikməsi böyük həcmli trafik üçün uyğun deyil - hər zəng isti flotu çıxarır və yenidən yükləyir. Biz daha sonra istifadənin bir slot ayırmasını təqdir etdiyi təqdirdə "isti Lance" səviyyəsini əlavə edə bilərik, ya da ikinci H200-ü xüsusi olaraq birləşdirilmiş modellər üçün əlavə edə bilərik. İndilikcə bu Free.ai-in digər öz-özünə-hosting modelləri kimi eyni token iqtisadiyyatında əlavə ödənişsiz mövcuddur, yalnız divar-saat GPU vaxtını əks etdirən zəng başına daha yüksək token qiyməti.
Rəsm-redaktə və VQA üçün yüklənmiş şəkillər iş bitdikdən sonra dərhal silinir. Yaratılan nəticələr CDN-də 24 saat (ödənişli istifadəçilər üçün 7 gün) saxlanılır, buna görə də /account/?tab=history-dən yenidən yükləyə bilərsiniz. ByteDance ilə heç nə paylaşılmır - çəkilər bizim avadanlıqda yerli olaraq işləyir. Bütün məlumatlar /privacy/-dədir.