Pratélan Model
Ngendi
Lance 3B (unified) iku a Model AI dibangun déning ByteDance. Dhèwèké uga dadi anggota grup band Free_Freaks. Self-hosted on Free.ai GPUs — runs free against your daily token pool (100 tokens saben panggunaan). Released under Apache 2.0 — commercial use permitted on Free.ai.
Nggunakake liwat API
curl https://api.free.ai/v1/chat/ \
-H "Authorization: Bearer YOUR_KEY" \
-d '{"model":"lance-3b"}'
Ngbandingake
FAQ
Lance iku model multimodal asli ByteDance 2025 — 3B parameter aktif ing Apache 2.0. Satunggaling set bobot nglumpukaken papat tugas: teks→gambar (768×768), gambar-sunting (768×768), teks→video (480p, dumugi 121 bingkai ≈5detik), lan gambar+ video pangertèn (VQA, captioning). Diwangun ing Qwen-derived LLM backbone karo Wan-Video VAE lan Qwen.5-VL ViT. Self-hosted ing Free.ai's H200 tanpa upstream provider, ora API markup, lan ora per-call fees ngluwihi saldo token sampeyan.
Kabèh stack kang dibukak milih spesialis kang paling apik kanggo saben permukaan — SDXL utawa FLUX kanggo nyipta gambar raw, Qwen-Image-Edit kanggo penyuntingan, Wan 2.2 kanggo video, Qwen.5-VL kanggo raos basa visi. Lance ngganti cacahé kualitas per-tugas kanggo koherénsi cross-tugas: representasi internal kang padha nyedhiyani saben output, mula gambar kang sampeyan nyipta lan banjur nyedhiyani tetep gayané, lan VQA kang diwènèhaké modél ngenani video padha karo modél basa ing checkpoint kang padha. Migunani kanggo riset lan demo kang bisa kagunakaké saka siji model kang konsisten tinimbang saka pipa papat.
Pilih Lance nalika: sampeyan pengin gaya sing konsisten ing gambar + édit + video saka siji model, sampeyan lagi prototyping multi-task pipeline lan sudut "siji model" penting, utawa sampeyan butuh lisensi permisif ing aliran kerja sing digabung. Pilih spesialis nalika: sampeyan pengin gambar raw kualitas dhuwur (FLUX.2 Klein > Lance ing >768²), video kualitas dhuwur / paling dawa (Wan 2.2 TI2V-5B utawa HunyuanVideo > Lance ing >480p), utawa VQA paling cepet ing chatting (Qwen.5-VL tansah adhem ing H200, Lance kudu cold-load).
Teks→gambar lan gambar-sunting: 5,000 token (cocog karo FLUX-klasa gambar gen). Teks→video: 15,000 token (cocog karo CogVideoX / Wan 5B kelas). Gambar+video VQA: 1,000 token. Biaya kang luwih dhuwur tinimbang SDXL (1,000) nggambarake bobot-dingin Lance kang luwih akèh — saben panjaluk nglumpukake sisa saka armada panas lan ngre-load 40 GB bobot, kang nambah 25-40 s ing ndhuwur inference dhewe. Kita ngitung kanggo total wektu jam dinding GPU, ora mung inference.
1500-an (MCCCC) punika taun ingkang kalampahan ing taun kabisan ing Kaléndri Gréja Katulik Roma. taun punika dipunwiwiti tanggal 1500 lan pungkasan tanggal 1501. taun punika dipunwiwiti tanggal 1502 lan pungkasan tanggal 1503. taun punika dipunwiwiti tanggal 1504 lan pungkasan tanggal 1505. taun punika dipunwiwiti tanggal 1506 lan pungkasan tanggal 1507. taun punika dipunwiwiti tanggal 1508 lan pungkasan tanggal 1509. taun punika dipunwiwiti tanggal 1509 lan pungkasan tanggal 1510.
Penciptaan gambar lan penyuntingan gambar dipérang dadi 768×768. Penciptaan video dipérang dadi 480p (biasané 480×848 landscape) lan diwatesi ing 121 frame (~5 detik ing 24 fps). Iki ya iku resolusi kang dilatih Lance; kanggo ngupayaké resolusi kang luwih dhuwur, perlu diupscale liwat model kang béda (coba /image/upscaler/ kanggo gambar utawa /video/upscaler/ kanggo video).
Janus (DeepSeek) lan Show-o ngpisahaké pangertèn lan panggawéan dadi kepala kang kapisah ing backbone kang dipérang; Lance luwih digabungake — siji set saka panggawéan+pangertèn kepala karo token tugas eksplisit. Emu3 (BAAI) nggabungaké kabèh kaya token diskret kalebu piksel, kang ndadekake panggawéan autoregressive luwih resik nanging kualitas luwih endhek ing komputasi kang ditetepake. Lance's pitch iku papat-tugas cover ing 3B aktif params ditambah VAE kang asalé saka Wan kang ngrawat video kanthi asli (Janus lan Show-o mung gambar).
Apache 2.0 — kaliyan bobot (huggingface.co/bytedance-research/Lance) lan repositori GitHub (github.com/bytedance/Lance). Ora ana watesan teritorial, ora ana watesan MAU, ora ana rider non-komersial, ora ana klausa riset-saben. Output iku kanggo sampeyan kanggo digunakake kanthi komersial tanpa royalti utawa persyaratan atribusi ing saliyané teks lisensi Apache 2.0 standar.
40 GB minimum per ByteDance's README. Params aktif 3B iku ngganggu - Qwen LLM + Wan VAE + Qwen.5-VL ViT lengkap kabeh manggon ing memori bebarengan. Kanggo self-host sampeyan bakal butuh siji A100 80 GB, A6000 48 GB, utawa H100/H200 kanthi paling ora 40 GB gratis. Kita ngoperasikake ing H200 kita (141 GB total) nanging isih ngeculaké sisa-sisa model sing dimuat saben panjaluk amarga iku sing paling abot single-shot ing kotak.
Ya — POST JSON utawa multipart menyang /v1/multimodal/lance/ ing api.free.ai kanthi {task: "t2i" | "image_edit" | "t2v" | "vqa", prompt: "...", gambar: <upload> utawa image_url: "/static/outputs/..."}.
Kita nyathet Lance minangka eksperimen amarga latensi pendinginan-load tegesé ora cocog kanggo lalu lintas volume dhuwur - saben panjaluk ngeculaké armada panas lan ngreload. Kita bisa nambah "warm Lance" tingkat sabanjuré yen panggunaan ngrewangi dedikasikan slot, utawa kita bisa nambah H200 kaping kalih khusus kanggo model sing digabung. Kanggo saiki, iku kasedhiya ing token ekonomi sing padha kaya sisa Free.ai's self-hosted model tanpa surcharge, mung luwih dhuwur per-call token biaya nggambarake jam dinding GPU wektu.
Gambar kang diunggah kanggo penyuntingan gambar lan VQA dihapus langsung sawisé tugas rampung. Output kang dihasilaké ana ing CDN kita kanggo 24 jam (7 dina kanggo pangguna sing mbayar) supaya sampeyan bisa ngundhuh maneh saka /account/?tab=history. Ora ana sing dituduhake karo ByteDance — bobot dijalanake lokal ing piranti keras kita. Rincian lengkap ing /privacy/.