Detalye modèl
Atik
Lance 3B (unified) se a Modèl AI ki te bati pa ByteDance. Li se pi gwo vil la nan Cross-task research, prototyping pipelines that need image + video + edit + VQA from one model, "one model, four tasks" demos. Apache 2.0, commercial use OK.. Self-hosted sou Free.ai GPUs — kouri gratis kont chak jou ou a token pool (100 tokens pou chak itilize). Li libere anba lisans Apache 2.0 — itilize komèsyal pèmèt sou Free.ai.
Itilize via API
curl https://api.free.ai/v1/chat/ \
-H "Authorization: Bearer YOUR_KEY" \
-d '{"model":"lance-3b"}'
Konpare
FAQ
Lance se 2025 natif-natal ByteDance a unifié multimodal modèl — 3B paramèt aktif anba Apache 2.0. Yon seri de pwa kouvri kat travay: tèks→ imaj (768 × 768), imaj-edisyon (768 × 768), tèks→ videyo (480p, jiska 121 kadr ≈ 5 segonn), ak imaj + videyo konprann (VQA, tit). Konpoze sou yon Qwen-derived LLM backbone ak yon Wan-Video VAE ak yon Qwen.5-VL ViT. Self-hosted sou Free.ai a H200 san okenn upstream founisè, san markup API, ak san frè pou chak apèl depase balans ou token.
Pifò piles louvri chwazi pi bon espesyalis pou chak sifas — SDXL oswa FLUX pou jenerasyon imaj brut, Qwen-Image-Edit pou modifye, Wan 2.2 pou videyo, Qwen.5-VL pou rezonaj lang vizyèl. Lance trades yon ti kras nan kalite pou chak travay pou koherans ant-task: menm reprezantasyon anndan an manje chak rezilta, se konsa yon imaj ou jenere epi lè sa a modifye kenbe style li, ak VQA modèl la bay sou yon videyo matche ak modèl lang nan menm pwen an. Itil pou rechèch ak demos ki gen benefis nan yon modèl konstan pi plis pase yon pipeline de kat.
Chofe Lance lè: ou vle yon style konstan sou imaj + modifye + videyo soti nan yon sèl modèl, ou ap prototiping yon multi-task pipeline ak "yon modèl" ang enpòtan, oswa ou bezwen lisans permissive sou flè travay la unifié. Chofe espesyalis lè: ou vle pi bon kalite imaj brute gen (FLUX.2 Klein > Lance nan> 768²), pi long / pi bon kalite videyo (Wan 2.2 TI2V-5B oswa HunyuanVideo > Lance nan> 480p), oswa pi vit VQA nan chat (Qwen.5-VL se toujou cho sou H200, Lance gen pou cold-load).
Text→image and image-edit: 5,000 tokens (matches FLUX-class image gen). Text→video: 15,000 tokens (matches CogVideoX / Wan 5B class). Image+video VQA: 1,000 tokens. The higher cost vs SDXL (1,000) reflects Lance's heavier cold-load — every call evicts the rest of the warm fleet and re-loads 40 GB of weights, which adds 25-40 s on top of the inference itself. We're billing for total wall-clock GPU time, not just inference.
Apre cold-load (~25-40 s): imaj gen ~12-20 s, imaj modifye ~15-25 s, tèks→videyo ~60-180 s (ki depann de num_frames), VQA ~3-8 s. chak apèl Lance cold-loads modèl la paske li pa ka co-resident ak rès la nan flote cho sou H200, se konsa detant cold-load se yon pati nan chak apèl, pa sèlman premye a.
Kreyasyon imaj ak editasyon imaj fikse a 768×768. Kreyasyon videyo fikse a 480p (tipikman 480×848 paysage) ak yon limit 121 kad (~5 segonn a 24 fps). Sa yo se rezoudyon Lance te antrene sou; pou pouse pi wo a mande pou upscale via yon modèl separe (espere /image/upscaler/ pou imaj oswa /video/upscaler/ pou videyo).
Janus (DeepSeek) ak Show-o divize konpòtman ak jenerasyon an nan tèt separe sou yon baz pataje; Lance se pi byen unifié — yon sèl set de konpòtman + konpòtman tèt ak esplike travay tokens. Emu3 (BAAI) tokenize tout bagay kòm diskrè tokens ki gen ladan pixels, ki bay li pi pwòp autoregressive jenerasyon men pi ba kalite nan komputasyon fiks. Lance a pitch se kouvrefe a kat-task nan 3B params actifs plis li a Wan-derived VAE ki jere videyo natif natal (Janus ak Show-o se imaj-se sèlman).
Apache 2.0 — tou de pwa (huggingface.co/bytedance-research/Lance) ak repòtaj GitHub (github.com/bytedance/Lance). Pa gen restriksyon teritwa, pa gen limit MAU, pa gen rider ki pa komèsyal, pa gen kondisyon pou rechèch sèlman. Rezoud yo se ou pou itilize komèsyalman san okenn restriksyon oswa kondisyon pou asiyen ki depase tèks lisans Apache 2.0 a.
40 GB minimòm pou README ByteDance a. 3B params actifs yo dekouraje - Qwen LLM + Wan VAE + Qwen.5-VL ViT tout sit nan memwa ansanm. Pou tèt-antre ou ta bezwen yon sèl A100 80 GB, A6000 48 GB, oswa yon H100/H200 ak nan pi ba pase 40 GB gratis. Nou kouri li sou nou H200 (141 GB total) men li toujou depòte rès la nan modèl yo chaje pa apèl paske li se pi lou single-shot sou ka a.
Wi — POST JSON oswa multipart pou /v1/multimodal/lance/ sou api.free.ai ak {task: "t2i" | "image_edit" | "t2v" | "vqa", prompt: "...", image: <upload> or image_url: "/static/outputs/..."}. Auth depo via klike sou API detèmine. Reponn gen ladan job_id, URL dechouke, ak share_token. /api/ gen egzanp curl pou chak travay.
Nou make Lance esè paske fre-lòd latency vle di li pa yon gwo ranje pou trafik gwo volim - chak apèl depòte flote cho ak reloads. Nou ka ajoute yon "Lance cho" nivo pita si utilisation justifie dedikasyon yon slot, oswa nou ka ajoute yon dezyèm H200 espesifikman pou modèl unified.For kounye a li disponib sou menm ekonomi token tankou rès la nan Free.ai's modèl self-hosted san okenn sou-koute, jis pi wo a per-call token pri reflete tan GPU wall-clock.
imaj ki te telechaje pou edite imaj ak VQA yo te efase imedyatman apre travay la te fini. rezilta yo te kreye rete sou CDN nou an pou 24 èdtan (7 jou pou itilizatè ki peye) se konsa ou ka telechaje ankò soti nan / kont /? tab= istwa. pa gen anyen ki pataje ak ByteDance — pwa yo kouri lokalman sou ekipman nou an. detay konplè nan / vi prive /.