Modeloplysninger
Om
Lance 3B (unified) er {article____freai_ph_kategori} bygget af ByteDance. Stærkeste på Cross-task research, prototyping pipelines that need image + video + edit + VQA from one model, "one model, four tasks" demos. Apache 2.0, commercial use OK.. Self-hostet på Free.ai GPU'er kører gratis mod din daglige token pool (100 tokens pr. anvendelse). Udgivet under Apache 2.0 tilladt kommerciel brug på Free.ai.
Brug via API
curl https://api.free.ai/v1/chat/ \
-H "Authorization: Bearer YOUR_KEY" \
-d '{"model":"lance-3b"}'
Sammenlign
Ofte stillede spørgsmål
Lance is ByteDance's 2025 native samlede multimodale model ~ 3B aktive parametre under Apache 2.0. Et sæt vægte dækker fire opgaver: tekst→image (768×768), billede-redigering (768×768), tekst→video (480p, op til 121 rammer 5 sekunder), og billede + video forståelse (VQA, billedtekstering). Bygget på en Qwen-afledt LLM rygrad med en Wan-Video VAE og en Qwen.5-VL ViT. Selvværtet på Free.ai H200 uden opstrømsleverandør, ingen API markup, og ingen per-cal gebyrer ud over din symbolske balance.
De fleste åbne stakke vælge den bedste specialist for hver overflade ~ SDXL eller FLUX for rå billedgenerering, Qwen-Image-Rediger for redigeringer, Wan 2.2 for video, Qwen.5-VL for vision-sprog ræsonnement. Lance handler en smule per-task kvalitet for cross-task sammenhæng: den samme interne repræsentation feeds hver output, så et billede, du genererer og derefter redigerer bevarer sin stil, og VQA modellen giver om en video matcher sprogmodellen i samme checkpoint. Nyttig for forskning og demoer, der drager fordel af en konsekvent model snarere end en rørledning på fire.
Pick Lance, når: du ønsker konsekvent stil på tværs af billede + redigere + video fra en model, du prototyping en multi-task pipeline og "one model" vinkel spørgsmål, eller du har brug for permissive licensering på den samlede arbejdsgang. Vælg specialister, når: du ønsker højeste kvalitet rå image gen (FLUX.2 Klein > Lance på >7682), længste / højeste kvalitet video (Wan 2.2 TI2V-5B eller HunyuanVideo > Lance på >480p), eller hurtigste VQA i chatten (Qwen.5-VL er altid varm på H200, Lance har til kold-læs).
Tekst→billede og billede-redigering: 5.000 tokens (matcher FLUX-klasse billede gen). Tekst→video: 15.000 tokens (matches CogVideoX / Wan 5B klasse). Billede + video VQA: 1.000 tokens. Den højere pris vs SDXL (1.000) afspejler Lance tungere kold-læs • hvert opkald udsender resten af den varme flåde og genindlæser 40 GB vægte, som tilføjer 25-40 s oven på selve inferencen. Vi fakturerer for total væg-clock GPU tid, ikke bare inference.
Efter kold-belastning (~ 25-40 s): billede gen ~ 12-20 s, billede redigere ~ 15-25 s, tekst→video ~ 60-180 s (afhængigt af num_frames), VQA ~3-8 s. Hver Lance kalder kold-laster modellen, fordi det ikke kan med-residente med resten af den varme flåde på H200, så kulde-last forsinkelse er en del af hvert opkald, ikke kun den første.
Billedgenerering og billedredigering er fastsat til 768×768. Videogenerering er fastsat til 480p (typisk 480×848 landskab) og begrænset til 121 rammer (~ 5 sekunder ved 24 fps). Det er opløsninger Lance blev trænet på; skubbe højere kræver upskalering via en separat model (prøv /image/upscaler / for billeder eller /video/upscaler / til videoer).
Janus (DeepSeek) og Show-o split forståelse og generation i separate hoveder på en delt rygrad; Lance er mere tæt samlet ~ et sæt generation + forstående hoveder med eksplicit opgave tokens. Emu3 (BAAI) tokenizes alt som diskrete tokens, herunder pixels, som giver det renere autoregressive generation, men lavere kvalitet på fast compute. Lance pitch er den fire-task dækning i 3B aktive params plus dens Wan-afledte VAE, der håndterer video indbygget (Janus og Show-o er billede-kun).
Apache 2.0 er både vægtene (huggingface.co/bytedance-research/Lance) og GitHub repo (github.com/bytedance/Lance). Ingen territoriale begrænsninger, ingen MAU cap, ingen ikke-kommerciel rytter, ingen forsknings-only klausul. Outputs er dine til at bruge kommercielt uden royalties eller tildelingskrav ud over standard Apache 2.0 licenstekst.
40 GB minimum per ByteDance's README. De 3B aktive params er vildledende Qwen LLM + Wan VAE + Qwen.5-VL ViT alle sidder i hukommelsen sammen. For selvvært skal du bruge en enkelt A100 80 GB, A6000 48 GB, eller en H100/H200 med mindst 40 GB gratis. Vi kører det på vores H200 (141 GB i alt), men det stadig skubber resten af de indlæste modeller per opkald, fordi det er den tungeste enkelt-shot på boksen.
Ja! POST JSON eller multipart to /v1/multimodal/lance/ on api.free.ai with {task: "t2i" ~ "image_ redit" "t2v" • "vqa," prompt: "...", image: <upload> or image_url: "/static/ outputs/..."}. Bearer auth via udvikler API taster. Respons omfatter job_id, output URL, and share_ token. /api/ has curl examples per task.
Vi markerer Lance eksperimenterende, fordi kold-last latenstid betyder, at det ikke er en stor egnet til høj-volumen trafik! hvert opkald udsender den varme flåde og genindlæser. Vi kan tilføje en "varm Lance" niveau senere, hvis brugen retfærdiggør dedikation af en slot, eller vi kan tilføje en anden H200 specifikt for samlede modeller. For nu er det tilgængelig på den samme symbolske økonomi som resten af Free.ai's selv-hostet modeller uden tillæg, bare den højere per-call token omkostninger afspejler wall-clock GPU tid.
Uploadede billeder til billedredigering og VQA slettes umiddelbart efter opgaven er afsluttet. Genererede udgange sidder på vores CDN i 24 timer (7 dage for betalte brugere), så du kan re-download fra /account /?tab=historie. Intet deles med ByteDance ~ vægtene kører lokalt på vores hardware. Fulde detaljer på /privacy /.