Question 1

Hvad er Lance?

Accepted Answer

Lance is ByteDance's 2025 native samlede multimodale model ~ 3B aktive parametre under Apache 2.0. Et sæt vægte dækker fire opgaver: tekst→image (768×768), billede-redigering (768×768), tekst→video (480p, op til 121 rammer 5 sekunder), og billede + video forståelse (VQA, billedtekstering). Bygget på en Qwen-afledt LLM rygrad med en Wan-Video VAE og en Qwen.5-VL ViT. Selvværtet på Free.ai H200 uden opstrømsleverandør, ingen API markup, og ingen per-cal gebyrer ud over din symbolske balance.

Question 2

Hvorfor "forenet"? Hvordan er det anderledes end at køre SDXL + en editor + Wan separat?

Accepted Answer

De fleste åbne stakke vælge den bedste specialist for hver overflade ~ SDXL eller FLUX for rå billedgenerering, Qwen-Image-Rediger for redigeringer, Wan 2.2 for video, Qwen.5-VL for vision-sprog ræsonnement. Lance handler en smule per-task kvalitet for cross-task sammenhæng: den samme interne repræsentation feeds hver output, så et billede, du genererer og derefter redigerer bevarer sin stil, og VQA modellen giver om en video matcher sprogmodellen i samme checkpoint. Nyttig for forskning og demoer, der drager fordel af en konsekvent model snarere end en rørledning på fire.

Question 3

Hvornår skal jeg vælge Lance mod specialisterne?

Accepted Answer

Pick Lance, når: du ønsker konsekvent stil på tværs af billede + redigere + video fra en model, du prototyping en multi-task pipeline og "one model" vinkel spørgsmål, eller du har brug for permissive licensering på den samlede arbejdsgang. Vælg specialister, når: du ønsker højeste kvalitet rå image gen (FLUX.2 Klein > Lance på >7682), længste / højeste kvalitet video (Wan 2.2 TI2V-5B eller HunyuanVideo > Lance på >480p), eller hurtigste VQA i chatten (Qwen.5-VL er altid varm på H200, Lance har til kold-læs).

Question 4

Hvor meget koster hver Lance opgave?

Accepted Answer

Tekst→billede og billede-redigering: 5.000 tokens (matcher FLUX-klasse billede gen). Tekst→video: 15.000 tokens (matches CogVideoX / Wan 5B klasse). Billede + video VQA: 1.000 tokens. Den højere pris vs SDXL (1.000) afspejler Lance tungere kold-læs • hvert opkald udsender resten af den varme flåde og genindlæser 40 GB vægte, som tilføjer 25-40 s oven på selve inferencen. Vi fakturerer for total væg-clock GPU tid, ikke bare inference.

Question 5

Hvor lang tid tager hver opgave?

Accepted Answer

Efter kold-belastning (~ 25-40 s): billede gen ~ 12-20 s, billede redigere ~ 15-25 s, tekst→video ~ 60-180 s (afhængigt af num_frames), VQA ~3-8 s. Hver Lance kalder kold-laster modellen, fordi det ikke kan med-residente med resten af den varme flåde på H200, så kulde-last forsinkelse er en del af hvert opkald, ikke kun den første.

Question 6

Hvad er den maksimale output størrelse / længde?

Accepted Answer

Billedgenerering og billedredigering er fastsat til 768×768. Videogenerering er fastsat til 480p (typisk 480×848 landskab) og begrænset til 121 rammer (~ 5 sekunder ved 24 fps). Det er opløsninger Lance blev trænet på; skubbe højere kræver upskalering via en separat model (prøv /image/upscaler / for billeder eller /video/upscaler / til videoer).

Question 7

Hvordan sammenligner Lance sig med Janus, Show-o, Emu3, eller andre kombinerede multimodale?

Accepted Answer

Janus (DeepSeek) og Show-o split forståelse og generation i separate hoveder på en delt rygrad; Lance er mere tæt samlet ~ et sæt generation + forstående hoveder med eksplicit opgave tokens. Emu3 (BAAI) tokenizes alt som diskrete tokens, herunder pixels, som giver det renere autoregressive generation, men lavere kvalitet på fast compute. Lance pitch er den fire-task dækning i 3B aktive params plus dens Wan-afledte VAE, der håndterer video indbygget (Janus og Show-o er billede-kun).

Question 8

Hvilken licens er Lance under? Kan jeg bruge det kommercielt?

Accepted Answer

Apache 2.0 er både vægtene (huggingface.co/bytedance-research/Lance) og GitHub repo (github.com/bytedance/Lance). Ingen territoriale begrænsninger, ingen MAU cap, ingen ikke-kommerciel rytter, ingen forsknings-only klausul. Outputs er dine til at bruge kommercielt uden royalties eller tildelingskrav ud over standard Apache 2.0 licenstekst.

Question 9

Hvilken VRAM og hardware har det brug for at selvværd?

Accepted Answer

40 GB minimum per ByteDance's README. De 3B aktive params er vildledende Qwen LLM + Wan VAE + Qwen.5-VL ViT alle sidder i hukommelsen sammen. For selvvært skal du bruge en enkelt A100 80 GB, A6000 48 GB, eller en H100/H200 med mindst 40 GB gratis. Vi kører det på vores H200 (141 GB i alt), men det stadig skubber resten af de indlæste modeller per opkald, fordi det er den tungeste enkelt-shot på boksen.

Question 10

Er der en API?

Accepted Answer

Ja! POST JSON eller multipart to /v1/multimodal/lance/ on api.free.ai with {task: "t2i" ~ "image_ redit" "t2v" • "vqa," prompt: "...", image: <upload> or image_url: "/static/ outputs/..."}. Bearer auth via udvikler API taster. Respons omfatter job_id, output URL, and share_ token. /api/ has curl examples per task.

Question 11

Hvorfor "forsøge"?

Accepted Answer

Vi markerer Lance eksperimenterende, fordi kold-last latenstid betyder, at det ikke er en stor egnet til høj-volumen trafik! hvert opkald udsender den varme flåde og genindlæser. Vi kan tilføje en "varm Lance" niveau senere, hvis brugen retfærdiggør dedikation af en slot, eller vi kan tilføje en anden H200 specifikt for samlede modeller. For nu er det tilgængelig på den samme symbolske økonomi som resten af Free.ai's selv-hostet modeller uden tillæg, bare den højere per-call token omkostninger afspejler wall-clock GPU tid.

Question 12

Er mine prompter og uploads gemt eller brugt til træning?

Accepted Answer

Uploadede billeder til billedredigering og VQA slettes umiddelbart efter opgaven er afsluttet. Genererede udgange sidder på vores CDN i 24 timer (7 dage for betalte brugere), så du kan re-download fra /account /?tab=historie. Intet deles med ByteDance ~ vægtene kører lokalt på vores hardware. Fulde detaljer på /privacy /.

Modeloplysninger

Om

Brug via API

Sammenlign

Ofte stillede spørgsmål

Modeloplysninger

Om

Brug via API

Sammenlign

Ofte stillede spørgsmål

Få 10.000 gratis tokens

Vent! Få 10K gratis tokens!

Vil du have mere?