Question 1

Milyen típusú gyógyszer a Lance?

Accepted Answer

Lance a ByteDance 2025-ös natív, egységes multimodális modellje, a 3B aktív paraméterei az Apache 2.0 alatt. Az egyik súlycsoport négy feladatot fed le: text→kép (768×768), kép-edit (768×768), text→video (480p, maximum 121 képkockák • 5 másodperc) és kép+video megértés (VQA, feliratozás). Beépített Qwen-származék LLM gerinc egy Wan-Video VAE és a Qwen,5-VL ViT. Önálló Free.ai H200-on, upstream szolgáltató nélkül, API jelölés nélkül, és nem per-call díjak túl a token egyensúly.

Question 2

Miben különbözik ez az SDXL + egy szerkesztő + Wan külön-külön futtatásától?

Accepted Answer

A legtöbb nyitott stack a legjobb specialistát választja ki minden egyes felülethez, az SDXL-t vagy a FLUX-et a nyers képgeneráláshoz, Qwen-Image-Edit a szerkesztéshez, Wan 2.2 a videóhoz, Qwen.5-VL a látási nyelvre vonatkozó érveléshez. Lance egy kis per-task minőséget ad a keresztfeladatok koherenciájához: ugyanaz a belső reprezentáció táplál minden kimenetet, így egy kép, amit készítesz és aztán szerkesztesz, megtartja a stílusát, és a VQA modell egy videót ad, amely megegyezik a nyelvi modellel ugyanazon ellenőrzőpontban. Hasznos a kutatáshoz és demókhoz, amelyek egy következetes modellből profitálnak, nem pedig egy négyből álló csővezetékből.

Question 3

Mikor válasszam Lance-t a specialisták ellen?

Accepted Answer

Válassza ki Lance-t, amikor: konzisztens stílust szeretne a képen keresztül + szerkeszteni + videót egy modellről, egy többfeladatos csővezetéket és az "egy modell" szöget prototipizál, vagy az egységes munkafolyamaton való engedékeny engedélyezésre van szüksége. Válasszon szakembereket, amikor: a legmagasabb minőségű nyers képgent (FLUX.2 Klein > Lance > 7682), a leghosszabb / legmagasabb minőségű videót (Wan 2.2 TI2V-5B vagy HunyuanVideo > Lance > Lance > 480p), vagy a leggyorsabb VQA-t szeretné a chatben (Qwen.5-VL mindig meleg a H200-on, a Lance-nek hideg terheléssel kell rendelkeznie).

Question 4

Mennyibe kerül minden Lance feladat?

Accepted Answer

Text→kép és kép-edit: 5000 zseton (egyezés FLUX-osztályú kép-gen). Text→video: 15 000 zseton (egyezés CogVideoX / Wan 5B osztály). Image+video VQA: 1000 zseton. A magasabb költség az SDXL-lel (1.000) szemben Lance nehezebb hideg terhelését tükrözi minden hívás kilakoltatja a többi meleg flottát és újratölt 40 GB súlyt, ami 25-40 s-t ad magának a következtetésnek a tetejére.

Question 5

Meddig tart minden feladat?

Accepted Answer

Cold-load (~25-40 s): image gen ~12-20 s, image edition ~15-25 s, text→video ~60-180 s (num_frames-től függően), VQA ~3-8 s. Minden Lance hívás hidegen tölti a modellt, mert a H200-on nem tud együtt elhelyezkedni a többi meleg flottával, így a hideg-load késleltetés minden hívás része, nem csak az első.

Question 6

Mi a maximális kimeneti méret / hossz?

Accepted Answer

A képgenerálás és képszerkesztés 768×768-on van rögzítve. A videógenerálás 480p (jellemzően 480×848 tájkép) és 121 képkockán (~5 másodperc 24 fps-en) van rögzítve. Ezek azok az állásfoglalások, amelyekre Lance-t kiképezték; a magasabb fokozatok egy külön modellen keresztül történő megnyomásához szükséges (try /image/upscaler/ for images or /video/upscaler/ for videos).

Question 7

Hogyan hasonlítja össze Lance Janus, Show-o, Emu3 vagy más egyesített multimodális?

Accepted Answer

Janus (DeepSeek) és Show-o osztott megértés és generáció külön fejek egy megosztott gerincen; Lance szorosabban egységes egy sor generáció+felismerő fejek kifejezett feladat tokens. Emu3 (BAAI) tokenizál mindent, mint különálló tokens beleértve pixelek, ami tisztább autoregresszív generáció, de alacsonyabb minőségű fix compute. Lance pályája a négyfeladatú lefedettség 3B aktív params plusz a Wan-eredetű VAE, amely kezeli videó natív (Janus és Show-o a kép-csak).

Question 8

Milyen engedély alatt van Lance?

Accepted Answer

Az Apache 2.0 - mind a súlyok (ölelkezési felület/bytedance-research/Lance) mind a GitHub repó (github.com/bytedance/Lance). Nincs területi korlátozás, nincs MAU sapka, nincs nem kereskedelmi lovas, nincs kizárólag kutatási záradék. A kimenetek az Apache 2.0 szabvány licencszövegén túli jogdíjak vagy odaítélési követelmények nélkül, kereskedelmi forgalomban használhatók.

Question 9

Milyen VRAM-ra és hardverre van szüksége az öngazdálkodáshoz?

Accepted Answer

A 3B aktív paramok megtévesztőek a teljes Qwen LLM + Wan VAE + Qwen.5-VL ViT mind együtt ülnek a memóriában. Ahhoz, hogy Önálló legyen, egyetlen A100 80 GB-ra, A6000 48 GB-ra vagy egy H100/H200-ra van szükséged, legalább 40 GB ingyen. A H200-n futtatjuk (141 GB összesen), de még mindig kilakoltatja a többi megtöltött modellt hívásonként, mert ez a legnehézebb egylövés a dobozon.

Question 10

Van API?

Accepted Answer

Igen, vagy több rész /v1/multimodal/lance/ on api.free.ai with {task: "t2i" "image_edit" "t2v" "vqa," prompt:...", image: <upload> or image_url: "/static/outputs/..."}. Bearer auth via developer API keys. A válasz magában foglalja a job_id, kimeneti URL, és share_token. /api/ göndör példák egy feladat.

Question 11

Miért "tapasztalat"?

Accepted Answer

Megjelöljük Lance kísérleti, mert a hideg rakomány latencia azt jelenti, hogy ez nem egy nagy alkalmas nagy volumenű forgalom. Minden hívás kilakoltatja a meleg flotta és újratöltések. Mi lehet hozzá egy "meleg Lance" szint később, ha a használat indokolja a rés dedikálását, vagy adhatunk hozzá egy második H200 kifejezetten egységes modellek. Most már elérhető ugyanazon a token gazdaság, mint a többi Free.ai önszálló modellek nélkül felár, csak a magasabb hívásonként token költség tükrözi a falióra GPU időt.

Question 12

A parancsaimat és feltöltéseimet tároljuk, vagy edzésre használjuk?

Accepted Answer

Feltöltött képeket kép-edit és VQA töröljük azonnal a feladat befejezése után. Generált kimenetek ülni a CDN 24 órán keresztül (7 nap fizetett felhasználók), így lehet újra letölteni /account/?tab=történelem. Semmit sem osztott meg ByteDance • a súlyok fut helyileg a hardver. Teljes részletek /privacy /.

A minta részletei

Körülbelül

Alkalmazása API-n keresztül

Összehasonlítás

GYIK

A minta részletei

Körülbelül

Alkalmazása API-n keresztül

Összehasonlítás

GYIK

Szerezz 10 000 ingyen zsetont!

Várj, kapsz 10K ingyen zsetont!

Kérsz még?