Csevegés

Nincs korábbi csevegés

Free.ai (self-hosted) ~100 zsetonok/msg
Lance 3B (unified)

Szia! Lance 3B (unified). Kérdezz bármit.

~100 zsetonok/msg · napi medence Belépés a elküldéshez
A minta részletei

A minta részletei

Házigazdával Free.ai (self-hosted)
Létrehozta: ByteDance
Kategória Multimodal
Háttér 32768 tokens
Költség ~100 zsetonok/msg · napi medence

Körülbelül

Lance 3B (unified) an AI-modell készítette ByteDance. A legerősebb aCross-task research, prototyping pipelines that need image + video + edit + VQA from one model, "one model, four tasks" demos. Apache 2.0, commercial use OK.. Önálló, Free.ai GPU-n fut ingyenes ellen a napi token medence (100 tokens alkalmazásonként). A Apache 2.0 alatt kiadott kereskedelmi célú felhasználás megengedett Free.ai-en.

Alkalmazása API-n keresztül

curl https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer YOUR_KEY" \
  -d '{"model":"lance-3b"}'
API Dokumentumok

GYIK

Lance a ByteDance 2025-ös natív, egységes multimodális modellje, a 3B aktív paraméterei az Apache 2.0 alatt. Az egyik súlycsoport négy feladatot fed le: text→kép (768×768), kép-edit (768×768), text→video (480p, maximum 121 képkockák • 5 másodperc) és kép+video megértés (VQA, feliratozás). Beépített Qwen-származék LLM gerinc egy Wan-Video VAE és a Qwen,5-VL ViT. Önálló Free.ai H200-on, upstream szolgáltató nélkül, API jelölés nélkül, és nem per-call díjak túl a token egyensúly.

A legtöbb nyitott stack a legjobb specialistát választja ki minden egyes felülethez, az SDXL-t vagy a FLUX-et a nyers képgeneráláshoz, Qwen-Image-Edit a szerkesztéshez, Wan 2.2 a videóhoz, Qwen.5-VL a látási nyelvre vonatkozó érveléshez. Lance egy kis per-task minőséget ad a keresztfeladatok koherenciájához: ugyanaz a belső reprezentáció táplál minden kimenetet, így egy kép, amit készítesz és aztán szerkesztesz, megtartja a stílusát, és a VQA modell egy videót ad, amely megegyezik a nyelvi modellel ugyanazon ellenőrzőpontban. Hasznos a kutatáshoz és demókhoz, amelyek egy következetes modellből profitálnak, nem pedig egy négyből álló csővezetékből.

Válassza ki Lance-t, amikor: konzisztens stílust szeretne a képen keresztül + szerkeszteni + videót egy modellről, egy többfeladatos csővezetéket és az "egy modell" szöget prototipizál, vagy az egységes munkafolyamaton való engedékeny engedélyezésre van szüksége. Válasszon szakembereket, amikor: a legmagasabb minőségű nyers képgent (FLUX.2 Klein > Lance > 7682), a leghosszabb / legmagasabb minőségű videót (Wan 2.2 TI2V-5B vagy HunyuanVideo > Lance > Lance > 480p), vagy a leggyorsabb VQA-t szeretné a chatben (Qwen.5-VL mindig meleg a H200-on, a Lance-nek hideg terheléssel kell rendelkeznie).

Text→kép és kép-edit: 5000 zseton (egyezés FLUX-osztályú kép-gen). Text→video: 15 000 zseton (egyezés CogVideoX / Wan 5B osztály). Image+video VQA: 1000 zseton. A magasabb költség az SDXL-lel (1.000) szemben Lance nehezebb hideg terhelését tükrözi minden hívás kilakoltatja a többi meleg flottát és újratölt 40 GB súlyt, ami 25-40 s-t ad magának a következtetésnek a tetejére.

Cold-load (~25-40 s): image gen ~12-20 s, image edition ~15-25 s, text→video ~60-180 s (num_frames-től függően), VQA ~3-8 s. Minden Lance hívás hidegen tölti a modellt, mert a H200-on nem tud együtt elhelyezkedni a többi meleg flottával, így a hideg-load késleltetés minden hívás része, nem csak az első.

A képgenerálás és képszerkesztés 768×768-on van rögzítve. A videógenerálás 480p (jellemzően 480×848 tájkép) és 121 képkockán (~5 másodperc 24 fps-en) van rögzítve. Ezek azok az állásfoglalások, amelyekre Lance-t kiképezték; a magasabb fokozatok egy külön modellen keresztül történő megnyomásához szükséges (try /image/upscaler/ for images or /video/upscaler/ for videos).

Janus (DeepSeek) és Show-o osztott megértés és generáció külön fejek egy megosztott gerincen; Lance szorosabban egységes egy sor generáció+felismerő fejek kifejezett feladat tokens. Emu3 (BAAI) tokenizál mindent, mint különálló tokens beleértve pixelek, ami tisztább autoregresszív generáció, de alacsonyabb minőségű fix compute. Lance pályája a négyfeladatú lefedettség 3B aktív params plusz a Wan-eredetű VAE, amely kezeli videó natív (Janus és Show-o a kép-csak).

Az Apache 2.0 - mind a súlyok (ölelkezési felület/bytedance-research/Lance) mind a GitHub repó (github.com/bytedance/Lance). Nincs területi korlátozás, nincs MAU sapka, nincs nem kereskedelmi lovas, nincs kizárólag kutatási záradék. A kimenetek az Apache 2.0 szabvány licencszövegén túli jogdíjak vagy odaítélési követelmények nélkül, kereskedelmi forgalomban használhatók.

A 3B aktív paramok megtévesztőek a teljes Qwen LLM + Wan VAE + Qwen.5-VL ViT mind együtt ülnek a memóriában. Ahhoz, hogy Önálló legyen, egyetlen A100 80 GB-ra, A6000 48 GB-ra vagy egy H100/H200-ra van szükséged, legalább 40 GB ingyen. A H200-n futtatjuk (141 GB összesen), de még mindig kilakoltatja a többi megtöltött modellt hívásonként, mert ez a legnehézebb egylövés a dobozon.

Igen, vagy több rész /v1/multimodal/lance/ on api.free.ai with {task: "t2i" "image_edit" "t2v" "vqa," prompt:...", image: <upload> or image_url: "/static/outputs/..."}. Bearer auth via developer API keys. A válasz magában foglalja a job_id, kimeneti URL, és share_token. /api/ göndör példák egy feladat.

Megjelöljük Lance kísérleti, mert a hideg rakomány latencia azt jelenti, hogy ez nem egy nagy alkalmas nagy volumenű forgalom. Minden hívás kilakoltatja a meleg flotta és újratöltések. Mi lehet hozzá egy "meleg Lance" szint később, ha a használat indokolja a rés dedikálását, vagy adhatunk hozzá egy második H200 kifejezetten egységes modellek. Most már elérhető ugyanazon a token gazdaság, mint a többi Free.ai önszálló modellek nélkül felár, csak a magasabb hívásonként token költség tükrözi a falióra GPU időt.

Feltöltött képeket kép-edit és VQA töröljük azonnal a feladat befejezése után. Generált kimenetek ülni a CDN 24 órán keresztül (7 nap fizetett felhasználók), így lehet újra letölteni /account/?tab=történelem. Semmit sem osztott meg ByteDance • a súlyok fut helyileg a hardver. Teljes részletek /privacy /.

Love this tool? Share it!

Szavazz erre az oldalra