Question 1

Što je Lance?

Accepted Answer

Lance je domorodni multimodalni model 2025. – 3B aktivni parametri pod Apache 2.0. Jedan skup težina obuhvaća četiri zadatka: text→image (7668×768), slika-edit (768/768), tekst→video (480p, do 121 okvira ± 5 sekundi) i sliku+video razumijevanje (VQA, naslov). Izgrađen na Qwen-pokrenuta LLM hrbta s Wan-Video VAE i Qwen.5-VL ViT. Samohosted na Free.ai H200 bez upstream dostavljača, bez API označavanja i bez per-call naknade izvan vašeg simbolskog ravnoteže.

Question 2

Zašto "ujedinjeni"? Kako se to razlikuje od pokretanja SDXL + urednik + Wan odvojeno?

Accepted Answer

Većina otvorenih stakova odaberite najboljeg specijalistu za svaku površinu — SDXL ili FLUX za stvaranje sirovih slika, Qwen-Uredba slika za uređivanje, Wan 2.2 za video, Qwen.5-VL za razmatranje vizije. Lance trgova malo kvalitete po zadatku za usklađivanje među zadacima: isti interni prikaz hrani svaki izlaz, tako da slika koju generirate i zatim uređiva svoj stil, a VQA model daje o videu odgovara modelu jezika u istoj kontrolnoj točki. Korisno za istraživanje i demo koje koristi od jednog dosljednog modela, a ne od cjevovoda četiri.

Question 3

Kada da odaberem Lancea protiv specijalista?

Accepted Answer

Odaberite Lancea kada: želite dosljedan stil preko slike + uređivanje + video iz jednog modela, vi ste prototipiranje više zadataka cjevovoda i "jedan model" kuta važno, ili vam je potrebno dopušteno licenciranje na jedinstvenom radnom toku. Odaberite stručnjake kada: želite najkvalitetniju sirovu sliku gen (FLUX.2 Klein > Lance na >7682), najduže / najviša kvaliteta video (Wan 2.2 TI2V-5B ili HunyuanVideo > Lance na >480p) ili najbrži VQA u razgovoru (Qwen.5-VL je uvijek toplo na H200, Lance mora hladno opterećenje).

Question 4

Koliko košta svaki Lance zadatak?

Accepted Answer

Text→image and image-edit: 5.000 žetona (uparava FLUX-class image gen). Text→video: 15.000 žetona (uparuje CogVideoX / Wan 5B klasa). Image+video VQA: 1000 žetona. Viši troškovi protiv SDXL (1.000) odražava Lanceov teži hladni opterećenje – svaki poziv iseljuje ostatak toplog flote i ponovno natovara 40 GB utežina, što dodaje 25-40 s na vrhu samog zaključka. Mi naplaćujemo za ukupno vrijeme GPU-a za zidove, ne samo za paljenje.

Question 5

Koliko traje svaki zadatak?

Accepted Answer

Nakon hladnog opterećenja (~25-40 s): slika gen ~12-20 s, slika urediti ~15-25 s, tekst→video ~60-180 s (ovisno o num_frames), VQA ~3-8 s. Svaki Lance poziva hladno opterećenje modela jer ne može sustanovati s ostatkom tople flote na H200, tako da je odgoda hladnoće dio svakog poziva, ne samo prvi.

Question 6

Koja je maksimalna izlazna veličina / dužina?

Accepted Answer

Generacija i uređivanje slika fiksni su na 768×768. Video generacija je fiksirana na 480p (obično 48×848 pejzaž) i potisnuta na 121 okvira (~5 sekundi na 24 fps). To su rezolucije Lance je obučen; guranje više zahtijeva upscling putem odvojenog modela (pokušaj /image/upscaler/ za slike ili /video/upscaler/ za video).

Question 7

Kako se Lance usporedi s Janusom, Show-o, Emu3, ili drugim ujedinjenim multimodalima?

Accepted Answer

Janus (DeepSeek) i Show-o podijeliti razumijevanje i generaciju u odvojene glave na zajedničkoj kičmi; Lance je čvršće ujedinjen — jedan skup generacije+razumijevajućih glava s eksplicitnim žetonima zadataka. Emu3 (BAAI) potvrđuje sve kao diskretne žetone uključujući piksele, što mu daje čistiju automatsko regresivnu generaciju, ali nižu kvalitetu na fiksnom računanju. Lanceova pozicija je pokrivenost četiri zadatka u 3B aktivnim parama plus njezin Wan-dived VAE koji rukovodi videom na materijalnom (Janus i Show-o su samo slike).

Question 8

Mogu li je koristiti komercijalno?

Accepted Answer

Apache 2.0 – i težine (huggingface.co/bytedance-research/Lance) i GitHub repo (github.com/bytedance/Lance). Bez teritorijalnih ograničenja, bez MAU kape, bez ne-komercijalnog vozača, bez klauzule samo za istraživanje. Rezultati su vaši da se koriste komercijalno bez autoriteta ili zahtjeva za pripisivanje izvan standardnog Apach 2.0 licence tekst.

Question 9

Koji VRAM i hardver trebaju za samostalnog domaćina?

Accepted Answer

40 GB minimum po bajtDance's README. 3B aktivni parami su varljivi — puni Qwen LLM + Wan VAE + Qwen.5-VL ViT svi sjede u pamćenju zajedno. Da bi samostalni voditelj trebao jedan A100 80 GB, A6000 48 GB, ili H100/H200 sa najmanje 40 GB besplatno. Provjeravamo ga na našem H200 (141 GB ukupno), ali još uvijek iseljuje ostatak utovarenih modela po pozivu jer je to najteže jednokratno snimanje na kutiji.

Question 10

Postoji li API?

Accepted Answer

Da — POST JSON ili multipart to /v1/multimodal/lance/ on api.free.ai with {task: "t2i"  "image_edit"  "t2v"  "vqa", prost: "...", slika: <upload> ili image_url: "/static/outputs /..."}. Nositelj auth. auth. putem razvojnih API tipki. Odgovor uključuje job_id, izlazni URL i share_token. /api/ ima curl primjere po zadatku.

Question 11

Zašto "eksperimentalno"?

Accepted Answer

Označavamo Lance eksperimentalni jer hladno opterećenje latency znači da ne odgovara velikoj količini prometa – svaki poziv izbacuje toplu flotu i ponovno učitava. Možemo dodati "topli Lance stupanj" kasnije ako korištenje opravdava posvećivanje slota, ili možemo dodati drugi H200 posebno za jedinstvene modele. Za sada je dostupan u istom žeton ekonomiji kao i ostatak Free.ai samohosted modela bez nadoplate, samo viši po pozivu žeton trošak odražava vrijeme GPU zida.

Question 12

Jesu li moji upiti i uploadovi spremljeni ili korišteni za trening?

Accepted Answer

Odabrane slike za uređivanje slika i VQA brišu se odmah nakon završetka zadatka. Generirani izlazi sjede na našem CDN 24 sata (7 dana za plaćene korisnike) tako da možete ponovno preuzeti iz /account /?tab=history. Ništa se ne dijeli s BayteDance — težine pokrenuti lokalno na našem hardveru. Potpuni detalji na /privacy /.

Detalji modela

O programu

Koristi preko API-ja

Usporedi

Pitanja

Detalji modela

O programu

Koristi preko API-ja

Usporedi

Pitanja

Nabavite 10.000 besplatnih tokena

Čekajte, dobiti 10K besplatnih tokena!

Hoćeš još?