Detalji modela
O programu
_FREEAI_PH_Leadan {kategorija} izgrađena po ByteDance. Najjači na Cross-task research, prototyping pipelines that need image + video + edit + VQA from one model, "one model, four tasks" demos. Apache 2.0, commercial use OK.. Samodobavljeni na Free.ai GPU-ova — trči besplatno na vaš dnevni žeton bazen (100 žetoni po upotrebi). Oslobađa se pod {licence} — komercijalna upotreba dopuštena na Free.ai.
Koristi preko API-ja
curl https://api.free.ai/v1/chat/ \
-H "Authorization: Bearer YOUR_KEY" \
-d '{"model":"lance-3b"}'
Usporedi
Pitanja
Lance je domorodni multimodalni model 2025. – 3B aktivni parametri pod Apache 2.0. Jedan skup težina obuhvaća četiri zadatka: text→image (7668×768), slika-edit (768/768), tekst→video (480p, do 121 okvira ± 5 sekundi) i sliku+video razumijevanje (VQA, naslov). Izgrađen na Qwen-pokrenuta LLM hrbta s Wan-Video VAE i Qwen.5-VL ViT. Samohosted na Free.ai H200 bez upstream dostavljača, bez API označavanja i bez per-call naknade izvan vašeg simbolskog ravnoteže.
Većina otvorenih stakova odaberite najboljeg specijalistu za svaku površinu — SDXL ili FLUX za stvaranje sirovih slika, Qwen-Uredba slika za uređivanje, Wan 2.2 za video, Qwen.5-VL za razmatranje vizije. Lance trgova malo kvalitete po zadatku za usklađivanje među zadacima: isti interni prikaz hrani svaki izlaz, tako da slika koju generirate i zatim uređiva svoj stil, a VQA model daje o videu odgovara modelu jezika u istoj kontrolnoj točki. Korisno za istraživanje i demo koje koristi od jednog dosljednog modela, a ne od cjevovoda četiri.
Odaberite Lancea kada: želite dosljedan stil preko slike + uređivanje + video iz jednog modela, vi ste prototipiranje više zadataka cjevovoda i "jedan model" kuta važno, ili vam je potrebno dopušteno licenciranje na jedinstvenom radnom toku. Odaberite stručnjake kada: želite najkvalitetniju sirovu sliku gen (FLUX.2 Klein > Lance na >7682), najduže / najviša kvaliteta video (Wan 2.2 TI2V-5B ili HunyuanVideo > Lance na >480p) ili najbrži VQA u razgovoru (Qwen.5-VL je uvijek toplo na H200, Lance mora hladno opterećenje).
Text→image and image-edit: 5.000 žetona (uparava FLUX-class image gen). Text→video: 15.000 žetona (uparuje CogVideoX / Wan 5B klasa). Image+video VQA: 1000 žetona. Viši troškovi protiv SDXL (1.000) odražava Lanceov teži hladni opterećenje – svaki poziv iseljuje ostatak toplog flote i ponovno natovara 40 GB utežina, što dodaje 25-40 s na vrhu samog zaključka. Mi naplaćujemo za ukupno vrijeme GPU-a za zidove, ne samo za paljenje.
Nakon hladnog opterećenja (~25-40 s): slika gen ~12-20 s, slika urediti ~15-25 s, tekst→video ~60-180 s (ovisno o num_frames), VQA ~3-8 s. Svaki Lance poziva hladno opterećenje modela jer ne može sustanovati s ostatkom tople flote na H200, tako da je odgoda hladnoće dio svakog poziva, ne samo prvi.
Generacija i uređivanje slika fiksni su na 768×768. Video generacija je fiksirana na 480p (obično 48×848 pejzaž) i potisnuta na 121 okvira (~5 sekundi na 24 fps). To su rezolucije Lance je obučen; guranje više zahtijeva upscling putem odvojenog modela (pokušaj /image/upscaler/ za slike ili /video/upscaler/ za video).
Janus (DeepSeek) i Show-o podijeliti razumijevanje i generaciju u odvojene glave na zajedničkoj kičmi; Lance je čvršće ujedinjen — jedan skup generacije+razumijevajućih glava s eksplicitnim žetonima zadataka. Emu3 (BAAI) potvrđuje sve kao diskretne žetone uključujući piksele, što mu daje čistiju automatsko regresivnu generaciju, ali nižu kvalitetu na fiksnom računanju. Lanceova pozicija je pokrivenost četiri zadatka u 3B aktivnim parama plus njezin Wan-dived VAE koji rukovodi videom na materijalnom (Janus i Show-o su samo slike).
Apache 2.0 – i težine (huggingface.co/bytedance-research/Lance) i GitHub repo (github.com/bytedance/Lance). Bez teritorijalnih ograničenja, bez MAU kape, bez ne-komercijalnog vozača, bez klauzule samo za istraživanje. Rezultati su vaši da se koriste komercijalno bez autoriteta ili zahtjeva za pripisivanje izvan standardnog Apach 2.0 licence tekst.
40 GB minimum po bajtDance's README. 3B aktivni parami su varljivi — puni Qwen LLM + Wan VAE + Qwen.5-VL ViT svi sjede u pamćenju zajedno. Da bi samostalni voditelj trebao jedan A100 80 GB, A6000 48 GB, ili H100/H200 sa najmanje 40 GB besplatno. Provjeravamo ga na našem H200 (141 GB ukupno), ali još uvijek iseljuje ostatak utovarenih modela po pozivu jer je to najteže jednokratno snimanje na kutiji.
Da — POST JSON ili multipart to /v1/multimodal/lance/ on api.free.ai with {task: "t2i" "image_edit" "t2v" "vqa", prost: "...", slika: <upload> ili image_url: "/static/outputs /..."}. Nositelj auth. auth. putem razvojnih API tipki. Odgovor uključuje job_id, izlazni URL i share_token. /api/ ima curl primjere po zadatku.
Označavamo Lance eksperimentalni jer hladno opterećenje latency znači da ne odgovara velikoj količini prometa – svaki poziv izbacuje toplu flotu i ponovno učitava. Možemo dodati "topli Lance stupanj" kasnije ako korištenje opravdava posvećivanje slota, ili možemo dodati drugi H200 posebno za jedinstvene modele. Za sada je dostupan u istom žeton ekonomiji kao i ostatak Free.ai samohosted modela bez nadoplate, samo viši po pozivu žeton trošak odražava vrijeme GPU zida.
Odabrane slike za uređivanje slika i VQA brišu se odmah nakon završetka zadatka. Generirani izlazi sjede na našem CDN 24 sata (7 dana za plaćene korisnike) tako da možete ponovno preuzeti iz /account /?tab=history. Ništa se ne dijeli s BayteDance — težine pokrenuti lokalno na našem hardveru. Potpuni detalji na /privacy /.