Chatovi

Nema prethodnih razgovora

Free.ai (self-hosted) ~100 tokens/msg
Lance 3B (unified)

Zdravo! Lance 3B (unified). Pitaj me bilo šta.

~100 tokens/msg · dnevno Enter za slanje
Detalji o modelu

Detalji o modelu

Provider Free.ai (self-hosted)
Napravio ByteDance
Kategorija Multimodal
Kontekst 32768 tokens
Trošak ~100 tokens/msg · dnevno

O meni

Lance 3B (unified) is a Model built by ByteDance. 2013. (en) Rezultati za IC 555. Self-hosted on Free.ai GPUs — runs free against your daily token pool (100 tokens po upotrebi). Objavljen pod Apache 2.0 — komercijalna upotreba dozvoljena na Free.ai.

Korištenje putem API

curl https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer YOUR_KEY" \
  -d '{"model":"lance-3b"}'
API dokumentacija

FAQ

Lance je ByteDance-ov 2025 nativni unified multimodal model — 3B aktivnih parametara pod Apache 2.0. Jedan set težina pokriva četiri zadatka: text→image (768×768), image-edit (768×768), text→video (480p, do 121 frame ≈ 5 sekundi), i image+video understanding (VQA, captioning). Izgrađen na Qwen-derivated LLM backbone sa Wan-Video VAE i Qwen.5-VL ViT. Self-hosted on Free.ai's H200 with no upstream provider, no API markup, and no per-call fees beyond your token balance.

Većina otvorenih stokova bira najboljeg specijalista za svaku površinu — SDXL ili FLUX za generiranje sirove slike, Qwen-Image-Edit za uređivanje, Wan 2.2 za video, Qwen.5-VL za razmišljanje o jeziku vida. Lance mijenja malo kvaliteta po-zadataka za koherentnost između zadataka: ista unutrašnja reprezentacija hrani svaki izlaz, tako da slika koju generirate i zatim uređujete zadržava svoj stil, a VQA model daje o videozapisu koji odgovara jeziku modela u istoj kontrolnoj tački. Korisno za istraživanja i demonstracije koje imaju koristi od jednog dosljednog modela umjesto kanala od četiri.

Odaberite Lance kada: želite dosljedan stil preko slike + uređivanje + video iz jednog modela, vi prototipizirate više-zadatak cijev i "jedan model" kut je važan, ili vam treba permisivno licenciranje na jedinstvenom toku rada. Odaberite specijaliste kada: želite najvišu kvalitetu sirove slike gen (FLUX.2 Klein > Lance na >768²), najduži / najviši kvalitet video (Wan 2.2 TI2V-5B ili HunyuanVideo > Lance na >480p), ili najbrži VQA u razgovoru (Qwen.5-VL je uvijek toplo na H200, Lance mora hladno učitavanje).

Tekst→slika i uređivanje slike: 5.000 žetona (podudara se sa FLUX-klasom generiranja slika). Tekst→video: 15.000 žetona (podudara se sa CogVideoX / Wan 5B klasom). Slika+video VQA: 1.000 žetona. Viša cijena u odnosu na SDXL (1.000) odražava Lanceovo teže hladno opterećenje — svaki poziv izbacuje ostatak tople flote i ponovno učita 40 GB težina, što dodaje 25-40 s na vrh samog zaključka. Naplaćujemo za ukupno vrijeme GPU-a zidnog sata, ne samo zaključka.

Nakon hladnog opterećenja (~25-40 s): generiranje slike ~12-20 s, uređivanje slike ~15-25 s, tekst→video ~60-180 s (zavisno od num_frames), VQA ~3-8 s. svaki poziv Lance-a hladno opterećuje model jer ne može biti ko-rezident sa ostatkom tople flote na H200, tako da je kašnjenje hladnog opterećenja dio svakog poziva, ne samo prvog.

Generiranje slike i uređivanje slike su fiksirani na 768×768. Generiranje videa je fiksirano na 480p (obično 480×848 pejzaž) i ograničeno na 121 kadr (~5 sekundi na 24 fps). Ovo su rezolucije na kojima je Lance obučen; za pomjeranje na više potrebno je povećanje rezolucije putem zasebnog modela (isprobajte /image/upscaler/ za slike ili /video/upscaler/ za videozapise).

Janus (DeepSeek) i Show-o dijele razumijevanje i generiranje u odvojene glave na zajedničkoj okosnici; Lance je čvršće ujedinjen — jedan set glava za generiranje + razumijevanje sa eksplicitnim tokenima zadataka. Emu3 (BAAI) tokenizira sve kao diskretne tokene uključujući piksele, što mu daje čišću autoregresivnu generaciju ali niži kvalitet pri fiksnom računanju. Lanceov pitch je pokrivenost četiri zadatka u 3B aktivnim parametrima plus njegov Wan-izvedeni VAE koji nativno obrađuje video (Janus i Show-o su samo slike).

Apache 2.0 — oba težina (huggingface.co/bytedance-research/Lance) i GitHub repo (github.com/bytedance/Lance). Nema teritorijalnih ograničenja, nema ograničenja MAU, nema nekomercijalnog ridera, nema klauzule samo za istraživanje. Izlazi su vaši za komercijalnu upotrebu bez prava ili zahtjeva za atribuciju izvan standardnog teksta Apache 2.0 licence.

40 GB minimum po ByteDance README. 3B aktivni parametri su obmanjujući — puni Qwen LLM + Wan VAE + Qwen.5-VL ViT svi sjede u memoriji zajedno. Za samo-hosting trebat će vam jedan A100 80 GB, A6000 48 GB, ili H100/H200 sa najmanje 40 GB slobodnog prostora. Mi ga pokrećemo na našem H200 (141 GB ukupno) ali i dalje izbacuje ostatak učitavanja modela po pozivu jer je to najteži single-shot na kutiji.

Da — POST JSON ili multipart to /v1/multimodal/lance/ on api.free.ai with {task: "t2i" | "image_edit" | "t2v" | "vqa", prompt: "...", image: <upload> or image_url: "/static/outputs/..."}. Bearer auth via developer API keys. Response includes job_id, output URL, and share_token. /api/ has curl examples per task.

Označavamo Lance eksperimentalnim jer latencija hladnog opterećenja znači da nije savršeno pogodan za promet velikog obima — svaki poziv izbacuje toplo flotu i ponovno se učitava. Možemo dodati "topli Lance" nivo kasnije ako upotreba opravdava posvećenje utora, ili možemo dodati drugi H200 posebno za objedinjene modele. Za sada je dostupan na istoj ekonomiji tokena kao i ostali Free.ai-ovi samohostirajući modeli bez nadoplate, samo viša cijena po pozivu tokena odražava vrijeme GPU-a za zidni sat.

Učitane slike za uređivanje slika i VQA se brišu odmah nakon završetka zadatka. Generirani izlazi ostaju na našem CDN-u 24 sata (7 dana za korisnike koji plaćaju) tako da ih možete ponovo preuzeti iz /account/?tab=history. Ništa se ne dijeli sa ByteDance-om — težine se izvode lokalno na našem hardveru. Puni detalji na /privacy/.

Volite Free.ai?

Ocijeni ovu stranicu