Vestlused

Varasemaid vestlusi pole

Free.ai (self-hosted) ~100 märgid/msg
Lance 3B (unified)

Tere! Lance 3B (unified). Küsi minult ükskõik mida.

~100 märgid/msg · päevane bassein Saatmiseks sisesta
Mudel Üksikasjad

Mudel Üksikasjad

Majutusasutuses (hosted on) Free.ai (self-hosted)
Loodud ByteDance
Kategooria Multimodal
Kontekst 32768 tokens
Kulud ~100 märgid/msg · päevane bassein

Info

Lance 3B (unified) on an AI mudel builded by ByteDance. Tugevam Cross-task research, prototyping pipelines that need image + video + edit + VQA from one model, "one model, four tasks" demos. Apache 2.0, commercial use OK.. Isemajandatud Free.ai GPU-l on tasuta sinu igapäevase žetoonide basseini vastu (100 märgid ühe kasutuskorra kohta). Released under Apache 2.0 — commercial use permitted on Free.ai.

Kasutamine API kaudu

curl https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer YOUR_KEY" \
  -d '{"model":"lance-3b"}'
API Docs

KKK

Lance on 2025. aasta ByteDance'i native ühtne mitmeliigiline mudel 3B aktiivsed parameetrid Apache 2.0 all. Üks kaalude komplekt hõlmab nelja ülesannet: text→image (768×768), image-edit (768×768), text→video (480p, kuni 121 kaadrit ~ 5 sekundit) ja pildi+video mõistmist (VQA, pealdis). Ehitatud Qwen-toodetud LLM selgroog Wan-Video VAE ja Qwen.5-VL ViT. Isehostitud Free.ai's H200 ilma eelneva pakkujata, ei ole API kaubamärgiga ega ühe kõnetasuta väljaspool sinu tokeeni tasakaalu.

Enamik avatud korstnad valida parim spetsialist iga pinna ® SDXL või FLUX toorpilt põlvkonna, Qwen-Image-Edit toimetused, Wan 2.2 video, Qwen,5-VL vision-language arutluskäik. Lance kaupleb natuke per-task kvaliteet cross-task sidusus: sama siseesindus söödab iga väljund, nii et pilt ja seejärel redigeerida säilitab oma stiili, ja VQA mudel annab umbes video sobib keele mudeli samas kontrollpunktis. Kasulik teadus-ja demos, mis kasu üks järjekindel mudel, mitte toru neli.

Pick Lance kui: soovite järjekindel stiil kogu pilt + redigeerida + video ühest mudelist, olete prototüüpimine multi-task torujuhtme ja "üks mudel" nurka küsimusi, või teil on vaja lubades ühtse töövoo. Vali spetsialistid, kui: soovite kõrgeima kvaliteediga toorpilt gen (FLUX.2 Klein > Lance juures > 7682), pikim / kõrgeima kvaliteediga video (Wan 2.2 TI2V-5B või HunyuanVideo > Lance juures > 480p), või kiireim VQA vestluses (Qwen,5-VL on alati soe H200, Lance on külm laadida).

Text→image and image-edit: 5000 tokenit (sobib FLUX-klassi pildigen). Text→video: 15000 tokenit (sobib CogVideoX / Wan 5B klass). Image+video VQA: 1000 tokenit. Kõrgem hind vs SDXL (1000) peegeldab Lance'i raskemat külma koormat ~ iga väljatõstja ülejäänud sooja laevastiku ja laadib 40 GB kaalu, mis lisab 25-40 s tipus lause ise. Me arveid kogu seina-kella GPU aeg, mitte lihtsalt järeldada.

Pärast külma koormust (~25-40 s): pilt gen ~12-20 s, pildi muutmine ~15-25 s, tekst→video ~60-180 s (sõltuvalt num_arvutid), VQA ~3-8 s. Iga Lance helistada külma-koormus mudel, sest see ei saa kaasresident ülejäänud soe laevastiku H200, nii külm-koormus viivitus on osa iga kõne, mitte ainult esimene.

Pildi genereerimine ja pildi muutmine on fikseeritud väärtusega 768×768. Video genereerimine on fikseeritud kiirusega 480p (tavaliselt 480×848 maastik) ja piiratud 121 kaadriga (~5 sekundit 24 fps juures). Need resolutsioonid Lance' i treeniti; kõrgema vajutamine nõuab suurendamist eraldi mudeli abil (pildi/pildi/ülesmõõtja/ piltide või /video/upscaler/ videote jaoks).

Janus (DeepSeek) ja Show-o jagatud arusaam ja generatsioon eraldi peadeks jagatud selgrool; Lance on tihedamalt ühendatud ühe põlvkonna + mõistva peaga, millel on selge ülesanne märgid. Emu3 (BAAI) tokeniseerib kõike diskreetsete märkidena, sealhulgas pikslitena, mis annab sellele puhtama automaatse regressiivse põlvkonna, kuid madalama kvaliteedi fikseeritud arvu juures. Lance'i samm on neljatakiline katvus 3B aktiivses params pluss selle Wani tuletatud VAE, mis tegeleb video põliselanikega (Janus ja Show-o on ainult pildiga).

Apache 2.0 ~ nii kaal (kimbunägu.co/bytedance-research/Lance) kui ka GitHub repo (github.com/bytedance/Lance). Ei territoriaalseid piiranguid, ei MAU cap, ei ole mittekaubanduslik rattur, ei ole teadus-ainult klausel. Väljundid on teie kasutada kaubanduslikult ilma litsentsitasude või määramise nõuded kaugemale standard Apache 2.0 litsentsi teksti.

40 GB ByteDance's README'i kohta. 3B aktiivsed paramid on petlikud Qwen LLM + Wan VAE + Qwen.5-VL ViT - kõik istuvad koos mälus. Isehostile vajad sa ühte A100 80 GB, A6000 48 GB või H100/H200, millel on vähemalt 40 GB tasuta. Me kasutame seda meie H200 (141 GB kokku) peal, kuid see tõstab siiski välja ülejäänud laaditud mudelid ühe kõne kohta, sest see on karbil kõige raskem üksikvõte.

Jah POST JSON või multipart to /v1/multimodal/lance/ on api.free.ai with {task: "t2i" ~ "image_edit" ~ "t2v" ~ "vqa," spot: "...," image: <upload> või image_url: "/state/outputs/...."}. Bearer auth arendaja API võtmete kaudu. Vastus sisaldab töö_id, väljund URL ja share_ token. / api/ on loki näited ülesande kohta.

Märgime Lance'i eksperimentaalseks, sest külmakoormusega latentsus tähendab, et see ei sobi hästi suuremahuliseks liikluseks. Iga kõne tõstab sooja laevastiku ja laadib. Me võime lisada "soe Lance'i" taseme hiljem, kui kasutamine õigustab pesa pühendamist, või me võime lisada teise H200 spetsiaalselt ühtlustatud mudelitele. Praegu on see saadaval samal sümboolne majandus kui ülejäänud Free.ai isehostitud mudelid ilma lisatasuta, lihtsalt kõrgem kõne žetooni hind peegeldab seinakella GPU aega.

Üleslaaditud pildid pildirediidile ja VQA kustutatakse kohe pärast ülesande lõpetamist. Genereeritud väljundid istuvad meie CDN- i 24 tundi (tasuliste kasutajate puhul 7 päeva), nii et saate uuesti alla laadida failist /account/? tab=ajaloost. ByteDance' iga ei jagata mitte midagi. Täpselt / privaatsus /.

Armastus Free.ai?

Hinda seda lehekülge