Keskustelut

Ei aiempia keskusteluita

Free.ai (self-hosted) ~100 rahakkeet/msg
Lance 3B (unified)

Hei, minä tässä. Lance 3B (unified). Kysy mitä tahansa.

~100 rahakkeet/msg · päivittäinen allas Syötä lähetettäväksi
Mallin tiedot

Mallin tiedot

Hoidettu Free.ai (self-hosted)
Luonut ByteDance
Luokka Multimodal
Konteksti 32768 tokens
Kustannukset ~100 rahakkeet/msg · päivittäinen allas

Tietoja

'FREAI_PH_lead' on 'FREAI_PH' particle' 'FREAI_PH_category', jonka on rakentanut FREAI_PH_provider'. Vahvin "FREAI_PH_best" -ohjelmassa. Itsekeskeinen Free.ai GPU:lla – kulkee vapaasti päivittäistä pokaalia vastaan ({tpm_tokeno},Käyttökertaa kohti). Vapautettu nimellä Apache 2.0, kaupallinen käyttö sallittu Free.ai:lla.

Käyttö API:n kautta

curl https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer YOUR_KEY" \
  -d '{"model":"lance-3b"}'
API-lääkärit

FAQ

Lance is ByteDance's 2025 native unified multimodal model — 3B active parameters under Apache 2.0. One set of weights covers four tasks: text→image (768×768), image-edit (768×768), text→video (480p, up to 121 frames ≈ 5 seconds), and image+video understanding (VQA, captioning). Built on a Qwen2-derived LLM backbone with a Wan-Video VAE and a Qwen2.5-VL ViT. Self-hosted on Free.ai's H200 with no upstream provider, no API markup, and no per-call fees beyond your token balance.

Useimmat avoimet pinot valitsevat jokaiselle pinnalle parhaan asiantuntijan – SDXL:n tai FLUX:n raakakuvan tuottamiseen, â €Qwenâ €-Image-Edit muokkauksille, Wan 2.2:n videolle, â €Qwen,5-VL:n visualisointiin. Lance vaihtaa hieman tehtäväkohtaista laatua työtehtävien johdonmukaisuuteen: sama sisäinen esitys syö jokaisen tuotoksen, joten kuva, jonka luot ja sitten muokkaat, säilyttää tyylinsä, ja VQA:n malli antaa videon, joka vastaa saman tarkistuspisteen kielimallia. Hyödyllistä tutkimus- ja demoille, jotka hyötyvät yhdestä johdonmukaisesta mallista neljän hengen putkiston sijaan.

Valitse Lance, kun haluat tasaisen tyylin kuvasta + muokkaa + videota yhdestä mallista, prototyypität monitoimiputken ja "yhden mallin" kulmalla on merkitystä, tai tarvitset sallivaa lisensiointia yhtenäiseen työnkulkuun. Valitse asiantuntijoita, kun haluat korkealaatuista raakakuvaa gen (FLUX.2 Klein > Lance > 7682), pisimpään / korkealaatuisimpaan videoon (Wan 2,2 TI2V-5B tai HunyuanVideo > Lance > 480p), tai nopeimpaan VQA chatissa (Qwen,5-VL on aina lämmin H200:lla, Lance joutuu kylmäkuormaamaan).

Text→image and image-edit: 5 000 tokenttia (vastaa FLUX-luokan kuvaa gen). Text→video: 15 000 tokenia (vastaa CogVideoX / Wan 5B -luokkaa). Image+video VQA: 1 000 tokenttia. Korkeampi hinta verrattuna SDXL:ään (1 000) kertoo Lancen raskaammasta kylmäkuormasta – jokainen puhelu häätää lämpimän kaluston ja lataa 40 Gt painoja, mikä lisää 25-40 s itse tutkimuksen päälle. Laskutamme kokonaista seinäkellon GPU-aikaa, ei vain päättelyä.

Kylmälatauksen jälkeen (~25-40 s): kuva gen ~12-20 s, kuvan muokkaus ~15-25 s, teksti→video ~60-180 s (riippuen num_frameista), VQA ~3-8 s. Jokainen Lance soittaa kylmälatauksen malliin, koska se ei voi olla yhdessä muun H200:n lämpimän kaluston kanssa, joten kylmälatausviive on osa jokaista puhelua, ei vain ensimmäistä.

Kuvasukupolvi ja kuvan muokkaus on vahvistettu 768×768:ksi. Videosukupolvi on 480p (tyypillisesti 480×848 maisemaa) ja se on rajattu 121 kehykseen (~5 sekuntia 24 fps:ssä). Nämä ovat resoluutiot, joihin Lance koulutettiin, ja korkeammalle on nostettava tasoa erillisen mallin avulla (try/image/upscaler/ for photos tai /video/upscaler/ for videos).

Janus (â €DeepSeek) ja Show-o jakoivat ymmärryksen ja polveutuvat erillisiksi päiksi jaettuun selkärankaan. Lance on kiinteämmin yhtenäinen – yksi sukupolvi + ymmärtää päät selkeillä tehtävämerkeillä. Emu3 (BAAI) mykisti kaiken erillisiksi rahakkeiksi, mukaan lukien pikseleiksi, mikä antaa sille puhtaamman autoregressiivisen sukupolven, mutta matalamman laadun kiinteässä laskussa. Lancen sävel on nelitehtäväinen kattaus 3B-aktiivisissa parameissa sekä Wan-johdannainen VAE, joka käsittelee videota natiivisesti (Janus ja Show-o ovat vain kuva-aiheisia).

Apache 2.0 – sekä painot (haggingface.co/bytedance-research/Lance) että GitHub-repo (github.com/bytedance/Lance). Ei alueellisia rajoituksia, ei MAU-kattoa, ei ei-kaupallista ratsastajaa, ei vain tutkimuslauseketta. Tuotteita saa käyttää kaupallisesti ilman rojalteja tai tarjousvaatimuksia Apache 2.0 -lupatekstin lisäksi.

40 GB minimi ByteDancen LUEME-ohjelmaa kohti. 3B-aktiiviset paramit ovat petollisia – koko A100 80 GB:n, A6000 48 GB:n tai H100/H200:n, jossa on vähintään 40 GB vapaata. Teemme sen H200:lla (141 GB yhteensä) mutta se silti häätää loput ladatuista malleista puhelua kohden, koska se on raskain kertalaukaus laatikossa.

Kyllä – POST JSON tai multipart to /v1/multimodaal/lance/ on api.free.ai kanssa {tehtävä: "t2i" "image_edit" "t2v" "vqa", nopea: "...", kuva: <upload> tai image_url: "/static/outputs/..."}. Bearer auth via developer API avaimet. Vastaus sisältää job_id, tuotos URL, ja Share_token. /api/ has curl examples per tehtävä.

Merkitsemme Lancen kokeelliseksi, koska kylmälatauksen latenssi tarkoittaa, että se ei sovi kovinkaan hyvin suurvolyymiseen liikenteeseen – jokainen puhelu häätää lämpimän kaluston ja uudelleenlataukset. Voimme lisätä "lämpimän Lancen" tason myöhemmin, jos käyttö oikeuttaa varaamaan paikan, tai voimme lisätä toisen H200:n nimenomaan yhtenäisille malleille. Tällä hetkellä se on saatavilla samalla tavalla kuin muut Free.ai:n itseohjautuvat mallit ilman lisämaksua, mikä on vain korkeampi puhelukohtainen hinta, joka heijastaa seinäkellon GPU-aikaa.

Ladatut kuvat kuvaeditille ja VQA:lle poistetaan heti tehtävän päätyttyä. Luodut lähdöt istuvat CDN:llä 24 tuntia (7 päivää maksullisille käyttäjille), joten voit ladata ne uudelleen /account/?tab=histeryltä. ByteDancen kanssa ei jaeta mitään, sillä painot pyörivät paikallisesti laitteessamme. Tiedot löytyvät osoitteesta /privacy/.

Love this tool? Share it!

Arvostele tätä sivua