Sgwrsio

Dim sgwrsio blaenorol

Free.ai (self-hosted) ~100 tocynnau/msg
Lance 3B (unified)

Hi! Lance 3B (unified). Gofynnwch rywbeth i mi.

~100 tocynnau/msg · cronfa ddyddiol Mewnosod i anfon
Manylion Model

Manylion Model

Wedi'i westy ar Free.ai (self-hosted)
Creuwyd gan ByteDance
Categori Multimodal
Cyfeirnod 32768 tokens
Cost ~100 tocynnau/msg · cronfa ddyddiol

Am

Lance 3B (unified) yw a Model AI a adeiladwyd gan ByteDance. Mwyaf gryf ar Cross-task research, prototyping pipelines that need image + video + edit + VQA from one model, "one model, four tasks" demos. Apache 2.0, commercial use OK.. Hunan-gartrefedig ar Free.ai GPUs — rhedeg yn rhad ac am ddim yn erbyn eich pool tocynnau bob dydd (100 tokens Defnyddio). Rhyddhawyd o dan Apache 2.0 — caniateir defnydd masnachol ar Free.ai.

Defnyddio trwy API

curl https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer YOUR_KEY" \
  -d '{"model":"lance-3b"}'
Dogfennau API

Cwestiynau Cyffredin

Model aml-modd unedig naturiol 2025 ByteDance yw Lance — 3B o baramedrau gweithredol o dan Apache 2.0. Mae un set o bwysau yn cwmpasu pedwar tasg: testun→ddelwedd (768×768), golygu-delwedd (768×768), testun→fideo (480p, hyd at 121 ffrâm ≈ 5 eiliad), a deall delwedd+fideo (VQA, isdeitlau). Adeiladwyd ar Qwen-ddibynnir LLM-gwricwlwm gyda Wan-Video VAE a Qwen.5-VL ViT. Hunan-gartrefi ar Free.ai's H200 heb unrhyw ddarparwr uwch-ffrwd, dim marcio API, ac dim ffioedd galwad y tu hwnt i'ch balans tocyn.

Mae'r rhan fwyaf o stackoedd agored yn dewis yr arbenigwr gorau ar gyfer pob wyneb — SDXL neu FLUX ar gyfer creu delwedd amrwd, Qwen-Image-Edit ar gyfer golygu, Wan 2.2 ar gyfer fideo, Qwen.5-VL ar gyfer rhesymu iaith-gweledigaeth. Mae Lance yn trosglwyddo rhywfaint o ansawdd y tasg ar gyfer cydlyniant rhwng tasgau: mae'r un cynrychiolaeth fewnol yn bwydo pob allbwn, felly mae delwedd rydych chi'n ei chreu ac yna'n ei golygu yn cadw ei arddull, a'r VQA mae'r model yn ei roi am fideo yn cydweddu â'r model iaith yn yr un pwynt gwirio. Defnyddiol ar gyfer ymchwil a dangosiadau sy'n elwa o un model cydlynol yn hytrach na phlygell o bedwar.

Dewiswch Lance pan: ydych chi eisiau arddull gyson ar draws delwedd + golygu + fideo o un model, rydych chi'n creu prototeip o pibellau aml-dasg a bod yr ongl "un model" yn bwysig, neu mae angen trwyddedu caniatáu ar y llif gwaith unedig. Dewiswch arbenigwyr pan: ydych chi eisiau'r gen delwedd crai o ansawdd uchaf (FLUX.2 Klein > Lance at >768²), y fideo hiraf / o ansawdd uchaf (Wan 2.2 TI2V-5B neu HunyuanVideo > Lance at >480p), neu'r VQA cyflymaf yn y sgwrs (Qwen.5-VL yn boeth bob amser ar y H200, rhaid i Lance lwytho'n oer).

Testun→delwedd a golygu-delwedd: 5,000 tocynnau (yn cydweddu â gen delwedd dosbarth FLUX). Testun→fideo: 15,000 tocynnau (yn cydweddu â dosbarth CogVideoX / Wan 5B). VQA Delwedd+fideo: 1,000 tocynnau. Mae'r gost uwch o gymharu â SDXL (1,000) yn adlewyrchu llwyth oer mwy Lance — mae pob galwad yn gwasgu allan y gweddill o'r llongau poeth ac yn ail-lwytho 40 GB o bwysau, sy'n ychwanegu 25-40 eiliad ar ben y dehongliad ei hun. Rydym yn cyfrifo am gyfanswm amser GPU'r cloc wal, nid dim ond am y dehongliad.

Ar ôl lwytho-coch (~25-40 eil): creu delwedd ~12-20 eil, golygu delwedd ~15-25 eil, testun→fideo ~60-180 eil (yn dibynnu ar num_frames), VQA ~3-8 eil. Mae pob galwad Lance yn lwytho-coch y model oherwydd ni all fod yn gyd-breswylydd gyda'r gweddill o'r llongau poeth ar yr H200, felly mae'r oedi lwytho-coch yn rhan o bob galwad, nid dim ond y cyntaf.

Mae creu delwedd a golygu delwedd yn cael eu gosod ar 768×768. Mae creu fideo yn cael ei gosod ar 480p (480×848 tirlun fel arfer) a'i gyfyngu i 121 ffrâm (~5 eiliad ar 24 fps). Dyma'r cydraniad y cafodd Lance ei hyfforddi arno; mae pwyso uwch yn gofyn am uwchraddio drwy ddull ar wahân (ceisiwch /image/upscaler/ ar gyfer delweddau neu /video/upscaler/ ar gyfer fideos).

Janus (DeepSeek) a Show-o yn rhannu deall a chreu i bennau ar wahân ar ddarn cefn rhannedig; Lance yn fwy unedig - un set o bennau creu+deall gyda thocynnau tasg eglur. Emu3 (BAAI) yn tocanio popeth fel tocynnau di-gyswllt gan gynnwys picseli, sy'n ei roi yn creu creu awto-gymhellach mwy glanach ond ansawdd isach ar gyfrifiadau sefydlog. Pistyll Lance yw'r cwmpasu pedwar tasg mewn paramedrau gweithredol 3B ynghyd â'i VAE Wan-ddibynnol sy'n trin fideo'n naturiol (Janus a Show-o yn ddelwedd-yn-unig).

Apache 2.0 — y ddau bwysau (huggingface.co/bytedance-research/Lance) a'r repository GitHub (github.com/bytedance/Lance). Dim cyfyngiadau tir, dim cap MAU, dim gyrrwr di-fasnach, dim paragraff ymchwil yn unig. Eich defnydd chi yw'r allbwn i'w ddefnyddio'n fasnachol heb unrhyw hawliau perchnogaeth na gofynion dynodi tu hwnt i'r testun trwydded safonol Apache 2.0.

40 GB o leiaf ar gyfer README ByteDance. Mae'r paramedrau gweithredol 3B yn dwyllodrus — mae'r Qwen LLM + Wan VAE + Qwen.5-VL ViT llawn yn eistedd yn y cof gyda'i gilydd. I hunan-gartrefu bydd angen A100 sengl 80 GB, A6000 48 GB, neu H100/H200 gydag o leiaf 40 GB rhad. Rydyn ni'n rhedeg hwn ar ein H200 (141 GB yn gyfanswm) ond mae'n dal i ryddhau'r gweddill o'r modelau wedi'u llwytho ar gyfer pob galwad oherwydd mai hwn yw'r un-sêr pwysicaf ar y blwch.

Ie — POST JSON neu multipart i /v1/multimodal/lance/ ar api.free.ai gyda {task: "t2i" | "image_edit" | "t2v" | "vqa", prompt: "...", image: <upload> or image_url: "/static/outputs/..."}. Dilysiant y barwr drwy allweddi API datblygwr. Mae'r ymateb yn cynnwys job_id, URL allbwn, a share_token. Mae gan /api/ enghreifftiau o curl am bob tasg.

Mae'r Lance wedi ei farcio fel un arbrofol oherwydd mae'r diffyg llwyth oer yn golygu nad yw'n addas iawn ar gyfer traffig o faint uchel - mae pob galwad yn gwasgu'r llongau poeth ac yn ail-lwytho. Efallai y byddwn yn ychwanegu haen "warm Lance" yn ddiweddarach os yw'r defnydd yn cyfiawnhau dyrannu slot, neu efallai y byddwn yn ychwanegu ail H200 yn benodol ar gyfer modelau unedig. Ar hyn o bryd mae ar gael ar yr un economi tocynnau â gweddill modelau Free.ai sy'n hunan-westyadwy heb unrhyw gost ychwanegol, dim ond y gost tocynnau uwch ar gyfer pob galwad sy'n adlewyrchu amser y GPU cloc wal.

Mae delweddau a lwythwyd i fyny ar gyfer golygu delweddau a VQA yn cael eu dileu ar unwaith ar ôl i'r dasg gael ei chwblhau. Mae'r allbwn a gynhyrchir yn aros ar ein CDN am 24 awr (7 diwrnod ar gyfer defnyddwyr sy'n talu) fel y gallwch ei lawrlwytho eto o /account/?tab=history. Ni chaiff dim ei rannu gyda ByteDance — mae'r pwysau'n rhedeg yn lleol ar ein caledwedd. Manylion llawn yn /privacy/.

Hoffwch Free.ai? Meddwl am eich ffrindiau!

Graddio'r dudalen hon