ControlNet — 12 lloje kondicionimesh në një instrument

Ngarko një figurë referuese, zgjedh një lloj kushtëzimi, shkruaj një pyetje. AI mban strukturën e referencës suaj (vija, pozë, thellësi, etj.) dhe krijon përmbajtje të re në çdo stil. Mbështetur nga ControlNet-Union SDXL ProMax — Apache 2.0, krejtësisht i përshtatshëm për përdorim komercial.

Canny / lineart për linja të pastra. Pose për pozicionin e trupit. Thellësia për 3D. Scribble / soft-edge për gërvishtje të ashpra. MLSD për arkitekturën. Normal / segmentation / tile për rrjedhje të avancuara të punës.
Kushtëzimi është nxjerrë nga kjo — ngjyrat janë hequr, vetëm sinjalet strukturore (për llojin e zgjedhur) janë ruajtur.
Më i dobët 0.7 Më i rreptë
~1,200 tokens (SDXL × 1.2 ControlNet)
Rezultati

Si funksionon ControlNet

ControlNet ju lejon të drejtoni krijimin e figurës me strukturën e një figure referimi në vend që të mbështeteni vetëm tek kërkesa e tekstit. Një paraprocesor lexon referencën tuaj dhe nxjerr një sinjal të vetëm kushtëzues — skajet e saj, hartën e thellësisë së saj, skeletin e pozës së një personi, etj. Modeli i përhapjes pastaj bllokohet tek ai sinjal ndërsa kërkesa vendos stilin, ngjyrat, ndriçimin dhe subjektin. Rezultati mban kompozimin e saktë që keni dhënë por duket si diçka krejtësisht e re.

Ky instrument mbështetet nga ControlNet-UnionSDXL ProMax (Apache 2.0) — një model i vetëm që kupton të gjitha 12 llojet e kushtëzimit më poshtë, kështu që mund të ndërrosh mes tyre nga një zgjedhës pa ngarkuar një rrjet të ndryshëm çdo herë. Është krejtësisht i përshtatshëm për përdorim komercial: mbaje, shit ose modifiko çfarëdo që krijon.

12 llojet e kushtëzimit

- E çuditshme.
Zbulimi i skajeve të mprehta. Më i miri për ruajtjen e kontureve të mprehta dhe të linjave të pastra.
Thellësia
Harta e thellësive 3D. Ruan hapësirën e hapësirës - çfarë është pranë dhe çfarë është larg.
Pozo
Skeleti i trupit OpenPose. Bllokon pozicionet e figurave dhe të gjymtyrëve.
Scribble
Skarbëzat e vogla të vizatuara me dorë u kthyen në art të plotë.
Segmentimi
Harta e rajonit me ngjyra. Assign çdo zonë e skenës në një klasë.
Normale
Harta e sipërfaqes normale. Ruan orientimin e sipërfaqes 3D dhe gërvishtjet.
Artë lineare
Ekstrakti i linjave të hollë — ideal për bojë, manga dhe ilustrim.
Soft-edge
Zbulimi i kufijve të butë që ndjek forma më lehtë se Canny.
MLSD
Segmente të drejta, të bërë për arkitekturë, interier dhe fotografi të produkteve.
Pllakëza
Kushtëzimi i ruajtjes së detajeve për rritjen e shkallës dhe punën e pafundme të teksturës.
Piktura
Kushtëzimi i vetëdijshëm për maskën për të rigjeneruar vetëm një pjesë të një imazhi.
Ripikturo
Zgjero një kanavacë ose ripikturo rajone duke respektuar strukturën rrethuese.

Tre hapa

  1. Ngarko një figurë referuese — një fotografi, një skicë, një screenshot, gjithçka me strukturën që dëshiron të mbash.
  2. Zgjidh llojin e kushtëzimit që përputhet me atë që të intereson (pozë për një figurë, thellësi për një skenë, i zgjuar ose linear për konturet e pastra).
  3. Shkruaj një kërkesë që përshkruan pamjen që dëshiron dhe gjeneroje. Rrit forcën e kontrollit për të ndjekur referencën më ngushtë, ul atë për liri më kreative.

ControlNet — 12 lloje kondicionimesh në një instrument — FAQ

Një mjet i vetëm që ekspozon të gjitha 12 llojet e kushtëzimit nga modeli ControlNet-Union SDXL ProMax - canny, pose, depth, scribble, lineart, anime-lineart, MLSD, HED, soft-edge, normal, segmentation, dhe tile. Zgjidh një lloj kushtëzimi, lësho një figurë referuese, shkruaj një kërkesë dhe SDXL do të krijojë një figurë të re që ndjek strukturën e figurës tuaj të referencës.

img2img ripikturoi mbi hyrjen direkt — ngjyrat, skajet, dhe gjeometria përzihen me kërkesën. ControlNet i hedh ngjyrat dhe mban vetëm sinjalin strukturor të zgjedhur (vijat, skeletin e pozës, hartën e thellësisë, etj.). Kjo ju lejon të ndërroni përmbajtjen radikalisht ndërsa kompozimi mbetet i qëndrueshëm. Kontroll strukturor më i fortë se img2img.

Canny / lineart për të pastruar të dhënat e linjave. Anime-lineart për të dhënat e linjave në stil anime. Scribble / soft-edge / HED për skica dhe gërvishtje të papërpunuara. Pozë për të kopjuar një pozicion trupor nga një foto. Thellësia për të ruajtur gjeometrinë e skenës / strukturën 3D. MLSD për të ruajtur vija të drejta (arkitekturë / interier). Normal për të ruajtur orientimin e sipërfaqes dhe volumin. Segmentimi për të ruajtur rajonet. Pllakë për të përmirësuar ose rritur variacionet e një figure ekzistuese.

ControlNet-Union SDXL ProMax (xinsir, Apache 2.0) i paketon të gjithë 12 rrjetet e kushtëzimit në një peshë të vetme 2.5 GB. Shpërndarjet e vjetra shkarkonin një peshë të veçantë ~2.5 GB për lloj - ndërrimi midis canny dhe pose do të thotë një nisje e ftohtë. Modeli i unionit ngarkohet një herë dhe qëndron i ngrohtë, kështu që çdo lloj kushtëzimi është sub-sekond pas thirrjes së parë.

Po. ~1,200 tokens për render (1,000 base SDXL + 20% ControlNet kusht mbi pagesë). Përdoruesit e regjistruar marrin 30,000 tokens falas në ditë — rreth 25 render kusht në ditë pa kosto. Anonim: 2,500 tokens / ditë (~2 render).

Po — rrëshqitësi i forcës së kontrollit (i prezgjedhur 0.7) përcakton se sa strikt do të ndjekë dalje referencën tuaj. 1.0 = strikt (dalja duket si një ri-render i referencës suaj). 0.4 = i lirë (prompt ka më shumë liri). Ule atë për variacione kreative, ngrite atë kur besnikëria është e rëndësishme.

512×512 e paracaktuar. Raportet standarde SDXL — 768×1024 portret, 1024×768 peizazh, 1024×1024 katror — të gjitha funksionojnë. Shfaqjet më të mëdha konsumojnë më shumë VRAM dhe token; H200 suporton deri në 1024×1024 me lehtësi.

Figurat e referencës përpunohen menjëherë, kushtëzimi nxjerret, pastaj file i referencës eleminohet. Vetëm kërkesa + paraqitja përfundimtare mbetet në /account/?tab=history. Nuk përdoret kurrë për trainim. /privacy/ për politikën e plotë.

ControlNet-Union SDXL ProMax është lëshuar nën Apache 2.0 — plotësisht i lejuar, duke përfshirë përdorimin komercial. Baza SDXL është OpenRAIL++. Të dyja lejojnë përdorimin komercial; figurat e gjeneruara janë tuaja për përdorim komercial pa pagesë.

I njëjti model, e njëjta cilësi, të njëjtat sinjale kondicionimi. ComfyUI dhe A1111 kërkojnë një GPU lokale me 12+ GB VRAM plus konfigurim. Ne e përdorim atë në një infrastrukturë të përbashkët me një pool të lirë të gjerë — pa instalim, pa nevojë për GPU.

Thirrjet e para shkarkojnë peshën e bashkimit (~2.5 GB) në cache e GPU dhe ngrohë SDXL pipeline. Prit 30-60 sekonda në kërkesën e parë pas një shpërndarje ose LRU përjashtim. Thirrjet e mëvonshme nën ngarkim tipike kthehen në 4-7 sekonda.

Po — POST multipart në /v1/image/generate/ me model=sdxl (ose model=controlnet-union-sdxl-promax), prompt, control_image (file), control_type=<një nga: canny, pose, depth, scribble, lineart, anime-lineart, mlsd, hed, soft-edge, normal, segmentation, tile>, optional control_strength (0.1-1.5). Autentifikim i bartësit, 10K tokens të lirë/muaj. /api/ ka shembuj të curl.

Të pëlqen Free.ai?

Vlerësoni këtë faqe