ControlNet — 12-il tip ta’ kondizzjonament f’għodda waħda

Ittella' immaġni ta' referenza, agħżel tip ta' kondizzjonament, ikteb ittra ta' għajnuna. L-AI żżomm l-istruttura tar-referenza tiegħek (linji, poża, fond, eċċ.) u tirrendi kontenut ġdid fi kwalunkwe stil.

Canny / lineart għal linework nadif. Pożi għall-pożizzjoni tal-ġisem. Fond għal tqassim 3D. Scribble / soft-tarf għall doodles mhux maħduma. MLSD għall-arkitettura. Normali / segmentazzjoni / madum għall-flussi tax-xogħol avvanzati.
Kondizzjonament huwa estratt minn dan — il-kuluri huma skartati, biss is-sinjal strutturali (kull tip magħżul tiegħek) huwa ppreservat.
Looser 0.7 Aktar stretti
~1,200 tokens (SDXL × 1.2 ControlNet)
Riżultat

Kif jaħdem ControlNet

ControlNet jippermettilek li tmexxi l-ġenerazzjoni ta’ immaġni bl-istruttura ta’ immaġni ta’ referenza minflok ma tiddependi fuq il-prompt tat-test waħdu. Preproċessur jaqra r-referenza tiegħek u jestraġġixxi sinjal kondizzjonat wieħed — it-trufijiet tagħha, il-mappa tal-fond tagħha, l-iskeletru tal-poża ta’ persuna, eċċ. Il-mudell tad-diffużjoni mbagħad jiġi llokkjat għal dak is-sinjal waqt li l-prompt jiddeċiedi l-istil, il-kuluri, id-dawl, u s-suġġett. Ir-riżultat iżomm il-kompożizzjoni eżatta li tkun daħħalt imma jidher bħal xi ħaġa kompletament ġdida.

Din l-għodda hija appoġġjata minn ControlNet-UnionSDXL ProMax (Apache 2.0) — mudell wieħed li jifhem it-12-il tip ta’ kondizzjonament hawn taħt, sabiex inti taqleb bejniethom minn picker wieħed mingħajr ma tgħabbi netwerk differenti kull darba.Hija kompletament kummerċjali għall-użu faċli: żomm, ibiegħ, jew timmodifika kull ma tiġġenera.

It-12-il tip ta’ kondizzjonament

Kannella
Sejbien tarf iqarmeċ. Aħjar għall-preservazzjoni contours li jaqtgħu u linework nadif.
Fond
Mappa tal-fond 3D. Żomm it-tqassim spazjali — x’inhu qrib u x’inhu ’l bogħod.
Pożizzjoni
OpenPose skeletru tal-ġisem. Locks-pożizzjoni tal-figura u l-pożizzjonijiet tar-riġlejn.
Scribble
Doodles maħlula mfassla bl-idejn inbidlu f'arti lesta.
Segmentazzjoni
Mappa tar-reġjun b’kodiċi tal-kulur. Assenja kull żona tax-xena għal klassi.
Normali
Mappa normali tal-wiċċ. Ippreserva l-orjentazzjoni tal-wiċċ 3D fina u l-ħotob.
Arti lineari
Estrazzjoni tal-linja fina - ideali għall-ink, manga, u illustrazzjoni.
Tarf artab
Sejbien tal-konfini ġentili li jsegwi l-forom b'mod aktar laxk minn Canny.
MLSD
Segmenti linja dritta. Magħmula għall-arkitettura, interjuri, u shots prodott.
Madum
Kondizzjonament li jippreserva d-dettalji għal upscaling u xogħol mingħajr xkiel tat-tessut.
Żebgħa
Maskra-aware kondizzjonament biex jiġġeneraw biss parti minn immaġni.
Repaint / outpaint
Estendi kanvas jew repiint reġjuni filwaqt li onora l-istruttura tal-madwar.

Tliet passi

  1. Upload immaġni ta' referenza — ritratt, sketch, screenshot, xi ħaġa bl-istruttura li tixtieq iżżomm.
  2. Agħżel it-tip kondizzjonament li jaqbel ma dak li inti tieħu ħsieb (poża għal figura, fond għal xena, canny jew lineart għall-konturi nadif).
  3. Ikteb prompt li jiddeskrivi l-ħarsa li tixtieq u jiġġeneraw.Żid is-saħħa tal-kontroll biex isegwu r-referenza aktar strettament, tbaxxiha għal aktar libertà kreattiva.

ControlNet — 12-il tip ta’ kondizzjonament f’għodda waħda — FAQ

Għodda waħda li tesponi l-12-il tip ta’ kondizzjonament mill-mudell ControlNet-Union SDXL ProMax — canny, pose, fond, scribble, lineart, anime-lineart, MLSD, HED, soft-edge, normali, segmentazzjoni, u madum.Agħżel tip ta’ kondizzjonament, waqqa’ immaġni ta’ referenza, ikteb twissija, u SDXL tirrendi immaġni ġdida li ssegwi l-istruttura tar-referenza tiegħek.

img2img re-pittura fuq l-input direttament — kuluri, truf, u ġeometrija taħlita mal-prompt. ControlNet tarmi l-kuluri bogħod u jżomm biss is-sinjal strutturali magħżula (linji, pose skeletru, mappa fond, eċċ). Li jippermettilek radikalment swap kontenut filwaqt li żżomm kompożizzjoni blat solidu.

Canny / lineart għal input nadif tal-linja. Anime-lineart għal input tal-linja fl-istil tal-anime. Scribble / soft-edge / HED għal skedi u doodles mhux maħduma. Pose biex tikkopja pożizzjoni tal-ġisem minn ritratt. Depth biex tippreserva l-ġeometrija tax-xena / tqassim 3D. MLSD biex tippreserva linji dritti (arkitettura / interni). Normal biex tippreserva l-orjentazzjoni u l-volum tal-wiċċ. Segmentation biex tippreserva r-reġjuni. Tile biex tirfina jew tkabbar varjazzjonijiet ta' immaġni eżistenti.

ControlNet-Unjoni SDXL ProMax (xinsir, Apache 2.0) pakketti kollha 12 kondizzjonament netwerks f'wieħed 2.5 GB piż. aktar antiki tniżżel ~ 2.5 GB piż separata għal kull tip — li taqleb bejn canny u pose ifisser a cold-start.-mudell Unjoni tagħbijiet darba u jibqa sħun, sabiex kull tip kondizzjonament huwa sub-sekonda wara l-ewwel sejħa.

Iva. ~1,200 tokens għal kull render (1,000 bażi SDXL + 20% ControlNet kondizzjonament surcharge).Utenti li jkunu ffirmaw jiksbu 30,000 tokens b'xejn kuljum — madwar 25 kondizzjonati renders kuljum mingħajr ebda spiża.Anonymous: 2,500 tokens/jum (~2 renders).

Iva — il-kontroll saħħa slider (default 0.7) jiddetermina kemm strettament l-output isegwi r-referenza tiegħek. 1.0 = stretti (output jidher bħal re-rendering tar-referenza tiegħek). 0.4 = laxka (prompt għandha aktar libertà).

Proporzjonijiet standard SDXL — 768 × 1024 ritratt, 1024 × 768 pajsaġġ, 1024 × 1024 kwadru — kollha tax-xogħol. outputs akbar jikkunsmaw aktar VRAM u tokens; l-H200 jappoġġja sa 1024 × 1024 komdu.

Immaġini ta’ referenza huma pproċessati immedjatament, il-kondizzjonament jiġi estratt, imbagħad il-fajl ta’ referenza jitħassar. Il-prompt + ir-render finali biss jibqgħu fuq /account/?tab=history. Qatt ma jintużaw għat-taħriġ. /privacy/ għall-politika sħiħa.

ControlNet-Union SDXL ProMax huwa rilaxxat taħt Apache 2.0 — permess għal kollox, inkluż l-użu kummerċjali.Il-bażi SDXL hija OpenRAIL++.It-tnejn jippermettu l-użu kummerċjali; l-immaġini ġġenerati tiegħek huma tiegħek biex tużahom kummerċjalment mingħajr royalties.

L-istess mudell, l-istess kwalità, l-istess sinjali kondizzjonament.ComfyUI u A1111 jeħtieġu GPU lokali ma 12 + GB VRAM plus setup. Aħna tmexxiha fuq infrastruttura kondiviża ma ġenerużi pool ħielsa — l-ebda installazzjoni, l-ebda GPU meħtieġa.

L-ewwel sejħa tniżżel il-piż tal-Unjoni (~ 2.5 GB) fil-cache tal-GPU u ssaħħan il-pipeline SDXL. Tistenna 30-60 sekonda fuq l-ewwel talba wara l-iskjerament jew l-evakwazzjoni tal-LRU.

Iva — POST multipart għal /v1/image/generate/ b’model=sdxl (jew model=controlnet-union-sdxl-promax), prompt, control_image (fajl), control_type=<waħda minn: canny, pose, depth, scribble, lineart, anime-lineart, mlsd, hed, soft-edge, normal, segmentation, tile>, optional control_strength (0.1-1.5). awtentikazzjoni tal-bearer, 10K tokens b’xejn/xahar. /api/ għandu eżempji ta’ curl.

Imħabba Free.ai? Għid lill-ħbieb tiegħek!

Irraporta din il-paġna