ControlNet — 12 conditioning uri sa isang tool

Q: Paano ControlNet naiiba mula sa img2img o imahe-sa-imahe?

< img2img muling-paintings sa ibabaw ng input nang direkta — kulay, gilid, AT geometry halo sa prompt. ControlNet throws ang mga kulay ang layo at pinapanatili lamang ang piniling istraktura signal (linya, pose skeleton, depth map, atbp.). Na nagbibigay-daan sa iyo upang radikal na palitan ang nilalaman habang pinapanatili ang komposisyon rock solid. malayo mas malakas na istraktura control kaysa sa img2img.

Q: Anong uri ng conditioning ang dapat kong piliin?

Ang mga ito ay ang mga sumusunod: Canny / lineart para sa malinis na linework input. Anime-lineart para sa anime-style na linya ng input. Scribble / soft-edge / HED para sa mga rough sketches at doodles. Pose upang kopyahin ang isang katawan posisyon mula sa isang larawan. Depth upang mapanatili ang eksena geometry / 3D layout. MLSD upang mapanatili ang tuwid na linya (arkitektura / interiors). Normal upang mapanatili ang ibabaw na pag-uugali at dami. Segmentation upang mapanatili ang mga rehiyon. Tile upang pabutihin o upscale pagkakaiba-iba ng isang umiiral na imahe.

Q: Bakit isang modelo para sa lahat ng 12 uri?

ControlNet-Union SDXL ProMax (xinsir, Apache 2.0) packs lahat ng 12 conditioning network sa isang solong 2.5 GB timbang. Mas lumang deployments-download ng isang hiwalay na ~ 2.5 GB timbang bawat uri - paglipat sa pagitan ng canny at pose sinadya ng isang malamig na simula. Ang unyon modelo ng mga load ng isang beses at natiling mainit, kaya ang bawat conditioning uri ay sub-pangalawang pagkatapos ng unang tawag.

Q: Ito ba ay tunay na libre?

Oo. ~1,200 tokens bawat render (1,000 base SDXL + 20% ControlNet conditioning surcharge). Ang mga naka-sign in na gumagamit ay makuha ng 30,000 libreng tokens araw-araw — tungkol sa 25 conditioned renders bawat araw nang walang gastos. Anonymous: 2,500 tokens / araw (~2 renders).

Q: Maaari ko bang i-tune kung gaano mahigpit ang AI sumusunod sa conditioning?

Oo — ang Control lakas slider (default 0.7) ay tumutukoy kung paano mahigpit ang output sumusunod sa iyong reference. 1.0 = mahigpit (output mukhang isang muling pag-render ng iyong reference). 0.4 = maluwag (prompt ay may higit pang kalayaan). Ibaba ito para sa creative pagkakaiba-iba, itaas ito kapag katotohanan bagay.

Q: Ano ang mga laki ng output ay suportado?

SDXL standard ratios — 768×1024 portrait, 1024×768 landscape, 1024×1024 square — lahat ng trabaho. Mas malaki output kumain ng higit pang VRAM at token; ang H200 sumusuporta sa hanggang sa 1024×1024 komportable.

Q: Ang mga imahe ng reference na nai-upload ay naka-imbak?

Reference imahe ay naproseso kaagad, conditioning ay kinuha, pagkatapos ay ang reference file ay tinanggal. Lamang ang prompt + huling render mananatili sa /account/?tab=history. Hindi kailanman ginagamit para sa pagsasanay. /privacy/ para sa buong patakaran.

Q: Ano ang lisensya ng modelo sa ilalim? Maaari ko bang gamitin ang output komersyal?

Ang ControlNet-Union SDXL ProMax ay inilabas sa ilalim ng Apache 2.0 — ganap na permissive, kabilang ang komersyal na paggamit. Ang SDXL base ay OpenRAIL++. Parehong pinapayagan ang komersyal na paggamit; ang iyong mga imahe ay iyong gamitin sa komersyal na walang royalties.

Q: Paano ito ihambing sa ComfyUI o Automatic1111 sa ControlNet?

Parehong modelo, parehong kalidad, parehong conditioning signal. ComfyUI at A1111 nangangailangan ng isang lokal na GPU na may 12+ GB VRAM plus setup. Patakbuhin namin ito sa ibinahaging imprastraktura na may isang malawak na libreng pool — walang pag-install, walang GPU na kailangan.

I-upload ang isang reference image, pumili ng isang uri ng conditioning, sumulat ng isang prompt. Ang AI ay natiling istraktura ng iyong reference (mga linya, pose, lalim, atbp) at gumagawa ng bagong nilalaman sa anumang estilo.

Tipo ng conditioning

Canny / lineart para sa malinis na linework. Pose para sa posisyon ng katawan. Lalim para sa 3D layout. Scribble / soft-edge para sa magaspang doodles. MLSD para sa architecture. Normal / segmentation / tile para sa mga advanced na workflows.

Reference imahe

Conditioning ay kinuha mula sa ito - ang mga kulay ay tinanggal, lamang ang istraktural na signal (sa pamamagitan ng iyong piniling uri) ay preserved.

Mag-prompt

Kontrolin ang lakas

Luma 0.7 Mas mahigpit

Aspect ratio

~1,200 tokens (SDXL × 1.2 ControlNet)

Paano gumagana ang ControlNet

Ang ControlNet ay nagbibigay-daan sa iyo upang pamahalaan ang paglikha ng imahe gamit ang istraktura ng isang imahe ng sanggunian sa halip na umasa sa tekstong prompt lamang. Ang isang preprocessor ay nagbabasa ng iyong sanggunian at nag-a-extract ng isang solong signal ng pag-aayos — ang mga gilid nito, ang mapa ng lalim nito, ang pose ng skeleton ng isang tao, at iba pa. Ang modelo ng pagpapakalat ay pagkatapos ay naka-lock sa signal na iyon habang ang prompt ay nagpasya sa estilo, kulay, ilaw, at paksa. Ang resulta ay natiling eksaktong komposisyon na iyong ibinigay sa ngunit mukhang isang bagay na ganap na bago.

Ang tool na ito ay suportado ng ControlNet-UnionSDXL ProMax (Apache 2.0) — isang solong modelo na nauunawaan ang lahat ng 12 conditioning uri sa ibaba, kaya i-switch sa pagitan ng mga ito mula sa isang picker nang walang pag-load ng isang iba't ibang network sa bawat oras. Ito ay ganap na komersyal na-gamitin friendly: panatilihin, magbenta, o baguhin ang anumang iyong nilikha.

Ang 12 uri ng conditioning

Kanluran

Crisp gilid detection. Pinakamahusay para sa pagpapanatili ng matalim outlines at malinis na linework.

Lalim

3D depth map. Pinapanatili ang spatial layout — kung ano ang malapit at kung ano ang malayo.

Pag-upo

OpenPose katawan skeleton. Naka-lock ang posisyon ng figure at mga posisyon ng mga limbs.

Pag-ibig

Ang mga karaniwang uri ng mga palabas sa telebisyon ay kinabibilangan ng mga palabas sa arte.

Pag-segment

Kulay-code na rehiyon mapa. Magtalaga ng bawat lugar ng eksena sa isang klase.

Normal

Surface-normal na mapa. Pinapanatili ang fine 3D ibabaw ng pag-uugali at bumps.

Linya

Fine linya pag-alis - perpekto para sa inking, manga, at paglalarawan.

Soft- gilid

Ang mga ito ay mga karaniwang mga katangian ng mga organismong may buhay na mas malaki kaysa sa mga hindi nabubuhay.

Mga MLM

Tuwid na linya segment. Ginawa para sa architecture, interiors, at mga shot ng produkto.

Tiles

Ang mga ito ay mga halimbawa ng mga sistemang hindi linyar at mga sistemang linyar na linyar.

Pagpipinta

Ang mga ito ay maaaring mag-iba mula sa isang simpleng imahe hanggang sa isang mas komplikadong imahe.

Repaint / outpaint

Palawakin ang isang canvas o repaint rehiyon habang paggalang sa nakapalibot na istraktura.

Tatlong hakbang

I-upload ang isang reference na larawan — isang larawan, isang sketch, isang screenshot, anumang bagay na may istraktura na nais mong panatilihin.
Piliin ang uri ng conditioning na tumutugma sa kung ano ang iyong pag-aalaga tungkol sa (pose para sa isang larawan, lalim para sa isang eksena, canny o lineart para sa malinis na mga hugis).
Mag-sulat ng isang prompt na naglalarawan ng hitsura na nais mong at bumuo. Taasan ang kontrol lakas upang sundin ang reference mas mahigpit, ibaba ito para sa mas creative kalayaan.

ControlNet — 12 conditioning uri sa isang tool — FAQ

Ang isang solong tool na nagpapakita ng lahat ng 12 conditioning uri mula sa ControlNet-Union SDXL ProMax modelo - canny, pose, depth, scribble, lineart, anime-lineart, MLSD, HED, soft-edge, normal, segmentation, at tile. Pumili ng isang conditioning uri, drop ng isang reference image, sumulat ng isang prompt, at SDXL ay nagpapakita ng isang bagong imahe na sumusunod sa istraktura ng iyong reference.