ControlNet 12 tipus de condició en una eina

Publica una imatge de referència, escolliu un tipus de condició, escriviu un indicatiu. L' IA manté l' estructura de referència (línies,pose, profunditat, etc.) i representa nous continguts en qualsevol estil. En qualsevol moment canviat per ControlNet- UNion SDXL ProMax 1080 Apache 2. 0, totalment amigable.

Canny / lineat per a la línia de treball neta. Pose per a la posició del cos. Profunditat per a la disposició 3D. Sccrible / suedge per a fer- lo en brut. MLSD per a arquitectura. Normal/ segmentació / mosaic per a fluxs avançats de treball.
S' extrau la condició d' aquest removen els colors, només es preserva la senyal estructural (per al vostre tipus escollit).
LoodorCity name (optional, probably does not need a translation) 0.7 StricestCity name (optional, probably does not need a translation)
~1,200 tokens (SDXL × 1.2 ControlNet)
Resultat

ComControlNet funciona

ControlNet us permet conduir la generació d' imatges amb l' estructura d' una imatge de referència en comptes de confiar en l' indicatiu de text. Un preprocessador llegeix la vostra referència i extraieu una sola condició en el seu indicador, el seu mapa de profunditat, el joc d' esquelet d' una persona, i així successivament. El model de difusió està bloquejat per a aquesta senyal mentre l' indicatiu decideix l' estil, la il· luminació i el subjecte. El resultat manté la composició exacta que us alimenta en però sembla una cosa completament nova.

Aquesta eina està recolzada per ControlNet-Union SDXL ProMax (Apache 2.0) un únic model que entén tots els 12 tipus de condició a sota, de manera que canvieu entre ells sense carregar una xarxa diferent cada vegada. És totalment útil: mantenir, vendre o modificar el que genereu.

Els 12 tipus de condició

CannyCity name (optional, probably does not need a translation)
Detecció de la vora Crisp, millor per a preservar línies de contorn afilades i treball net.
Profunditat
Mapa de profunditat en 3D. Manté la disposició especial Urakami el que està a prop i el que és molt lluny.
PoseCity name (optional, probably does not need a translation)
L'esquelet del cos OpenPose, bloqueja la postura i les posicions de la figura.
Scribble
Deixeu anar els flassadors de mà cap a un art acabat.
Segmentació
Mapa de regió de codi de color. Assigna cada àrea de l' escena a una classe.
Normal
Mapa normal de superfícies. Preserva l' orientació fina de la superfície 3D i els salts.
Lineal
Una bona extracció ideal d'extracció d'extracció, manga i il·lustracions.
Suavitzat
Detecció suau del límit que segueix amb més mides que Canny.
MLSD
segments de línies rectes, fetes per arquitectura, interiors i trets de producte.
Mosaic
Insocien amb detall la condició de l'elevament i el treball amb textura forta.
Repintat
La condició conscient de la màscara només per regenerar una imatge.
Repinta / repinta
Estén un llenç o repinta regions mentre honorava l'estructura circumdadant.

Tres passes

  1. Publica una imatge de referència kdeaccessibility una foto, un croquis, una captura de pantalla, qualsevol cosa amb l' estructura que voleu mantenir.
  2. Escolliu el tipus de condició que coincideix amb el que us importa (posa't per una figura, profunditat per a una escena, cany o lineal per als contorns nets).
  3. Escriviu una estimació que descriu l' aspecte que voleu i genereu. Augmenta la força del control per seguir la referència amb més força, més baixa per a una llibertat més creativa.

ControlNet 12 tipus de condició en una eina — FAQ

Una única eina que mostra tots els 12 tipus de condició des del model SDXL ProMax Prony,pose, profunditat, gargot, lineal, ame- lineat, MLD, heed-ge, normal, segmentació i mosaic. Trieu un tipus de condició, deixeu anar una imatge de referència, escriure un indicatiu i SDL representa una nova imatge que segueix l' estructura de la vostra referència.

Img2img torna a repintar sobre l' entrada directament colors del darrere, vores i geometria amb l' indicatiu. ControlNet llança els colors lluny i manté el senyal estructural seleccionat (línies, posa l' esquelet, profunditat, mapa, etc.). Això us permet intercanviar radicalment contingut mentre manté el control estructural sòlid. Un control estructural més fort que l' img2gggg.

Canny / lineat per a l' entrada de línia neta. Anme- lineart per a una entrada de línia d' estil. Scobible / sua-ge / herD per a dibuixos durs i punts de referència. Pose per a copiar una posició del cos des d' una foto. Profunditat per a preservar l' escena geometria / format 3D. MLSD per a preservar línies rectes rectes directes (arquiture / interior). Normal preservar la superfície i l' orientació de volum. Segació per a preservar les regions. mosaic per ajustar o canviar les variacions d' una imatge existent.

ControlNet- Union SDXL ProMaxx (xinir, Apache 2.0) agafa totes les 12 xarxes de condició en un sol pes de 2. 2. 0 GB. Olderstate descarrega un pes separat ~2. 5 GB per tipus 07, canvi entre canny iposer. El model d' unió es carrega una vegada i es manté calent, de manera que cada tipus de condició és sub-segon després de la primera crida.

Sí. ~1, 200 fitxes per representació (1.000 fitxes base SDXL + 20% ControlNet conditioning surar). Els usuaris amb signe reben 30.000 fitxes diàries sobre 25 estats representades per dia. Anonymous: 2500 fitxes/ dia (~2 renderitzat).

Sí (# 0 = sortida és igual a una barra de control de la vostra referència. 0. 4 = un regreda de la vostra referència). 0. 4 = solida (prompt té més llibertat). Més baixa per a la variació creativa, s' eleva quan es tracta de fidelitat.

512×512 per omissió. Les relacions estàndard SDXL 768 ×1024 vertical, 1024×768 apaïsat, 1024×1024 square all work. Les sortides grans consumeixen més VRAM i fitxes; l' H200 dóna suport a 1024×1024 còmodament.

Les imatges de referència es processen immediatament, s' extrauen, i després s' esborra el fitxer de referència. Només s' ha esborrat l' indicatiu + final queda' s en / compte/?tab=hist. Mai s' usa per a l' entrenament. / privcy/ per a tota la política.

ControlNet- Union SDXL ProMax és alliberat sota l' Apache 2. 0 l' ús comercial, incloent- hi la base comercial. SDXL és OpenRAL++. Tant sols permet l' ús comercial; les vostres imatges generades són vostres per usar comercialment sense reials.

El mateix model, la mateixa qualitat, els senyals amb condició. ComfyUI i A11 requereixen una GPU local amb 12+ GBVRAM + configuració. Ho executeu en infraestructura compartida amb una generosa piscina lliure no instal· lar, no cal la GPU.

En primer lloc les baixades del pes de la Unió (~2. 5 GB) a la memòria cau de la GPU i escalfa la canonada SDXL. SDXL. S' espera 3060 segons en la primera petició després d' un desplegat o un desallotjament LRU. Les crides subsent sota un retorn típic en 47 segons.

Sí×PANAN multipart a / v1/image/genete / amb model=sdxl (o model=controlnet- unition- sdxl-promax), ask, control_ image (fitxer), control_ type=<ny: canpose, profunditat, gargot, lineal, ame- tlineal, mlsd, wed, normalge, segmentació, mosaic>, opcional de control_ streng (0. 1). Óser, 10K monther/ gepleries. / isp/ gepi/ skins.

Like this tool? Share it!

Valora aquesta pàgina