ControlNet - 12 tipos de condicionamento nunha ferramenta

Envíe unha imaxe de referencia, escolla un tipo de condicionamento, escriba un aviso. A IA mantén a estrutura da referencia (liñas, pose, profundidade, etc.) e renderiza o novo contido en calquera estilo. Apoiado por ControlNet- Union SDXL ProMax — Apache 2. 0, totalmente amigable para uso comercial.

Canny / lineart para liñas limpas. Pose para posición do corpo. Profundidade para disposición 3D. Gargalo / bordos suaves para garabatos áspero. MLSD para arquitectura. Normal / segmentación / mosaico para fluxos de traballo avanzados.
O condicionamento é extraído a partir disto - as cores son descartadas, só o sinal estrutural (segundo o tipo escollido) é preservado.
Looser 0.7 Máis estrito
~1,200 tokens (SDXL × 1.2 ControlNet)
Resultado

Como funciona ControlNet

ControlNet permite dirixir a xeración da imaxe coa estrutura dunha imaxe de referencia no canto de depender só do aviso de texto. Un preprocesador le a referencia e extrae un único sinal condicionante: os seus bordos, o seu mapa de profundidade, o esqueleto da pose dunha persoa, etc. O modelo de difusión é bloqueado a ese sinal mentres o aviso decide o estilo, cores, iluminación e tema. O resultado mantén a composición exacta que introduciu pero parece algo completamente novo.

Esta ferramenta está apoiada por ControlNet-UnionSDXL ProMax (Apache 2.0) — un modelo único que entende os 12 tipos de condicionamento en baixo, polo que pode cambiar entre eles desde un selector sen cargar unha rede diferente cada vez. É totalmente amigable para uso comercial: garda, vende ou modifica o que xeres.

Os 12 tipos de condicionamento

Canny
Detección de bordos nítidos. Mellor para preservar contornos nítidos e liñas limpas.
Profundidade
Mapa de profundidade 3D. Mantén a disposición espacial, o que está preto e o que está lonxe.
Posición
Esqueleto corporal OpenPose. Bloquea a postura e as posicións dos membros da figura.
Garabato
Garabatos soltos debuxados a man convertéronse en arte acabada.
Segmentación
Mapa de rexión codificado por cores. Asigna cada área da escena a unha clase.
Normal
Mapa normal de superficie. Conserva a orientación e as protuberancias da superficie en 3D.
Arte linear
Extracción de liñas finas, ideal para tinta, manga e ilustración.
Bordes suaves
Detección suave de límites que segue as formas máis libremente que Canny.
MLSD
Segmentos de liña recta. Feito para arquitectura, interiores e fotos de produtos.
Mosaico
Condiciónamento que preserva os detalles para aumentar a escala e traballar con texturas sen problemas.
Pintar
Condicións sensibles á máscara para rexenerar só parte dunha imaxe.
Repintar / sobrepintar
Estender un lenzo ou pintar de novo rexións mentres se respecta a estrutura circundante.

Tres pasos

  1. Envíe unha imaxe de referencia — unha foto, un esbozo, unha captura de pantalla, calquera cousa coa estrutura que queira manter.
  2. Escolla o tipo de condicionamento que coincida co que lle importa (pose para unha figura, profundidade para unha escena, astuto ou linear para contornos limpos).
  3. Escriba un aviso describindo o aspecto que queira e xere. Aumente a forza do control para seguir a referencia máis de preto, baixe para ter máis liberdade creativa.

ControlNet - 12 tipos de condicionamento nunha ferramenta — FAQ

Unha única ferramenta que expón os 12 tipos de condicionamento do modelo ControlNet- Union SDXL ProMax: canny, pose, depth, scribble, lineart, anime- lineart, MLSD, HED, soft- edge, normal, segmentation e tile. Escolla un tipo de condicionamento, solte unha imaxe de referencia, escriba un aviso e SDXL renderizará unha nova imaxe que siga a estrutura da súa referencia.

img2img pinta de novo directamente sobre a entrada — mestura cores, bordos E xeometría co aviso. ControlNet elimina as cores e só mantén o sinal estrutural escollido (liñas, esqueleto de pose, mapa de profundidade, etc.). Isto permítelle trocar radicalmente o contido mantendo a composición sólida. Control estrutural moito máis forte que img2img.

Canny / lineart para unha entrada de liñas limpas. Anime- lineart para unha entrada de liñas ao estilo de anime. Scribble / soft- edge / HED para esbozos e garabatos. Pose para copiar unha posición do corpo dunha foto. Profundidade para preservar a xeometría da escena / disposición 3D. MLSD para preservar liñas rectas (arquitectura / interiores). Normal para preservar a orientación e o volume da superficie. Segmentación para preservar rexións. Mosaico para refinar ou aumentar as variacións dunha imaxe existente.

ControlNet- Union SDXL ProMax (xinsir, Apache 2. 0) empaqueta as 12 redes de condicionamento nunha soa carga de 2, 5 GB. As implementacións máis antigas descargaban unha carga separada de ~ 2, 5 GB por tipo; cambiar entre canny e pose significaba un arranque en frío. O modelo de unión cárgase unha vez e permanece quente, polo que cada tipo de condicionamento é subsegundo despois da primeira chamada.

Si. ~1. 200 tokens por renderizacións (1. 000 base SDXL + 20% sobretaxa de condicionamento ControlNet). Os usuarios rexistrados obteñen 30. 000 tokens gratuítos diarios — aproximadamente 25 renderizacións condicionadas por día sen custo. Anónimo: 2. 500 tokens/ día (~2 renderizacións).

Si, o control deslizante de intensidade do control (por omisión 0, 7) determina o rigor coa que a saída segue a referencia. 1, 0 = rigoroso (a saída parece unha re- representación da referencia). 0, 4 = frouxo (o prompt ten máis liberdade). Baixe para variación creativa, elévao cando a fidelidade é importante.

Por omisión 512x512. As proporcións estándar SDXL — 768x1024 vertical, 1024x768 horizontal, 1024x1024 cadrado — funcionan todas. As saídas máis grandes consumen máis VRAM e tokens; o H200 soporta ata 1024x1024 con comodidade.

As imaxes de referencia son procesadas inmediatamente, extraéndose o condicionamento e logo eliminándose o ficheiro de referencia. Só o aviso + a representación final permanecen en / account/? tab=history. Nunca se emprega para adestramento. / privacy/ para a política completa.

ControlNet- Union SDXL ProMax é publicado baixo Apache 2. 0 — totalmente permisivo, incluíndo o uso comercial. A base de SDXL é OpenRAIL++. Ambos permiten o uso comercial; as imaxes xeradas son súas para uso comercial sen royalties.

O mesmo modelo, a mesma calidade, os mesmos sinais de condicionamento. ComfyUI e A1111 requiren unha GPU local con 12+ GB de VRAM máis configuración. Execútano nunha infraestrutura compartida cunha xenerosa reserva libre — non se precisa instalación nin GPU.

A primeira chamada descarga a carga da Unión (~2, 5 GB) na caché da GPU e quenta o conduto SDXL. Agarde 30- 60 segundos na primeira solicitude despois dunha implementación ou expulsión da LRU. As chamadas subseguintes baixo carga típica regresan en 4- 7 segundos.

Si — POST multipart a /v1/image/generate/ con model=sdxl (ou model=controlnet-union-sdxl-promax), prompt, control_image (ficheiro), control_type=<un de: canny, pose, depth, scribble, lineart, anime-lineart, mlsd, hed, soft-edge, normal, segmentation, tile>, opcional control_strength (0.1-1.5). Autenticación do portador, 10K tokens libres/mes. /api/ ten exemplos curl.

Amas Free.ai?

Cualificar esta páxina