ControlNet — 12 tipi di cundizionamentu in un strumentu

Carica un'imaggini di riferimentu, scegli un tipu di cundizionamentu, scrivi un prompt. L'IA mantini a struttura di u vostru riferimentu (linii, postu, prufundità, ecc.) è rende novi cuntenuti in ogni stili. Supportatu da ControlNet-Union SDXL ProMax — Apache 2.0, cumpletamenti amichevole per l'usu cummerciale.

Canny / lineart pi lignu pulitu. Pose pi pusizioni di corpu. Profondità pi layout 3D. Scribble / soft-edge pi scarabocchi ruvi. MLSD pi l'architittura. Normal / segmentation / tile pi flussi di travagghiu avanzati.
Si estrae lu cundiziunamentu di chistu - li culori sunnu scartati, sulu lu signali strutturali (per u tipu ca sceglite) è priservatu.
Più lascivu 0.7 Strittu
~1,200 tokens (SDXL × 1.2 ControlNet)
Risurtatu

Comu ControlNet funziona

ControlNet vi permette di guidà a generazione di l'imaghjini cù a struttura di un'imaghjini di rifirimentu invece di basassi solu supra u testu. Un preprocessore leghji u vostru rifirimentu è estrae un singulu signali di cundizionamentu - i so bordi, a so mappa di prufundità, u scheletru di una persona, ecc. U mudellu di diffusione hè poi bloccatu à stu signali mentri u testu decide u stile, i culori, l'illuminazione è u suggettu. U risultatu mantiene l'esatta cumposizione chì avete inseritu ma pare qualcosa di cumpletamente novu.

Stu strumentu hè supportatu da ControlNet-UnionSDXL ProMax (Apache 2.0) — un singulu mudellu ca capisci tutti i 12 tipi di cundizioni sottu, accussì si pò passà trà di elli da un selettore senza caricari una rete diversa ogni volta. È cumpletamenti amichevole per l'usu cummerciale: mantene, vende o mudificà tuttu ciò chì generate.

I 12 tipi di cundizionamentu

Canny
Rilevazione di bordi nitti. Migliore pi mantèniri i contorni nitti e li linii netti.
Prufunnità
Mappa di prufundità 3D. Manteni a disposizione spaziali - ciò ch'è vicinu è ciò ch'è luntanu.
Posizzioni
U scheletru di corpu OpenPose. Blocca a pusizzioni di l'arti e di l'azzioni di la figura.
Scribble
Scribbiti disignati a manu trasfurmati in arti finita.
Segmentazione
Mappa di riggiuni cu un codice di culori. Assigna ogni riggiuni dâ scena a na classa.
Normali
Mappa di superficia-nurmali. Manteni l'orientazioni 3D di a superficia e i buffi.
Lineart
Estrazzioni di linii fini — ideale pi l'inchiostru, manga, e illustrazioni.
Bordu lisciu
Rilevamentu di cunfini lisciu ca siguìsci e formi cchiù lisciu ca Canny.
MLSD
Segmenti di linii dritte. Fatti per l'architettura, l'interni è i scatti di prudutti.
Piastrelle
Cundizioni di preservazione di i detalli per l'upscaling è u travagliu di texture senza soluzione di continuità.
Pittura
Cundizioni di maschera per rigenerari sulu parti di n'imàgini.
Ripinniri / ripinniri
Estendi una tela o ripittura riggiuni senza canciari la struttura.

Tri passi

  1. Carica n'ìmmi di rifirimentu — na fotografia, un schizziu, na schermata, tuttu chiddu ca havi la struttura chi vo vulete mantèniri.
  2. Sceglite u tipu di cundiziunamentu ca vi interessa (postu pi na figura, prufundità pi na scena, cunci o lineari pi contorni puliti).
  3. Scrivi un prompt ca discrivi l'aspettu chi vo vulete è generallu. Aumenta a forza di u cuntrollu pi seguità u riferimentu cchiù strettu, abbassalla pi cchiù libertà criativa.

ControlNet — 12 tipi di cundizionamentu in un strumentu — FAQ

Un strumentu simplici ca esponi tutti i 12 tipi di cundizioni di u mudellu ControlNet-Union SDXL ProMax - canny, pose, depth, scribble, lineart, anime-lineart, MLSD, HED, soft-edge, normal, segmentation, and tile. Sceglite un tipu di cundizione, lasciate calà un'imaggini di rifirimentu, scrivite un prompt, e SDXL renderà una nova immagine ca seguita a struttura di u vostru rifirimentu.

img2img ripinni direttamente supra l'input, mischjannu i culori, i bordi E a giumitrìa cu lu prompt. ControlNet scarta i culori e mantini sulu u signali strutturali sceltu (linii, scheletru di pusizioni, mappa di prufundità, ecc.). Ciò vi lascia canciari radicalmenti u cuntinutu mantenennu a cumposizzioni solida. Un cuntrollu strutturali assai cchiù forti di img2img.

Canny / lineart pi l'input di linii puliti. Anime-lineart pi l'input di linii in stile anime. Scribble / soft-edge / HED pi schizzi e scarabocchi. Pose pi copiari a pusizzioni di un corpu di na fotografia. Profondità pi priserviri la giumitrìa di la scena / layout 3D. MLSD pi priserviri li linii dritte (architittura/interni). Normali pi priserviri l'orientazzioni e lu voluminu di la superficia. Segmentazione pi priserviri li riggiuni. Tile pi raffinari o aumintari li variazioni di n'imaggini esistenti.

ControlNet-Union SDXL ProMax (xinsir, Apache 2.0) imballa tutte e 12 reti di cundizionamentu in un singulu pesu di 2.5 GB. I dispiegamenti più vechji scaricàvanu un pesu ~ 2.5 GB separatu per tipu - passandu trà canny è pose significò un avviu à freddu. U mudellu di unione si carica una volta è rimane caldu, cusì ogni tipu di cundizionamentu hè sub-secondu dopu a prima chiamata.

Sì. ~1,200 tokens per render (1,000 base SDXL + 20% surcharge di cundizionamentu ControlNet). L'utenti registrati ricevenu 30,000 tokens gratuiti ogni ghjornu — circa 25 render condizionati ogni ghjornu senza alcun costu. Anonim: 2,500 tokens/giornale (~2 render).

Sì — u cursori di forza di cuntrollu (predefinitu 0.7) ditermina quantu strettamente l'output siguìsci a vostra riferenza. 1.0 = strettu (l'output pari un ri-rendering di a vostra riferenza). 0.4 = lassatu (prompt hà cchiù libertà). Abbassàlu pi variazioni criativi, alzàllu quannu a fedeltà conta.

512 × 512 di default. SDXL rapporti standard - 768 × 1024 ritrattu, 1024 × 768 paesaggiu, 1024 × 1024 quadratu - tutti funzionanu. Outputs più grandi consumanu più VRAM e tokens; u H200 supporta finu à 1024 × 1024 comodamente.

L'immàgini di rifirimentu sunnu processati immediatamenti, u cundizionamentu è estrattu, poi u file di rifirimentu è canciatu. Sulu u prompt + u render finali rimane in /account/?tab=history. Mai usatu pi l'addestramentu. /privacy/ pi la pulitica completa.

ControlNet-Union SDXL ProMax hè rilasciatu sutta Apache 2.0 — cumpletamenti permissivu, cumpresu l'usu cummerciali. A basa SDXL hè OpenRAIL++. Entrambi cunsentinu l'usu cummerciale; l'imaghjini chì generate sò vostre pi l'usu cummerciale senza royalties.

Stessu mudellu, stessa qualità, stessi signali di cundizionamentu. ComfyUI è A1111 richiedenu una GPU locale cù 12+ GB VRAM più a configurazione. Li eseguimu in un'infrastruttura cundivisa cù un generosu pool gratuitu - senza installazione, senza GPU necessaria.

A prima chiamata scaricà u pesu di l'Unione (~ 2.5 GB) in a cache GPU è scalda u pipeline SDXL. Aspettate 30-60 secondi à a prima richiesta dopu un deploy o un evacuazione LRU. Chiamate successive sottu un caricu tipica ritornu in 4-7 secondi.

Sì — POST multipart à /v1/image/generate/ cù model=sdxl (o model=controlnet-union-sdxl-promax), prompt, control_image (file), control_type=<unu di: canny, pose, depth, scribble, lineart, anime-lineart, mlsd, hed, soft-edge, normal, segmentation, tile>, optional control_strength (0.1-1.5). Bearer auth, 10K tokens gratuiti/month. /api/ hà esempi curl.

Amuri Free.ai? Dì i vostri amichi!

Vota sta pàggina