ControlNet – 12 typów kondycjonowania w jednym narzędziu

Wyślij obraz referencyjny, wybierz typ kondycjonowania, napisz skrót. AI zachowuje strukturę Twojego odniesienia (linie, pozę, głębokość itp.) i wytwarza nową zawartość w dowolnym stylu. Backed by ControlNet-Union SDXL ProMax — Apache 2.0, w pełni przyjazny dla użytkowania komercyjnego.

Canny / lineat dla czystej liniowej pracy. Pozycja dla pozycji ciała. Głęboka dla 3D układu. Scribble / miękki bok dla surowych doodles. MLSD dla architektury. Normal / segmentation / płytka dla zaawansowanych przepływów pracy.
Z tego wydobywa się warunek – kolory są wyrzucane, zachowywa się tylko sygnał konstrukcyjny (na wybrany typ).
Uwolniony 0.7 Bardziej ściśle
~1,200 tokens (SDXL × 1.2 ControlNet)
Wynik

Jak ControlNet działa

ControlNet pozwala kierować generacją obrazu z strukturą obrazu referencyjnego zamiast polegać na samej skrócie tekstu. Preprocesor odczytuje Twoje odniesienie i wyciąga pojedynczy sygnał kondycyjny – jego krawędzi, jego mapa głębin, szkielet pozy osoby, itp. Model dyfuzji jest następnie zablokowany do tego sygnału, podczas gdy skrót decyduje o stylu, kolorach, oświetleniu i przedmiotu. Wynik utrzymuje dokładny skład, w którym karmiłeś, ale wygląda jak coś zupełnie nowego.

Narzędzie to jest poparte przez ControlNet-UnionSDXL ProMax (Apache 2.0) – pojedynczy model, który rozumie wszystkie 12 typów kondycjonowania poniżej, więc przełącza się między nimi z jednego pikacza bez załadowania innej sieci za każdym razem. Jest w pełni przyjazny do użytku komercyjnego: zachować, sprzedawać lub modyfikować, cokolwiek generujesz.

12 typów kondycjonowania

Canny.
Wykrywanie krawędzi. Najlepsze do zachowania ostrych konturów i czystej liniowej pracy.
Głęboka
Mapa głębi 3D. Utrzymuje układ przestrzenny – to, co jest blisko i co jest daleko.
Pose
Zamyka pozycję figury i pozycje kończyn.
Skrabling
Ręcznie narysowane doodle zamieniły się w skończoną sztukę.
Segmentacja
Kolorowo kodowana mapa regionu. Przypisz każdy obszar sceny klasie.
Zwykłe
Powierzchniowo-normalna mapa. Zachowuje 3D orientację powierzchni i wybryki.
Liniowy
Doskonałe wydobycie linii — idealne dla kingu, mangi i ilustracji.
Miękkie
Łagodne wykrywanie granic, które śledzi kształty bardziej luźne niż Canny.
MLSD
Proste segmenty. Wyprodukowane do architektury, wnętrz, i zdjęć produktów.
Płytka
Szczegółowe kondycjonowanie do podskalowania i bezproblemowej pracy tekstury.
Zabarwienie
Maska-świadoma kondycja do regeneracji tylko części obrazu.
Ponowne farbowanie / outpaint
Rozszerzyć płótno lub przemalować regiony przy uhonorowaniu otaczającej struktury.

Trzy kroki

  1. Wyślij obraz referencyjny – zdjęcie, szkic, obrazek, wszystko, co chcesz zachować z strukturą.
  2. Wybierz typ kondycjonowania, który pasuje do tego, na czym ci zależy (pozycja dla figury, głębokość dla sceny, kanny lub liniowy dla czystych konturów).
  3. Napisz szybko opisując wygląd, który chcesz i generujesz. Zwiększ siłę kontroli, aby ściśle śledzić odniesienie, obniżyć go dla bardziej twórczej wolności.

ControlNet – 12 typów kondycjonowania w jednym narzędziu — FAQ

Pojedyncze narzędzie, które ujawnia wszystkie 12 typów kondycjonowania z modelu ControlNet-Union SDXL ProMax – kanny, poza, głębia, scribble, linia, anime-liniart, MLSD, HED, miękkie, normalne, segmentacja i płytki. Wybierz typ kondycjonowania, upuść obraz odniesienia, napisz szybko i SDXL wyświetla nowy obraz, który odpowiada strukturze Twojego odniesienia.

img2img przemaluje bezpośrednio nad wejściem — kolory, krawędzie i geometria miesza się z prędkością. ControlNet odrzuca kolory i utrzymuje tylko wybrany sygnał strukturalny (linie, pozycja szkielet, mapa głębokości itp.). Pozwala to radykalnie wymienić zawartość podczas utrzymywania składu rock stały. O wiele silniejsze kontrolowanie strukturalne niż img2img.

Canny / lineat dla czystej linii wejścia. Anime-lineat dla wejścia liniowego anime-style. Scribble / miękkie-bodzie / HED dla surowych szkiców i doodles. Pose do kopiowania pozycji ciała z zdjęcia. Głęboka do zachowania geometrii sceny / 3D layout. MLSD do zachowania linii prostych (architektura / wnętrza). Normalne do zachowania orientacji powierzchni i objętości. Segmentacja do zachowania regionów. Płytka do udoskonalenia lub udoskonalenia zmian istniejącego obrazu.

ControlNet-Union SDXL ProMax (xinsir, Apache 2.0) pakuje wszystkie 12 sieci kondycyjnych w pojedynczą wagę 2,5 GB. Starsze rozmieszczenie pobiera odrębną wagę ~2.5 GB na typ — przełączanie między kanny i pozowanie oznaczało zimny start. Model unionowy ładuje raz i pozostaje ciepły, więc każdy typ kondycjonowania jest podsekund po pierwszym telefonie.

Tak. ~1,200 tokenów na wyświetlenie (1 000 bazowych SDXL + 20% ControlNet dopłata). Użytkownicy podpisane otrzymują 30 000 bezpłatnych tokenów dziennie — około 25 kondycjonowanych wyświetlaczy dziennie bez kosztów. Anonimowy: 2500 tokenów/dzień (~2 wyświetlaczy).

Tak — suwak mocny sterowania (domyślnie 0.7) określa, jak ściśle wynik śledzi się po odniesieniu. 1.0 = ścisły (wyjście wygląda jak oddanie odnośnika). 0.4 = luźny (prompt ma większą swobodę). Obniż go dla twórczych zmian, podnieś go, gdy sprawa wierności ma znaczenie.

512×512 domyślnie. Stosunky standardowe SDXL — 768×1024 portret, 1024×768 krajobraz, 1024×1024 kwadrat — wszystkie prace. Większe wyjścia zużywają więcej VRAM i żetonów; H200 obsługuje do 1024×1024 komfortowo.

Zdjęcia referencyjne są przetwarzane natychmiast, kondycjonowanie jest wydobywane, następnie usuwa się plik referencyjny. Tylko skrót + końcowy wyświetlacz pozostaje na /account /?tab=history. Nigdy nie używany do treningu. /privacy / dla pełnej polityki.

ControlNet-Union SDXL ProMax jest wydany w ramach Apache 2.0 — w pełni dopuszczalny, w tym użytkowanie komercyjne. Bazą SDXL jest OpenRAIL++. Obydwa pozwalają na użytkowanie komercyjne; Twoje wygenerowane obrazy są Twoje do użytku komercyjnego bez licencji.

Ten sam model, ta sama jakość, te same sygnały kondycyjne. ComfyUI i A1111 wymagają lokalnego GPU z 12+ GB VRAM plus konfiguracja. Prowadzimy go na wspólnej infrastrukturze z hojnym bezpłatnym basenem – bez instalacji, bez GPU potrzeb.

Pierwsze wywołanie pobiera wagę Unii (~2.5 GB) do podręcznika GPU i ogrzewa rurociąg SDXL. Oczekuj 30-60 sekund na pierwszy wniosek po rozmieszczeniu lub emisji LRU. Kolejne połączenia w ramach typowego zwrotu obciążenia w ciągu 4-7 sekund.

Tak — POST multipart to /v1/image/generate/ with model=sdxl (lub model=controlnet-union-sdxl-promax), speat, control_image (file), control_type=<one of: canny, poze, scrubble, liniant, anime-lineart, mlsd, hed, miękka, normalna, segmentacja, płytka>, opcjonalne control_strength (0.1-1.5). Nosienie auth, 10K darmowe żetony/miesiąc. /api/ ma przykłady kwigły.

Love this tool? Share it!

Oszacuj tę stronę