ControlNet — 하나의 도구에 12가지 컨디셔닝 유형

참조 이미지를 업로드하고 조건 유형을 선택하고 프롬프트를 작성합니다. AI는 참조의 구조(선, 포즈, 깊이 등)를 유지하고 새로운 콘텐츠를 모든 스타일로 렌더링합니다. ControlNet-Union SDXL ProMax — Apache 2.0, 완전히 상업적 사용 친화적입니다.

조건 유형

깨끗한 선 작업을 위한 Canny / lineart. 몸 위치를 위한 포즈. 3D 레이아웃을 위한 Depth. 거친 낙서를 위한 Scribble / soft-edge. 건축을 위한 MLSD. 고급 워크플로우를 위한 Normal / segmentation / tile.

참조 이미지

조건화는 이것에서 추출됩니다 — 색상은 버려지고, 구조 신호만 (당신이 선택한 유형에 따라) 보존됩니다.

프롬프트

제어 강도

느린 0.7 엄격함

화면 비율

~1,200 tokens (SDXL × 1.2 ControlNet)

ControlNet 작동 방법

ControlNet 는 텍스트 프롬프트에만 의존하는 대신 참조 이미지의 구조를 사용하여 이미지 생성을 제어할 수 있게 해줍니다. 프리프로세서가 참조를 읽고 가장자리, 깊이 맵, 사람의 포즈 골격 등 단일 조건화 신호를 추출합니다. 프롬프트가 스타일, 색상, 조명, 주제를 결정하는 동안 확산 모델은 그 신호에 고정됩니다. 결과는 입력한 정확한 구성을 유지하지만 완전히 새로운 것처럼 보입니다.

이 도구는 ControlNet-UnionSDXL ProMax (Apache 2.0)에 의해 지원되며, 이는 아래의 12가지 조건화 유형을 모두 이해하는 단일 모델이므로, 각각 다른 네트워크를 로드하지 않고 한 번의 픽커에서 이들 사이를 전환할 수 있습니다.

12 컨디셔닝 유형

똑똑하네

선명한 윤곽선과 깨끗한 라인워크를 유지하는 데 가장 적합합니다.

깊이

3D 깊이 지도. 공간 레이아웃을 유지합니다. 가까운 것과 멀리는 무엇입니까?

포즈

OpenPose 몸 골격. 캐릭터의 자세와 사지 위치를 잠그는 효과입니다.

쓰레기통

느슨한 손으로 그린 낙서가 완성된 예술로 변했습니다.

세그먼트화

색상 코드 지역 지도. 장면의 각 영역을 클래스에 할당합니다.

일반

표면 정규화 맵. 3D 표면의 정밀한 방향과 볼프를 보존합니다.

선 그림

미세한 선 추출 — 잉크, 만화, 일러스트레이션에 이상적입니다.

소프트 에지

Canny보다 모양을 더 느슨하게 따르는 부드러운 경계 감지.

MLSD 디버거

건축, 인테리어, 제품 촬영을 위해 제작되었습니다.

타일

업스케일링 및 원활한 텍스처 작업을 위한 세부 사항 보존 조건화.

페인트

이미지의 일부만 재생성하는 마스크 인식 조건화.

재그림/ 외부그림

주변 구조를 유지하면서 캔버스를 확장하거나 영역을 다시 페인트합니다.

세 단계

참조 이미지를 업로드하세요. 사진, 스케치, 스크린샷, 보관하고 싶은 구조를 가진 모든 것을 업로드하세요.
당신이 관심을 가지고 있는 것과 일치하는 조건 유형을 선택하십시오 (그림의 포즈, 장면의 깊이, 깨끗한 윤곽선의 날카로움 또는 선형성).
원하는 모양을 설명하고 생성하는 프롬프트를 작성합니다. 컨트롤 강도를 높여 참조를 더 밀접하게 따르고, 낮춰 더 많은 창의적 자유를 얻습니다.

ControlNet — 하나의 도구에 12가지 컨디셔닝 유형 — FAQ

ControlNet-Union SDXL ProMax 모델에서 12가지 조건화 유형(canny, pose, depth, scribble, lineart, anime-lineart, MLSD, HED, soft-edge, normal, segmentation, tile)을 모두 노출하는 단일 도구입니다. 조건화 유형을 선택하고 참조 이미지를 드롭하고 프롬프트를 작성하면 SDXL이 참조의 구조를 따르는 새로운 이미지를 렌더링합니다.

img2img는 입력에 직접 재페인트를 칠합니다. 색상, 모서리, 그리고 지오메트리를 명령어와 함께 혼합합니다. ControlNet은 색상을 버리고 선택한 구조 신호만을 유지합니다(선, 포즈 골격, 깊이 맵 등). 이렇게 하면 콘텐츠를 급진적으로 교환하면서도 컴포지션을 견고하게 유지할 수 있습니다. img2img보다 훨씬 강력한 구조 제어.

Canny / lineart는 깨끗한 선 작업 입력을 위한 것입니다. Anime- lineart는 애니메이션 스타일의 선 입력을 위한 것입니다. Scribble / soft- edge / HED는 거친 스케치와 낙서를 위한 것입니다. 포즈는 사진에서 몸의 위치를 복사합니다. Depth는 장면의 형상을 보존합니다. MLSD는 직선을 보존합니다. Normal은 표면 방향과 볼륨을 보존합니다. Segmentation은 영역을 보존합니다. Tile는 기존 이미지의 변형을 정교하게 만들거나 업스케일링합니다.

ControlNet-Union SDXL ProMax(xinsir, Apache 2.0)는 12개의 조건화 네트워크를 하나의 2.5GB 웨이트로 패키징합니다. 이전 배포에서는 유형당 별도의 ~2.5GB 웨이트를 다운로드했으므로 canny와 pose 간의 전환은 콜드 스타트를 의미했습니다. union 모델은 한 번 로드되고 온도가 높게 유지되므로 모든 조건화 유형은 첫 번째 호출 후 초 이내에 완료됩니다.

렌더당 ~1,200 토큰(1,000 기본 SDXL + 20% ControlNet 조건부 부가 요금). 로그인한 사용자는 매일 30,000개의 무료 토큰을 받으며, 하루에 약 25개의 조건부 렌더링을 무료로 볼 수 있습니다. 익명: 하루 2,500개의 토큰(~2개의 렌더링).

예 — 제어 강도 슬라이더(기본값 0.7)는 출력이 참조를 얼마나 엄격하게 따르는지를 결정합니다. 1.0 = 엄격 (출력이 참조의 재렌더링처럼 보입니다.) 0.4 = 느슨 (프롬프트가 더 자유롭습니다.) 창의적인 변화를 위해 낮추고 충실성이 중요할 때 높입니다.

SDXL 표준 비율(768×1024 세로, 1024×768 가로, 1024×1024 사각)은 모두 작동합니다. 더 큰 출력은 더 많은 VRAM과 토큰을 소비하며, H200은 최대 1024×1024를 편안하게 지원합니다.

참조 이미지는 즉시 처리되고 조건이 추출되고 참조 파일이 삭제됩니다. 프롬프트 + 최종 렌더링만 /account/?tab=history에 남습니다. 훈련에는 사용하지 않습니다. 전체 정책은 /privacy/ 에서 볼 수 있습니다.

ControlNet-Union SDXL ProMax는 아파치 2.0 아래 출시되었으며 상업적 사용을 포함하여 완전히 허용됩니다. SDXL의 기본은 OpenRAIL++입니다. 두 버전 모두 상업적 사용을 허용합니다.

동일한 모델, 동일한 품질, 동일한 조건 신호. ComfyUI와 A1111은 12GB 이상의 VRAM과 설치가 포함된 로컬 GPU가 필요합니다. 우리는 풍부한 무료 풀을 갖춘 공유 인프라에서 실행하므로 설치도 필요하지 않고 GPU도 필요하지 않습니다.

첫 번째 호출은 Union 무게(~2.5 GB)를 GPU 캐시로 다운로드하고 SDXL 파이프라인을 워밍업합니다. 배포 또는 LRU 철수 후 첫 번째 요청에 30~60초가 소요됩니다. 일반적인 부하에서 이후 호출은 4~7초 안에 반환됩니다.

예 — /v1/image/generate/에 다중 부분을 POST하여 model=sdxl (또는 model=controlnet-union-sdxl-promax), 프롬프트, control_image (파일), control_type=<canny, pose, depth, scribble, lineart, anime-lineart, mlsd, hed, soft-edge, normal, segmentation, tile> 중 하나를 사용합니다. 옵션으로 control_strength (0.1-1.5)를 사용할 수 있습니다.

ControlNet — 하나의 도구에 12가지 컨디셔닝 유형

결과

ControlNet 작동 방법

12 컨디셔닝 유형

세 단계

ControlNet — 하나의 도구에 12가지 컨디셔닝 유형 — FAQ

무료 AI ControlNet 발생기는 무엇입니까?

ControlNet이 img2img 또는 이미지 간 이미지와 어떻게 다르나요?

어떤 컨디셔닝 유형을 선택해야 하나요?

왜 12가지 유형에 대해 하나의 모델을 사용합니까?

정말 무료입니까?

AI가 조건화를 얼마나 엄격하게 따르는지 조정할 수 있나요?

어떤 출력 크기가 지원됩니까?

업로드된 참조 이미지가 저장되나요?

어떤 라이선스로 모델을 사용할 수 있습니까? 출력물을 상업적으로 사용할 수 있습니까?

이것은 ComfyUI 또는 ControlNet을 사용하는 Automatic1111과 어떻게 비교됩니까?

콜드 스타트 후 첫 번째 렌더링이 더 오래 걸리는 이유는 무엇입니까?

API가 있습니까?

10,000 무료 토큰 받기

기다려요 — 10K 무료 토큰 받기!

더 먹고 싶어?