ControlNet — 12 намуди шароити дар як асбоб

Тасвири истинодро бор кунед, намуди шароитиро интихоб кунед, саволро нависед. AI сохтори истиноди шуморо нигоҳ медорад (хатҳо, гузориш, чуқурӣ ва ғ.) ва мундариҷаи нав дар ҳар як услубро нишон медиҳад. Бо пуштибонии ControlNet- Union SDXL ProMax — Apache 2. 0, пурра барои истифодаи тиҷоратӣ мувофиқ аст.

Canny / lineart барои коркарди тозаи хатҳо. Поза барои ҷойгиршавии бадан. Қаъри барои тарҳбандии 3D. Scribble / soft- edge барои аломатҳои норавшан. MLSD барои меъморӣ. Оддӣ / сегментатсия / плитка барои ҷараёни корҳои пешрафта.
Аз ин ҷо шартҳо бароварда мешаванд — рангҳо аз назар гузаронида мешаванд, танҳо аломати сохторӣ (барои намуди интихобшуда) нигоҳ дошта мешавад.
& Тасвирот 0.7 Санҷиш
~1,200 tokens (SDXL × 1.2 ControlNet)
Натиҷа

Чӣ тавр ControlNet кор мекунад

ControlNet ба шумо имкон медиҳад, ки эҷоди тасвирро бо сохтори тасвири истинод ба ҷои танҳо ба матни савол асос ёбед. Пештаъминкунанда истинодро мехонад ва як сигнали шартӣ - нӯгҳои он, харитаҳои чуқурии он, скелети ҳолати одам ва ғайраро бармеоварад. Баъд аз ин, модел ба ин сигнал қулф мешавад, дар ҳоле ки савол услуб, рангҳо, равшанӣ ва мавзӯъро муайян мекунад. Натиҷаи он таркиби дақиқи шуморо нигоҳ медорад, аммо ба монанди чизе комилан нав менамояд.

Ин абзор бо ControlNet-UnionSDXL ProMax (Apache 2.0) дастгирӣ мешавад — як модели ягона, ки ҳамаи 12 намуди шартгузориро дар поён фаҳмида метавонад, бинобар ин шумо метавонед байни онҳо аз як интихобкунанда бе боркунии шабакаи гуногун ҳар дафъа иваз кунед. Он пурра барои истифодаи тиҷоратӣ мувофиқ аст: нигоҳ доред, фурӯшед ё ҳар чизе, ки шумо эҷод мекунед, тағйир диҳед.

12 намуди шартгузорӣ

Канни
Муайянкунии лабаҳои равшан. Барои нигоҳ доштани канори равшан ва хатҳои тоза беҳтарин аст.
Қаъри уфуқ
Харитаи чуқурии 3D. Тарҳбандии фазоиро нигоҳ медорад - он чизе, ки наздик аст ва он чизе, ки дур аст.
& Ҷойгиршавӣ
Скелети OpenPose. Позитсияи шакл ва қисмҳои баданро қулф мекунад.
& Хат кашидан
Дар ин давра эҷодиёти ӯ ба санъати тасвирӣ табдил ёфт.
Сегментатсия
Харитаи минтақаи рангӣ. Ҳар як минтақаи саҳнаро ба синф таъин кунед.
& Оддӣ
Харитаи нормалии сатҳи. Нигоҳ доштани 3D-и хуб ва уфуқҳои сатҳи.
Хати тасвир
Инчунин, дар ин ҷо барои дарёфти маълумот, барои дарёфти маълумот, барои дарёфти маълумот.
Лабаҳои нарм
Муайянкунии аломатҳои нарм, ки шаклҳоро бештар аз Canny пайгирӣ мекунад.
MLSD
Сегментҳои хатҳои рост. Барои меъморӣ, дохили биноҳо ва тасвирҳои маҳсулот сохта шудааст.
Файли 3D
Таҳқиқоти илмӣ оид ба масъалаҳои геология ва геологияи дарёҳо.
& Ранги асосӣ:
Ниқоби-шиноси шартгузорӣ барои аз нав сохтани танҳо қисмати тасвир.
Аз нав ранг кардан / берун аз ранг кардан
Дарозӣ ва паҳноии риштаи рангкунӣ ё минтақаҳои рангкунии дигар бо нигоҳ доштани сохтори атрофи он.

Се қадам

  1. Боркунии тасвири истинод — сурат, намуна, скриншот, ҳар чизе бо сохтори шумо мехоҳед нигоҳ доред.
  2. Интихоби намуди шартгузорӣ, ки ба он шумо аҳамият медиҳед (поза барои тасвир, чуқурӣ барои саҳна, канни ё линӣ барои контурҳои тоза).
  3. Намоиши тасвири хоҳишшударо нависед ва эҷод кунед. Барои пайравӣ кардани истинод ба таври қатъӣ, қувваи идоракуниро баланд кунед, барои озодии эҷодӣ онро паст кунед.

ControlNet — 12 намуди шароити дар як асбоб — FAQ

Як абзори ягона, ки ҳамаи 12 намуди шароити аз ControlNet- Union SDXL ProMax модел - canny, pose, depth, scribble, lineart, anime- lineart, MLSD, HED, soft- edge, оддӣ, сегментатсия ва плиткаро нишон медиҳад. Навъи шароити интихоб кунед, тасвири истинодро партоед, саволро нависед, ва SDXL тасвири навро, ки сохтори истиноди шуморо пайгирӣ мекунад, нишон медиҳад.

img2img аз нав рангкуниро дар дохили воридот бевосита иҷро мекунад - рангҳо, лабаҳо ва геометрияи бо талабот омехташуда. ControlNet рангҳоро аз байн мебарад ва танҳо аломати сохтори интихобшударо нигоҳ медорад (хатҳо, скелети позитсия, харитаҳои чуқурӣ ва ғ.). Ин ба шумо имкон медиҳад, ки мундариҷаро радикалӣ иваз кунед, дар ҳоле ки таркиби устуворро нигоҳ медорад. Контроли сохтори хеле қавитар аз img2img.

Canny / lineart барои вориди тозаи хати кор. Anime- lineart барои вориди хати anime- style. Scribble / soft- edge / HED барои намунаҳои ғафс ва аломатҳои ғафс. Поза барои нусхабардории мавқеи бадан аз сурат. Қаъри барои нигоҳ доштани геометрияи саҳна / тарҳбандии 3D. MLSD барои нигоҳ доштани хатҳои рост (меъморӣ / дохилӣ). Оддӣ барои нигоҳ доштани самти рӯи ва ҳаҷм. Сегментатсия барои нигоҳ доштани минтақаҳо. Тасвир барои тоза кардан ё зиёд кардани тағирёбии тасвири мавҷуда.

ControlNet- Union SDXL ProMax (xinsir, Apache 2. 0) ҳамаи 12 шабакаи шароитиро ба як вазнинии 2. 5 ГБ мепӯшонад. Барқароркуниҳои кӯҳна барои ҳар як намуд ~2. 5 ГБ вазнинӣ боргирӣ мекарданд - гузариш байни canny ва pose маънои оғози хунукро дошт. Намунаи иттиҳод як бор боргирӣ мешавад ва гарм мемонад, бинобар ин ҳар як намуди шароити баъд аз зангзании аввал дар як сония аст.

Ҳа. ~1,200 нишонаҳо барои ҳар як намоиш (1,000 асоси SDXL + 20% иловапулии ControlNet). Истифодабарандагон, ки ба система ворид шудаанд, ҳар рӯз 30,000 нишонаҳои ройгон мегиранд — дар бораи 25 намоишҳои шартӣ дар як рӯз бепул. Ношинос: 2,500 нишонаҳо/рӯз (~2 намоиш).

Да - слайдери Идоракунии қудрат (бо нобаёнӣ 0. 7) муайян мекунад, ки чӣ қадар сахт хуруҷ аз истиноди шумо пайравӣ мекунад. 1. 0 = сахт (хоруҷ мисли ре- рендери истиноди шумо менамояд). 0. 4 = озод (пурсиш озодии бештар дорад). Барои тағйироти эҷодӣ онро паст кунед, барои аҳамияти дақиқӣ баланд кунед.

Пешфарз 512×512. Андозаи стандартии SDXL — 768×1024 каҷ, 1024×768 рост, 1024×1024 квадратӣ — ҳама кор мекунанд. Хуруҷи калонтар VRAM ва токенҳои зиёдро истифода мебарад; H200 то 1024×1024- ро бо осонӣ дастгирӣ мекунад.

Тасвирҳои истинод зуд коркард карда мешаванд, шартгузорӣ бароварда мешавад, баъд файли истинод нобуд карда мешавад. Танҳо савол + намоишгари ниҳоӣ дар /account/?tab=history боқӣ мемонад. Ҳеҷ гоҳ барои машқ истифода набаред. /privacy/ барои сиёсати пурра.

ControlNet- Union SDXL ProMax дар асоси Apache 2. 0 - пурра иҷозат дода шудааст, аз ҷумла истифодаи тиҷоратӣ. Асосӣ SDXL OpenRAIL++ мебошад. Ҳарду истифодаи тиҷоратиро иҷозат медиҳанд; тасвирҳои эҷодшудаи шумо барои истифодаи тиҷоратӣ бе ҳаққи муаллифӣ мебошанд.

Яке аз моделҳо, якхелаи сифат, якхелаи сигналҳои шароити. ComfyUI ва A1111 талаботи GPU-и маҳаллӣ бо 12+ GB VRAM ва танзимотро доранд. Мо онро дар инфрасохтори муштарак бо захираи озоди бузург иҷро мекунем — насбкунӣ нест, GPU лозим нест.

Зангзании якум ба кеши GPU- и фаврӣ боркунии вазнинии иттиҳодро (~ 2. 5 ГБ) ва гармкунии риштаи SDXL- ро иҷро мекунад. Дархости аввал пас аз ҷойгиркунӣ ё LRU- и хориҷшуда 30- 60 сонияро интизор шавед. Зангзаниҳои баъдӣ дар зери боркунии оддӣ дар 4- 7 сония бармегарданд.

Бале — POST multipart ба /v1/image/generate/ бо model=sdxl (ё model=controlnet-union-sdxl-promax), prompt, control_image (файл), control_type=<яке аз: canny, pose, depth, scribble, lineart, anime-lineart, mlsd, hed, soft-edge, normal, segmentation, tile>, optional control_strength (0.1-1.5). Автентикатсияи соҳиб, 10K токенҳои ройгон/моҳа. /api/ мисолҳои curl дорад.

Шумо Free.ai- ро дӯст медоред? Ба дӯстонатон бигӯед!

Ин саҳифаро баҳо диҳед