ControlNet — бир асбобда 12 та шароит яратиш турлари

Эслатиб ўтиладиган тасвирни юкланг, шароитлаш турини танланг, савол ёзинг. AI сизнинг эслатма тузилмангизни (йўллар, ҳолат, чуқурлик ва ҳоказо) сақлаб қолади ва янги мазмунни ҳар қандай услубда кўрсатади. ControlNet-Union SDXL ProMax — Apache 2.0 томонидан қўллаб-қувватланади, тўлиқ савдо-сотиқ учун қулай.

Canny / lineart тоза чизиқлар учун. Pose - танани жойлашиши учун. Depth - 3D кўриниш учун. Scribble / soft-edge - қиррали чизиқлар учун. MLSD - архитектура учун. Normal / segmentation / tile - юқори даражадаги иш жараёнлари учун.
Бу ерда шароитлар ажратиб олинади - ранглар йўқ қилинади, фақат структура сигнали (сайланган турга кўра) сақланиб қолади.
Лоусер 0.7 Қисқа
~1,200 tokens (SDXL × 1.2 ControlNet)
Натижа

ControlNet қандай ишлайди

ControlNet сизга тасвир яратишни матн саволига таяниш ўрнига, тасвирнинг структураси билан бошқаришга имкон беради.Препроцессор сизнинг саволингизни ўқийди ва биргина шароитли сигнални ажратади — унинг қирралари, чуқурлик харитаси, инсоннинг тана шакли ва ҳоказо. Диффузия модели шу сигналга боғланади, савол эса услуб, ранглар, ёруғлик ва мавзуни белгилайди. Натижа сиз киритган композицияни сақлаб қолади, аммо бутунлай янги кўринади.

Бу асбоб ControlNet-UnionSDXL ProMax (Apache 2.0) томонидан қўллаб-қувватланади — қуйидаги барча 12 та шароитлаш турларини тушунадиган ягона модел, шунинг учун сиз ҳар сафар бошқа тармоқни юкламасдан бир танловчидан улар орасидан ўтишингиз мумкин. Бу тўлиқ савдо-сотиқ учун қулай: яратган нарсангизни сақланг, сотинг ёки ўзгартиринг.

12 та шароитлаш турлари

Канни
Тўғри чизиқларни аниқлаш. Тўғри чизиқларни сақлаш ва тоза чизиқларни яратиш учун энг яхши.
Чуқурлик
3D чуқурлик харитаси. Ҳавовий жойлашувни сақлайди - нима яқин ва нима узоқ.
Поза
OpenPose танаси скелети. Фигуранинг ҳолати ва аъзолар жойлашувини қулфлайди.
Скрипка
Ёпиқ қўл билан чизилган тошбосмалар тугал санъатга айланди.
Сегментлаш
Ранги кодланган ҳудуд харитаси. Сценарийнинг ҳар бир ҳудудини бир синфга тақсимланг.
Оддий
Юза-норма харитаси. 3D юза йўналиши ва бурчакларини сақлайди.
Сўз
Тўғри чизиқларни ажратиш - қалам, манга ва иллюстрация учун идеал.
Ёпиқ чет
Canny'дан кўра шаклларга камроқ риоя қиладиган юмшоқ чегара аниқлаш.
MLSD
Тўғри чизиқли сегментлар. Архитектура, интерьер ва маҳсулот суратлари учун яратилган.
Тасвир
Маҳсулотни катталаштириш ва текстура ишларини бир текисда бажариш учун деталларни сақлаш шарти.
Расм чизиш
Расмнинг фақат бир қисмини қайта яратиш учун маскага мослаш.
Такрор чизиш / ташқари чизиш
Хонани кенгайтириш ёки атрофидаги тузилмаларни ҳурмат қилган ҳолда ҳудудларни қайта чизиш.

Уч қадам

  1. Эслатма тасвирини юклаб олинг — фотосурат, эскиз, экран сурати ёки сақлаб қолишни хоҳлаган тузилмадаги бошқа нарса.
  2. Сизга қизиқ бўлган шароитлаш турини танланг (расм учун позиция, саҳна учун чуқурлик, тоза чизиқлар учун аниқ ёки тўғри чизиқ).
  3. Сиз хоҳлаган кўриниш ва уни яратиш учун савол ёзинг. Қўллаш кучини ошириш учун манбани янада қаттиқроқ риоя қилинг, уни камайтириш учун эса, янада кўпроқ ижодкорлик эркинлигига эга бўлинг.

ControlNet — бир асбобда 12 та шароит яратиш турлари — FAQ

ControlNet-Union SDXL ProMax моделидан барча 12 та шароитлаш турларини намойиш этадиган ягона асбоб - canny, pose, depth, scribble, lineart, anime-lineart, MLSD, HED, soft-edge, normal, segmentation, ва tile. Шароитлаш турини танланг, манба тасвирини ташланг, савол ёзинг, ва SDXL сизнинг манба структурасига мос келадиган янги тасвирни кўрсатади.

img2img киритилган маълумотларни тўғридан-тўғри қайта чизади — ранглар, чизиқлар ва геометрияларни талаб билан аралаштиради. ControlNet рангларни олиб ташлайди ва фақат танланган структура сигналини сақлаб қолади (қисқа чизиқлар, позиция скелети, чуқурлик харитаси ва ҳоказо). Бу сизга композицияни мустаҳкам сақлаб туриш билан биргаликда мазмунни радикал тарзда алмаштиришга имкон беради. img2img дан кўра кучлироқ структура назорати.

Canny / lineart тоза чизиқлар киритиш учун. Anime-lineart anime услубидаги чизиқлар киритиш учун. Scribble / soft-edge / HED оқсоқ эскизлар ва тошбосмалар учун. Поза фотосуратдан танани жойини нусхалаш учун. Deep - саҳна геометриясини сақлаш учун / 3D кўриниши. MLSD - тўғри чизиқларни сақлаш учун (архитектура / интерьер). Normal - юза йўналишини ва ҳажмини сақлаш учун. Segmentation - ҳудудларни сақлаш учун. Tile - мавжуд тасвирнинг ўзгаришларини яхшилаш ёки катталаштириш учун.

ControlNet-Union SDXL ProMax (xinsir, Apache 2.0) барча 12 та шароитлаш тармоқларини битта 2.5 GB оғирликка жойлайди. Кўпроқ тарқалган тарқатишлар ҳар бир тур учун алоҳида ~2.5 GB оғирликни юклаб олган — canny ва pose ўртасида алмаштириш совуқ бошланиш дегани. Унион модели бир марта юкланади ва иссиқ қолади, шунинг учун ҳар бир шароитлаш тури биринчи чақириқдан кейин бир сония ичида бўлади.

Ҳа. Ҳар бир рендер учун ~1,200 токен (1,000 база SDXL + 20% ControlNet шароитли қўшимча тўлов). Кирган фойдаланувчилар ҳар куни 30,000 бепул токен оладилар — кунига 25 шароитли рендерлар бепул. Аноним: 2,500 токен/кун (~2 рендер).

Ҳа — Идора қилиш кучи силжитувчиси (стандарт 0.7) чиқим сизнинг истиснонгизга қанчалик қатъий риоя қилишини белгилайди. 1.0 = қатъий (чиқиш сизнинг истиснонгизнинг қайта кўринишига ўхшайди). 0.4 = енгил (пропорционаллик кўпроқ эркинликка эга). Буни креатив ўзгаришлар учун пасайтиринг, ишончлилик муҳим бўлганда кўтаринг.

512×512 аввалдан. SDXL стандарт нисбатлари — 768×1024 портрет, 1024×768 горизонтал, 1024×1024 квадрат — ҳаммаси ишлайди. Кўпроқ чиқимлар кўпроқ VRAM ва токенларни сарфлайди; H200 1024×1024 гача қулайлик билан қўллаб-қувватлайди.

Эслатиб ўтиш тасвирлари дарҳол ишланади, шароитлар ажратилади, сўнгра эслатиб ўтиш файли ўчириб ташланади. Фақат савол + охирги тасвир /account/?tab=history да қолади. У ҳеч қачон машғулот учун ишлатилмайди. /privacy/ тўлиқ сиёсат учун.

ControlNet-Union SDXL ProMax Apache 2.0 остида чиқарилган — тўлиқ рухсат берилган, шу жумладан, савдо учун ҳам. SDXL асоси OpenRAIL++. Иккаласи ҳам савдо учун рухсат берилган; сиз яратган тасвирлар сизнинг мулкингиз бўлиб, уларни савдо учун фойдаланишингиз мумкин.

Худди шундай модел, худди шундай сифат, худди шундай мослаш сигналлари. ComfyUI ва A1111 учун 12+ GB VRAM ва ўрнатиш билан локал GPU талаб этилади. Биз уни кенг кўламли бепул пул билан умумий инфратузилма устида ишлаймиз — ўрнатиш йўқ, GPU керак эмас.

Биринчи чақириқ GPU кэшига Union оғирлигини (~2.5 GB) юклайди ва SDXL қувурини иситади. Дебют ёки LRU эвакуациясидан кейинги биринчи талабда 30-60 секунд кутинг. Типик юк остидаги кейинги чақириқлар 4-7 секундда қайтиб келади.

Ҳа — /v1/image/generate/га multipart POST, model=sdxl (ёки model=controlnet-union-sdxl-promax), prompt, control_image (file), control_type=<canny, pose, depth, scribble, lineart, anime-lineart, mlsd, hed, soft-edge, normal, segmentation, tile>, optional control_strength (0.1-1.5) билан. Бўйинсунувчининг гувоҳномаси, ойига 10K бепул токенлар. /api/ curl мисоллари билан.

Free.aiни севасанми? Дўстларингга айт!

Бу саҳифани баҳолаш