ControlNet — 12 jenis keadaan dalam satu alat

Muat naik imej rujukan, pilih jenis keadaan, tulis prompt. AI menyimpan struktur rujukan anda (garis, pose, kedalaman, dll) dan renderkan kandungan baru dalam mana-mana gaya. Didukung oleh ControlNet-Union SDXL ProMax — Apache 2.0, mesra penggunaan komersial.

Canny / lineart untuk kerja garisan bersih. Pose untuk kedudukan badan. Depth untuk susunatur 3D. Scribble / soft-edge untuk doodles kasar. MLSD untuk arsitektur. Normal / segmentasi / jubin untuk aliran kerja maju.
Keadaan diekstrak daripada ini — warna dibuang, hanya isyarat struktur (per jenis yang dipilih) dipelihara.
Looser 0.7 Lebih ketat
~1,200 tokens (SDXL × 1.2 ControlNet)
Hasil

Bagaimana ControlNet berfungsi

ControlNet membolehkan anda mengawal penjanaan imej dengan struktur imej rujukan bukannya bergantung pada prompt teks sahaja. Preproses membaca rujukan anda dan mengekstrak satu isyarat penentu — tepinya, peta kedalamannya, rangka pose seseorang, dan sebagainya. Model penyebaran kemudiannya dikunci kepada isyarat itu sementara prompt memutuskan gaya, warna, pencahayaan, dan subjek. Hasilnya menyimpan komposisi tepat yang anda isikan tetapi kelihatan seperti sesuatu yang baru.

Alat ini disokong oleh ControlNet-UnionSDXL ProMax (Apache 2.0) — model tunggal yang memahami semua 12 jenis keadaan di bawah, jadi anda beralih antara mereka dari satu pemilih tanpa memuatkan rangkaian yang berbeza setiap masa. Ianya sangat mesra penggunaan komersial: simpan, jual, atau ubahsuai apa sahaja yang anda cipta.

12 jenis keadaan

Canny
Pengesanan tepi cerah. Terbaik untuk memelihara garisan luaran yang tajam dan kerja garisan bersih.
Kedalaman
Peta kedalaman 3D. Menyimpan susunatur ruang — apa yang dekat dan apa yang jauh.
Berpose
Kerangka badan OpenPose. Kunci kedudukan postur dan anggota badan figur.
Scribble
Doodles yang dilukis tangan berubah menjadi seni yang siap.
Segmen
Peta kawasan berkod warna. Tetapkan setiap kawasan adegan ke kelas.
Normal
Peta permukaan-normal. Mempertahankan orientasi permukaan 3D dan bump yang baik.
Seni Garis
Ekstrak garis halus — sesuai untuk mencetak, manga, dan ilustrasi.
Tepi-lembut
Pengesanan sempadan yang lembut yang mengikuti bentuk lebih lebar daripada Canny.
MLSD
Segmen garis lurus. Dibuat untuk seni bina, interior, dan gambar produk.
Jubin
Penyelenggaraan yang memelihara perincian untuk skala naik dan kerja tekstur tanpa serat.
Input
Keadaan yang peka-topeng untuk membina semula hanya sebahagian imej.
Melukis Semula / Outpaint
Kembangkan kanvas atau cetak semula kawasan sambil menghormati struktur sekeliling.

Tiga langkah

  1. Muat naik imej rujukan — foto, sketsa, tangkap skrin, apa-apa dengan struktur yang anda mahu simpan.
  2. Pilih jenis penyelenggaraan yang sepadan dengan apa yang anda pedulikan (posis untuk gambar, kedalaman untuk adegan, bijak atau linear untuk garisan luaran bersih).
  3. Tulis prompt menggambarkan penampilan yang anda mahu dan cipta. Naikkan kekuatan kawalan untuk ikut rujukan lebih rapat, turunkannya untuk kebebasan kreatif yang lebih.

ControlNet — 12 jenis keadaan dalam satu alat — FAQ

Alat tunggal yang memaparkan semua 12 jenis keadaan dari model ControlNet-Union SDXL ProMax — canny, pose, depth, scribble, lineart, anime-lineart, MLSD, HED, soft-edge, normal, segmentasi, dan jubin. Pilih jenis keadaan, jatuhkan imej rujukan, tuliskan prompt, dan SDXL mengekspresikan imej baru yang mengikut struktur rujukan anda.

img2img melukis semula input secara langsung — warna, tepi, DAN geometri dicampurkan dengan prompt. ControlNet membuang warna dan hanya menyimpan isyarat struktur yang dipilih (garis, rangka pose, peta kedalaman, dll). Yang membolehkan anda tukar kandungan secara radikal sambil menjaga komposisi tetap. Kawalan struktur yang jauh lebih kuat daripada img2img.

Canny / lineart untuk input kerja garis bersih. Anime-lineart untuk input garis gaya anime. Scribble / soft-edge / HED untuk sketsa kasar dan doodles. Pose untuk menyalin kedudukan badan dari foto. Depth untuk memelihara geometri adegan / susunatur 3D. MLSD untuk memelihara garis lurus (arkitektur / dalaman). Normal untuk memelihara orientasi permukaan dan volum. Segmentation untuk memelihara kawasan. Tile untuk memperhalus atau menaikkan skala varian imej sedia ada.

ControlNet-Union SDXL ProMax (xinsir, Apache 2.0) membungkus semua 12 rangkaian keadaan ke dalam berat 2.5 GB tunggal. Pelaksanaan lama memuat turun berat ~2.5 GB terpisah bagi setiap jenis — menukar antara canny dan pose bermakna permulaan sejuk. Model persatuan memuatkan sekali dan kekal hangat, jadi setiap jenis keadaan adalah sub-saat selepas panggilan pertama.

Ya. ~1,200 token per render (1,000 asas SDXL + 20% caj tambahan keadaan ControlNet). Pengguna yang log masuk mendapat 30,000 token percuma setiap hari — kira-kira 25 render keadaan setiap hari tanpa kos. Anonim: 2,500 token/hari (~2 render).

Ya — pelaris Kekuatan Kawalan (piawai 0.7) menentukan betapa ketatnya output mengikut rujukan anda. 1.0 = ketat (output kelihatan seperti render semula rujukan anda). 0.4 = lebar (mintaan mempunyai lebih kebebasan). Turunkan untuk variasi kreatif, naikkan apabila ketulenan penting.

Lalai 512×512. Nisbah piawai SDXL — 768×1024 potret, 1024×768 landskap, 1024×1024 persegi — semua berfungsi. Output yang lebih besar menggunakan lebih banyak VRAM dan token; H200 menyokong sehingga 1024×1024 dengan selesa.

Imej rujukan diproses dengan segera, keadaan diekstrak, kemudian fail rujukan dipadam. Hanya prompt + renderan akhir yang kekal pada /account/?tab=history. Tidak pernah digunakan untuk latihan. /privacy/ untuk polisi penuh.

ControlNet-Union SDXL ProMax dikeluarkan di bawah Apache 2.0 — sepenuhnya dibenarkan, termasuk penggunaan komersial. Asas SDXL adalah OpenRAIL++. Kedua-duanya membenarkan penggunaan komersial; imej yang dijana adalah milik anda untuk digunakan secara komersial tanpa royalti.

Model yang sama, kualiti yang sama, isyarat pengaturan yang sama. ComfyUI dan A1111 memerlukan GPU setempat dengan 12+ GB VRAM plus setup. Kami jalankan ia pada infrastruktur berkongsi dengan kolam percuma yang luas — tiada pemasangan, tiada GPU diperlukan.

Panggilan pertama memuat turun berat Union (~2.5 GB) ke dalam cache GPU dan memanaskan paip SDXL. Tunggu 30-60 saat pada permintaan pertama selepas pelaksanaan atau pemindahan LRU. Panggilan seterusnya di bawah muatan tipikal kembali dalam 4-7 saat.

Ya — POST multipart ke /v1/image/generate/ dengan model=sdxl (atau model=controlnet-union-sdxl-promax), prompt, control_image (file), control_type=<satu daripada: canny, pose, depth, scribble, lineart, anime-lineart, mlsd, hed, soft-edge, normal, segmentation, tile>, control_strength pilihan (0.1-1.5). Autentifikasi pemegang, 10K token percuma/bulan. /api/ mempunyai contoh curl.

Love this tool? Share it!

Nilaikan halaman ini