Kendalikan 12 tipe pengkondisian dalam satu alat

Unggah gambar referensi, pilih tipe pengkondisian, tulis sebuah prompt. AI menyimpan struktur referensi Anda (baris, pose, kedalaman, dll.) dan render konten baru dalam gaya apapun. Didukung oleh ControlNet-Unition SDXL ProMax Apache 2.0, penggunaan komersial penuh ramah.

Canny / lineart untuk linework bersih. Pose untuk posisi tubuh. Kedalaman untuk tata letak 3D. Scribble / soft-edge untuk doodles kasar. MLSD untuk arsitektur. Normal / segmentasi / segmentasi / tile untuk alur kerja maju.
Pengolahan diekstrak dari ini ▪ Warna-warna dibuang, hanya sinyal struktural (per tipe pilihan Anda) yang diawetkan.
Looser 0.7 Lebih ketat
~1,200 tokens (SDXL × 1.2 ControlNet)
Hasil

Bagaimana ControlNet bekerja

ControlNet memungkinkan anda mengarahkan pembuatan gambar dengan struktur gambar referensi daripada mengandalkan teks prompt saja. Sebuah preprosesor membaca referensi anda dan mengekstrak sebuah sinyal pengkondisian tunggal å tepiannya, peta kedalamannya, kerangka pose dari seseorang, dan sebagainya. Model difusi kemudian terkunci ke sinyal ketika perintah memutuskan gaya, warna, pencahayaan, dan subjek. Hasilnya menyimpan komposisi yang tepat yang anda masukkan tapi terlihat seperti sesuatu yang benar-benar baru.

Alat ini didukung oleh ControlNet-Union SDXL ProMax (Apache 2.0) sebuah model tunggal yang memahami semua 12 tipe pengkondisian di bawah ini, sehingga Anda beralih dari satu pemetik tanpa memuat jaringan yang berbeda setiap saat. Ini sepenuhnya menggunakan ramah komersial: tetap, jual, atau memodifikasi apapun yang Anda hasilkan.

12 tipe pengkondisian

Canny
Deteksi tajam terbaik untuk menjaga garis-garis tajam dan garis-garis yang bersih.
Kedalaman
Peta kedalaman 3D menjaga tata letak spasial yang dekat dan apa yang jauh.
Pose
Membuka kerangka tubuh Kunci posisi sosok dan posisi anggota tubuh.
Scribble
Urat tangan yang longgar berubah menjadi seni yang sudah selesai.
Segmentasi
Peta wilayah kode warna. Tetapkan setiap area adegan ke kelas.
Normal
Peta permukaan normal, menjaga orientasi dan benjolan 3D yang baik.
Lineart
Pengekstrakan garis bagus yang ideal untuk inking, manga, dan ilustrasi.
Soft-edge
Deteksi batas lembut yang berikut bentuk lebih longgar dari Canny.
MLSD
segmen garis lurus dibuat untuk arsitektur, interior, dan pengambilan gambar produk.
Ubin
Kondisi yang layak untuk kerja tekstur tingkat tinggi dan seamless.
Cat
Pengkondisian kesadaran-topeng untuk regenerasi hanya bagian dari gambar.
Cat ulang / cat luar
Perluas kanvas atau cat ulang sewaktu menghormati struktur di sekitarnya.

Tiga langkah

  1. Upload gambar referensi ° foto, sketsa, cuplikan layar, apa pun dengan struktur yang ingin Anda simpan.
  2. Pilih tipe pengkondisian yang cocok dengan apa yang Anda pedulikan (rasakan sebuah angka, kedalaman untuk sebuah adegan, canny atau lineart untuk garis luar bersih).
  3. Tulis sebuah saran yang menjelaskan tampilan yang Anda inginkan dan hasilkan. Tingkatkan kekuatan untuk mengikuti referensi yang lebih erat, turunkan untuk lebih banyak kebebasan kreatif.

Kendalikan 12 tipe pengkondisian dalam satu alat — FAQ

Sebuah alat tunggal yang mengekspos semua 12 tipe pengkondisian dari SDXL ProMax model kontrol dari SDXL ProMax, canny, pose, kedalaman, coretan, lineart, anime-lineart, MLSD, HED, soft-edged, normal, segmentasi, dan genteng. Pilih tipe pengkondisian, jatuhkan gambar referensi, tulis sebuah prompt, dan SDXL render gambar baru yang mengikuti struktur referensi Anda.

Img2img mengecat ulang masukan secara langsung warna, tepi, dan geometri bercampur dengan prompt. KontrolNet membuang warna dan hanya menjaga sinyal struktural terpilih (garis, rangka pose, peta kedalaman, dll.). Itu memungkinkan Anda secara radikal swap konten sementara menjaga komposisi batuan padat. Kontrol struktur jauh lebih kuat daripada Img2img.

Canny / lineart untuk masukan linework bersih. Anime-lineart untuk sebuah line input gaya anime. Scribble / soft-edge / HED untuk sketsa kasar dan doodles. Pose untuk menyalin posisi tubuh dari foto. Depth untuk melestarikan adegan tata letak geometri / 3D. MLSD untuk melestarikan garis lurus (arktur / interiors). Normal untuk melestarikan orientasi permukaan dan volume. Segmentasi untuk melestarikan daerah. Tile untuk memperbaiki atau meningkatkan variasi skala gambar yang ada.

ControlNet-Union SDXL ProMax (xinsir, Apache 2.0) paket semua 12 jaringan pengkondisian menjadi berat tunggal 2,5 GB. Penyebaran Lama diunduh terpisah ~2,5, GB berat per tipe ugie switch antara canny dan pose berarti sebuah dingin-start. Model serikat beban sekali dan tetap hangat, sehingga setiap tipe pengkondisian adalah sub-detik setelah panggilan pertama.

Ya. ~ 1.200 token per render (11.000 base SDXL + 20% ControlNet AC surcharge). Ditandatangani dalam pengguna mendapatkan 30.000 token gratis setiap hari sekitar 25 dirender dengan tanpa biaya. Anonymous: 2.500 tokens/hari (~2 kali).

Ya slider daya Kendali (baku 0,7) menentukan bagaimana keluaran secara ketat mengikuti referensi Anda. 1.0 = ketat (keluaran tampak seperti re-render referensi Anda). 0.4 = longgar (prompt memiliki lebih banyak kebebasan). Turunkan untuk variasi kreatif, naikkan ketika masalah kesetiaan.

512×512 default standar rasio standar SDXL 768×1024 potret, 1024×768 lansekap, 1024×1024 semua kerja. keluaran besar mengkonsumsi lebih banyak VRAM dan token; H200 mendukung hingga 1024×102424 dengan nyaman.

Referensi gambar diproses segera, pengkondisian diekstrak, maka berkas referensi dihapus. Hanya prompt + final render tetap pada /account/.tab=history. Tidak pernah digunakan untuk pelatihan. /privacy/ untuk kebijakan penuh.

ControlNet-Union SDXL ProMax dirilis di bawah Apache 2.0 sepenuhnya serbaboleh, termasuk penggunaan komersial. Basis SDXL adalah OpenXRAIL++. Keduanya memungkinkan penggunaan komersial; gambar yang dihasilkan Anda adalah milik Anda untuk digunakan secara komersial tanpa royalti.

Model yang sama, kualitas yang sama, sinyal pengkondisian yang sama, ComfyUI dan A1111 memerlukan GPU lokal dengan 12+ GB VRAM ditambah setup, kami menjalankan infrastruktur bersama dengan kolam gratis yang murah hati tidak ada instalasi, tidak ada GPU dibutuhkan.

Panggilan pertama mengunduh berat Uni (~2.5 GB) ke dalam cache GPU dan menghangatkan jalur pipa SDXL. Mengharapkan 30-60 detik pada permintaan pertama setelah penyisiran atau LRU. Panggilan subsequent di bawah usual load return dalam 4-7 detik.

Ya, POST multipart to /v1/image/generate/ with model=sdxl (atau model=controlnet-sxl-promax), prompt, control_image (file), control_type=<one of: canny, pose, ranch, lineart, anime-lineart, mlsd, hed, soft-edged, normal, segmentasi, kontrol opsional_1.5.

Love this tool? Share it!

Laju halaman ini