1つのツールに12の条件付けタイプを統合したControlNet

参照画像をアップロードし、条件付けタイプを選択し、プロンプトを書きます。AIは参照画像の構造(線、ポーズ、深さなど)を保持し、新しいコンテンツを任意のスタイルでレンダリングします。ControlNet-Union SDXL ProMax — Apache 2.0をサポートし、完全に商用利用可能です。

清潔な線描画のための Canny/Lineart。身体の位置のための Pose。3D レイアウトのための Depth。粗い落書きのための Scribble/Soft-Edge。建築のための MLSD。高度なワークフローのための Normal/Segmentation/Tile。
条件付けはこれから抽出される。色は捨てられ、構造信号のみが保存される。
ルーサー 0.7 ストリクター
~1,200 tokens (SDXL × 1.2 ControlNet)
結果

ControlNetの動作

ControlNetは、テキストプロンプトのみに依存する代わりに、参照画像の構造を使って画像生成を制御できます。プリプロセッサは参照画像を読み、そのエッジ、深さマップ、人物のポーズ骨格などの単一の条件付け信号を抽出します。プロンプトがスタイル、色、照明、対象を決定する間、拡散モデルはその信号にロックされます。結果は、フィードした正確な構成を保持しますが、全く新しいものに見えます。

これは、下記の12の条件付けタイプをすべて理解する単一のモデルであるControlNet-UnionSDXL ProMax (Apache 2.0) に基づいています。それゆえ、毎回別のネットワークをロードしなくても、1つのピッカーからそれらの間を切り替えることができます。これは完全に商用利用に適しています。生成したものはどれでも保持、販売、修正できます。

12の条件付け

カニー
鋭いエッジ検出。鋭い輪郭ときれいな線を保つのに最適です。
深さ
3D 深度マップ。空間レイアウトを保持します。近くと遠くのものを表示します。
ポーズ
OpenPose 骨格。人物の姿勢と四肢の位置を固定します。
落書き
ゆるい手描きの落書きが 完成した芸術に変わった
セグメンテーション
色分けされた領域マップ。シーンの各領域をクラスに割り当てます。
ノーマル
表面ノルムマップ。細かい三次元表面の方位とバンプを保持します。
線画
細線抽出―インキ,マンガ,イラストに適している。
ソフトエッジ
Canny よりも形状にゆるやかに従う柔らかい境界検出。
MLSD
建築やインテリア、製品写真に使う
タイル
アップスケールとシームレステクスチャ作業のための詳細保存条件付けを行った。
インペイント
画像の一部のみを再生するマスク認識条件付け。
再描画/アウトペイント
周囲の構造を尊重しながらキャンバスを拡張または再描画する

三段階

  1. 参考画像をアップロードします。写真、スケッチ、スクリーンショット、保持したい構造の何でも。
  2. あなたが気にするものに合った条件付けのタイプを選択します。(人物の場合はポーズ、シーンの場合は深さ、清潔な輪郭の場合はカニーまたはリニアート)。
  3. プロンプトを書き、望む外観を記述して生成します。参照により厳密に従うにはコントロール強度を上げ、より自由に作成するにはコントロール強度を下げてください。

1つのツールに12の条件付けタイプを統合したControlNet — FAQ

ControlNet-Union SDXL ProMax モデルから canny、pose、depth、scribble、lineart、anime-lineart、MLSD、HED、soft-edge、normal、segmentation、tiles の 12 種類の条件付けを全て露出するツールです。条件付けのタイプを選択し、参照画像をドラッグしてプロンプトを書くと、SDXL は参照画像の構造に従って新しい画像をレンダリングします。

img2img は入力に直接塗り替えます。プロンプトで色、エッジ、そして幾何学的な構造を混ぜます。ControlNet は色を捨て、選択した構造シグナル (線、ポーズ骨格、深さマップなど) を保持します。これによりコンテンツを根本的にスワップしながら、構成を固定できます。img2img よりもはるかに強力な構造制御です。

Canny/lineart は清潔な線画入力に、Anime-lineart はアニメ風の線画入力に、Scribble/soft-edge/HED は粗いスケッチや落書きに、Pose は写真から身体の位置をコピーするために、Depth はシーンの幾何学的な形状/3D レイアウトを保存するために、MLSD は直線 (建築/内装) を保存するために、Normal は表面の方向性と体積を保存するために、Segmentation は領域を保存するために、Tile は既存の画像の変化を細かくしたり拡大したりするために使用します。

ControlNet-Union SDXL ProMax (xinsir, Apache 2.0) は、12 つの条件付けネットワークを一つの 2.5 GB の重みにパッケージ化します。古いデプロイメントは、タイプごとに別々の ~2.5 GB の重みをダウンロードしました。cannyとposeの間を切り替えると、コールドスタートを意味します。unionモデルは一度ロードされ、温まり続けます。つまり、各条件付けタイプは最初の呼び出しからサブ秒で実行されます。

はい。レンダリングごとに約1,200トークン (1,000ベースSDXL + 20% ControlNet 条件付けの追加料金)。ログインしたユーザは毎日30,000トークンを無料で受け取ります。これは、1日に約25の条件付けのレンダリングを無料で受け取ることができます。匿名: 2,500トークン/日 (約2回のレンダリング)。

はい - 制御強度スライダー (デフォルト 0.7) は出力が参照にどれだけ厳密に従うかを決定します。 1.0 = 厳密 (出力は参照の再レンダリングに見える) 0.4 = ゆるい (プロンプトはより自由になります) クリエイティブな変更のためにこれを下げ、忠実さが重要な場合はこれを上げてください。

デフォルトは 512×512 です。SDXL 標準の画面比率 — 縦 768×1024, 横 1024×768, 四角 1024×1024 — はすべて有効です。より大きな出力はより多くの VRAM とトークンを消費します。H200 は 1024×1024 までを快適にサポートします。

参照画像は直ちに処理され、条件付けが抽出され、参照ファイルは削除されます。プロンプトと最終レンダリングのみが /account/?tab=historyに残ります。訓練には使用しません。全体のポリシーは /privacy/ にあります。

ControlNet-Union SDXL ProMaxは Apache 2.0 でリリースされており、商用利用も含めて完全に許容されています。SDXLベースは OpenRAIL++ です。両方とも商用利用が許可されています。生成された画像は、ロイヤリティフリーで商用利用できます。

同じモデル、同じ品質、同じ調整信号。ComfyUIとA1111は12GB以上のVRAMと設定を備えたローカルGPUを必要とします。共有インフラストラクチャ上で、豊富なフリープールを使って実行します。インストールもGPUも必要ありません。

最初のコールは Union 重量 (約 2.5 GB) を GPU キャッシュにダウンロードし、SDXL パイプラインをウォームアップします。デプロイまたは LRU 排除後の最初の要求に 30-60 秒を予想してください。典型的な負荷下での次のコールは 4-7 秒で返します。

はい - /v1/image/generate/ に model=sdxl (または model=controlnet-union-sdxl-promax ) 、プロンプト、control_image (ファイル)、control_type=<canny, pose, depth, scribble, lineart, anime-lineart, mlsd, hed, soft-edge, normal, segmentation, tile> のいずれか、オプションの control_strength (0.1-1.5) で多重パートを POST します。 持ち主認証、10K のフリートークン/月。 /api/ には curl の例があります。

Love this tool? Share it!

このページを評価