ନିୟନ୍ତ୍ରଣନେଟ — ଗୋଟିଏ ଉପକରଣରେ 12ଟି ସ୍ଥିତି ପ୍ରକାର

ଗୋଟିଏ ସଂଯୋଗ ପ୍ରତିଛବିକୁ ଅଦ୍ୟତନ କରନ୍ତୁ, ଗୋଟିଏ ସ୍ଥିତି ପ୍ରକାରକୁ ବାଛନ୍ତୁ, ଗୋଟିଏ ପ୍ରମୋଟ ଲେଖନ୍ତୁ। AI ଆପଣଙ୍କର ସଂଯୋଗର ଢାଞ୍ଚାକୁ (ରେଖା, ସ୍ଥାପନ, ଗଭୀରତା, ଇତ୍ୟାଦି) ରଖିଥାଏ ଏବଂ କୌଣସି ଶୈଳୀରେ ନୂତନ ବିଷୟବସ୍ତୁକୁ ପ୍ରଦର୍ଶନ କରେ। ControlNet-Union SDXL ProMax - Apache 2.0 ଦ୍ୱାରା ସମର୍ଥିତ, ସମ୍ପୂର୍ଣ୍ଣ ବାଣିଜ୍ୟ-ବ୍ୟବହାର ସହଜ।

ସ୍ୱଚ୍ଛ ରେଖାକାର ପାଇଁ Canny / lineart. ଶରୀରର ଅବସ୍ଥାନ ପାଇଁ Pose. 3D ବିନ୍ୟାସ ପାଇଁ ଗଭୀରତା. ସରଳ doodles ପାଇଁ Scribble / soft-edge. ସ୍ଥାପତ୍ୟ ପାଇଁ MLSD. ଉନ୍ନତ କାର୍ଯ୍ୟ ପ୍ରବାହ ପାଇଁ ସାଧାରଣ / ବିଭାଜନ / ଟାଇଲ।
ଏହିଠାରୁ ସ୍ଥିତିକୁ ବାହାର କରାଯାଏ - ରଙ୍ଗଗୁଡ଼ିକୁ ପରିତ୍ୟାଗ କରାଯାଏ, କେବଳ ଢାଞ୍ଚା ସଂକେତ (ଆପଣଙ୍କ ବଚ୍ଛିତ ପ୍ରକାର ଅନୁଯାୟୀ) ସଂରକ୍ଷିତ ହୋଇଥାଏ।
ହାରିବା 0.7 କଠୋର
~1,200 tokens (SDXL × 1.2 ControlNet)
ଫଳାଫଳ

ControlNet କିପରି କାମ କରେ

ControlNet କେବଳ ପାଠ୍ୟ ପ୍ରୋମୋଟ ଉପରେ ନିର୍ଭର କରିବା ବଦଳରେ ଗୋଟିଏ ସଂଦେଷ ପ୍ରତିଛବିର ଢାଞ୍ଚା ସହିତ ପ୍ରତିଛବି ଉତ୍ପାଦନକୁ ଆପଣ ନିର୍ଦ୍ଦେଶ କରିପାରିବେ। ଗୋଟିଏ ପୂର୍ବପ୍ରକ୍ରିୟାକାରୀ ଆପଣଙ୍କର ସଂଦେଷକୁ ପଢ଼ିଥାଏ ଏବଂ ଗୋଟିଏ ସର୍ତ୍ତାବଳୀ ସଂକେତକୁ ବାହାର କରିଥାଏ - ଏହାର ସର୍ଭେ, ଏହାର ଗଭୀରତା ମାନଚିତ୍ର, ଜଣେ ବ୍ୟକ୍ତିର ପୋଜ କଷ୍ଟମ, ଏବଂ ଅନ୍ୟାନ୍ୟ। ପ୍ରୋମୋଟ ଶୈଳୀ, ରଙ୍ଗ, ଆଲୋକ, ଏବଂ ବିଶୋଧନ ନିଷ୍ପତ୍ତି ନେବା ସମୟରେ ବିସ୍ତାର ମଡେଲକୁ ସେହି ସଂକେତକୁ ଅପରିବର୍ତ୍ତନୀୟ କରାଯାଏ। ଫଳାଫଳଟି ଆପଣ ଭର୍ତ୍ତି କରିଥିବା ସଠିକ ସଂଯୋଜନାକୁ ଧାରଣ କରିଥାଏ କିନ୍ତୁ ସମ୍ପୂର୍ଣ୍ଣ ନୂତନ କିଛି ପରି ଦେଖାଯାଏ।

ଏହି ସାଧନଟି ControlNet-UnionSDXL ProMax (Apache 2.0) ଦ୍ୱାରା ସମର୍ଥିତ - ଗୋଟିଏ ଏକକ ମଡେଲ ଯାହାକି ନିମ୍ନରେ ଥିବା ସମସ୍ତ 12ଟି ସ୍ଥିତି ପ୍ରକାରକୁ ବୁଝିଥାଏ, ତେଣୁ ଆପଣ ପ୍ରତ୍ୟେକ ସମୟରେ ଗୋଟିଏ ଭିନ୍ନ ନେଟୱର୍କକୁ ଧାରଣ ନକରି ଗୋଟିଏ ଚୟନକାରୀରୁ ସେମାନଙ୍କ ମଧ୍ୟରେ ପରିବର୍ତ୍ତନ କରିପାରିବେ। ଏହା ସମ୍ପୂର୍ଣ୍ଣ ବାଣିଜ୍ୟ-ବ୍ୟବହାର ସହଜ: ଆପଣ ଯାହାକୁ ସୃଷ୍ଟି କରନ୍ତି ତାହା ରଖିବା, ବିକ୍ରି କରିବା କିମ୍ବା ପରିବର୍ତ୍ତନ କରନ୍ତୁ।

12ଟି ସ୍ଥିତିର ପ୍ରକାର

କନି
ସ୍ପଷ୍ଟ ପ୍ରାନ୍ତ ଅନୁସନ୍ଧାନ। ତୀକ୍ଷ୍ଣ ପରିସର ଏବଂ ସ୍ୱଚ୍ଛ ରେଖାକାର ପାଇଁ ସବୁଠାରୁ ଭଲ।
ଗଭୀରତା
3D ଗଭୀରତା ମାନଚିତ୍ର। ସ୍ଥାନୀୟ ବିନ୍ୟାସକୁ ରଖିଥାଏ - ଯାହା ପାଖରେ ଅଛି ଏବଂ ଯାହା ଦୂରରେ ଅଛି।
ସ୍ଥାପନ କରନ୍ତୁ
OpenPose ଶରୀରର କୋଷକ। ଆକାରର ଅବସ୍ଥାନ ଏବଂ ଅଙ୍ଗ ଅବସ୍ଥାନକୁ ଅପରିବର୍ତ୍ତନୀୟ କରିଥାଏ।
ସ୍କ୍ରିବ୍ଲName
ହାତରେ ଅଙ୍କିତ ଢୁଡେଲ୍ସକୁ ଶେଷ କଳାକାରରେ ପରିଣତ କରାଯାଇଛି ।
ବିଭାଜନ
ରଙ୍ଗ-ସଂକେତିତ ଅଂଚଳ ମାନଚିତ୍ର। ଦର୍ଶନର ପ୍ରତ୍ୟେକ ଅଂଶକୁ ଗୋଟିଏ ଶ୍ରେଣୀକୁ ବଣ୍ଟନ୍ତୁ।
ସାମାନ୍ୟ
ସ୍ଥଳଭାଗ-ସାଧାରଣ ମାନଚିତ୍ର। ଭଲ 3D ସ୍ଥଳଭାଗ ଅଭିମୁଖ୍ୟ ଏବଂ ବମ୍ପକୁ ସଂରକ୍ଷଣ କରିଥାଏ।
ରେଖାଙ୍କିତ
ଫାଇନ ରେଖା ଉତ୍ତୋଳନ - ଇଙ୍କିଙ୍ଗ, ମାଙ୍ଗା, ଏବଂ ଚିତ୍ରଣ ପାଇଁ ଆଦୌ ଉପଯୁକ୍ତ ନୁହେଁ।
ନରମ-ପ୍ରାନ୍ତ
ସନ୍ତୁଳିତ ସୀମା ଅନୁସନ୍ଧାନ ଯାହାକି କାନି ଅପେକ୍ଷା ଆକାରକୁ ଅଧିକ ଲମ୍ବା ଭାବରେ ଅନୁସରଣ କରିଥାଏ।
MLSD
ସିଧା-ରେଖା ଅଂଶଗୁଡ଼ିକ। ସ୍ଥାପତ୍ୟ, ଆଭ୍ୟନ୍ତରୀଣ ଏବଂ ଉତ୍ପାଦ ଶଟ ପାଇଁ ନିର୍ମିତ।
ଟାଇଲ
ଉନ୍ନତ ମାପ ଏବଂ ସିମଲେସ ଟେକ୍ସଚର କାର୍ଯ୍ୟ ପାଇଁ ବିବରଣୀ-ସଂରକ୍ଷଣ ସ୍ଥିତି।
ଚିତ୍ରଣ କରନ୍ତୁ
ଗୋଟିଏ ପ୍ରତିଛବିର କେବଳ ଅଂଶକୁ ପୁନଃନିର୍ମାଣ କରିବା ପାଇଁ ମାରଣାସ୍ତ୍ର-ସଚେତନ ସ୍ଥିତି।
ପୁନଃ ଚିତ୍ରଣ / ଆଉଟପେଇନ
ଗୋଟିଏ କାନ୍ଥକୁ ବଢ଼ାନ୍ତୁ କିମ୍ବା ପରିବେଶର ଢାଞ୍ଚାକୁ ସମ୍ମାନ ଦେଇ କ୍ଷେତ୍ରଗୁଡ଼ିକୁ ପୁନଃଚିତ୍ର କରନ୍ତୁ।

ତିନିଟି ପଦକ୍ଷେପ

  1. ଗୋଟିଏ ସଂଯୋଗ ପ୍ରତିଛବିକୁ ଅଦ୍ୟତନ କରନ୍ତୁ - ଗୋଟିଏ ଫଟୋ, ଗୋଟିଏ ସ୍କେଚ, ଗୋଟିଏ ସ୍କ୍ରିନସଟ, ଆପଣ ରଖିବାକୁ ଚାହୁଁଥିବା ଢାଞ୍ଚା ସହିତ କିଛି ବି।
  2. ଆପଣ ଯାହାକୁ ଗୁରୁତ୍ୱ ଦିଅନ୍ତି ତାହା ସହିତ ମେଳ ଖାଉଥିବା ସ୍ଥିତି ପ୍ରକାରକୁ ବାଛନ୍ତୁ (ଅଙ୍କ ପାଇଁ ସ୍ଥିତି, ଦୃଶ୍ୟ ପାଇଁ ଗଭୀରତା, ସ୍ୱଚ୍ଛ ପରିସର ପାଇଁ canny କିମ୍ବା lineart)।
  3. ଆପଣ ଚାହୁଁଥିବା ଦୃଶ୍ୟକୁ ବର୍ଣ୍ଣନା କରି ଗୋଟିଏ ପ୍ରୋମୋଟ ଲେଖନ୍ତୁ ଏବଂ ସୃଷ୍ଟି କରନ୍ତୁ। ସଂଯୋଗକୁ ଅଧିକ ସଠିକ ଭାବରେ ଅନୁସରଣ କରିବା ପାଇଁ ନିୟନ୍ତ୍ରଣ ଶକ୍ତିକୁ ବଢାନ୍ତୁ, ଅଧିକ ସୃଜନଶୀଳ ସ୍ୱାଧୀନତା ପାଇଁ ଏହାକୁ କମ କରନ୍ତୁ।

ନିୟନ୍ତ୍ରଣନେଟ — ଗୋଟିଏ ଉପକରଣରେ 12ଟି ସ୍ଥିତି ପ୍ରକାର — FAQ

ଗୋଟିଏ ଏକକ ସାଧନ ଯାହାକି ControlNet-Union SDXL ProMax ମଡେଲରୁ ସମସ୍ତ 12ଟି ସ୍ଥିତି ପ୍ରକାରକୁ ପ୍ରଦର୍ଶନ କରେ - canny, pose, depth, scribble, lineart, anime-lineart, MLSD, HED, soft-edge, normal, segmentation, ଏବଂ tile। ଗୋଟିଏ ସ୍ଥିତି ପ୍ରକାରକୁ ବାଛନ୍ତୁ, ଗୋଟିଏ ସଂଯୋଗ ପ୍ରତିଛବିକୁ ଛାଡିଦିଅନ୍ତୁ, ଗୋଟିଏ ପ୍ରୋମୋଟ ଲେଖନ୍ତୁ, ଏବଂ SDXL ଗୋଟିଏ ନୂତନ ପ୍ରତିଛବିକୁ ପ୍ରଦର୍ଶନ କରେ ଯାହାକି ଆପଣଙ୍କର ସଂଯୋଗର ଢାଞ୍ଚାକୁ ଅନୁସରଣ କରେ।

img2img ନିବେଶ ଉପରେ ସିଧାସଳଖ ପୁନଃ-ବର୍ଣ୍ଣନ କରେ - ରଙ୍ଗ, ସର୍ଭର, AND ଜ୍ୟାମିଟି ମିଶ୍ରଣ ପ୍ରୋମୋଟ ସହିତ। ନିୟନ୍ତ୍ରଣନେଟ ରଙ୍ଗଗୁଡ଼ିକୁ ଦୂରକୁ ପକାଇଥାଏ ଏବଂ କେବଳ ବଚ୍ଛିତ ଢାଞ୍ଚା ସଂକେତକୁ ରଖିଥାଏ (ରେଖା, ସ୍ଥାପନ କୋଷ, ଗଭୀରତା ମାନଚିତ୍ର, ଇତ୍ୟାଦି)। ଏହା ଆପଣଙ୍କୁ ସଂଯୋଜନାକୁ ସ୍ଥିର ରଖିବା ସମୟରେ ବିଷୟବସ୍ତୁକୁ ଆଧାରଶୂନ୍ୟ ଭାବରେ ବଦଳାଇବାକୁ ଅନୁମତି ଦେଇଥାଏ। img2img ଅପେକ୍ଷା ଅଧିକ ଶକ୍ତିଶାଳୀ ଢାଞ୍ଚା ନିୟନ୍ତ୍ରଣ।

Canny / lineart ସ୍ୱଚ୍ଛ ରେଖାକାର ନିବେଶ ପାଇଁ। Anime-lineart anime-ଶୈଳୀ ରେଖା ନିବେଶ ପାଇଁ। Scribble / soft-edge / HED ଅଳ୍ପ ସ୍କେଚ ଏବଂ doodles ପାଇଁ। ଫଟୋରୁ ଶରୀରର ଅବସ୍ଥାନକୁ ନକଲ କରିବା ପାଇଁ ପୋଜ କରନ୍ତୁ। ସ୍ଥିତି ସ୍ଥାପନା / 3D ବିନ୍ୟାସକୁ ସଂରକ୍ଷଣ କରିବା ପାଇଁ ଗଭୀରତା। ସିଧା ରେଖା (ଭୂତତ୍ତ୍ୱ/ଆଭ୍ୟନ୍ତରୀଣ)କୁ ସଂରକ୍ଷଣ କରିବା ପାଇଁ MLSD। ସ୍ଥଳ ଦିଗ ଏବଂ ପରିମାଣକୁ ସଂରକ୍ଷଣ କରିବା ପାଇଁ ସାଧାରଣ। କ୍ଷେତ୍ରକୁ ସଂରକ୍ଷଣ କରିବା ପାଇଁ ବିଭାଜନ। ଗୋଟିଏ ଅବସ୍ଥିତ ପ୍ରତିଛବିର ପରିବର୍ତ୍ତନକୁ ସୁଦୃଢ କରିବା କିମ୍ବା ବଢାଇବା ପାଇଁ ଟାଇଲ।

ControlNet-Union SDXL ProMax (xinsir, Apache 2.0) ସମସ୍ତ 12ଟି ସ୍ଥିତି ନେଟୱର୍କକୁ ଗୋଟିଏ 2.5 GB ଓଜନରେ ପ୍ୟାକ କରିଥାଏ। ପୁରୁଣା ବିସ୍ତାରଗୁଡ଼ିକ ପ୍ରତି ପ୍ରକାର ପାଇଁ ଏକ ବିଶେଷ ~2.5 GB ଓଜନକୁ ଡାଉନଲୋଡ କରିଥାଏ - canny ଏବଂ pose ମଧ୍ୟରେ ପରିବର୍ତ୍ତନ କରିବା ଅର୍ଥ ହେଉଛି ଶୀତଳ-ଆରମ୍ଭ। ୟୁନିୟନ ମଡେଲଟି ଥରେ ଧାରଣ କରିଥାଏ ଏବଂ ଗରମ ରହିଥାଏ, ତେଣୁ ପ୍ରତ୍ୟେକ ସ୍ଥିତି ପ୍ରକାର ପ୍ରଥମ କଲ ପରେ ଉପ-ସେକେଣ୍ଡ ଅଟେ।

ହଁ। ~1,200 ଟୋକନ ପ୍ରତି ରେଣ୍ଡର (1,000 ଆଧାର SDXL + 20% ControlNet conditioning surcharge)। ଲଗଇନ ହୋଇଥିବା ଚାଳକମାନେ ପ୍ରତିଦିନ 30,000 ମୁକ୍ତ ଟୋକନ ପାଇଥାନ୍ତି - ପ୍ରତିଦିନ ପ୍ରାୟ 25 conditioned renders କୌଣସି ଖର୍ଚ୍ଚ ବିନା। ବେନାମି: 2,500 ଟୋକନ/ଦିନ (~2 renders)।

ହଁ - ନିୟନ୍ତ୍ରଣ ଶକ୍ତି ସ୍ଲାଇଡର ( ପୂର୍ବନିର୍ଦ୍ଧାରିତ 0.7) ନିର୍ଦ୍ଧାରଣ କରେ ଯେ ନିର୍ଗମ ଆପଣଙ୍କର ସଂଯୋଗକୁ କେତେ ସଠିକ ଭାବରେ ଅନୁସରଣ କରେ। 1.0 = ସଠିକ (ନିର୍ଗମ ଆପଣଙ୍କ ସଂଯୋଗର ପୁନଃପ୍ରଦର୍ଶନ ଭଳି ଦେଖାଯାଏ)। 0.4 = ଲମ୍ବା (ପ୍ରୋମୋଟର ଅଧିକ ସ୍ୱାଧୀନତା ଥାଏ)। ସୃଜନଶୀଳ ପରିବର୍ତ୍ତନ ପାଇଁ ଏହାକୁ ନିମ୍ନ କରନ୍ତୁ, ଭରସାଯୋଗ୍ୟତା ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ ହେଲେ ଏହାକୁ ବଢାନ୍ତୁ।

512×512 ପୂର୍ବନିର୍ଦ୍ଧାରିତ। SDXL ମାନକ ଅନୁପାତ - 768×1024 ପେଣ୍ଟାଗୋ, 1024×768 ଲ୍ୟାଣ୍ଡସ୍କେପ, 1024×1024 ବର୍ଗ - ସବୁକିଛି କାମ କରେ। ବଡ଼ ନିର୍ଗମ ଅଧିକ VRAM ଏବଂ ଟୋକନ ବ୍ୟବହାର କରେ; H200 1024×1024 ପର୍ଯ୍ୟନ୍ତ ସୁବିଧାରେ ସମର୍ଥନ କରେ।

ସଂଯୋଗ ପ୍ରତିଛବିଗୁଡ଼ିକୁ ତୁରନ୍ତ ପ୍ରକ୍ରିୟାକରଣ କରାଯାଏ, ସ୍ଥିତିକୁ ବାହାର କରାଯାଏ, ତା'ପରେ ସଂଯୋଗ ଫାଇଲକୁ ଅପସାରଣ କରାଯାଏ। କେବଳ ପ୍ରୋମୋଟ + ଅନ୍ତିମ ରେଣ୍ଡର / ଖାତା/?ଟ୍ୟାବ=ଇତିହାସରେ ଥାଏ। ପ୍ରଶିକ୍ଷଣ ପାଇଁ କେବେବି ବ୍ୟବହାର କରନ୍ତୁ ନାହିଁ। ସମ୍ପୂର୍ଣ୍ଣ ନୀତି ପାଇଁ /privacy/।

ControlNet-Union SDXL ProMax କୁ Apache 2.0 ଅନ୍ତର୍ଗତ ମୁକ୍ତ କରାଯାଇଛି - ବାଣିଜ୍ୟିକ ବ୍ୟବହାର ସମେତ ସମ୍ପୂର୍ଣ୍ଣ ଅନୁମତିପ୍ରାପ୍ତ। SDXL ଆଧାରଟି OpenRAIL++। ଉଭୟ ବାଣିଜ୍ୟିକ ବ୍ୟବହାରକୁ ଅନୁମତି ଦେଇଥାଏ; ଆପଣଙ୍କର ନିର୍ମିତ ପ୍ରତିଛବିଗୁଡ଼ିକ ଆପଣଙ୍କର ବାଣିଜ୍ୟିକ ବ୍ୟବହାର ପାଇଁ କୌଣସି ରେୟାଲଟି ବିନା।

ସମାନ ଆକାର, ସମାନ ଗୁଣବତ୍ତା, ସମାନ ପରିଚାଳନା ସଂକେତ। ComfyUI ଏବଂ A1111 ପାଇଁ 12+ GB VRAM ସହିତ ସ୍ଥାନୀୟ GPU ଆବଶ୍ୟକ। ଆମେ ଏହାକୁ ଏକ ଉଦାର ମୁକ୍ତ ପୁଲ ସହିତ ସହଭାଗୀ ଭିତ୍ତିଭୂମିରେ ଚଲାଉଛୁ - କୌଣସି ସ୍ଥାପନ ନାହିଁ, କୌଣସି GPU ଆବଶ୍ୟକ ନାହିଁ।

ପ୍ରଥମ କଲ GPU କ୍ୟାଶେକୁ ୟୁନିୟନ ଓଜନ (~2.5 GB) ଆହରଣ କରିଥାଏ ଏବଂ SDXL ପାଇପଲାଇନକୁ ଗରମ କରିଥାଏ। ଗୋଟିଏ ବିସ୍ତାର କିମ୍ବା LRU ବହିଷ୍କାର ପରେ ପ୍ରଥମ ଅନୁରୋଧରେ 30-60 ସେକଣ୍ଡର ଅପେକ୍ଷା କରନ୍ତୁ। ପରବର୍ତ୍ତୀ କଲଗୁଡ଼ିକ ସାଧାରଣ ଧାରଣ ଅନ୍ତର୍ଗତ4-7 ସେକଣ୍ଡରେ ଫେରିଥାଏ।

ହଁ — /v1/image/generate/ ରେ multipart POST କରିବା ପାଇଁ ମଡେଲ=sdxl (ଅଥବା ମଡେଲ=controlnet-union-sdxl-promax), ପ୍ରୋମୋଟ, ନିୟନ୍ତ୍ରଣ_ଚିତ୍ର (ଫାଇଲ), ନିୟନ୍ତ୍ରଣ_ପ୍ରକାର=<ଏକଟି: canny, pose, depth, scribble, lineart, anime-lineart, mlsd, hed, soft-edge, normal, segmentation, tile>, ଇଚ୍ଛାରୂପୀ ନିୟନ୍ତ୍ରଣ_ଶକ୍ତି (0.1-1.5). ଧାରକ ପ୍ରମାଣପତ୍ର, 10K ମୁକ୍ତ ଟୋକନ/ମାସ। /api/ ରେ curl ଉଦାହରଣ ଅଛି।

Free.aiକୁ ଭଲପାଆନ୍ତି କି? ଆପଣଙ୍କ ବନ୍ଧୁମାନଙ୍କୁ ଜଣାଇ ଦିଅନ୍ତୁ!

ଏହି ପୃଷ୍ଠାକୁ ଆକଳନ କରନ୍ତୁ