ControlNet — একটি টুল-এ ১২টি স্থিতিশীল ধরন

একটি রেফারেন্স ছবি আপলোড করুন, একটি স্থিতিশীল ধরন নির্বাচন করুন, একটি প্রম্পট লিখুন। AI আপনার রেফারেন্সের কাঠামো (লাইন, পোজ, গভীরতা, ইত্যাদি) ধরে রাখে এবং যেকোন ধরনের নতুন উপাদান প্রদর্শন করে। ControlNet-Union SDXL ProMax দ্বারা সমর্থিত - Apache 2.0, সম্পূর্ণ বাণিজ্যিক ব্যবহারের জন্য বন্ধুত্বপূর্ণ।

পরিষ্কার লাইনওয়ার্কের জন্য Canny / lineart। শরীরের অবস্থানের জন্য Pose। ত্রিমাত্রিক বিন্যাস করার জন্য Depth। রুক্ষ টুকরো টুকরো করার জন্য Scribble / soft- edge। স্থাপত্যের জন্য MLSD। উন্নত ওয়ার্কফ্লোর জন্য Normal / segmentation / tile।
এই থেকে শর্ত বের করা হয় - রংগুলি বাতিল করা হয়, শুধুমাত্র কাঠামোগত সংকেত (আপনার নির্বাচিত ধরনের জন্য) সংরক্ষিত হয়।
লস 0.7 কঠোর
~1,200 tokens (SDXL × 1.2 ControlNet)
ফলাফল

ControlNet কিভাবে কাজ করে

ControlNet আপনাকে শুধুমাত্র টেক্সট প্রম্পটের ওপর নির্ভর না করে একটি রেফারেন্স ছবির কাঠামোর সাহায্যে ছবির উৎপাদন পরিচালনা করতে দেয়। একটি প্রাক-প্রসেসর আপনার রেফারেন্স পড়ে এবং একটি একক স্থিতিশীল সংকেত বের করে নেয় - এর প্রান্ত, এর গভীরতা মানচিত্র, একজন ব্যক্তির পোজ কাঠামো, ইত্যাদি। এরপর ডিফ্যুশন মডেল সেই সংকেতটির উপর লক করা হয় যখন প্রম্পট স্টাইল, রং, আলোকসজ্জা এবং বিষয় নির্ধারণ করে। ফলাফলটি আপনি যে সঠিক গঠনটি প্রদান করেছেন তা ধরে রাখে কিন্তু এটি সম্পূর্ণ নতুন কিছুর মতো দেখায়।

এই টুলটি ControlNet-UnionSDXL ProMax (Apache 2.0) দ্বারা সমর্থিত — একটি একক মডেল যা নিচের ১২টি conditioning ধরন বুঝে, তাই আপনি তাদের মধ্যে একটি পছন্দকারী থেকে প্রতিবার একটি ভিন্ন নেটওয়ার্ক লোড না করে পরিবর্তন করতে পারেন। এটি সম্পূর্ণ বাণিজ্যিক ব্যবহারের জন্য বন্ধুত্বপূর্ণ: আপনি যা তৈরি করেন তা রাখুন, বিক্রি করুন বা পরিবর্তন করুন।

১২ ধরনের শর্ত

কৌতুক
চকচকে প্রান্ত সনাক্তকরণ। চকচকে আকৃতি ও পরিষ্কার লাইনওয়ার্ক সংরক্ষণের জন্য সবচেয়ে উপযুক্ত।
গভীরতা
ত্রিমাত্রিক গভীরতা মানচিত্র। স্থানীয় বিন্যাস বজায় রাখে - কি কাছে এবং কি দূরে।
পোজ
OpenPose শরীরের কাঠামো। আকৃতির অবস্থান এবং অঙ্গের অবস্থান লক করে।
স্ক্রিবলName
হাতের লেখা টুকরো
অংশবিশেষ
রঙের কোডযুক্ত অঞ্চল মানচিত্র। দৃশ্যের প্রতিটি অঞ্চলকে একটি শ্রেণীতে বরাদ্দ করুন।
স্বাভাবিক
পৃষ্ঠ-সাধারণ মানচিত্র। ত্রিমাত্রিক পৃষ্ঠের দিক ও ঝাপটা সংরক্ষণ করে।
লাইন- আর্ট
লাইন অপসারণ — ইঙ্কিং, মাঙ্গা এবং ইলাস্ট্রেশনের জন্য আদর্শ।
নরম প্রান্ত
কানীর চেয়ে আকৃতির অনুসরণে আরো পাতলা সীমানা সনাক্তকরণ।
এমএলএসডি
সরাসরি লাইন, স্থাপত্য, অভ্যন্তর এবং পণ্য ছবির জন্য তৈরি।
টাইল
আপস্কেলিং এবং সিমলেস টেক্সচার কাজের জন্য বিস্তারিত-সংরক্ষণের জন্য স্থিতিশীলতা।
অঙ্কন
ছবির অংশবিশেষ পুনরুদ্ধার করার জন্য মাস্ক-সচেতন বিন্যাস।
পুনরায় আঁকো / আউটপেইন্ট করো
চারপাশের কাঠামোর সম্মান করে একটি ক্যানভাস বা পুনরায় আঁকা অঞ্চল প্রসারিত করুন।

তিন ধাপ

  1. একটি রেফারেন্স ছবি আপলোড করুন - একটি ছবি, একটি স্কেচ, একটি স্ক্রিনশট, যে কোন কিছু যা আপনি সংরক্ষণ করতে চান।
  2. আপনার পছন্দের বিন্যাস নির্বাচন করুন (আকৃতির জন্য পোজ, দৃশ্যের জন্য গভীরতা, পরিষ্কার পরিসর দেখার জন্য কৌশল বা লাইন) ।
  3. আপনি যে ধরনের চেহারা চান তা বর্ণনা করে একটি প্রম্পট লিখুন এবং তা তৈরি করুন। রেফারেন্সটি আরও নিবিড়ভাবে অনুসরণ করার জন্য নিয়ন্ত্রণের শক্তি বাড়িয়ে দিন, আরও বেশি সৃজনশীল স্বাধীনতার জন্য এটি কমিয়ে দিন।

ControlNet — একটি টুল-এ ১২টি স্থিতিশীল ধরন — FAQ

একটি একক টুল যা ControlNet-Union SDXL ProMax মডেল থেকে সকল ১২টি conditioning ধরন প্রকাশ করে - canny, pose, depth, scribble, lineart, anime-lineart, MLSD, HED, soft-edge, normal, segmentation, এবং tile। একটি conditioning ধরন বেছে নিন, একটি রেফারেন্স ছবি ছেড়ে দিন, একটি প্রম্পট লিখুন, এবং SDXL একটি নতুন ছবি প্রদর্শন করবে যা আপনার রেফারেন্সের কাঠামো অনুসরণ করে।

img2img সরাসরি ইনপুট- এর উপরে পুনরায় আঁকে — রং, প্রান্ত এবং জিওমেট্রি মিশ্রণ প্রম্পটের সাথে । ControlNet রংগুলো সরিয়ে ফেলে এবং শুধুমাত্র নির্বাচিত কাঠামোগত সিগন্যাল (রেখা, পোজ কাঠামো, গভীরতা মানচিত্র, ইত্যাদি) রাখে । এটি আপনাকে রূপান্তর করতে দেয় এবং একই সাথে আপনার গঠনকে মজবুত রাখে । img2img- এর চেয়ে অনেক বেশি শক্তিশালী কাঠামোগত নিয়ন্ত্রণ ।

Canny / lineart পরিষ্কার লাইনওয়ার্ক ইনপুট জন্য । Anime- lineart anime- ধরনের লাইন ইনপুট জন্য । Scribble / soft- edge / HED রুক্ষ স্কেচ এবং doodles জন্য । পোজ একটি ছবি থেকে একটি শরীর অবস্থান অনুলিপি করতে । গভীরতা দৃশ্য জ্যামিতি / ত্রিমাত্রিক বিন্যাস সংরক্ষণ করতে । MLSD সরল লাইন (সজ্জা / অভ্যন্তর) সংরক্ষণ করতে । স্বাভাবিক পৃষ্ঠ অভিমুখ এবং আকার সংরক্ষণ করতে । Segmentation অঞ্চল সংরক্ষণ করতে । টাইল একটি বিদ্যমান ছবির বৈচিত্র্য উন্নত করতে বা বৃদ্ধি করতে ।

ControlNet-Union SDXL ProMax (xinsir, Apache 2.0) সমস্ত ১২টি conditioning নেটওয়ার্ককে একই ২.৫ GB ওজনের মধ্যে প্যাক করে। পুরনো ডেভেলপমেন্ট প্রতি ধরনের জন্য আলাদা ~২.৫ GB ওজন ডাউনলোড করে - canny এবং pose এর মধ্যে পরিবর্তনের অর্থ হল একটি শীতল-স্টার্ট। union মডেল একবার লোড করে এবং উষ্ণ থাকে, তাই প্রত্যেক conditioning ধরন প্রথম কলের পর সাব-সেকেন্ডে।

হ্যাঁ। প্রতিটি রেন্ডারে ~১,২০০ টোকেন (১,০০০ বেস এসডিএক্সএল + ২০% কন্ট্রোলনেট কনডিশনিং সার্ভিস চার্জ)। লগ-ইন করা ব্যবহারকারীরা প্রতিদিন ৩০,০০০ বিনামূল্যে টোকেন পাবেন - প্রতিদিন ২৫টি কনডিশনেড রেন্ডারিং কোন খরচ ছাড়াই। বেনামী: ২,৫০০ টোকেন/দিন (~২টি রেন্ডারিং)।

হ্যাঁ — নিয়ন্ত্রণের শক্তি স্লাইডার (ডিফল্ট ০.৭) নির্ধারণ করে আউটপুট আপনার রেফারেন্সের কতটা সঠিকভাবে অনুসরণ করবে। ১.০ = সঠিক (আউটপুট আপনার রেফারেন্সের পুনরায় রূপায়ণের মত দেখায়)। ০.৪ = মুক্ত (প্রম্পটের আরো বেশি স্বাধীনতা আছে)। সৃজনশীল পরিবর্তনের জন্য এটি নিচে নামিয়ে দিন, সত্যতা গুরুত্বপূর্ণ হলে এটি বাড়িয়ে দিন।

ডিফল্ট মান ৫১২×৫১২। SDXL-এর মানসম্মত অনুপাত — ৭৬৮×১০২৪ পোর্ট্রেট, ১০২৪×৭৬৮ ল্যান্ডস্কেপ, ১০২৪×১০২৪ বর্গক্ষেত্র — সবই কাজ করে। বড় আউটপুট বেশি VRAM এবং টোকেন ব্যবহার করে; H200-এর সমর্থন ১০২৪×১০২৪ পর্যন্ত।

রেফারেন্স ছবি অবিলম্বে প্রসেস করা হয়, conditioning এক্সট্র্যাক্ট করা হয়, তারপর রেফারেন্স ফাইল মুছে ফেলা হয়। শুধুমাত্র প্রম্পট + শেষ রেন্ডার /account/?tab=history এ থাকে। প্রশিক্ষণের জন্য কখনো ব্যবহার করা হয় না। /privacy/ এর জন্য সম্পূর্ণ নীতিমালা।

ControlNet-Union SDXL ProMax আপাচি ২.০ এর অধীনে প্রকাশিত হয়েছে - বাণিজ্যিক ব্যবহারসহ সম্পূর্ণ অনুমোদিত। SDXL ভিত্তি হচ্ছে OpenRAIL++। উভয়ই বাণিজ্যিক ব্যবহারের অনুমতি দেয়; আপনার তৈরি ছবি বাণিজ্যিকভাবে ব্যবহারের জন্য আপনার জন্য মুক্ত।

একই মডেল, একই গুণমান, একই স্থিতিশীল সংকেত। ComfyUI এবং A1111 এর জন্য ১২+ GB VRAM সহ স্থানীয় GPU এবং সেটআপ প্রয়োজন। আমরা এটি একটি বিনামূল্যে পুলের সাথে একটি অংশীদারি পরিকাঠামোতে চালিয়েছি - কোন ইনস্টলেশন, কোন GPU প্রয়োজন নেই।

প্রথম কল ইউনিয়ন ওজন (~২.৫ GB) GPU ক্যাশেতে ডাউনলোড করে এবং SDXL পাইপলাইন গরম করে। একটি deploy বা LRU eviction এর পর প্রথম অনুরোধের জন্য ৩০-৬০ সেকেন্ডের অপেক্ষা করুন। পরবর্তী কলগুলো সাধারণ লোডের অধীনে ৪-৭ সেকেন্ডের মধ্যে ফিরে আসে।

হ্যাঁ — /v1/image/generate/ এ multipart POST করতে হবে model=sdxl (বা model=controlnet-union-sdxl-promax), প্রম্পট, control_image (ফাইল), control_type=<একটি: canny, pose, depth, scribble, lineart, anime-lineart, mlsd, hed, soft-edge, normal, segmentation, tile>, optional control_strength (০.১-১.৫)। বাহক অনুমোদন, ১০K ফ্রি টোকেন/মাস। /api/ এ curl এর উদাহরণ আছে।

Free.ai ভালোবাসো?

এই পাতাটি রেটিং দিন