Question 1

Step1X-Edit nədir?

Accepted Answer

Step1X-Edit-v1p2 (ReasonEdit-S) StepFun'un şəkil-redaktə modelidir - Apache 2.0 altında 2025-ci ilin noyabr ayında buraxılmışdır. Qwen-Image-Edit doğrudan göstərişlərə ("göyləri bənövşəyi et") uyğundur, Step1X-Edit isə çox addımlı, istinadlı və abstrakt redaktələrlə bağlı ("bu otaqda işıqlandırmanı qızıl saat gün batımına uyğunlaşdırır", "sol əlində anatomik olaraq səhv görünən şeyi düzəldir"). O, KRIS-Bench və GEdit-Bench-də GPT-4o / Gemini-2-Flash redaktə keyfiyyətinə uyğunlaşdırmaq üçün təlim edilmiş bir düşüncə keçidi + əks-səda ətrafındakı diffuziya ətrafındakı dövrləri idarə edir. Free.ai'in H200-də öz-özünə yerləşdirilir - heç bir yüksələn provayder, heç bir mətn qeydi yoxdur.

Question 2

Step1X-Edit Qwen-Image-Edit-dən necə fərqlənir?

Accepted Answer

Qwen-Image-Edit-2511 Free.ai-də ən sürətli pulsuz əmr-redaktədir - redaktə başına ~10-15 saniyə, MMDiT arxası Qwen.5-VL mətn kodlayıcı ilə. Step1X-Edit daha yavaş, daha ağıllı qardaşıdır: bir DiT dekoderi və ayrı bir MLLM ön tərəfi ki, bir düşünmə keçidi (diffuzer üçün sorğu formatını dəyişdir) və bir seçimli refleksiya keçidi (kandidatları müqayisə et, ən yaxşısını seç). Düzgün redaktə üçün Qwen istifadə et; sorğu interpretasiyaya ehtiyac duyanda, çoxlu cümlələrə sahib olduqda, ya da çərçivənin xaricindəki bir şeyə istinad etdikdə Step1X istifadə et.

Question 3

Step1X-Edit FLUX Kontext / Seedream / Nano Banana-dan necə fərqlənir?

Accepted Answer

Bunlar ödənişli provayderlər (fal.ai upstream) vasitəsilə yönləndirilən premium modellərdir və redaktə üçün 30K-112K tokenlərə başa gəlir. Step1X-Edit Apache 2.0 altında Free.ai's H200-də tam olaraq öz-özünə host edilir və ~2000 tokenə başa gəlir. Premium modelləri məhsul fotoqrafiyası və qrafika dizaynının qorunması üçün həqiqətən də irəlidədir; Step1X əsaslandırma çağırışlarında qalib gəlir və göndərdiyimiz ən güclü açıq alternativdir.

Question 4

Step1X-Edit ilə hansı sorğular ən yaxşı işləyir?

Accepted Answer

Bir çox addımlı ("su işarəsini sil və sonra rəng temperaturunu qızdır"), istinadlı ("1985 Polaroid'in çərçivəsinə uyğunlaşdır"), şərhedici ("özünü daha əmin hiss etsin"), düzəltmə üslubu ("əli düzəlt", "üfüqləri düzəlt") və abstrakt ("bunu xatirə kimi görünsün"). Sadə "X'i Y'ə dəyiş" düzəlişləri üçün Qwen-Image-Edit daha sürətlidir.

Question 5

Step1X-Edit nə qədərdir?

Accepted Answer

~2,000 tokens per edit — double the standard image-edit rate (1,000 tokens) because the thinking + reflection passes roughly double wall-clock time vs Qwen-Image-Edit. Anonymous users get 2,500 free tokens/day; signed-in users get 30,000/day — enough for ~15 reasoning edits daily without paying.

Question 6

Düzəltmə nə qədər vaxt aparır?

Accepted Answer

Düşünmə + əks etdirmə fəallaşdırılmış (öncəki) 1024-səhifəlik redaktə üçün ~25-50 saniyə. Əks etdirmə fəallaşdırılmadıqda (enable_reflection=false) bu, çox addımlı sorğularda kiçik bir dəqiqlik səhvi ilə ~15-25 saniyəyə enir. Əks etdirmə keçidi adi diffuziya redaktələrində tez-tez rast gəlinən "əl düzəldildi, amma səhvən arxa plan dəyişdirildi" səhv modunu yaxalayır.

Question 7

Step1X-Edit hansı lisenziyaya malikdir?

Accepted Answer

Apache 2.0 — həm çəkilər (huggingface.co/stepfun-ai/Step1X-Edit-v1p2) həm də GitHub repo (github.com/stepfun-ai/Step1X-Edit). Yerli kəsmə yoxdur, MAU limiti yoxdur, ticarətsiz sürücü yoxdur, yalnız tədqiqat şərtləri yoxdur. Yaratdığınız şəkillər sizindir və royaltisiz ticarət məqsədilə istifadə edə bilərsiniz.

Question 8

Hansı VRAM və hardverə ehtiyacı var?

Accepted Answer

~22 GB model CPU yüksəlməsi ilə (transformer + VAE GPU-da, MLLM + mətn enkoderi CPU-dan paged). 41.8 GB diskdə. H200-də 24 GB slotu ayırırıq və əgər VRAM 18 GB-dan aşağı düşərsə, wrapper start zamanı dayandırılır. Öz-özünə host etmək üçün minimum 24 GB istehlakçı kartına (RTX 4090), ideal olaraq 40 GB+ headroom-a ehtiyacınız var.

Question 9

Düşünmə/təsvir sürətini artırmaq üçün keçidləri işə sala bilərəmmi?

Accepted Answer

Bəli — MLLM-in prompt-formatlaşdırma keçidini keçmək üçün enable_thinking=false, ya da çox namizədli seçmə turu keçmək üçün enable_reflection=false keçin. İkisi də söndürüldükdə Step1X ~12-15 s/edit-də vanil DiT şəkil redaktoru kimi davranır. İkisini də ön qurğulu olaraq açırıq çünki modelin bu iş üçün hazırlanması və benchmark suites-də sadə diffuziyadan daha yaxşı olması səbəbindən.

Question 10

Hansı arxitekturalar onu gücləndirir?

Accepted Answer

Step1X-Edit-v1p2 (ReasonEdit-S) DiT əsaslı dekoderi Qwen.5-VL ailəsinin MLLM ön tərəfi ilə birləşdirir. MLLM redaktə əmrini izah edir; DiT dekoderi redaktəni rəngləyir. Diffuzerlərin boru kəməri sinfi Step1XEditPipelineV1P2-dir (diffuzerlərin Peyton-Chen fork-unda yaşayır, step1xedit_v1p2 filialı). RegionE MLLM-in dəyişməmiş kimi işarə etdiyi bölgələrdə diffuziyanı keçərək seçici olaraq nəticəni sürətləndirir.

Question 11

Yükləmələr saxlanılırmı ya da təlim üçün istifadə olunurmu?

Accepted Answer

Yüklənmiş şəkillər redaktə bitdikdən sonra dərhal silinir. Çıxış 24 saat (ödənişli istifadəçilər üçün 7 gün) CDN-də qalır, buna görə də /account/?tab=history-dən yenidən yükləyə bilərsiniz. Təlim üçün heç vaxt istifadə edilmir. Gizlilik siyasəti /privacy/-dədir.

Question 12

API varmı?

Accepted Answer

Bəli — /v1/image/edit/-ə image, model=step1x-edit, operation=img2img (və ya inpaint / outpaint / style_transfer / və s.), prompt, optional enable_thinking, enable_reflection, steps (default 50), guidance_scale (default 6.0) ilə çox hissəli POST. Bearer auth, 10K tokens/month free. /api/ curl nümunələri var.

Step1X-Edit v1p2

Tez-tez Sorulan Sual