Step1X-Edit v1p2

Free.ai (self-hosted) · image_edit · ~1000 tokens per edit

Fayl buraya at ya da axtarmaq üçün basın

~1000 tokens per edit

Step1X-Edit-v1p2 (ReasonEdit-S, released Nov 2025) — Apache 2.0. StepFun's reasoning image-edit model: pairs a DiT-based decoder with an MLLM front-end, then adds a thinking + reflection pass around the diffusion forward. Trained to match GPT-4o / Gemini-2-Flash edit quality on KRIS-Bench and GEdit-Bench, especially on multi-step, referential, and abstract edits ("fix what looks wrong about her left hand", "match the lighting in this room to a sunset"). Self-hosted on Free.ai's H200 (dedicated venv-step1x-edit). The reflection pass costs ~25-50 s per 1024-side edit but catches the drift artifacts plain diffusion edits often produce. Free tier for /image/edit/ reasoning-mode operations.

API vasitəsilə istifadə et
curl -X POST https://api.free.ai/v1/image/edit/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"step1x-edit","prompt":"your prompt here"}'
API sənədləşdirilməsi API Açarı

Tez-tez Sorulan Sual

Step1X-Edit-v1p2 (ReasonEdit-S) StepFun'un şəkil-redaktə modelidir - Apache 2.0 altında 2025-ci ilin noyabr ayında buraxılmışdır. Qwen-Image-Edit doğrudan göstərişlərə ("göyləri bənövşəyi et") uyğundur, Step1X-Edit isə çox addımlı, istinadlı və abstrakt redaktələrlə bağlı ("bu otaqda işıqlandırmanı qızıl saat gün batımına uyğunlaşdırır", "sol əlində anatomik olaraq səhv görünən şeyi düzəldir"). O, KRIS-Bench və GEdit-Bench-də GPT-4o / Gemini-2-Flash redaktə keyfiyyətinə uyğunlaşdırmaq üçün təlim edilmiş bir düşüncə keçidi + əks-səda ətrafındakı diffuziya ətrafındakı dövrləri idarə edir. Free.ai'in H200-də öz-özünə yerləşdirilir - heç bir yüksələn provayder, heç bir mətn qeydi yoxdur.

Qwen-Image-Edit-2511 Free.ai-də ən sürətli pulsuz əmr-redaktədir - redaktə başına ~10-15 saniyə, MMDiT arxası Qwen.5-VL mətn kodlayıcı ilə. Step1X-Edit daha yavaş, daha ağıllı qardaşıdır: bir DiT dekoderi və ayrı bir MLLM ön tərəfi ki, bir düşünmə keçidi (diffuzer üçün sorğu formatını dəyişdir) və bir seçimli refleksiya keçidi (kandidatları müqayisə et, ən yaxşısını seç). Düzgün redaktə üçün Qwen istifadə et; sorğu interpretasiyaya ehtiyac duyanda, çoxlu cümlələrə sahib olduqda, ya da çərçivənin xaricindəki bir şeyə istinad etdikdə Step1X istifadə et.

Bunlar ödənişli provayderlər (fal.ai upstream) vasitəsilə yönləndirilən premium modellərdir və redaktə üçün 30K-112K tokenlərə başa gəlir. Step1X-Edit Apache 2.0 altında Free.ai's H200-də tam olaraq öz-özünə host edilir və ~2000 tokenə başa gəlir. Premium modelləri məhsul fotoqrafiyası və qrafika dizaynının qorunması üçün həqiqətən də irəlidədir; Step1X əsaslandırma çağırışlarında qalib gəlir və göndərdiyimiz ən güclü açıq alternativdir.

Bir çox addımlı ("su işarəsini sil və sonra rəng temperaturunu qızdır"), istinadlı ("1985 Polaroid'in çərçivəsinə uyğunlaşdır"), şərhedici ("özünü daha əmin hiss etsin"), düzəltmə üslubu ("əli düzəlt", "üfüqləri düzəlt") və abstrakt ("bunu xatirə kimi görünsün"). Sadə "X'i Y'ə dəyiş" düzəlişləri üçün Qwen-Image-Edit daha sürətlidir.

~2,000 tokens per edit — double the standard image-edit rate (1,000 tokens) because the thinking + reflection passes roughly double wall-clock time vs Qwen-Image-Edit. Anonymous users get 2,500 free tokens/day; signed-in users get 30,000/day — enough for ~15 reasoning edits daily without paying.

Düşünmə + əks etdirmə fəallaşdırılmış (öncəki) 1024-səhifəlik redaktə üçün ~25-50 saniyə. Əks etdirmə fəallaşdırılmadıqda (enable_reflection=false) bu, çox addımlı sorğularda kiçik bir dəqiqlik səhvi ilə ~15-25 saniyəyə enir. Əks etdirmə keçidi adi diffuziya redaktələrində tez-tez rast gəlinən "əl düzəldildi, amma səhvən arxa plan dəyişdirildi" səhv modunu yaxalayır.

Apache 2.0 — həm çəkilər (huggingface.co/stepfun-ai/Step1X-Edit-v1p2) həm də GitHub repo (github.com/stepfun-ai/Step1X-Edit). Yerli kəsmə yoxdur, MAU limiti yoxdur, ticarətsiz sürücü yoxdur, yalnız tədqiqat şərtləri yoxdur. Yaratdığınız şəkillər sizindir və royaltisiz ticarət məqsədilə istifadə edə bilərsiniz.

~22 GB model CPU yüksəlməsi ilə (transformer + VAE GPU-da, MLLM + mətn enkoderi CPU-dan paged). 41.8 GB diskdə. H200-də 24 GB slotu ayırırıq və əgər VRAM 18 GB-dan aşağı düşərsə, wrapper start zamanı dayandırılır. Öz-özünə host etmək üçün minimum 24 GB istehlakçı kartına (RTX 4090), ideal olaraq 40 GB+ headroom-a ehtiyacınız var.

Bəli — MLLM-in prompt-formatlaşdırma keçidini keçmək üçün enable_thinking=false, ya da çox namizədli seçmə turu keçmək üçün enable_reflection=false keçin. İkisi də söndürüldükdə Step1X ~12-15 s/edit-də vanil DiT şəkil redaktoru kimi davranır. İkisini də ön qurğulu olaraq açırıq çünki modelin bu iş üçün hazırlanması və benchmark suites-də sadə diffuziyadan daha yaxşı olması səbəbindən.

Step1X-Edit-v1p2 (ReasonEdit-S) DiT əsaslı dekoderi Qwen.5-VL ailəsinin MLLM ön tərəfi ilə birləşdirir. MLLM redaktə əmrini izah edir; DiT dekoderi redaktəni rəngləyir. Diffuzerlərin boru kəməri sinfi Step1XEditPipelineV1P2-dir (diffuzerlərin Peyton-Chen fork-unda yaşayır, step1xedit_v1p2 filialı). RegionE MLLM-in dəyişməmiş kimi işarə etdiyi bölgələrdə diffuziyanı keçərək seçici olaraq nəticəni sürətləndirir.

Yüklənmiş şəkillər redaktə bitdikdən sonra dərhal silinir. Çıxış 24 saat (ödənişli istifadəçilər üçün 7 gün) CDN-də qalır, buna görə də /account/?tab=history-dən yenidən yükləyə bilərsiniz. Təlim üçün heç vaxt istifadə edilmir. Gizlilik siyasəti /privacy/-dədir.

Bəli — /v1/image/edit/-ə image, model=step1x-edit, operation=img2img (və ya inpaint / outpaint / style_transfer / və s.), prompt, optional enable_thinking, enable_reflection, steps (default 50), guidance_scale (default 6.0) ilə çox hissəli POST. Bearer auth, 10K tokens/month free. /api/ curl nümunələri var.

Free.ai-i sevirsiniz? Dostlarınıza deyin!

Bu səhifəni qiymətləndir