Step1X-Edit v1p2

Free.ai (self-hosted) · image_edit · ~1000 ቶኮኖች ለ edit

ፋይልን እዚህ አስቀምጥ ወይም ለመዝጋት ጠቅ አድርግ

~1000 ቶኮኖች ለ edit

Step1X-Edit-v1p2 (ReasonEdit-S, released Nov 2025) — Apache 2.0. StepFun's reasoning image-edit model: pairs a DiT-based decoder with an MLLM front-end, then adds a thinking + reflection pass around the diffusion forward. Trained to match GPT-4o / Gemini-2-Flash edit quality on KRIS-Bench and GEdit-Bench, especially on multi-step, referential, and abstract edits ("fix what looks wrong about her left hand", "match the lighting in this room to a sunset"). Self-hosted on Free.ai's H200 (dedicated venv-step1x-edit). The reflection pass costs ~25-50 s per 1024-side edit but catches the drift artifacts plain diffusion edits often produce. Free tier for /image/edit/ reasoning-mode operations.

ከAPI በመጠቀም
curl -X POST https://api.free.ai/v1/image/edit/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"step1x-edit","prompt":"your prompt here"}'
ማስረጃ የAPI ቁልፍ ማግኘት

ብዙ ጊዜ የሚጠየቁ ጥያቄዎች

Step1X-Edit-v1p2 (ReasonEdit-S) is StepFun's reasoning image-edit model — released November 2025 under Apache 2.0. Where Qwen-Image-Edit follows direct instructions ("make the sky purple"), Step1X-Edit reasons about multi-step, referential, and abstract edits ("match the lighting in this room to a golden-hour sunset", "fix what looks anatomically wrong about her left hand"). It runs a thinking pass + reflection rounds around the diffusion forward, trained to match GPT-4o / Gemini-2-Flash edit quality on KRIS-Bench and GEdit-Bench. Self-hosted on Free.ai's H200 — no upstream provider, no markup.

Qwen-Image-Edit-2511 በFree.ai ላይ ፈጣን ነፃ መመሪያ-ማስተካከል ነው - ~ 10-15 ሰከንዶች ለ ማስተካከል, MMDiT backbone አንድ Qwen 2.5-VL ፅሁፍ encoder ጋር. Step1X-Edit ዝቅተኛ, smarter ወንድም ነው: አንድ DiT decoder ተጨማሪ አንድ MLLM ፊት-መጨረሻ አንድ ሐሳብ መውሰድ (ለተፋፋይ ጥያቄን መልሶ ማውጣት) እና ምርጫ ሐሳብ መውሰድ (ምርጫዎች ይወዳደሩ, ምርጡን ይምረጡ). ለቀጥታ ማስተካከያዎች Qwen ይጠቀሙ; ጥያቄው ትርጉም ያስፈልጋል ጊዜ Step1X ይጠቀሙ, ብዙ ክላሶች አሉት, ወይም ከፍሬም ውጭ ነገርን ያመለክታል።

እነዚህ የፕሪሚየም ሞዴሎች ናቸው የተከፈለ አቅራቢዎች (fal.ai upstream) እና 30K-112K ቶኮኖች በአንድ ማሻሻያ ዋጋ. Step1X-Edit በሙሉ በ Free.ai's H200 ውስጥ በአፓቺ 2.0 ስር በራስ-ሰር ይቀመጣል እና ~ 2,000 ቶኮኖች ዋጋ አለው. የፕሪሚየም ሞዴሎች ለምርት ፎቶግራፍ እና ለግራፊክ ዲዛይን መከላከል በቅሪተ አካል ፍቅር ላይ ገና በፊት ናቸው; Step1X በግምገማዎች ላይ ያሸንፋል እናም እኛ የምናስቀምጠው በጣም ጠንካራ የከፈተልን አማራጭ ነው.

የብዙ-ደረጃ ("የውሃ ምልክቱን ያስወግዱ ከዚያም የቀለም ሙቀት መጠንን ያሞቁ"), ሪፌረንሲያል ("የ1985 ፖላሮይድን ፍሬም ያመሳስሉ"), አስተያየት ("የእይታዋን መልክ የበለጠ እርግጠኛ እንዲሆን አድርጉ"), የጥገና-ስርዓት ("እጅን ያስተካክሉ", "የአከባቢውን ቀጥ አድርጉ"), እና የተወሰነ ("ይህን እንደ ማስታወሻ አድርጉ"). ለቀላል "Xን ወደ Y" ለውጦች፣ Qwen-Image-Edit ፈጣን ነው

~2,000 tokens per edit — double the standard image-edit rate (1,000 tokens) because the thinking + reflection passes roughly double wall-clock time vs Qwen-Image-Edit. Anonymous users get 2,500 free tokens/day; signed-in users get 30,000/day — enough for ~15 reasoning edits daily without paying.

~25-50 ሰከንዶች ለእያንዳንዱ 1024-ገጽ ማሻሻያ በግምት + መላመድ የተሰጠ (የተቀመጠው). መላመድን ማሰናከል (enable_reflection=false) በብዙ-ደረጃዎች ላይ ትንሽ ትክክለኛነት ያለውን መታ ወደ ~15-25 ሰከንዶች ይቀንሳል. መላመድ "እጅን አረጋግጧል ግን በድብቅ ኋላፊቱን ተቀየረ" የፍጻሜ ሞድ ያገኛል ግልጽ የዲፍፋይ ማሻሻያዎች ብዙውን ጊዜ ወደ ውስጥ ይሄዳሉ.

አፓቺ 2.0 — ሁለቱም ክብደቶች (huggingface.co/stepfun-ai/Step1X-Edit-v1p2) እና የ GitHub repo (github.com/stepfun-ai/Step1X-Edit). ምንም የክልል ቅርንጫፎች ፣ ምንም MAU cap ፣ ምንም ያልሆነ የኮሜርስ ተሳፋሪ ፣ ምንም የምርምር-በእርግጥ ክፍል የለም ፡፡ የምትፈጥሩት ምስሎች ያለ royalties ለኮሜርስ ጥቅም የሚውሉ ናቸው።

~22 GB የሞዴል ሲፒዩ ጫና ጋር የቆየ ከፍታ (ትራንስፎርመር + VAE በጂፒዩ ውስጥ ወደፊት; MLLM + ፅሁፍ ሶፍትዌር ከ ሲፒዩ የተቀየረ). 41.8 GB በዲስክ ላይ. እኛ 24 GB ስሎት ላይ H200 እና ነፃ VRAM ከ 18 GB በታች ከሆነ በጀት ላይ ይቋረጣል. ራስ-አስተናጋጅ 24 GB ተጠቃሚ ካርድ (RTX 4090) በጥቂቱ ያስፈልጋል, ለ 40 GB + ራስ ክፍል.

አዎ — የMLLMን የፕሮም-ፎርማቲንግ መውጣት ለመቀነስ enable_thinking=false ወይም የብዙ-ምርጫ ዙር ለመቀነስ enable_reflection=false ይለጥፉ። ሁለቱንም ካነቃን Step1X እንደ ቫኒላ DiT ምስል-አስተዳዳሪ በ ~12-15 ሰከንዶች/ማስተካከል ይሰራል። ሁለቱንም በቅድመ-ማስታወሻ ላይ እናስቀምጣለን ምክንያቱም ይህ ሞዴሉ እንዲያደርግ የተሠራ ስለሆነ እና በቤንማርክ ስቱዲዮዎች ላይ ቀላል መተላለፊያውን በጥብቅ የሚሸነፍ ስለሆነ።

Step1X-Edit-v1p2 (ReasonEdit-S) በQwen.5-VL ቤተሰብ MLLM ፍሬንደር ላይ የተመሠረተ DiT-based decoder ይጋራል። MLLM የቀረጻ መመሪያን ያብራራል፤ DiT decoder የቀረጻውን ያሳያል። የዲፍፋይሰርስ ፒፕሊን ክፍል Step1XEditPipelineV1P2 ነው (በፔይተን-ቼን የዲፍፋይሰርስ ፎርክ ላይ ይኖር ነበር፣ ቅርንጫፍ step1xedit_v1p2)። RegionE አማራጭ በመሆኑ በMLLM እንደተሻሻለ ምልክት በማድረግ በዲፍፋይሰርስ ውስጥ በመውጣት ውጤቱን ያፋጥናል።

የተጫኑ ምስሎች ማስተካከያ ከተጠናቀቀ በኋላ በፍጥነት ይታጠፋሉ. ውጤቱ ለ 24 ሰዓታት (ለተከፍሉ ተጠቃሚዎች 7 ቀናት) በ CDN ላይ ይቀመጣል ስለዚህ ከ /account/?tab=history መጫን ይችላሉ. ለልምምድ ላለመጠቀም አይጠቀሙበትም. የግል መረጃ ፖሊሲ በ /privacy/ ላይ ነው።

አዎ - POST multipart ወደ /v1/image/edit/ ምስል ጋር, ሞዴል=step1x-edit, ኦፕሬሽን=img2img (ወይም inpaint / outpaint / style_transfer / ወዘተ), ጥያቄ, ምርጫ enable_thinking, enable_reflection, እርምጃዎች (የተለመደው 50), guidance_scale (የተለመደው 6.0). Bearer auth, 10K ቶኮኖች / ወር ነጻ. /api/ curl ምሳሌዎች አለው.

Free.aiን ወዳለህ? ወዳጆችህን ንገራቸው!

ይህ ገጽ