Question 1

Cosa hè Step1X-Edit?

Accepted Answer

Step1X-Edit-v1p2 (ReasonEdit-S) hè u mudellu di edizzioni di l'imaghjini di StepFun — rilasciatu u Novembre 2025 sottu Apache 2.0. Duve Qwen-Image-Edit siguìa istruzioni dirette ("fà u celu viola"), Step1X-Edit siguìa ragiunamenti supra a modificazioni multi-passu, rifirimentali, è astratta ("accoppiari l'illuminazione di sta stanza a un tramontu d'ora d'oru", "arrigistra ciò chì pare anatomicamente sbagliatu di a so manu manca"). Esegue un passaghju di raggiunamentu + riflessione in torno à a diffusione avanti, addestratu à accoppiari GPT-4o / Gemini-2-Flash qualità di edizione in KRIS-Bench e GEdit-Bench. Auto-ospitatu in Free.ai's H200 — senza fornituri upstream, senza marcatura.

Question 2

Cumu hè Step1X-Edit diversu da Qwen-Image-Edit?

Accepted Answer

Qwen-Image-Edit-2511 hè u più veloci di l'istruzzioni-edizione libere in Free.ai — ~10-15 secondi per edizione, backbone MMDiT cù un codificatore di testu Qwen.5-VL. Step1X-Edit hè u fratellu più lentu è intelligente: un decodificatore DiT più un front-end MLLM separatu chì esegue un passaghju di riflessione (riformatta u prompt per u diffusore) è un passaghju di riflessione opziunale (compara i candidati, scegli u megliu). Usa Qwen per l'edizioni dirette; usa Step1X quandu u prompt hà bisognu d'interpretazione, hà clausuli multipli, o rifirisci à qualcosa fora di u frame.

Question 3

In chì modu Step1X-Edit hè diversu da FLUX Kontext / Seedream / Nano Banana?

Accepted Answer

Quessi sò i mudelli premium chì si instradanu attraversu i fornitori pagati (fal.ai upstream) è costanu token 30K-112K per edizione. Step1X-Edit hè completamente auto-ospitatu nantu à l'H200 di Free.ai sottu Apache 2.0 è costa ~ 2,000 token. I modelli premium sò ancora avanti in a fedeltà grezza per a fotografia di u pruduttu è a preservazione di u disegnu graficu; Step1X vince in i suggerimenti di ragionamentu è hè l'alternativa aperta più forte chì spedimu.

Question 4

Quali prumpts funzionanu megliu cù Step1X-Edit?

Accepted Answer

Multi-passu ("rimuvi la filigrana e poi scalda a timpiratura dû culuri"), rifirimintali ("cunfurmi l'inquadratura di na Polaroid di u 1985"), interpretivu ("fà ca l'esprissioni pari cchiù sicura"), riparazzioni-stile ("arrigistra la manu", "radica l'urizzuntu"), e astrattu ("fà ca stu parra comu na riminzioni"). Pi l'edizzioni "cancia X a Y", Qwen-Image-Edit è cchiù veloci.

Question 5

Quantu costa Step1X-Edit?

Accepted Answer

~2,000 tokens per edit — duppiu di u standard rate di edit di l'imaghjini (1,000 tokens) picchì u pensamentu + riflessione passa circa u duppiu di u tempu di l'orologiu di a muratura vs Qwen-Image-Edit. L'utenti anonimi piglianu 2,500 tokens gratuiti/giornali; l'utenti registrati piglianu 30,000/giornali — abbastanza per ~15 edit di raggiunamentu ogni ghjornu senza pagà.

Question 6

Quantu tempu ci vole pi canciari una cosa?

Accepted Answer

~25-50 siconni pi ogni 1024-pagina di modificazioni cu riflessione abilitata (predefinitu). Disattivannu a riflessione (enable_reflection=false) cade a ~15-25 siconni cu na piccula accurtezza di risposta a li dumande multi-passu. U passaggiu riflessione cattura u modu di fallimentu "a manu hè stata arrigistrata ma accidentalmenti u sfondo hè statu canciatu" ca si trova assai spissu cu li modificazioni di diffusione.

Question 7

Cu quali licenza hè Step1X-Edit?

Accepted Answer

Apache 2.0 — sia i pesi (huggingface.co/stepfun-ai/Step1X-Edit-v1p2) sia u repositoriu GitHub (github.com/stepfun-ai/Step1X-Edit). Nisun carve-outs territoriali, nisun MAU cap, nisun rider non-commerciale, nisun clausula di ricerca. L'imaghjini chì generate sò vostre per l'usu cummerciale senza royalties.

Question 8

Di quali VRAM è hardware hà bisognu?

Accepted Answer

~22 GB di piccu di risistenza cù u scaricamentu di u CPU di u mudellu (trasformatore + VAE in GPU durante u forward; MLLM + codificatore di testu pagatu da CPU). 41.8 GB in discu. Riservamu un slot di 24 GB in H200 è l'incapsulamentu si interrompe à l'avviamentu se a VRAM libera scende sottu à 18 GB. Per l'auto-ospita vi servi una scheda di 24 GB (RTX 4090) almenu, idealmente 40 GB + per u spaziu.

Question 9

Possu disattivà i passi di pensamentu / riflessione per a velocità?

Accepted Answer

Sì — passate enable_thinking=false pi saltà u passaggiu di riformattazione di u MLLM, o enable_reflection=false pi saltà u turnu di selezzioni multi-candidati. Senza l'unu nè l'autru, Step1X si cumporta comu un editori d'imaghjini DiT à ~12-15 s/edit. Mantenu tutti dui attivi di manera predefinita picchì hè ciò chì u mudellu hè addestratu a fà è batte a diffusione pura in i suite di benchmark.

Question 10

Quali architittura l'alimentanu?

Accepted Answer

Step1X-Edit-v1p2 (ReasonEdit-S) accùppia un dicodificaturi basatu supra a DiT cu un front-end MLLM di la famigghia Qwen.5-VL. U MLLM interpretra l'istruzzioni di edizzioni; u dicodificaturi DiT pinza a modifica. A classa di pipeline di diffusuri è Step1XEditPipelineV1P2 (viva supra a furchetta Peyton-Chen di diffusuri, ramificazzioni step1xedit_v1p2). RegionE accellera l'infirienza saltannu a diffusiuni ntê riggiuni ca u MLLM marca comu incanciati.

Question 11

I caricamenti sò archiviati o usati per l'addestramentu?

Accepted Answer

L'imaghjini caricati sò eliminati immediatamente dopu a fini di l'edizzioni. L'output si trova in u nostru CDN per 24 ore (7 ghjorni per l'utenti pagati) cusì chì pudete scaricà di novu da /account/?tab=history. Mai usatu per l'addestramentu. Politica di privacy à /privacy/.

Question 12

C'è un API?

Accepted Answer

Sì — POST multipart à /v1/image/edit/ cù image, model=step1x-edit, operation=img2img (o inpaint / outpaint / style_transfer / ecc.), prompt, opziunali enable_thinking, enable_reflection, steps (default 50), guidance_scale (default 6.0). Bearer auth, 10K tokens/month free. /api/ hà esempi curl.

Step1X-Edit v1p2

Dumande frequenti