Step1X-Edit v1p2

Free.ai (self-hosted) · image_edit · ~1000 tokens per edit

Lasciari un figghiu chistu o cliccari pi sfogghiari

~1000 tokens per edit

Step1X-Edit-v1p2 (ReasonEdit-S, released Nov 2025) — Apache 2.0. StepFun's reasoning image-edit model: pairs a DiT-based decoder with an MLLM front-end, then adds a thinking + reflection pass around the diffusion forward. Trained to match GPT-4o / Gemini-2-Flash edit quality on KRIS-Bench and GEdit-Bench, especially on multi-step, referential, and abstract edits ("fix what looks wrong about her left hand", "match the lighting in this room to a sunset"). Self-hosted on Free.ai's H200 (dedicated venv-step1x-edit). The reflection pass costs ~25-50 s per 1024-side edit but catches the drift artifacts plain diffusion edits often produce. Free tier for /image/edit/ reasoning-mode operations.

Usare via API
curl -X POST https://api.free.ai/v1/image/edit/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"step1x-edit","prompt":"your prompt here"}'
Documentazione Otteni a chiave API

Dumande frequenti

Step1X-Edit-v1p2 (ReasonEdit-S) hè u mudellu di edizzioni di l'imaghjini di StepFun — rilasciatu u Novembre 2025 sottu Apache 2.0. Duve Qwen-Image-Edit siguìa istruzioni dirette ("fà u celu viola"), Step1X-Edit siguìa ragiunamenti supra a modificazioni multi-passu, rifirimentali, è astratta ("accoppiari l'illuminazione di sta stanza a un tramontu d'ora d'oru", "arrigistra ciò chì pare anatomicamente sbagliatu di a so manu manca"). Esegue un passaghju di raggiunamentu + riflessione in torno à a diffusione avanti, addestratu à accoppiari GPT-4o / Gemini-2-Flash qualità di edizione in KRIS-Bench e GEdit-Bench. Auto-ospitatu in Free.ai's H200 — senza fornituri upstream, senza marcatura.

Qwen-Image-Edit-2511 hè u più veloci di l'istruzzioni-edizione libere in Free.ai — ~10-15 secondi per edizione, backbone MMDiT cù un codificatore di testu Qwen.5-VL. Step1X-Edit hè u fratellu più lentu è intelligente: un decodificatore DiT più un front-end MLLM separatu chì esegue un passaghju di riflessione (riformatta u prompt per u diffusore) è un passaghju di riflessione opziunale (compara i candidati, scegli u megliu). Usa Qwen per l'edizioni dirette; usa Step1X quandu u prompt hà bisognu d'interpretazione, hà clausuli multipli, o rifirisci à qualcosa fora di u frame.

Quessi sò i mudelli premium chì si instradanu attraversu i fornitori pagati (fal.ai upstream) è costanu token 30K-112K per edizione. Step1X-Edit hè completamente auto-ospitatu nantu à l'H200 di Free.ai sottu Apache 2.0 è costa ~ 2,000 token. I modelli premium sò ancora avanti in a fedeltà grezza per a fotografia di u pruduttu è a preservazione di u disegnu graficu; Step1X vince in i suggerimenti di ragionamentu è hè l'alternativa aperta più forte chì spedimu.

Multi-passu ("rimuvi la filigrana e poi scalda a timpiratura dû culuri"), rifirimintali ("cunfurmi l'inquadratura di na Polaroid di u 1985"), interpretivu ("fà ca l'esprissioni pari cchiù sicura"), riparazzioni-stile ("arrigistra la manu", "radica l'urizzuntu"), e astrattu ("fà ca stu parra comu na riminzioni"). Pi l'edizzioni "cancia X a Y", Qwen-Image-Edit è cchiù veloci.

~2,000 tokens per edit — duppiu di u standard rate di edit di l'imaghjini (1,000 tokens) picchì u pensamentu + riflessione passa circa u duppiu di u tempu di l'orologiu di a muratura vs Qwen-Image-Edit. L'utenti anonimi piglianu 2,500 tokens gratuiti/giornali; l'utenti registrati piglianu 30,000/giornali — abbastanza per ~15 edit di raggiunamentu ogni ghjornu senza pagà.

~25-50 siconni pi ogni 1024-pagina di modificazioni cu riflessione abilitata (predefinitu). Disattivannu a riflessione (enable_reflection=false) cade a ~15-25 siconni cu na piccula accurtezza di risposta a li dumande multi-passu. U passaggiu riflessione cattura u modu di fallimentu "a manu hè stata arrigistrata ma accidentalmenti u sfondo hè statu canciatu" ca si trova assai spissu cu li modificazioni di diffusione.

Apache 2.0 — sia i pesi (huggingface.co/stepfun-ai/Step1X-Edit-v1p2) sia u repositoriu GitHub (github.com/stepfun-ai/Step1X-Edit). Nisun carve-outs territoriali, nisun MAU cap, nisun rider non-commerciale, nisun clausula di ricerca. L'imaghjini chì generate sò vostre per l'usu cummerciale senza royalties.

~22 GB di piccu di risistenza cù u scaricamentu di u CPU di u mudellu (trasformatore + VAE in GPU durante u forward; MLLM + codificatore di testu pagatu da CPU). 41.8 GB in discu. Riservamu un slot di 24 GB in H200 è l'incapsulamentu si interrompe à l'avviamentu se a VRAM libera scende sottu à 18 GB. Per l'auto-ospita vi servi una scheda di 24 GB (RTX 4090) almenu, idealmente 40 GB + per u spaziu.

Sì — passate enable_thinking=false pi saltà u passaggiu di riformattazione di u MLLM, o enable_reflection=false pi saltà u turnu di selezzioni multi-candidati. Senza l'unu nè l'autru, Step1X si cumporta comu un editori d'imaghjini DiT à ~12-15 s/edit. Mantenu tutti dui attivi di manera predefinita picchì hè ciò chì u mudellu hè addestratu a fà è batte a diffusione pura in i suite di benchmark.

Step1X-Edit-v1p2 (ReasonEdit-S) accùppia un dicodificaturi basatu supra a DiT cu un front-end MLLM di la famigghia Qwen.5-VL. U MLLM interpretra l'istruzzioni di edizzioni; u dicodificaturi DiT pinza a modifica. A classa di pipeline di diffusuri è Step1XEditPipelineV1P2 (viva supra a furchetta Peyton-Chen di diffusuri, ramificazzioni step1xedit_v1p2). RegionE accellera l'infirienza saltannu a diffusiuni ntê riggiuni ca u MLLM marca comu incanciati.

L'imaghjini caricati sò eliminati immediatamente dopu a fini di l'edizzioni. L'output si trova in u nostru CDN per 24 ore (7 ghjorni per l'utenti pagati) cusì chì pudete scaricà di novu da /account/?tab=history. Mai usatu per l'addestramentu. Politica di privacy à /privacy/.

Sì — POST multipart à /v1/image/edit/ cù image, model=step1x-edit, operation=img2img (o inpaint / outpaint / style_transfer / ecc.), prompt, opziunali enable_thinking, enable_reflection, steps (default 50), guidance_scale (default 6.0). Bearer auth, 10K tokens/month free. /api/ hà esempi curl.

Amuri Free.ai? Dì i vostri amichi!

Vota sta pàggina