Ang Arena!
> Dalawang modelo, parehong prompt, bulag boto. Ikaw ay magpasya kung aling AI ay mas mahusay.
> Ipasok ang isang prompt at pindutin ang Battle upang magsimula
> Models ay pinili nang walang tiyak na pagkakasunud-sunod at nakatago
Talaan ng mga manlalaro
| # | Modelo | Ang Elo! | Nanalo | Pagkawala | Mga Larawan | Win Rate |
|---|---|---|---|---|---|---|
| 1 | Qwen3 8B | 1233 | 3 | 0 | 8 | 27% |
| 2 | Kimi K2.5 | 1216 | 1 | 0 | 0 | 100% |
| 3 | Deepseek Chat V3 0324 | 1215 | 1 | 0 | 1 | 50% |
| 4 | Mistral | 1211 | 4 | 3 | 3 | 40% |
| 5 | Gpt 4O Mini | 1200 | 1 | 1 | 0 | 50% |
| 6 | Llama 3.3 70B Instruct | 1200 | 0 | 0 | 1 | 0% |
| 7 | Qwen7B | 1185 | 2 | 3 | 7 | 17% |
| 8 | Gemini 2.5 Pro | 1184 | 0 | 1 | 0 | 0% |
| 9 | Deepseek R1 7B | 1171 | 1 | 3 | 2 | 17% |
| 10 | Claude Sonnet 4 | 1168 | 0 | 2 | 0 | 0% |
24 total votes. ELO ratings update after each vote.