KI-Arena
Zwei Modelle, dieselbe prompte, blinde Stimme. Sie entscheiden, welche KI besser ist.
Geben Sie eine Eingabeaufforderung ein und klicken Sie auf Battle, um zu starten
Modelle werden nach dem Zufallsprinzip ausgewählt und versteckt
Leaderboard
| # | Modell | ELO | Gewinne | Verluste | Krawatten | Gewinnrate |
|---|---|---|---|---|---|---|
| 1 | Qwen3 8B | 1233 | 3 | 0 | 8 | 27% |
| 2 | Kimi K2.5 | 1216 | 1 | 0 | 0 | 100% |
| 3 | Deepseek Chat V3 0324 | 1215 | 1 | 0 | 1 | 50% |
| 4 | Mistral | 1211 | 4 | 3 | 3 | 40% |
| 5 | Gpt 4O Mini | 1200 | 1 | 1 | 0 | 50% |
| 6 | Llama 3.3 70B Instruct | 1200 | 0 | 0 | 1 | 0% |
| 7 | Qwen7B | 1185 | 2 | 3 | 7 | 17% |
| 8 | Gemini 2.5 Pro | 1184 | 0 | 1 | 0 | 0% |
| 9 | Deepseek R1 7B | 1171 | 1 | 3 | 2 | 17% |
| 10 | Claude Sonnet 4 | 1168 | 0 | 2 | 0 | 0% |
24 total votes. ELO ratings update after each vote.