Elo-Zahl
aus Wikipedia, der freien Enzyklopädie
Das Elo-System ist ein objektives Wertungssystem, das es erlaubt, die Spielstärke von Go- und Schachspielern durch eine Wertungszahl (kurz: Elo-Zahl) zu beschreiben. So gibt es beim Schach 9 Klassen, die sich jeweils um 200 Wertungspunkte unterscheiden. Ein Unterschied von einer Klasse bedeutet, dass der bessere Spieler als Ergebnis einer Partie 0,75 Punkte erwarten darf. Das System wurde von Arpad Elo in den 1960er Jahren entwickelt und auf dem FIDE-Kongress in Siegen 1970 eingeführt.
Neben der FIDE-Elo existieren auch noch nationale Wertungssysteme, mit unterschiedlichen Namen. In Deutschland heißt das nationale Wertungssystem DWZ, in Österreich und in der Schweiz heißt es ebenfalls Elo, in der Berechnung unterscheiden sich diese Systeme aber meist nur durch verschiedene kleinere Faktoren.
Inhaltsverzeichnis |
[Bearbeiten] Berechnung
Jemand, der zum Beispiel gerade in den Schachklub eingetreten ist, hat noch keine Elo-Zahl. Nach einer Reihe von Partien gegen verschiedene Spieler wird seine Elo-Zahl zunächst eingeschätzt. Nach dieser Phase werden die tatsächlichen Ergebnisse der Partien für den Elo-Punktestand gewertet.
Für die jeweilige Berechnung des neuen Elo-Stands ist die erwartete Punktezahl wichtig, die Spieler A gegen Spieler B voraussichtlich erreicht; dabei gilt wie üblich: für einen Sieg gibt es einen, für ein Unentschieden einen halben und für eine Niederlage keinen Punkt.
Anmerkung: Gäbe es kein Remis, so wäre die erwartete Punktezahl gerade die Wahrscheinlichkeit, dass A gewinnt. Da eine Schachpartie auch unentschieden enden kann, ist der erwartete Punktestand gleich der Wahrscheinlichkeit zu gewinnen plus einhalb mal der Wahrscheinlichkeit zu remisieren. Die Wahrscheinlichkeiten für Sieg, Remis und Niederlage werden im Elo-System gar nicht benötigt, sondern nur die Erwartungswerte.
-
- EA: Erwarteter Punktestand für Spieler A. Bei einer Serie von 5 Spielen kann man auch EA mit 5 multiplizieren.
- RA: bisherige Elo-Zahl von Spieler A
- RB: bisherige Elo-Zahl von Spieler B
Der Erwartungswert für A beträgt nun EA · 100 %.
-
- k: ist üblicherweise 15, bei Top-Spielern (Elo > 2400) 10, bei weniger als 30 gewerteten Partien 25
- SA: tatsächlich gespielter Punktestand (1 für jeden Sieg, 0,5 für jedes Unentschieden, 0 für jede Niederlage)
- R'A: Neue Elo-Zahl von Spieler A
Anmerkung 1: Die in der Formel enthaltene Zahl 400, sowie der ursprüngliche k-Faktor wurden von Arpad Elo so gewählt, dass die Elo-Zahlen mit den Wertungszahlen des früher verwendeten Rating-Systems von Kenneth Harkness möglichst gut kompatibel sind. Tatsächlich kann man das Harkness-Modell als eine stückweise lineare Approximation an das Elo-Modell auffassen.
Anmerkung 2: Es lässt sich auf mathematischem Wege leicht zeigen, dass gilt: EA + EB = 1
[Bearbeiten] Ein (erfundenes) Beispiel
Der Schachspieler Garri Kasparow (Elo: 2806) spielt gegen die Schachspielerin Zsuzsa Polgar (Elo: 2577). Gemäß der ersten Formel erwartet man, dass Kasparow (Spieler A) gegen Polgar (Spieler B) im Mittel EA = 0,789 Punkte pro Spiel bekommt:
Nach einem Spiel gibt es drei Möglichkeiten:
[Bearbeiten] Polgar gewinnt
Also SA = 0. Die neuen Elo-Punktestände R'A für Kasparow und R'B für Polgar sind dann
Kasparow büßt also acht Elo-Punkte ein, während Polgar acht Elo-Punkte gewinnt.
[Bearbeiten] Kasparow gewinnt
Also SA = 1. Dann bekommt Kasparow zwei weitere Elo-Punkte, und Polgar verliert zwei:
[Bearbeiten] Unentschieden
Also SA = 0,5. Kasparow verliert drei Elo-Punkte, Polgar gewinnt drei:
[Bearbeiten] Schach
Nach der Wertungszahl kann man Schachspieler folgenden Kategorien zuordnen:
Elo-Zahl | Kategorie |
---|---|
ab 2700 | Super-Großmeister |
2500-2699 | Großmeister |
2400-2499 | Internationaler Meister |
2300-2399 | FIDE-Meister |
2200-2299 | Candidate Master bzw. Nationaler Meister |
2000-2199 | Meisteranwärter, Experte |
1800-1999 | Amateur, Klasse A, sehr guter Vereinsspieler |
1600-1799 | Amateur, Klasse B, starker Freizeitspieler |
1400-1599 | Amateur, Klasse C, überdurchschnittlicher Spieler |
1200-1399 | Amateur, Klasse D, durchschnittlicher Hobbyspieler |
1000-1200 | unterdurchschnittlicher Hobbyspieler |
unter 1000 | Anfänger |
Zu beachten ist dabei, dass man die verschiedenen Titel Großmeister (GM) und Internationaler Meister (IM) nicht nur auf Grund einer bestimmten Elo-Zahl erhält, sondern durch die Erfüllung von anderen festgelegten Normen. Um den Titel nach Erfüllung aller Normen zu erhalten, muss ein angehender GM allerdings eine Elo-Zahl von mindestens 2500, ein IM eine Zahl von mindestens 2400 einmal erreicht haben.
Die typische Kaffeehausspielstärke liegt etwa zwischen 1400 und 1700, Spielstärken über 1800 werden von Nicht-Vereinsspielern selten erreicht.
Der Umfang einer Klasse beträgt 200 Elo-Punkte. Das System ist so geeicht, dass ein Unterschied von 200 Punkten einer Gewinnerwartung des stärkeren Spielers von 75% entspricht, 400 Punkte entsprechen knapp 94% Gewinnerwartung. Der Vergleich beruht auf statistischen Verfahren. Schon bei 600 Punkten Unterschied gewinnt der stärkere Spieler praktisch-statistisch immer, und zwar obwohl die Spielstärke bei Menschen natürlich von der Tagesform und Motivation abhängt. Die Verteilung ist bei Computern nicht nur per 200-Punkte-Definition gleich, sondern auch vom Kurvenverhalten her darüberhinaus sehr ähnlich, allerdings gibt es bei ähnlich starken Maschinen eine weitere Spielstärkenspreizung in den verschiedenen Partiephasen.
Die Berechnung der Zahl Elo wird durchgeführt durch den Vergleich von Schachspielern, die gegeneinander spielen.
[Bearbeiten] Statistik
Das Elo-System teilt die Schachspieler mit Hilfe einer Wertungszahl in neun Klassen ein, wobei die untere Grenze der obersten Klasse bei 2600 und die obere Grenze der untersten Klasse bei 1200 liegt. Die Wertungszahlen eines einzelnen Spielers sind intervallskaliert und normalverteilt; sie schwanken mit einer Standardabweichung von 200 um einen mittleren Wert. Es gibt viele Spieler mit Spielstärken unter 1200, das Elo-System ist auf diesem Spielniveau in der Vorhersagesicherheit aber nur eingeschränkt gültig. Wichtig ist insbesondere auf Hobbyspielerniveau, dass ein Spieler seine Zahl auch gegen stärkere Gegner verteidigen kann, ohne sich auf besondere Eigenschaften wie unbewusste psychische Schwächen oder schlechtes Zeitmanagement von Neulingen konzentrieren zu müssen. Utopische hohe Werte werden durch Niederlagen schnell, exakt und zuverlässig korrigiert. Die recht stabile Elo-Zahl wird mit verschiedenen Verfahren ermittelt. Manche gehen von wenigen Spielen aus oder von ähnlich starken Turnierteilnehmern, nach vielen Partien erreichen alle sehr ähnliche Gleichgewichte.
Grundlage der Berechnung ist die Hypothese, die Verteilung der Spielstärke in der Gesamtheit der Spieler entspreche mathematisch der Normalverteilung (Gaußsche Glockenkurve). Ausgehend von dieser Hypothese lässt sich für zwei Gegner statistisch voraussagen, mit welcher Wahrscheinlichkeit der eine Spieler gewinnen wird. Im Sonderfall der identischen Wertungszahl sind die Wahrscheinlichkeiten gleich hoch. Bei einem Turnier lässt sich anhand der Wertungszahl eines Spieler und des Durchschnitts der Wertungszahlen seiner Gegner voraussagen, welche Punktzahl er wahrscheinlich erzielen wird. Nach Abschluss des Turniers wird das tatsächliche Ergebnis mit dem statistisch vorausgesagten Ergebnis verglichen und aus der Abweichung die neue Wertungszahl des Spielers errechnet.
[Bearbeiten] Probleme von Rating-Systemen
[Bearbeiten] Intransitivität
Ist Spieler A gegenüber Spieler B der Favorit und B gegenüber C, so besitzt A ein höheres Rating als B und B ein höheres als C. Damit besitzt A ein höheres Rating als C und müsste Favorit gegenüber C sein. Diese Folgerung ist aber keineswegs korrekt, da Wahrscheinlichkeitsrelationen i. A. nicht transitiv sind (vgl. "Chinesische Würfel" oder "Intransitive Würfel") – dieses Problem ist natürlich keine Besonderheit des Elo-Systems, sondern ein prinzipielles Problem aller Rating-Systeme.
Das Elo-System trifft nicht nur eine qualitative Aussage bezüglich des Verhältnisses von A zu C, sondern sogar eine quantitative. Lässt man einmal die Möglichkeit von Remis außer acht, so kann man die Grundidee des Elo-Systems an folgendem Beispiel erklären: Angenommen Spieler A ist gegenüber Spieler B ein 3:1-Favorit (d. h. A gewinnt 75 % der Partien gegen B), B sei gegenüber C ein 2:1-Favorit, so fordert bzw. folgt aus Elo's-Modell, dass A gegenüber C ein 6:1-Favorit ist (obwohl A nicht einmal der Favorit zu sein braucht, s. o.)
Allgemein: Ist A ein x:1-Favorit gegenüber B und B ein y:1-Favorit gegenüber C, so ist gemäß Elo's Modell A ein xy:1-Favorit gegenüber C. Dies kann man leicht nachrechnen; diese Multiplikativität ist aber keine Konsequenz aus einer Normal- bzw. logistischen Verteilung. Man liest zwar oft, dass das Elo-Modell von einer dieser Verteilungen ausgeht, doch genügen diese Verteilungen nur sehr grob näherungsweise der Forderung nach Multiplikativität; sodass die Forderung nach Multiplikativität den besseren Ausgangspunkt für die Entwicklung des Modells darstellt.
[Bearbeiten] Deflation und Inflation
Will man mithilfe der Elo-Zahlen – oder anderer Ratings, dies betrifft nicht nur das Elo-System – die Stärken von Spielern aus unterschiedlichen Epochen vergleichen, so sollte ein Rating von z. B. 1600 aus dem Jahre 1970 gleichbedeutend mit einem Rating von 1600 aus dem Jahre 2000 sein. Insbesondere sollte, da sich infolge der Weiterentwicklung der Theorie die durchschnittliche Spielstärke im Laufe der Zeit zumindest nicht verschlechtert, sich die mittlere Ratingzahl nicht verringern.
Beim Elo-System gewinnt der Sieger einer Partie genau soviele Rating-Punkte hinzu, wie der Verlierer einbüßt: die mittlere Spielstärke beider bleibt gleich. Umfasst der Ratings-Pool nur Spitzenspieler, so ist folgendes Phänomen zu beobachten: Sooft ein Spieler neu in die Ratings aufgenommen wird, tritt er mit einer gewissen (niedrigen) Punktezahl ein. Im Laufe seiner Karriere verbessert er seine Stärke, gewinnt Punkte hinzu, und scheidet später mit einer (hohen) Punktezahl aus – dadurch werden der Gesamtheit Punkte entzogen, und die mittlere Ratingzahl sinkt; d. h. das System ist deflationär.
Vergrößert man den Ratings-Pool, so tritt der entgegengesetzte Effekt auf: Viele Spieler verlassen den Ratings-Pool mit einem niedrigeren Rating, als ihnen bei Eintritt zugemessen wurde – das System wird nun inflationär.
Dies war insbesondere früher der Fall, als der Weltschachbund FIDE Schachspieler erst ab einer Wertungszahl von 2200 in die Rangliste aufnahm. Da die Elo-Auswertung von Turnieren gebührenpflichtig ist und damit für die FIDE eine Einnahmequelle darstellt, wurde diese Schwelle immer weiter herab gesenkt, derzeit liegt sie bei 1400. Dennoch lässt es sich nicht vermeiden, dass viele Spieler den Ratings-Pool mit niedrigeren Wertungszahlen verlassen als sie bei Eintritt erhielten.
Eine maßvolle Inflation ist jedoch durchaus wünschenswert, diese sollte in ihrem Ausmaß der Weiterentwicklung der Spielstärken im Laufe der Zeit Rechnung tragen, allerdings ergibt sich hier zumeist das Problem einer zu großen Inflation.
So konnten die Elo-Zahlen immer neue Rekorde erreichen, ohne eigentlich noch ein Maß für die Spielstärke absolut zu sein. Vor ca. 20 Jahre gab es z. B. nur zwei Spieler mit einer Elo-Zahl größer 2700, und nur ca. 10-20 Spieler erreichten einen Wert größer 2600.
[Bearbeiten] Das Tausend-Partien-Problem
Ein weiteres Phänomen ist das sogenannte Tausend-Partien-Problem: Oft treffen Spieler der gleichen Spielstärke immer wieder aufeinander. Angenommen, zwei Spieler mit Elo 2000 spielen zehn Partien, bei denen der eine 80 % der Punkte erreicht. Nach der Berechnung der neuen Elo-Zahl ergeben sich die Werte 2080 für den Sieger und 1920 für den Verlierer. Tragen die beiden Spieler jedoch 1000 Partien mit gleichem Punkteverhältnis aus, so ergibt sich für den Sieger eine neue Wertungszahl, die höher als die des aktuellen Weltmeisters ist. Die heute üblichen Turniere gerade in der Weltspitze fördern also die Inflation der Zahlen.
Die Entwicklung der Wertzahlen wird auch von der Auswertungsperiode beeinflusst. Wurde bis 2002 nur halbjährlich ausgewertet, so wurde die Periode jetzt auf drei Monate verkürzt. Sinnvoll wäre prinzipiell eine Auswertung nach jedem Turnier, da so Formschwankungen von Spielern besser ausgeglichen werden können. Allerdings ist das derzeit nicht geplant.
[Bearbeiten] Spielstärken ausgewählter Schachspieler
Der ehemalige Schachweltmeister Garri Kasparow erreichte 1999 die bisher unübertroffene Elo-Zahl von 2851 Punkten. Großmeister kommen normalerweise auf eine Elo-Zahl von mindestens 2500, ab 2600 Punkten kann man von der erweiterten Weltspitze sprechen. Die nach FIDE-Auswertung zwanzig am höchsten bewerteten Spieler waren (Oktober 2006):
Rang | Name | Rating | Land |
---|---|---|---|
1 | Wesselin Topalow | 2813 | BUL |
2 | Viswanathan Anand | 2779 | IND |
3 | Wladimir Kramnik | 2750 | RUS |
4 | Pjotr Swidler | 2750 | RUS |
5 | Alexander Morosewitsch | 2747 | RUS |
6 | Wassyl Iwantschuk | 2741 | UKR |
7 | Lewon Aronjan | 2741 | ARM |
8 | Péter Lékó | 2741 | HUN |
9 | Michael Adams | 2735 | ENG |
10 | Boris Gelfand | 2733 | ISR |
11 | Teymur Räcäbov | 2729 | AZE |
12 | Şähriyar Mämmädyarov | 2728 | AZE |
13 | David Navara | 2725 | CZE |
14 | Alexei Schirow | 2720 | ESP |
15 | Wladimir Hakobjan | 2713 | ARM |
16 | Judit Polgár | 2710 | HUN |
17 | Alexander Grischtschuk | 2710 | RUS |
18 | Étienne Bacrot | 2705 | FRA |
19 | Gata Kamsky | 2705 | USA |
20 | Ruslan Ponomarjow | 2703 | UKR |
… | |||
30 | Arkadij Naiditsch | 2676 | GER |
… | |||
50 | Vadim Milov | 2657 | SUI |
… | |||
436 | Stefan Kindermann | 2532 | AUT |
[Bearbeiten] Historische Elo-Zahl im Schach
Hierzu ein eigenständiger Artikel: Historische Elo-Zahl
[Bearbeiten] Computerschach
Eine Rangliste ausgewählter Schachprogramme ist im gleichnamigen Artikel zu finden.
Diese Elo-Zahlen sind nicht ohne weiteres mit denen menschlicher Schachspieler zu vergleichen, da sie überwiegend durch Partien zwischen Computern ermittelt wurden und nicht durch Teilnahme an offiziellen Turnieren.
[Bearbeiten] Go
Bei Go wird die Spielstärke traditionell in Kyu- (Schüler) und Dan-Graden (Meister) angegeben.
Die Ermittlung dieser Spielstärke basiert innerhalb der European Go Federation und bei vielen Go-Servern im Internet auf einem von Elo abgeleiteten System, welches Kyu und Dan Grade wie folgt abbildet:
kyu / dan | Elo | Spielstärke und -erfahrung |
---|---|---|
30k | Regeln verstanden, aber noch keine Partie gespielt | |
29k - 28k | einige Partien gespielt | |
27k - 25k | einige Partien gegen Anfänger gewonnen | |
24k - 22k | einige Partien gegen Nicht-Anfänger gewonnen | |
21k - 18k | 0 - 349 | Hobby-Spieler |
17k - 14k | 350 - 749 | regelmäßiger Hobby-Spieler |
13k - 10k | 750 - 1149 | Club-Spieler |
9k - 5k | 1150 - 1649 | regelmäßiger Club-Spieler |
4k - 1k | 1650 - 2049 | guter Club-Spieler |
1d - 3d | 2050 - 2349 | sehr guter Club-Spieler |
4d - 7d | 2350 - 2649 | einer der besten Spieler seines Landes |
1p - 9p | 2650 - 2999 | professioneller Go-Spieler (aus Japan, Korea oder China), der stärker als ein Amateur-6dan spielt |