Hallo,
viele fragen sich ob sich Ratings, erzeugt durch eine komplett andere neue Gegnerschaft, sich wirklich verändern.
Vor kurzer Zeit hatte ich den CEGT zu SWCR gepostet.
Zu dem speziellen Vergleich von ChessTiger 2007 hatte niemand etwas hinzugefügt.
Schauen wir uns den Vergleich nochmals an!http://www.amateurschach.de/swcr/swcr-to-cegt-30082011.htmUnd gezielt auf die Nummer 158 der SWCR,
ChessTiger 2007.
In der CEGT spielte ChessTiger 2007 über 3.400 Partien gegen Gegnerschaft die vor einigen Jahren aktuell war. In der SWCR wurden die über 3.000 Partien gegen aktuelle Engines erspielt. Fabien schrieb mir vor ein paar Monaten mal, dass es ja ungerecht wäre, ChessTiger 2007 heute bei meinen Turnieren, Spießroutenläufen mitlaufen zu lassen, die Engine wäre zu weit hinten. Tja, genau das war der Grund warum ich das gemacht habe. ChessTiger 2007 hatte im Unterschied, wie seinerzeit zur CEGT, also mit deutlich stärkeren Programmen zu kämpfen.
Schauen wir uns den Vergleich an, stellen wir fest, ein ganz sicher messbares Ergebnis nach je über 3.000 Partien aufgrund 20 Punkte Differenz. ChessTiger 2007 spielt gegen stärkere Gegnerschaft 20 ELO besser. Grundsätzlich ist es durchschnittlich so, dass die Schwächeren den klar Stärkeren durchschnittlich 3 ELO rauben. Zumindest ist es bei den aktuellen Engines in der SWCR der Fall. Verbleiben aber noch 17 ELO.
Wie sind die 17 ELO zu erklären?
Wahrscheinlich durch die ...
A)
komplett anderen Gegner, immerhin hat ChessTiger bei mir 3.040 Partien : 40 Partien Matches = 76 verschiedene Engine Versionen gehabt bzw. 40 verschiedene Gegner. Weitere Partien kommen durch das SWCR Oldie Mix Turnier sehr bald hinzu.
B)
ChessTiger 2007 hat besondere Stärken im Mittelspiel. Das fällt auch heute auf, denn die Ergebnisse gegen deutlich schwächere sind besser als bei anderen aktuellen Engines dieser Spielstärke. ChessTiger 2007 erreicht mehr Remispartien gegen deutlich schwächere. Aufgrund meiner Statistiken kommt dieses mehr an Remispartien in der Partiephase 45 - 65 Züge zu Stande. Geht ChessTiger 2007 mit leichten Nachteilen oder ausgeglichen in ein Endspiel gegen aktuelle TOPs, ist die Engine wie auch die anderen Engines dieser Spielstärke chancenlos (kein statistischer Unterschied zu sehen).
Insofern kann die Frage dennoch nicht so ganz beantwortet werden.
Sind es die besonderen Stärken, die ChessTiger auch seinerzeit zu einer TOP-Engine machten (die Sourcen sind ja bekanntlich nicht frei) und mit ca. 15-20 Vorsprung seinerzeit zu Engines mit freien Sourcen zu betrachten wären oder ist es die komplett andere Gegnerschaft an sich. Ich kann das nicht beurteilen, müsste von allen Engines SWCR Engines ca. 3.000 Partien haben um versuchen zu differenzieren welcher der beiden Punkten mehr ausschlaggebend ist.
Fest steht, vermutlich einer dieser beiden Punkte sorgt für 20 ELO.
Sind es die völlig anderen Gegner, so liegt die Vermutung Nahe, dass die Inzucht durch Eng-Eng Matches Engines um ca. 15 ELO nach vorne getrieben hat (Verwendung gleicher Ideen, durch bekannte Sourcen). Um das natürlich zu bestätigen müsste ein vergleichbarer Test mit weiteren anderen Engines wiederholt werden ->
die brennend heiße Frage an sich !Kein Problem:
Sehr bald läuft das Oldie-Mix Turnier. Anschließend sind diesbezügliche Statistiken problemlos möglich.
Kleiner Vorgeschmack auf das was im Oktober bei der SWCR laufen wird.
Viele Grüße
Frank
Die Beschäftigung mit etwas tieferen Themen als blanke Zahlen ist einer der Reize an einer organisierten Ratingliste. Die Daten, sprich Partien, lassen jede erdenkliche Statistik zu ... der Fantasie ist hier keine Grenze gesetzt. Ob die gemutmaßten Rückschlüsse dann immer richtig sind ist eine andere Frage. Aber zumindest mal welche versuchen zu entwickeln ist interessanter als die blanken Zahlen verpuffen zu lassen.