Die aktuelle Spitzenschachprogramme (Stockfish, Obsidian, PlentyChess, Berserk, Alexandria) liegen sehr dicht beisammen.
Je kleiner der Abstand der Spielstärke, umso größer die Anzahl der Remispartien. Je Größer die Anzahl der Remispartien, umso schwieriger ist es festzustellen dass Programm A besser spielt als Programm B, denn die Abweichungen vom errechneten Spielstärkewert überschneiden sich meist schon mit dem Wert des nächsthöheren oder -niedrigeren Programms.
Man kann jetzt versuchen, die Anzahl der Gewinnpartien zu erhöhen und dadurch die Remisquote zu reduzieren. Damit zieht man die Abstände zwischen den Programmen auseinander und die Abweichungen überschneiden sich nicht mehr. Nur wie komme ich aber zu mehr Gewinnpartien?
Die einzige Möglichkeit ist, von gleichen Startbedingungen für beide Programme, zu ungleichen Bedingungen zu wechseln. Dafür gäbe es mehrere Möglichkeiten, z.B. Vorgabepartien, ungleiche Bedenkzeiten, Spielbeginn von Stellungen mit ungleichen Gewinnchancen,...Selbstverständlich muss man die Ungleichheit durch vertauschen der Farben wieder ausgleichen, aber es wird gemessen wer besser mit der Ungleichheit umgehen kann.
Ratinglisten aus Vorgabepartien oder Listen mit unterschiedlicher Bedenkzeit sind mir keine bekannt. Für ungleiche Gewinnchancen steht die sehr gut dokumentierte UHO-Rateinglist. Hier wird die Ungleichheit der Gewinnchancen mit ausgewählten Stellungen nach 6 Eröffnungszügen erreicht.
Die aktuelle Liste, für die eingangs erwähnten Programme, würde beim Schreiben dieses Eintrags so aussehen:
1 Stockfish 17.1 : 3854 4 4 15000 68.3% 3716 48.7%
2 Obsidian 16.0v a512 : 3783 4 4 15000 58.5% 3721 49.5%
3 PlentyChess 6.02 a512 : 3763 4 4 15000 55.6% 3723 50.3%
4 Berserk 250606 a512 : 3753 4 4 15000 54.2% 3723 49.4%
5 Alexandria 8.0 a512 : 3721 4 4 15000 49.5% 3725 50.3%
Mich hat interessiert, ob eine Liste die die höhe Remisquote in Kauf nimmt, andere Ergebnisse bringt. Dazu habe ich diese 5 Programme (teilweise geringfügig ältere Versionen) jeweils 500 Partien mit Rückrunde mit dem 8moves Eröffnungsbuch gegeneinander spielen lassen.
1 stockfish-17.1 : 3856 4 4 4000 56.4 % 3811 85.8 %
2 Obsidian160 : 3826 3 3 4000 51.1 % 3818 90.7 %
3 PlentyChess-5.0 : 3808 3 4 4000 47.8 % 3823 89.5 %
4 Berserk_20250307 : 3807 3 4 4000 47.6 % 3823 89.3 %
5 Alexandria-8.0 : 3804 3 4 4000 47.1 % 3824 89.4 %
Man sieht deutlich, währen die Remisquote bei ungleichen Gewinnchancen bei ca 50% liegt, ist sie bei gleichen ca 90%. Auch der Abstand zwischen der Nummer 1 und der Nummer 5 ist bei ungleichen Gewinnchancen 153 Punkte und bei gleichen 52 Punkte. Wichtig zu sehen ist, nicht die Programme haben sich geändert, auch nicht der Abstand zueinander, sondern die Art zu messen.
Abschließen möchte ich mit einem Zitat von Anton Zeilinger:
"Die Quantenphysik lehrt uns, dass wir die Wirklichkeit nicht ganz erfassen können.
Was wir erfassen können, sind nur Messergebnisse. Und das sind letztlich Aussagen über die Versuchsanordnung - nicht über die Wirklichkeit an sich."