Man fragt sich natürlich wieder, was den größeren Unterschied an der schönen Diskrimination zwischen den 3 hauptsächlich getesten Engines ausmacht, das Format des Tripel- Spießrutenlaufes oder das buchlose Match, natürlich wohl doch deutlich Ersteres, aber um ohne Eröffnungs- Vorgaben auszukommen, ist es wohl auch besonders gut geeignet.
Für klassische Matches wären vielleicht 2- Züger, die ja auch schon ziemlich viel Möglichkeit zur Varianz bieten, zu überlegen als Alternative zu längzügigeren Vorgaben, die dann, um nicht noch mehr Remis zu haben als die Grundstellung selbst, absichtlich das Vermeiden vom Ausgleich des in der Grundstellung noch vorhandenen Anzugsvorteils einbauen ("Uho"). Sind die gängigsten Eröffnungen deshalb so gängig, weil sie von schwarzer Seite eben genau das schon erreicht haben, (den Anzugsvorteil von Weiß auszugleichen), muss man diese in der Theorie als besonders remisträchtig bekannten Hauptvarianten ausklammern, damit klammert man aber halt natürlich schon genau das aus, was von Menschen am meisten (und aus gutem Grund am meisten) gespielt wird. Wenn die Engines, weil nach 4 Halbzügen mit den Vorgaben Schluss ist, auch diese Hauptvarianten von sich aus wählen und spielen können, sagt das über ihre Eröffnungsstärke meiner Meinung nach schon mehr aus, als wenn man ihnen das absichtlich durch die Vorgaben verbietet. Natürlich kämen nach vorgegeben 4 Halbzügen, die ihrerseits nicht die ausschließlich ungewöhnlichsten Möglichkeiten dieser ersten 4 plies darstellen würden, wieder stark dominant diejenigen Abspiele vor, die in der menschlichen Theorie auch die häufigen sind, aber wäre das nicht immer noch Theorie- relevanter als der umgekehrte Weg, diesen Großteill durch die Vorgaben zu vermeiden?
http://talkchess.com/forum3/viewtopic.php?p=931882&sid=5e4627d8bf8b146542f36cb523ea34ce#p931882Remistod hin oder her, will man sehen, wie die Engines aus der frühen, grundstellungsnahen Eröffnung selbst spielen, muss man Remis in Kauf nehmen, statistisch schaden sie ja sowieso überhautp nicht, im Gegenteil, die error bar bleibt mit ihrer Zahl niedriger als wenn man sie durch 1:1- Paare bei gleicher Performance ersetzt, man braucht also sogar weniger Partien für die gleiche statistische Relevanz der gleichen Matches (unter gleichen Teilnehmern mit der gleichen Hardware- Zeit) man hat halt keine gespreizten Elo (man könnte ja statt dessen eigentlich auch genau so gut Centielo zählen), sondern ungespreizte, und wenn 2 Engines gleich stark sind in ungespreizten, nicht weiter unterteilten Abständen, so what? Sollte man damit nicht auch langsam zu leben lernen? Dass manch ein vermeintlicher Fortschritt nicht messbar ist? Hindert einen ja nicht daran, weiter zu versuchen, einen zu erreichen, der sich dann eben ohne beliebig weite Spreizung des Erreichten auch in den Ergebnissen auswirkt.
Und um spezielle Fähigkeiten zu testen, die vor allem anfangen sollten, die Eröffnungs- Stärke selektiv von der im Mittel- und im Endspiel zu trennen, weil sie sonst sowieso immer zu einem (Mittelspiel) bzw. 2 Drittel (Endspiel) untergehen, diese Stärken, relativ zur Eröffnungsstärke im klassichen eng-eng-match, weil dieses mit immer wieder denselben Eröffnungen diejenigen Mittel- und Endspiele, die im Match nicht aufs Brett kommen, eben nicht testet. Für solche zusätzliche Fähigkeiten kann man Zusatztests machen, deren Elo sind dann eigene, aber das sind sowieso schon lange alle anderen (Elo) auch.
Und wenn man sich nicht auf Stellungstests verlassen will, die nicht ausgespielt werdenl, muss man halt Mittelspiel- Stellungen und Endspielstellungen extra ausspielen lassen, wär doch auch mal was. Und die Gesamtperformance würde sich dann aus wenig gespreizter Eröffnung und beliebig gespreiztem Mittel- und Endspiel ergeben.