Michael Scheidl schrieb:
Das ist schon sehr wichtig für menschliche Anwendungen, auch wenn der Unterschied in vielen konkreten Fällen nicht augenfällig sein mag. Die stärkere Engine genießt den größeren Vertrauensvorschuß, und das mit Recht.
Ja, ich sage ja auch nicht, dass die Ranglistencelo nichts mehr mit relevanter Spielstärke zu tun haben, die Art, wie sie erspielt werden, ist aber zu speziell, um auf alle oder auch nur die meisten Stellungen 1:1 übertragbar zu sein.
Ich probiere ja bei Stellungen, von denen ich noch nichts weiß, auch zuerst die top Gereihten, finde dadurch aber immer wieder heraus, dass Settings von ihnen, und sei es nur mal mehr und mal weniger Contempt, der verändert ist, vor Allem und oft genug aber auch wirklich andere Suchparameter, (Nullzug, LMRs, breitere oder auch schmälere Suchbäume) schneller weiter helfen und dass die dann auch im Ausspielen erfolgreicher sind, nicht unbedingt über Unmengen ganzer Partien, weil, wenn's eine Eröffnungsstellung oder eine Mittelspielstellung ist, die anderen Partiephasen vielleicht wieder von der default Version erfolgreicher bis zum Ende gespielt werden.
Aber über bestimmte Testlines geben, gerade auch mit backward gefülltem Hash immer wieder andere Versionen, Settings, Engines bessere Ergebnisse als die Ranglisten- Führer. Und auf jeden Fall auch zwischen den großen 3, um die's momentan geht, kehrt sich das Verhältnis von Ranglisten- Celo zu Stellungstestergebnis bei selektiveren Eröffnungs- Mittelspiel- und Endspielstellungen immer wieder um.
Diese Arbeit, das herauszufinden, kann dir beim Analysieren keine Rangliste abnehmen, ebensowenig wie das Forward- Backward selbst, um dann auch noch eigens zu testen, ob das Hashlernen der einen oder der anderen Engine besser für die jeweilige einzelne Stellung funktioniert.
Und der Hauptpunkt ist, dass die Anwendung Grundstellungsmatch (dem von grundstellungsähnlichen Stellungen ausgehenden Match praktisch identisch mittlerweile im Ergebnis) gegen ungefähr ähnliche und ganz ganz ähnliche Engines (die Bandbreite des Teilnehmerfeldes bestimmt die Ergebnisse mittlerweile mehr als alles andere bei gleichen Eröffnungen) eine ganz bestimmte Art von Engines, die genau auf diese Anwendung hin entwickelt und angepasst wurden und weiter werden, so sehr selektiert, dass die Steigerung der so gemessenen speziellen Spielstärke immer mehr Ähnlichkeit der Programme bewirkt, was den Code und die Art der Suche und Eval angeht.
Es sind nicht (nur und ich glaube auch nicht einmal hauptsächlich) die offenliegenden GPL- und anderen Sourcen, die bewirken, dass die Inzucht überhand nimmt, es ist die Nivellierung durch die Tests, besser gesagt durch den einen zu sehr nivellierten und dadurch nivellierenden Test.