Nehme alles zurück und behaupte das Gegenteil!
Die Suite ist hervorragend geeignet, genau die Art von taktischer Stärke zu messen, die in diesen Stellungen zählt, ganz nach dem Satz von Boring, Intelligenz ist, was der Intelligenztest misst
Von mir aus kann man die schöne Neghina-Rusz-Studie "Shield", die ja schon irgendwie ein Anti- Engine- Puzzle auch ist, durch eine leichtere Stellung ersetzen, diejenige, die ich schon vorgeschlagen hatte
https://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=157420#pid157420, ist auch zu schwer für die Engines bei kurzer bis mittlerer Hardware- Zeit, allerdings kann man ihr wirklich keine Praxis- Ferne vorwerfen. Man sieht, nicht alles, was die Engines nicht lösen, ist irrelevant, es sei denn halt für den Betrachter.
Zu viele zu schwere Stellungen sollen einfach aus statistischen Gründen nicht drin sein, nämlich im Vergleich zu den Lösungszeiten im Schnitt. Ich hatte auch schon wieder einen Versuch, mehr leichte zusätzlich zu den schweren reinzupacken, das ist ok, so lange es eben nicht auch wieder zu viele zu leichte werden, bei denen auch EloStatTS, wenn jede getestete Engine nur einzelne Sekunden braucht, daraus entsprechende Unterschiede in der Wertung herauszurechnen. Im Prinzip ist es immer wieder dasselbe Problem, egal ob im Stellungstest, wenn er so wie ElotStatTS die einzelnen Stellungen anhand der einzelnen Lösungszeiten als einzelne Matches (siehe deren Zahl in der Tabelle unter diesem Titel) zwischen je Engines an einer Stellung wertet, oder ob man Stellungen ausspielen lässt. Elo- Spreizung gegen error bar ist immer dasselbe Prinzip und dasselbe Problem, was in Wirklichkeit einfach immer den größten Unterschied macht, ist die Hardware- Zeit, die man für das eine oder das andere Ergebnis braucht, um es statistisch abzusichern.
Viel leichter aber verwendbar ist z.B. die hier von A.Jasik (wenn die Angabe im ACT5, aus dem sie stammt, richtig ist, dort ist sie die Nr.89):
bm 1.Tc6+
So als .epd- Stellung, wenn man sie mit dem Editor direkt austauschen will aus dem, was ich am Anfang reinkopiert habe ins Posting.
2k4q/1p2p3/1Pr2Rp1/PK1p2P1/P1p3R1/3p4/p2P4/2Q5 w - - bm Rxc6+; id "ACT5.098";
Also die bisherige Nr. 105 gegen sie austauschen, dann hat man eine Endspiel- Stellung durch eine andere ersetzt und hat eine weitere bei 15" von den meisten Engines, die ich bisher probiert hab, ziemlich sichere Lösung, bei der's mit EloSatTS "nur" auf die Zeiten ankommt.
Und wen diese Art von Stellungen, die die Engines in dieser Suite zu lösen haben, nicht interessiert, der nimmt halt andere. Ich nehm' die Suite sehr wohl auch weiterhin, um möglichst schnell möglichst viel Diskrimination zwischen genau den Engines zu bekommen, die in diesen Stellungen gut sind. Vergleichbar sind damit halt statistisch keine Engines, die unter 20 Stellungen lösen, aber da gibt' schon eine ganze Reihe von solchen, dass Sting auch dabei ist, wundert nicht. Und ja, im praktischen Spiel wird er nicht so gut abschneiden, aber so what?
Und die Resultate, die ich mit dieser Suite bekomme, muss ich ja nicht veröffentlichen, ätsch!
Im Ernst, man muss sowieso auch immer strenger unterscheiden, welche Engines man in welchem Test miteinander vergleicht, das ist gerade auch beim Eng-Eng-Match so, wie man jüngstens erst wieder im TCEC gesehen hat. Wenige Partien von vielen einzelnen Underdogs gegen die viel Stärkeren 3, ist auch ein Methode, aber auch eine die ziemlich für sich allein steht, und dass ausgerechnet dieser Bonus ohne Buch gespielt werden konnte und wurde, hatte schon auch seine schachlichen Gründe und seine Berechtigung.