[quote="Michael Scheidl"]
Was das positionelle Können betrifft, so denke ich daß dieses Element in Engines heutzutage ebenso sehr auf den typischen großen Suchtiefen beruht, als auf einer möglichst guten Bewertungsfunktion. Letztere bleibt natürlich von hoher Bedeutung, denn irgendwo muß ja immer aufgehört werden weiterzusuchen - die selektiven Tiefen sind allerdings enorm und wie mir gesagt würde, auch treffsicherer als früher.
[/quote]
Schon klar, Michael, der Mensch stellt sich "positionell" halt so vor, dass es um Pläne geht, die zu weit reichen, dass man sie im Kopf Zug um Zug durchrechnen kann.
Auch dabei gibt's aber solche und solche Pläne, wie man spätestens weiß, wenn man mal wieder eine Plan gemacht hat und einen zweiten und ein großes Licht war...du kennst den Spruch.
[quote="Michael Scheidl"]
Aber ich denke, bei 20+ Tiefe kommt der konkrete Nutzen eines guten positionellen Zuges, sei er nun materiell oder "sehr deutlich" positionell, bereits oft in den Suchhorizont heutiger Engines. Und bei nTCEC sahen wir nicht selten 30er-Tiefen und auch da kommen die Extensions noch hinzu. "Positionell" ist eben nur ein menschliches, und zwar sehr mächtiges Hilfskonstrukt als Ersatz für sehr genaue tiefe Suche, zu der wir eben nicht so im Stande sind wie Engines.
[/quote]
Gesagt, getan, gescheitert oder gescheiter geworden, auch durch den engine- Einsatz.
Wären aber die engines in ihren hohen Suchtiefen wirklich so treffsicher in der einen tiefen tiefen HV, die sie am weitesten berechnen, dass sie keine taktische Wendung
und keine positionelle Alternativvariante übersähen, würden sie nur mehr Remisen gegeneinander schieben und es gelänge guten Fernschachspielern nicht immer wieder, den gegnerischen engine- Varianten Überraschungen zu bieten.
Wenn du mit guter engine- Unterstützung und großem eigenen Zeitaufwand den engines immer wieder Alternativvarianten in Eröffnung, Mittelspiel und Endspiel (dort sollten sie doch eigentlich mit ihren tollen Suchstrategien fehlerlos sein, wenn es nur mehr wenige Steine sind, aber schau dir doch mal an, was da mit und ohne tbs von engines zussammengespielt und fehlevaluiert wird, dort wird's einfach erst für den Menschen wieder sichtbar, weil er selber mehr Einsicht gewinnt mit der ansonsten lückenhaften Strategie- Krücke) manuell eingibst, siehst du immer wieder, wie die evals im Vor und Zurück beeinflussbar sind mit dem Anfüttern vom hash, da wird einfach immer wieder dies und das erst durchs Ausprobieren so richtig berechnet.
Die Wahrscheinlichkeit spricht mir einfach sehr dafür, dass die Ökonomie des möglichst schnell in die Tiefe Rechnens links und rechts des Hauptweges sehr viel stehen lässt, weil es einfach
zunächst nicht so sicher berechenbar ist, zu weit weg führt vom sichersten Weg, und dann auch nicht mehr zum Zug kommt, weil auch die MP- Hardware- Nutzung und der zeitliche Mehraufwand ab einer gewissen Grenze das einmal Verworfene nicht mehr nachrechnet.
Ferner liegt auch einfach die Vermutung nahe, das sei
zunächst öfter "nur" "positionell", was da unbemerkt bleibt, und werde erst durch Verschieben des Horizonts dann wieder taktisch, weil naheliegende taktische Hotshots von den engines auf guter Hardware einfach nur mehr selten übersehen werden.
[quote="Michael Scheidl"]
Es gibt mindestens eine große Testsuite die sich mit positionellen Problemen befaßt:
https://sites.google.com/site/strategictestsuite/1.400 Positionen! Ich habe ihn noch nie ausprobiert; besonders populär scheint er nicht zu sein denn man sieht fast nie Resultate.
[/quote]
Swaminathan und Corbit.
An sich tolle Idee und große Leistung, das Alles so zusammenzutragen.
Ich habe mich mit den ersten paar Versionen, als es noch so 10, 11 Suites waren, eine Weile beschäftigt, auch mit der Umrechnung in Elo davon, da gibt's ein Hilfsprogramm dazu.
Dann schien mir aber der Anspruch, der dahinter steckt, auf diese Art eine positionelle over all playing strenght zu bestimmen, überzogen für den Aufwand, der ja doch auch damit verbunden ist.
Wohl sagt dieser STS etwas aus, so schnell, wie er abgearbeitet werden soll, fehlt mir aber doch wieder irgendwie das Zusammenwirken von eval und Suche mit entsprechendem Zeitaufwand, und in der Realität ist der Zusammenhang zwischen "Strategie" und Taktik, zwischen eval und Suche einfach nicht trennbar, was die Frage aufwirft, ob man das wirklich getrennt voneinander testen soll und kann, und was dann wirklich dabei herauskommt.
Bosheit am Rande: Elo, wie sie jetzt bestimmt werden, haben meiner Meinung nach aber genau so viel oder wenig Berechtigung, als Maß der Dinge herzuhalten, wie wenn man sie durch derartige Stellungstests bestimmte, positionelle mit taktischen kombiniert.
[quote="Michael Scheidl"]
Die pragmatische Idee wäre selbstverständlich: Man sucht alle möglichen Testsuites und kombiniert sie thematisch zu den drei Bereichen:
Taktisch, positionell, Endspiel. Je mehr Stellungen desto besser, dann können ein paar inkorrekte ignoriert werden weil sie statistisch erschlagen werden. Dann kann man ein paar (Top-)Engines testen und sehen was herauskommt. Stimmt es mit dem
Stil überein, nach allgemeiner Wahrnehmung? Sind die Stärkeprofile die sich abzeichnen, anhand praktischer Partien bisher so erkannt worden? Welche Engine soll ich, zumindest als kompetente zweite Meinung, für Stellungen des jeweiligen Typs in der Analyse heranziehen...?
Eine Titanenaufgabe!
[/quote]
Genau, persönlich glaube ich allerdings nicht, dass der menschliche Zeitaufwand, bis der Test steht, gemeinsam mit dem danach und dem Hardware- Strom- Zeiteinsatz nach einer Weile des Einlaufens, auch nur größenordungsmäßig mit dem vergleichbar wäre, was jetzt schon an Partiezahlen notwendig ist, um auch nur Houdini, Critter, Stockfish, Komodo , Ivan und Rybka (wird die dann denn auch irgendwann wieder weiterentwickelt, ansonsten setzen wir statt ihr einfach willkürlich einen der anderen Hoffnungsträger ein, die sie jetzt schon überholen und auch irgend einen Namen haben dürfen) auf die Dauer weiter voneinander zu unterscheiden, wenn man sie nur immer weiter grundstellungsnahe ausgeglichene Eröffnungen gegeneinander ausspielen lässt.
Diese Elo sind keine Zählos mehr, du kannst dir nix mehr drum kaufen, sie dienen nur noch dem automatischen Tuning der einander ohnehin immer ähnlicher werdenden Weiterentwicklungen, so werden mit ihnen die Entwicklungen und die derartigen Elo immer weniger wert.
Allein durch das Zugrundelegen von Stellungen, wie sie dir für den Stellungstest vorschweben und sonst den gleichen Ausspielregeln wie jetzt für die Ranglisten, hättest du mit sehr viel weniger Stellungen als du sie für den Stellungstest brauchst (der müsste ja schon deshalb sehr sehr umfangreich sein, damit das direkte Tunen der engines nicht auf einzelne erfolgen könnte, ein Problem, das die Veröffentlichung von handverlesenen Eröffnungsstellungen für Ranglisten ja aber jetzt auch schon verbietet) sofort eine viel geringere Remisquote, eine wieder viel höhere Merkmalsdifferenz und bräuchtest sofort wieder viel weniger Partien, um zur selben Signifikanz zu kommen, wie jetzt mit den grundstellungsnahen ausgeglichenen Stellungen allein.
Witz am Rande: keine Ahnung, ob z.B. Ingos Ausgangsstellungen nicht ohnehin einen guten Schritt weit in diese Richtung gehen, er kann sie ja nicht herzeigen, ebenso wenig wie die Partien.
Ich hab kein Problem damit, ich mutmaße nur einfach, es wären mir persönlich einfach zu wenige und zu wenig bunt gestreute und an die auch viel verwendete Alternative des breiten Kurzbuches glaube ich in Zeiten, in denen 5 Züge der gängigen Eröffnungen von den meisten engines in Sekunden von der Grundstellung aus im hash sind, ebenso wenig.
Das beste, was ich im Ansatz in die geschilderte Richtung sehe, ist Frank Quisinskys Datenbank, auch da finde ich aber die kategorische Beschränkung auf 8 Züge zu knapp und das Prinzip, die Auswahl einer bestimmten eval einer einzelnen engine zu überlassen, ist für mich auch kontraproduktiv, vor Allem das verfluchte "Ausgeglichen", Schach ist ohnehin schon halb remistod, da muss man doch nicht ständig mit den engines an nichts anderem arbeiten, als jede Spannung weiter herauszunehmen, indem man nur win or save draw mit den entsprechend möglichst restrikiven Testmethoden zu belohnt.
Nicht deine und meine Ideen sind willkürliche Selektion pur, die gängigen Testmethoden sind es.