Ja, Gerhard, weiß ich ja auch, und dass damals die Stellungstest ähnlich penetrant überbewertet wurden wie jetzt die Ranglisten, ist mir ja auch noch in Erinnerung.
Aber wer wäre denn damals mit dem Wahnsinnsaufwand an Stellungstests herangegangen, mit dem man jetzt die Ranglisten betreibt und betreiben muss, um die gleichermaßen gestiegenen Anforderungen der Statistik überhaupt noch befriedigen zu können?
Es ist ja nicht so, dass da einzelne Freaks nichts besseres zu tun hätten mit ihrer Zeit, ihrem Strom und ihrer Hardware, es geht einfach nicht mehr, mit 100 Partien engines statistisch signifikant zu unterscheiden, auf keine Art der Welt, nicht mit eng-eng-eng und nicht mit Stellungstests, und schon gar nicht, wenn man den Wust an jetzt schon vorhandenen und ungefähr gleich starken engines rein zahlenmäßig unter einen Hut, sprich unter eine Liste bringen will.
Folgenden Versuch, wenn du ihn nicht ohnehin schon oft genug und auch in letzter Zeit mal gemacht hast, könntest du noch mal kurz andenken, wenn du von mir Gegenvorschläge haben wolltest zu deinem Testset: lass gleich nur von der Grundstellung aus spielen, sch...au auf die Dubletten, aber nur insofern, als du sie als Mahnmal dafür nimmst, dass da halt
auch immer wieder derselbe Sch...achstil gespielt wird (Remisschieberei ist bei ein paar Züge später den Anzugsvorteil dann auch noch ausgeglichen habenden Stellungen erst recht noch mehr dabei, sag ich mal) und scher dich ansonten, wie auch normaler Weise immer, wenn's nur um die Ergebnisse geht, nicht um die Partien selbst, sondern nur um die Statistik.
Unterscheidet sich die irgendwie maßgebend von dem, was bei deinem Testset rauskommt?
Eben.
Ich meine, spricht doch schon auch irgendwie dafür, dass die Testsets und Bücher, wollte man mit dem Partiemateral als solchem nicht auch sonst noch irgendwas untersuchen, als Teststellungen der Grundstellung im Ergbnis verdammt ähnlich sind, nein?
Jetzt folge noch einmal bitte meinem Gedankengang, dass Stellungstests auch ausgespielt werden können und man daher genau genommen jedes Testset für eine Liste auch als solchen betrachten könnte, eigentlich müsste, als ausgespielten Stellungstest.
Wäre es dann nicht logisch, die Kritik, die man immer wieder aus dem Jahre Schnee gegen den Pfuipfuiausdruck Stellungstest hervorkramt, wenn's um Teststellungen irgend welcher Art geht, auch an Teststellungen für eng-eng-eng anzuwenden? Nämlich diese hier:
"Stellungstests testen die Teststellungen" war so ein alter Satz, mit dem man da immer gemeint hat, ein Totschlagargument zu haben, ich hab den immer schon geliebt, weil er zum "so what", "ja und?" einfach direkt zwingend herausfordert, ja was soll er denn zunächst mal ansonsten überhaupt testen? Natürlich muss man zunächst die Teststellungen testen, damit man dann mit denen engines testen kann und alles andere an Kritik kann immer nur die Zahl und Auswahl der Stellungen betreffen.
Über die Methodik, einzelne Lösungszüge oder Lösungsvarianten in bestimmter Zeit, auf bestimmter Hardware, SMP oder single core suchen zu lassen, einzelne primary und non primar variants, im single- oder multivariant- mode mit dem Output in Hinblick auf den Evalverlauf pro Tiefe und Halbzug zu vergleichen, oder was auch immer man sich da noch so einfallen lassen könnte, oder ob man lieber gleich die momentan halt einzig gängige Methode des Ausspielenlassens heranzieht, darüber kann man dann immer noch beliebig lang diskutieren.
Warum nicht auch Zwischendinge andenken: je nach Ausgangsstellung lässt man nur eine bestimmte Variantenlänge ausspielen und vergleicht dann Ausgangs- und Endevals. Damit man nicht mit den zwischen den engines nicht direkt vergleichbaren Zahlenwerten unmittelbar arbeiten muss, nimmt man den jeweiligen Quotienten aus Anfangs- und Endeval, ist der über einem bestimmten Maß, zählt man's als ganzen Punkt, sonst als halben.
Zunächst mal sollte man sich jedenfalls einig im Klaren sein, dass man mit bestimmten Teststellungen nur bestimmte engine- Fähigkeiten testet, egal, wie man diese Stellungen dann methodisch auswertet oder auswerten lässt.
Natürlich ist es von mir unfair, wenn ich immer nur einzelne Teststellungen hernehme und mit denen ein jeweils eigenes
stellungsabhängiges Rating erstelle für meinen persönlichen Bedarf und den jeweiligen engines of interest, unfair denen gegenüber, die mit ihren Tests ein allgemeingültiges Elomaß erstellen wollen, von dem wird man sich aber über kurz oder lang ohnehin verabschieden müssen.
Irgendwie wird sich die Erkenntnis (dazu muss man die Begriffe nur entsprechen konsequent definieren), Schachspielstärke ist genau genommen nur stellungsabhängig beschreib- und testbar, auch praktisch niederschlagen müssen.
Es verhält sich, würde ich sagen, so wie mit der sogenannten menschlichen Intelligenz, die kann man auch nur in Teilaufgaben testen, verbal, gestaltsorientiert, abstrakt rechnerisch, motorisch, wie auch immer man all die fragwürdigen IQ-Tests zuammenstellen will, Intelligenz muss ebenso wie Schachspielstärke einen konkreten Ausdruck finden, ohne den man sie nicht beurteilen kann, bei der Intelligenz wird subjektiv in der Regel nur der verbale Ausdruck beurteilt und bei Schachprogrammen nur der Umgang mit der Grundstellung und mit grundstellungsnahen, noch ausgeglicheren Stellungen als die Grundstellung selbst ist, das ist aber noch nie das einzig Interessante gewesen, ist es auch heute nicht.
Im Gegenteil, die Schachspieler wollten immer dort Unterstützung und wirklich gute Gegner, wo die Eröffnungstheorie gerade aus war, das ist heutzutage mit den allgemein zugänglichen Datenbanken auch längst ganz wo anders als vor noch wenigen Jahren.
Gebt als Tester diesem schachlich einzig sinnvollen Anwendungsbedarf endlich auch wieder etwas nach, weil kein Mensch mehr öffentlich over the board gegen engines spielt, heißt das ja nicht, dass die engines nur mehr unter sich spielen sollen, dürfen, müssen.
Fernschachspieler wollen gute Datenbanken, die wollen sie mit guten engines ausbauen, dazu wollen sie wissen, welche engine mit welcher frühen oder späten Mittelspielstellung und mit welcher Endspielstellung wie gut zurecht kommt.
Ich sehe es kommen, die over the board Profis für ihr Eröffnungsrepertoire und die Fernschachspieler werden sich Programmierer suchen, die gegen vernünftiges Geld engines eigens für bestimmte Stellungen adaptieren und programmieren und ihnen gleich noch entsprechend angepasste PSTs und aus Datenbanken angefüllte Lerndateien und persistent hashes mitgeben. Das sehe ich jedenfalls immer noch zukunftsträchtiger als die Cluster und die auch schon ziemlich verblassende Hoffnung, aus ein paar einzelnen Geldsäcken noch wirklich teures Geld für Hardware herauszukitzeln, wenn der Preisverfall der Hardware ja auch schon fast so schnell weitergeht, wie er bei der Software schon da ist, da sehe ich für wirklich spezialisierte Software noch mehr Chance, die dann vielleicht auch wieder in Kombination mit hochspezialisierter Hardware.
Mit Buchvarianten und mit Fernschachengines wird man vielleicht noch mit dem Computerschach Geld verdienen können in der Zukunft, mit Elofanten eher nicht mehr.