[quote="Michael Scheidl"]
Doch für eine Gesamtbewertung wird es keine allgemein akzeptierte Alternative mehr geben. Falls mir das früher nicht klar war, wurde ich spätestens dann überzeugt als jemand sinngemäß festhielt:
"Praktische Testpartien sind nichts anderes als eine Reihe von Stellungstests in einer Vielfalt von Positionen."[/quote]
Könnte glatt von mir sein, bei dem Vielen, was ich in genau die Richtung schon alles abgelassen habe, dennoch, den Satz hat wohl jemand Anderer geschrieben, schade, dass du nicht weißt, wer's war.
Gesamtbewertung ist allerdings sowieso auch reine Illusion, es ist einfach das, was wir aus welchem Testverfahren auch immer zu einer solchen hochstilisieren.
Bei Menschen ist's ja eigentlich noch krasser: wer will denn ernsthaft von sich oder einem anderen Schachspieler behaupten, geschweige denn beweisen, dass die Performance gegen einen bestimmten Gegner weniger spezifische Eröffnungsvorbereitung und Verständnis der bestimmten einzelnen aufs Brett gebrachten Positionen war oder ist und mehr "allgemeine Spielstärke"?
Natürlich, gegen je mehr Gegner in je mehr Eröffnungen jemand gewinnt, umso mehr kann er von sich behaupten der stärkste aller Klassen zu sein, so etwas statistisch beweisen zu wollen, ist Selbstbetrug am Wesen des Schachspiels vorbei.
[quote="Michael Scheidl"]
Für Deine Idee, den Bewertungsverlauf von Engines zu ermitteln und irgendwie zu bewerten, wirst Du keine Freunde finden.
[/quote]
Da magst du recht haben, was die Statistiker und die Elofans (wie wär's mit Elofanten?
) angeht, aber:
[quote="Michael Scheidl"]
Es gilt das Prinzip:
--> Stellung
--> bester Zug
--> ja oder neinDetails sind unwichtig, finde den besten Zug oder nicht. Besser so 10.000 Stellungen primitiv testen, als 50 mit einem Expertengutachten über warum, wieso, wie wars nach 12-11-10 Halbzügen (ist eh auf jedem Computer anders...) usw.usf. Das bringt doch nichts.
[/quote]
Das bringt in Wirklichkeit den Schachspielern den einzigen für sie relevanten Aufschluss, Michael, wie ändern sich die Evals über die Züge, die sie ausprobieren, mal brauche ich längere und mal kürzere Varianten, um den Vorteil der einen über die andere Seite und des einen über den anderen Zug zu sehen.
In der realen Partie gibt's den best move als hot shot höchstens ein- zweimal, wenn überhaupt, den einen bm, den du dir für deine Stellungstests vorstellst und den sich immer schon alle für so etwas gewünscht haben.
Natürlich kann man auch aus Unmengen von Partien und konstruierten Stellungen diejenigen herausssuchen, die in so ein einfach zu beurteilendes Schema passen, da bist du aber in der Auswahl so beschränkt, dass das, was dann als Sammlung herauskommt, wieder eine ganz eigene Schachwelt für sich darstellt, das tut jede Auswahl, aber die der taktisch eindeutig nachweisbaren best moves unmittelbar auf die Teststellung folgend, sind schon eine ganz spezielle solche, damit kannst du sehr schön bestimmte Stärken einzelner engines gegeneinander abwägen, overall playing strength ist nicht einmal die Summe von genau solchen Stellungen allein, da gehören vor allem auch sehr viel mehr "stille" Züge und Eröffnungsvarianten hinein.
Der Hauptsinn der engines ist immer noch der Fortschritt in der Eröffnungstheorie, dafür brauchst du engines, die von den grundstellungsnahen Stellungen aus in der Tiefe die positionellen Vorteile aufspüren, ohne die taktischen Fallen des Mittelspiels zu übersehen und dann im frühen Mittelspiel nicht nur das Remis als einzig sicheren Ausgang anrechnen.
Illusion nach wie vor?
Nicht unbedingt, man muss halt Zug um Zug und Variante um Variante vorgehen, dazu muss der Verlauf der Evals etwas aussagen.
Positionelle best moves für Einzüger- Stellungstests gibt's wohl, sie sind aber in aller Regel nur im Vergleich zu ein paar nicht viel schwächeren Kandidatenzügen und durch mehr oder weniger große Anzahlen von Folgezügen beweisbar.
Das ist mein Punkt:
Wenn du die kleinen Fortschritte, die auch in solchen "normalen" Stellungen drin stecken, von den nur Remis haltenden Alternativzügen am Verlauf der Evals sehen kannst, dann hast du ein starkes Schachwerkzeug, alles andere bleibt ein Spielzeug für sich, dessen Spielstärke gegen andere solche Spielzeuge nur von sehr beschränkter Relevanz für den menschlichen Spieler und die Eröffnungstheorie ist und bleibt.
Sagt dir die Spielstärke, die du in genau den Eröffnungen und anderen Stellungen, die dich selber interessieren, praktisch relevant messen kannst, etwas darüber aus, welche engine wo und wie am besten eingesetzt wird, dann hast du da auch schachlich was davon.
Hören wir hin und wieder mal ein bisschen damit auf, den Sport nur darin zu sehen, auf ein bestimmtes Pferd zu setzen und zum Schluss zu jubeln, wenn es als erstes durch irgend ein Ziel geht, und bringen wir die Interessen der Fernschachspieler, der Buchmacher und der Analysanten (auch nicht von mir, der Ausdruck
) wieder ein wenig mit dem der eng-eng-Spieler zusammen.
Oder glaubst du auch das nicht mehr, dass das noch gehen wird?
Dann können wir uns bald nur mehr entscheiden zwischen Schach oder Computerschach und ob wir spielen oder spielen lassen wollen.
Zugegeben, das mussten wir uns immer schon mehr für das eine oder das andere, es haben aber immer die einen auf das geschielt, was die anderen so hatten, die Fernschachspieler auf die Ranglisten und die eng-eng-Fans auf die Stellungstests und Analysen. Jetzt kranken die Ranglisten halt mehr und mehr am Überangebot an ähnlich starken engines und einer explodierenden Partienzahl als Voraussetzung, um noch statistisch saubere Aussagen treffen zu können, wie sehr sich wie viele engines an den 0815 Eröffnungsstellungen wie viel gegenseitig schenken.
Ich will das wirklich nicht in den Kübel treten, ich will nur die Gelegenheit noch einmal ergreifen, meine für mich schon sehr alte Sicht vom engine- Testen zu erklären, ich weiß schon, dass es eine sehr eigene Sicht ist, gleichzeit weiß ich, dass da jeder seine eigene hat.
Ich verspreche aber auch, ich werde nach diesem aller-allerletzen Mal keinen weiteren Versuch mehr machen, wenn sich wieder einmal mehr herausstellt, dass ich einfach nicht imstande bin, rüberzubringen, worum es mir geht.
Halt, das nehm ich sofort wieder zurück, dieses Versprechen war voreilig und unbedacht gegeben.
Es ist eben so: ich weiß, dass ich genau dasselbe will, wie die meisten, die sich mit Computerschach und Schach beschäftigen, ob es wirklich überhaupt noch geht, eine gemeinsame Basis zu finden, Spielstärkenunterschiede schachlich zu beurteilen, weiß ich auch nicht, Ideen hätte ich, und dass ich nicht versucht hätte, sie zu vermitteln, kann man mir auch nicht vorwerfen.
Vielleicht greift ja jemand Anderer so etwas ähnliches einmal auf, und dann bin ich sicher wieder mit Feuereifer dabei, hoffentlich bin ich dann nicht zu alt dafür...
Mittlerweile mach ich's halt zu meinem Privatvergnügen so weiter wie bisher, immerhin bringt es ja vielleicht doch mal mein Buch weiter, irgend etwas werde ich der Schachnachwelt schon hinterlassen, aber wenn das dann posthum alle anderen Bücher meilenweit hinter sich lässt, fragt mich bloss nicht ins Grab hinein, wie ich das gemacht habe.