Frank Quisinsky schrieb:
Aber die Zugbewertungen sind ein Thema um zu versuchen Spielstärke zu messen.
Find ich eben genau auch.
Seien wir mal ehrlich, beim Analysieren und beim einer eng-Partie Zuschauen linst ja doch ein jeder dauernd auf die Evals, es wird wirklich Zeit die engines mal auch ein bisschen bei diesem ihrem Wort zu nehmen, neben der Auswahl des best move ja doch die wesentlichste Leistung, nein?
Frank Quisinsky schrieb:
Wir brauchen eine GUI für statistische Auswertungen und dann könnte man stetig die mit den ganzen Ideen den Aufbau bzw. die Programmentwicklung dieser GUI nach vorne treiben. Es ist wirklich schade das wir dem 1:0, 0:1 und Remis hinterherjagen und uns die wirklich spannenden Infos was eigentlich alles passiert entgehen lassen.
Hast du meinen lichtvollen Ausführungen, die ich hier in meinem letzten Posting an dich auch gerade wieder ausgebreitet hatte, irgendetwas abgewinnen können?
Ich weiß echt auch schon wieder gar nicht mehr, wie oft ich damit schon ums Eck gekommen bin, scheint nach wie vor niemanden zu interessieren, mir persönlich kommt's eigentlich nach wie vor so einfach vor, dass man es meiner blauäugigen programmiertechnischen Vorstellung nach, ans GUI leicht sollte delegieren können.
Einmal probier ich's noch:
Du nimmst eine beliebige Stellung, fangen wir mit einer aus der Eröffnungstheorie bekannten an, aus den Fernschachdatenbanken und den Büchern dazu beliebig viele Abspiele interessanter Variantenlänge und bestimmst interaktiv daraus eine maximale und eine minimale Evalbandbreite, die du wie folgt berechnest:
Ausgangseval als Nenner, Endeval als Zähler, (eigentlich könnte man's auch umdrehen) der so berechnete Quotient macht mehr oder weniger unabhängig von den absoluten Zahlenwerten der Evals, weil sich das Verhältnis auch bei zwischen den einzelnen engines sehr unterschiedlichen Absolutwerten relativieren würde.
Hast du im Nenner 0.00, nimmst du statt dessen je nach Zählerevalvorzeichen - oder + 0.01, um nicht durch 0 dividieren zu müssen.
Mit diesem Quotienten, bei dem es nicht darauf ankommen sollte, mit welcher Vergleichsengine du den erstellst, wenn du ihr und dir genug Hardwarezeit lässt und sie mit dem richtigen Material fütterst, (endlich mal eine Aufgabe für die (Fern-)Schachspieler unter uns Computerschachfans) und den du wie gesagt aus den interaktiven Variantenanalysen vorbestimmt hast, gehst du daran, die ebenso ermittelten Quotienten derjenigen Varianten zu vergleichen, die die engines jede für sich oder gegeneinander (natürlich 2 verschiedene Tests, was dich halt jeweils gerade mehr interessiert) mit bestimmter Bedenkzeit ausspielen.
Dem GUI überträgst du die Aufgabe, diese ausgespielten Quotienten mit deiner vorgegebenen Quotienten- Range des Evalverlaufs zu vergleichen, welche engine drin ist, bekommt verschieden viele Punkte, kannst du einfach mit 1, 0, 1/2 machen der Einfachheit halber, oder Abstände von oberer und oder unterer Grenze deiner Range direkt anzurechnen, Geschmackssache.
Jedenfalls kannst du automatisiert, wenn du mal deine Teststellungen und deine Testvarianten geeicht hast, das GUI bestimmte Variantenlängen ausspielen lassen, und das GUI zählt die ganzen und halben Punkte oder auch direkt die Quotientenwerte relativ zur definierten Vergleichsrange.
Ist das wirklich so kompliziert, wäre das programmiertechnisch wirklich schwer ans GUI zu delegieren oder gar unmöglich?
Würde das nicht doch einiges an komplett ausgespielten Partien einsparen?
Ich erwähne hier mal noch sicherheitshalber, dass es
natürlich kein Ersatz einer Rangliste, wie wir sie jetzt haben sein kann und soll, sondern eine Ergänzung.
Könnte man damit nicht eher als mit eng-eng allein sinnvoll auch Mittel- und Endspielstellungen beliebiger positioneller und oder taktischer Schärfe testen?
Und ja, auch der umgekehrte Weg macht Sinn, wie er dir eher vorschwebt: du nimmst die vorhandene eng-eng- Partie, schneidest daraus eine bestimmte Variante einer bestimmten Länge aus und vergleichst deren Evalverslaufsquotienten der einen und der anderen engine mit einer wieder durch interaktive Analyse einer beliebig großen Anzahl an Vergleichsvarianten gewonnenen Evalverlaufsrange zwischen einem maximalen und einem minimalen deiner Berechnung nach zu erreichenden Quotienten aus Anfangs- und Endeval.
Du willst die forcierten Züge ausklammern, warum?
Für die bräuchtest du erst recht nur wenige und kurze Varianten meistens, bis sich herausstellen müsste, werden die besten Züge, die den größten Evalfortschritt bringen müssten, gefunden oder nicht.
Natürlich müssen die Vergleichsvarianten stimmen, selektiv sein und an Länge und Anzahl die wesentlichen Abspiele abdecken, aber dass eine engine zufällig bei einem eindeutigen best move diesen zwar nicht spielt, aber dennoch innerhalb der vorgegebenen Variantenlänge den vermeintlich zu erzielenden Evalfortschritt erreicht oder topt, wäre nur dann möglich, wenn die Testvarianten eben falsch wären, das stellte sich dann so auch gleich heraus, ganz im Sinn des alten Spruchs, Stellungstests testen die Teststellungen.
Nennen wir das Ganze z.B. Variantentests und niemand muss sich mehr genieren, dass es auch irgendwie ein Stellungstest wäre.