Benno Hartwig schrieb:
Dieser Erwartungswert ist eine konkrete reale Zahl, sie existiert. Sie ist keine Bereich, sondern eine konkrete Zahl. Nur dass wir sie nicht kennen und uns darum:
a) um ein möglichst gutes Schätzverfahren bemühen
b) versuchen, die Qualität dieser Schätzung einzuschätzen.
Dieser Erwartungswert ist eine konkrete reale Zahl, die wir dadurch hinten raus bekommen, dass wir am Anfang rein willkürlich Ausgangswerte einsetzen, um uns dann darüber zu streiten, wie genau die Ergebnisse mit dem übereinstimmen, was wir erwartet haben.
Ich würde ja noch einsehen, dass es mit der Errorbar so genau genommen wird, wenn man dann nicht doch, auch wenn sie unterschritten wird im Ergebnis, munter daran vorbei argumentierte, dass es mit soundso großer Wahrscheinlichkeiten eben schon auch genau so stimmen
könnte, wie's unten rausgekommen ist, auch wenn im einzig wirklich relevanten Sinn der Fragestellung, die man an eine Statistik knüpfen kann (über das nächste bevorstehende Einzelereignis sagt sie bekanntlich sowieso just gar nix aus) im Sinn von, ist die eine Engine sicher besser (statistisch signifikant bei bestimmten Matchvoraussetzungen, Partiezahlen und Performances, die Remisquote ist nur die eine Seite der Sache, die 1:1- Paare wirken sich just genau so Errobar- hebend aus) als die andere. Ist die Antwort auf diese Kernfrage, nein, kann man nicht statistisch signifikant sagen mit den Partien, die man hat, nicht einmal in Hinblick auf das eine Einzelmatch, sollte man drei Dinge vielleicht einfach lieber lassen: die Argumentation, wie wahrscheinlich es wäre, dass es vielleicht doch so ungefähr stimmt, erst recht die Argumentation, wie es höchst wahrscheinlich auf die Centielo genau stimmen
könnte, und vor allem:
man sollte nicht die Zahlen, die man jetzt herausbekommen hat, einfach ins nächste Match getrost als neue Ausgangswerte derselben Engines nehmen, nicht einmal unter genau gleichen Voraussetzungen, schon gar nicht unter Beteiligung anderer Engines, mit anderen Hardware- TCs und anderen Eröffnungen.
Wenn du die Qualität der Schätzungen zum Schluss beurteilst, Benno, rechne doch bitte schon auch irgendwie im Kopf ein, dass du die Ausgangswerte an Elo der Kontrahenten zuerst einfach aus anderen mehr oder weniger ähnlichen Matches übernommen hast, du hättest genau so gut (und ich bitte das "genau so" wieder genau so wenig mathematisch exakt zu betrachten, wie das letzte, das du in dem Zusammenhang von mir zitiert hast und perfekt widerlegt) ganz andere Ausgangswerte nehmen können oder etwas andere oder für die eine und etwas anders andere für die andere oder für die eine schon und für die andere nicht.
Schätzung ist in dem Zusammenhang der einzig richtige Ausdruck jedenfalls.
Und nein, etwas anderes hast du ja auch gar nicht gesagt, aber ja, beim Schätzen kommt es außer darauf, möglichst genau zu schätzen, halt schon auch darauf an, dass man die Schätzung nicht als Gewissheit verkauft, nicht sich selbst und nicht den Anderen.
Und um deine nächste Frage nach dem positiven Ausblick meinerseits sein könnte ("wie würdest du es denn machen?") nach all dem neuerlichen Repetieren der Schwächen der Computerschach- Elo- Messungen:
ich würde Reinholds Vergleich mit den menschlichen Schachspielern diesbezüglicxh gar nicht soo schlecht finden, weil für die (Menschen) hat Arpad Elo die Formel erdacht, und weil bei denen ist man sich eben im Klaren, dass man eine Elo- Performance eines Spielers in einem bestimmten Turnier, in einem bestimmten Match gegen einen bestimmten anderen, oder als Elo- Performance übers Jahr, als Elo-Performance im Blitzschach, im Schnellschach, im Fernschach zu betrachten hat, würde man das bei den Engines hin und wieder auch ein bisschen im Auge behalten, dass die Elo, die gemessen werden, immer als numerische Zahlenwerte in ihrer genauen Höhe für ein bestimmtes Einzelmatch zwischen 2 bestimmten Engines unter bestimmten Bedingungen oder eine bestimmte Rangliste unter bestimmten Bedingungen gelten und sowieso immer nur für einen begrenzten Zeitraum, müsste man weniger um die Errorbar eines Einzelmatches rumstreiten und um die einzelnen Dezielo, die mit soundsogroßer Wahrscheinlichkeit eben doch mehr oder weniger genau stimmen
könntenIst doch auch positiv, oder? Was für Grund und Anlass hätte man sonst überhaupt noch, immer wieder neuerlich Unmgengen von Partien spielen zu lassen, wenn die Erwartungswerte ohne schon vorher exakt genug wären?