Und wo steht jetzt, dass man Einzelmatches nicht in Elo messen darf?
Tatsächlich macht man ja nichts anderes, wenn man 2 Spielern vor und nach einem einzelnen Kräftemessen ihre Elo, die sie vor und nach einem solchen einzelnen Turnier oder auch einem 1:1- Match, im Extremfall sehr wohl auch einer einzelnen Partie als alte und neue Momentan- Performance anpasst.
So what?
Tatsächlich spielen beim Schach eigentlich in aller Regel immer nur 2 Seiten gegeneinander, wo sie jetzt da rein willkürlich die Grenze dessen ziehen wollen, was nicht gilt, weil's zu wenige solche Einzelpartien zwischen wem und wem auch immer sind, bin ich, in ihren weiteren Ausführungen zu erfahren, gespannt.
Dass die statistische Verlässlichkeit oder Signifikanz von der Zahl der Partien und den Ergebnissen abhängt, ist ja nicht vom Maß abhängig sondern vom Spiel. Dass man für eine verlässliche Aussage über die Spielstärkenverhältnisse von 2 oder mehreren Gegnern für ein bestimmtes Spiel, dessen Match- Bedingungen und das Kollektiv, in dem gespielt wird, eine bestimmte Menge an bestimmten Daten braucht, was hat das mit der Maßeinheit der Ergebnisse zu tun? Ob das nur die Punkte sind, die man zählt, oder sie in Prozent umrechnet oder in Elo, das ändert an der statistischen Aussagekraft just nix, oder? Gibt man eine error bar zur Messung an, sollte der Frage, ob die Messung "gültig" ist oder nicht, eine Quantifizierung mehr als eine Erlaubnis im Sinn von ja oder nein erteilt werden, und ich sage ja eben auch, dass es bei der Anzahl der Partien auch auf die Matchbedingungen wie z.B. die Eröffnungs(test)stellungen ankommt, jedenfalls mehr als auf das Maß, in dem das Ergebnis ausgewertet wird, das ist genau mein Punkt.
Edit: Dass die Elo, die man im Computerschach auf die verschiedensten Arten ausspielen lässt, und wie man die Ergebnisse eben genau fälschlich meint, miteinander vergleichen zu können, nur weil Elo dabei steht, eben nicht alle "dieselben" sind und schon gar nicht, was ihre Transitivität angeht, das ist ja seit Jahr und Tag mein Thema, sehr geehrter Herr Professor, vielleicht bin ich nur dahingehend bei allem Wortreichtum wieder unklar geblieben, ich habe sowieso von Anfang an den Verdacht gehabt, sie meinen im Wesentlichen auch nichts anderes als, die Elo, die man hier berechnen könnte (wenn man's denn wagte, weil's einem noch keiner erfolgreich verboten hätte) wären mit denen, die man sonst so gerne zur Aufrechterhaltung der allgemeinen Elosion als gute Elo lobt, "unangebrachte", böse Elo.
Oder anders formuliert, ob es Arpad wirklich nur recht gewesen wäre, Elo, wie er sie verstand, möglichst weit zu "spreizen", und sei es selbst mit vielen vielen Teilnehmern und vielen vielen Partien, und sei es nur mittels möglichst genau definierter (zum Teilnehmerfeld und den übrigen Matchbedingungen passender) Eröffnungsvorteile einer Seite, wenn nicht gar mittels Stellungstests, ausgespielt oder nicht ausgespielt, oder ob er nicht doch auch irgendwann gesagt hätte, das spreizt mir jetzt meine Elo doch zu weit, das sind jetzt dann schon mehr böse als gute Elo?
Edit, edit, edit: weil sie Frank Brenner erwähnt haben, von ihm stammt (soweit ich mich erinnere, jedenfalls habe ich den Begriff mal von ihm das erste Mal gelesen) ja auch der hier mal wieder so gut passende Begriff der "Themenelo".