Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / SWCR: Neuer Negativ ELO-Entwicklungs Rekord !!
- - By Frank Quisinsky Date 2011-05-18 20:26 Edited 2011-05-18 20:35
Hallo zusammen,

deutlich weniger Fälle liegen mir vor, wenn eine Engine schon über 1.000 Partien gespielt hat.
Von 520 auf 1.000 Partien gab es drei Fälle (von bislang getesteten 144 Engines) bei denen eine Engine knapp über 20 ELO verlor oder gewann.
Also 21, 21, 23 ELO verloren oder gewonnen von Partien-Nummer 520 auf Partien-Nummer 1.000!

Aber jetzt ...
Von Partie-Nummer 1.000 - 3.560 verlor Spike 1.4 Leiden 21 ELO.
Einstiegsrating in der SWCR-32 war 2803 nach 1.000 Partien, derzeitiges Rating ist 2.782!

Das ist der absolute Negativ Rekord hinsichtlich ELO-Entwicklung den ich jemals hatte.
Ganz interessant auch die ErrorBar ...

Bei 1.000 Partien, 1 ELO mehr als ErrorBar
Bei 1.500 Partien, 4 ELO mehr als ErrorBar
Bei 2.000 Partien, 4 ELO mehr als ErrorBar

Auch hier, das die ErrorBar bei mehr als 1.000 Partien nicht stimmt passierte bislang 1x !!
Das die ErrorBar bei mehr als 500 Partien nicht stimmt, passierte bislang 17x ... vom 143 Fällen!

Solche Dinge, wie jetzt hier bei Spike 1.4 Turin passieren.
Sind aber sehr sehr selten.

Wenn ich die Kurve z. B. weiter spinne ...
Wenn in drei von 144 Fällen zwischen Partiennummer 520 - 1000 eine Abweichung größer als 20 ist wie hoch wäre die Wahrscheinlichkeit, dass eine Abweichung von Partie Nummer 1.000 - 3500 von 21 herauskommt. Ganz interessante Frage, bin mir nicht richtig ob ich das mit meiner Excel überhaupt richtig berechnen kann, es fehlen Vergleichswerte ... bis ca. 1.500 Partien habe ich genug.

Dennoch, die Excel Tabelle gibt unglaublicher Weise aus:
Eine solche Abweichung passiert in 1 / 8.920 Fällen!

Da muss ich aber viele Engines in die SWCR aufnehmen um das zu überprüfen
So lange lebe ich nicht mehr!

Kann irgendwie nicht stimmen ist aber die logische Berechnung aufgrund bisheriger Statistik-Kurven.

Wäre dem so ...
Eine echte statistische Sensation

Wenn es denn interessiert!

Gruß
Frank

Übrigens, von Partiennummer 2.000 auf 3.000 verlor Spike 15 ELO !!!!
Parent - - By Frank Quisinsky Date 2011-05-18 20:57 Edited 2011-05-18 21:04
Ganz wirr macht mich dabei:

1. Keine Auffälligkeiten bei der Remisquote ...
2. Spike 1.4 Turin hat also 3.560 Partien gespielt, bedeutet ... 3.560 : 40 = 89 Gegner !!!

Wirft mal wieder alles über den Haufen.
Wenn das die Regel wäre, könnten wir alle Ratinglisten in die Tonne, denn ...

Meine Prognose gibt aus ...

Spike 1.4 Turin hat jetzt: 3.560 Partien
Auf 5.000 Partien: weitere -6 ELO
Auf 7.500 Partien: weitere -2 ELO
Auf 10.000 Partien: weitere - 1 ELO

Demnach würde Spike 1.4 Turin weitere 9 ELO von 3.560 auf 10.000 Partien verlieren wenn von der gleichen Regelmäßigkeit bei der Entwicklung von Partie-Nummer 1 - 3560 im Vergleich von 3.560 - 10.000 ausgegangen werden würde.

Demnach hätte Spike 1.4 Turin eine ELO von 2.773
Jetzt macht es Sinn mit anderen Listen zu vergleichen ... denn ich glaube nicht das alle andere ausgerechnet auch ein Spike Problem haben / hatten. Eher zufällig irgend welche anderen Engines wenn überhaupt ... passiert ja nicht so oft.

Gruß
Frank

Mal bei Ingo geschaut, der hat noch nicht so viele Partien von Spike ... haha ... habe ich ja direkt die richtige Engine herausgepickt, den er hat natürlich fast überall mehr Partien, logischer Weise ... denn er spielt mit der Hälfe meiner Bedenkzeit. Dort hat Spike 2.779 nach 2.800 Partien. Bei mir also derzeit 2.782 nach 3.560. Insofern ... beide Ergebnisse zusammen gerechnet ... 9 ELO wird Spike dann voraussichtlich bis Partiennummer 10.000 nicht mehr verlieren.
Parent - By Benno Hartwig Date 2011-05-20 08:11 Edited 2011-05-20 08:13
[quote="Frank Quisinsky"]Demnach würde Spike 1.4 Turin weitere 9 ELO von 3.560 auf 10.000 Partien verlieren wenn von der gleichen Regelmäßigkeit bei der Entwicklung von Partie-Nummer 1 - 3560 im Vergleich von 3.560 - 10.000 ausgegangen werden würde.[/quote]Oder eben gewinnen.
Wenn du beobachtest, dass während eines Turnierverlaufs der ELO-Wert sinkt, dann ist die Wahrscheinlichkeit, dass er nun weiter sinken wird, trotzdem nicht größer als die, dass er nun wieder steigen wird. Auch nach einer Sinkphase ist eben dieser ELO-Wert deine Schätzung, der mit gleicher Wahrscheinlichkeit zu groß oder zu klein geworden ist.
Dass der ELO-Wert sank bedeutet ja nur, dass die Gewinne und Verluste sich nicht einigermaßen gleichmäßig auf die Spielfolge verteilt hatten, dass stattdessen am Anfang mehr Siege lagen als später. Und aus dieser zufälligen Reihenfolge lässt sich keine zusätzliche Information zur Spielstärke der Engine ziehen.
(Es sei denn, natürlich, du hättest was an den Gegebenheiten geändert, den Parametern, dem Buch, der Hashgröße... Aber so böse bist du sicher nicht. )

Benno
Parent - - By Werner Mueller Date 2011-05-19 08:50
[quote="Frank Quisinsky"]
...
Aber jetzt ...
Von Partie-Nummer 1.000 - 3.560 verlor Spike 1.4 Leiden 21 ELO.
Einstiegsrating in der SWCR-32 war 2803 nach 1.000 Partien, derzeitiges Rating ist 2.782!

Das ist der absolute Negativ Rekord hinsichtlich ELO-Entwicklung den ich jemals hatte.
...

Übrigens, von Partiennummer 2.000 auf 3.000 verlor Spike 15 ELO !!!!
...
[/quote]
Was soll ich da erst sagen?
Ich habe in meinem letzten Turnier (9 Partien) mehr als 30 ELO-Punkte verloren!!!

(... etwas zum Nachdenken für Dich, und nicht nur für Dich , der Du

a) fast an der Welt verzweifelst weil eine Engine nach 2560 Partien 21 'ELO'-Punkte verloren hat
b) (hoffentlich) weißt, dass ein ELO-Verlust von mehr als 30 Punkten nach 9 Partien absolut nichts außergewöhnliches ist und
c) trotzdem nicht verstehen (oder wenigstens mal am Gegenteil zweifeln) willst, dass Listen-Ratingzahlen und ELO-Zahlen verschiedene mathematische Größen sind) 
Parent - - By Kurt Utzinger Date 2011-05-19 19:45
Hallo Werner
Ich kann die Aufregung von Frank auch nicht verstehen.
Mfg
Kurt
Parent - - By Benno Hartwig Date 2011-05-20 08:17
[quote="Kurt Utzinger"]Ich kann die Aufregung von Frank auch nicht verstehen.[/quote]'Aufregung' ist hier auch das falsche Wort.
Frank 'interessiert' sich eben. Für das Schachliche, das Technische, und eben auch für die Mathematik, die hinter der Beurteilung steckt. Wundern inbegriffen!
Seien wir ihm und manch anderem dankbar dafür, dass dies mit einem gewissen Enthusiasmus und öffentlich geschieht.

Benno
Parent - By Kurt Utzinger Date 2011-05-20 12:46
[quote="Benno Hartwig"]
[quote="Kurt Utzinger"]Ich kann die Aufregung von Frank auch nicht verstehen.[/quote]'Aufregung' ist hier auch das falsche Wort.
Frank 'interessiert' sich eben. Für das Schachliche, das Technische, und eben auch für die Mathematik, die hinter der Beurteilung steckt. Wundern inbegriffen!
Seien wir ihm und manch anderem dankbar dafür, dass dies mit einem gewissen Enthusiasmus und öffentlich geschieht.

Benno
[/quote]

... leider versteh ich nichts von Mathematik

Gruss
Kurt
Up Topic Hauptforen / CSS-Forum / SWCR: Neuer Negativ ELO-Entwicklungs Rekord !!

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill