Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / wie genau sind elo auswertungen wirklich?
- - By ernst happe Date 2010-10-02 20:45
dazu habe ich eine frage:

gibt es ein programm mit der man die standardabweichung der gerade berechneten elo zahl ausgeben kann?

ich meine keine error bar! 
Parent - - By Werner Mueller Date 2010-10-04 16:21
[quote="ernst happe"]
dazu habe ich eine frage:

gibt es ein programm mit der man die standardabweichung der gerade berechneten elo zahl ausgeben kann?

ich meine keine error bar! 
[/quote]
Habe ich mir schon gedacht, dass Du darauf keine Antwort erhalten wirst.
Weil nämlich die Frage (wenn ich sie denn richtig interpretiere) den Finger in genau die Wunde legt, die ich Prof._Elo_auf_den_Kopf_stellen nenne.
Parent - - By ernst happe Date 2010-10-04 18:15
hallo werner,

es gibt ja hier im forum einige die das, auch für mathematische fastlaien,
erklären könnten. ich habe die hoffnung noch nicht aufgegeben.

ernst happe
Parent - - By Werner Mueller Date 2010-10-05 08:38
[quote="ernst happe"]
hallo werner,

es gibt ja hier im forum einige die das, auch für mathematische fastlaien,
erklären könnten. ich habe die hoffnung noch nicht aufgegeben.

ernst happe
[/quote]
Mit Willis Flugschreiber klappt das!

Nun stürzen ja Flugzeuge nicht wg. defekter Flugschreiber ab - also nehmen wir statt dessen irgendein sicherheitsrelevantes Teil.

Wenn ein Flugzeug-Zulieferer die Lebensdauer dieses Teils statistisch bestimmen will - und wenn wir Glück haben (da kennen wir uns aus ) - zeichnet sich mit der Anzahl der Messungen eine Gaußsche Normalverteilung ab, um in Willis Beispiel zu bleiben, mit dem Maximum bei 500 Stunden und einer Standardabweichung (erkennt man an den Wendepunkten) von 100 Stunden.
D.h. bei einer mittleren Lebensdauer von 500 Stunden lägen die Ausfälle zu 95,45 Prozent im Intervall 500 +- 200 Stunden (wenn's um Leib und Leben geht kann man schon mal die 3-fache Standardabweichung nehmen: 99,73 Prozent der Ausfälle im Intervall 500 +- 300 Stunden).
So weit so gut (außer dass Willis Teil nicht besonders langlebig ist - ähäm ), genug Informationen um Vorkehrungen zu treffen.

Btw. , wenn wir 'Lebensdauer' durch 'Spielstärke' ersetzen, sind wir genau beim Elo-System.

Jemand habe eine Spielstärke von z.B. 2300 ELO ist gleichbedeutend mit: bei hypothetischen Messungen seiner Performance ergäbe sich eine Gaußsche Normalverteilung mit Maximum bei 2300 ELO und einer Standardabweichung von 200 ELO (diese 200 ELO habe ich jetzt nicht erfunden, das ist sozusagen die Klasseneinteilung nach Prof. Elo) und genau diese Normalverteilung liefert Wahrscheinlichkeitsaussagen für ein zu erwartendes Ergebnis bei einer konkreten Messung.
Z.B. dass mit 99,73 Prozent Wahrscheinlichkeit die gemessene (d.h. gezeigte) Performance im Intervall 2300 +- 600 ELO liegen wird. Sicher nicht eine der interessantesten Aussagen - gefällt mir jetzt aber, da angesichts derartiger +-Werte Ranglistenbetreiber grün im Gesicht werden. Nichtsdestotrotz, jeder Praktiker weiß, wie gnadenlos genau (und immer wieder) die eigenen engen(!) schachlichen Grenzen mit dem Elo-System bestätigt werden.
Festzuhalten bleibt, dass diese Normalverteilung (mit einer Standardabweichung von 200(!) ELO) das A&O des Elo-Systems ist und bei einer nackten ELO-Zahl diese Verteilung stets mitzudenken ist.

Zurück zum Flugzeug-Zulieferer und einer kleinen fiktiven Geschichte:
Der Abteilungsleiter der Qualitätssicherung nahm seinen Jahresurlaub und sein pfiffiger Stellvertreter grübelte über die +-300 Stunden, wunderte sich vor allem darüber, warum denn um Gottes Willen die mittlere Lebensdauer (die 500 Stunden) bisher nicht genauer bestimmt wurde. Möglicherweise waren's ja nur 498,6 oder aber vielleicht auch 507,5 Stunden oder gar mehr?? - hierin die Mitbewerber zu übertreffen DAS wäre doch DIE IDEE.
Und weil er pfiffig war, erinnerte er sich an seine Mathematik-Vorlesungen und den zentralen Grenzwertsatz der Statistik wonach die mittlere Lebensdauer im Prinzip beliebig genau messbar ist, die Standardabweichungen (Error-Bars) für diese mittlere Lebensdauer beliebig minimierbar sind.
Das liegt jetzt wohlgemerkt nicht an der Pfiffigkeit des Stellvertreters, sondern ist tatsächlich so. Der zentrale Grenzwertsatz besagt in etwa: wiederhole ich die anfangs beschriebene Messung N-mal, so bekomme ich natürlich N-mal eine mittlere Lebensdauer, trage ich diese Ergebnisse auf, erhalte ich (wiederum bzw. selbst dann wenn die ursprüngliche Verteilung keine Normalverteilung gewesen wäre) eine Normalverteilung (der Mittelwerte!!) und die Standardabweichung (d.h. die Error-Bars) dieser Normalverteilung der Mittelwerte geht mit dem Faktor 1/(Wurzel aus N), ist somit bei entsprechend großem N beliebig minimierbar. So in etwa rechnet z.B. EloStat.

Um die kleine Geschichte abzuschließen: das Teil war zum Glück billig in der Herstellung, das Praktikanten-Pack endlich mal ordentlich ausgelastet und nach Abschluss der Tests konnten die Teile bedruckt werden mit: 504h,26min +- 18min

Für die Moral der Geschicht' muss ich nochmal zu den Ranglistenbetreibern zurückkehren: was dem Einen sein Flugzeugabsturz sind den Anderen ihre gebetsmühlenartigen aber dennoch falschen Anmerkungen wie 'lächerlich kleine Partienanzahl', 'statistisch völlig irrelevant' usw., usw. ... zu ganz normalen, üblichen und bewährten schachlichen Turnierformen oder auch zu Engine-Tests mit überschaubarer Partienanzahl.

... und um jetzt mal richtig gemein zu sein: für das Elo-System (die Flugsicherheit sozusagen) ist eine exzessiv genaue Kenntnis der ELO-Zahl (mittleren Lebensdauer) sooo was von irrelevant! 
Parent - - By ernst happe Date 2010-10-05 21:06
hallo werner,

erst einmal vielen dank für deine ausführlichen erklärungen zur standardabweichung der elo zahl.

wie ich schon schrieb, beschreibt eine auswertung die vergangenheit, d.h. auch die gesamtheit der
gegner gegen die gespielt wurde. das heisst aber auch, das es keine absoluten wert für die spielstärke
gibt, sondern der wert relativ ist.

bei den ranglistenauswertungen wird immer wieder versucht auf einen referenzwert zu "eichen".
in meinen augen ist das ein schmarrn.

aber wenn die turniere abschnittsweise ausgewertet ( nach welchen präferenzen auch immer) werden
und daraus elo zahlen  resultieren, dann erhalte ich doch vierschiedene elo werte, eben wegen der
verschieden gegner/ eröffnungen ...

wenn ich jetzt mir eine engine herauspicke und mir die diversen elo zahlen als eine versuchsreihe ansehe,
dann müsste ich doch diese werte auch statistisch auswerten können. sind sie stabil oder schwanken
sie mehr oder weniger deutlich?

kann man daraus sinnvolle vergleiche mit verschiedenen engines anstellen? ich bin mir sicher das es möglich sein sollte.

ernst happe
Parent - By Werner Mueller Date 2010-10-06 16:00
[quote="ernst happe"]
wie ich schon schrieb, beschreibt eine auswertung die vergangenheit, d.h. auch die gesamtheit der
gegner gegen die gespielt wurde. das heisst aber auch, das es keine absoluten wert für die spielstärke
gibt, sondern der wert relativ ist.
[/quote]
Jein, die Auswertung der vorhandenen (und damit logischerweise in der Vergangenheit liegenden) Daten liefert eine (neue bzw. aktualisierte) ELO-Zahl, an der allerdings jeder Datenschützer seine helle Freude hätte - sämtliche Spuren sind sozusagen gelöscht: keine Gegner, keine Farbverteilung, keine Anzahl der Partien - absolut nichts.
Naürlich heißt das in der Elo-Theorie jetzt nicht, dass diese Zahl sozusagen 'scharf' sei, ganz im Gegenteil, die 'Unschärfe' (Gaußsche Glocke mit einer Standardabweichung von 200 ELO) ist geradzu Grundlage der Theorie und bleibt ein für allemal dieselbe.
(Wenn Du Dich an dieses defekte Flugzeugteil erinnerst - die Normalverteilung (wenn's denn eine ist) die man dort durch Messungen der Lebensdauer experimentell ermittelt hat, bekommst Du bei Elo per theoretischer Grundannahme 'verordnet').

[quote="ernst happe"]
bei den ranglistenauswertungen wird immer wieder versucht auf einen referenzwert zu "eichen".
in meinen augen ist das ein schmarrn.
[/quote]
Weiß ich jetzt nicht, was ich hier in den Diskussionen so mitgelesen haben, ist es wohl nicht ganz unproblematisch.

[quote="ernst happe"]
aber wenn die turniere abschnittsweise ausgewertet ( nach welchen präferenzen auch immer) werden
und daraus elo zahlen  resultieren, dann erhalte ich doch vierschiedene elo werte, eben wegen der
verschieden gegner/ eröffnungen ...

wenn ich jetzt mir eine engine herauspicke und mir die diversen elo zahlen als eine versuchsreihe ansehe,
dann müsste ich doch diese werte auch statistisch auswerten können. sind sie stabil oder schwanken
sie mehr oder weniger deutlich?
[/quote]
klar

[quote="ernst happe"]
kann man daraus sinnvolle vergleiche mit verschiedenen engines anstellen? ich bin mir sicher das es möglich sein sollte.
[/quote]
Ob sinnvoll oder nicht entscheidet sich hauptsächlich daran, ob die (zu klärende) Frage sinnvoll ist oder nicht (z.B. war bei dem defekten Flugzeugteil die statistische Jagd nach der exakten mittleren Lebensdauer natürlich möglich aber völlig sinnlos und übrigens durch die falsche Interpretation als 'wahre' Lebensdauer zudem noch fatal)

Und wenn Du Statistik außerhalb des Elo-Systems betreiben willst - an dieser Stelle haben die Ranglistenbetreiber schon Recht - brauchst Du natürlich ein paar Pfunde an Datenmaterial.
Parent - - By Willi Prinz Date 2010-10-04 18:47
Du kannst ja mal tausend Zufallszahlen im Computer erzeugen,also nur 0 oder 1.
Wenn dann 475 mal 0 kommt und 525 mal 1 entpricht das etwa 50 Elo.
Das ist aber nicht relevant,weil es kann sich in noch mal tausend Spielen auch wieder drehen.
Wenn du allerdings 400 mal 0 erhällst und 600 mal 1 ist das schon relevant,und wird sich auch kaum noch ändern.
Deshalb sind geringe Unterschiede bei Engines auch nicht relevant,alle Testergebnisse die weniger als sagen wir mal 80 Elo haben können sich noch drehen.
Die Testerei mit den Engines ist deshalb nur Sinnvoll wenn grosse Unterschiede bestehen.Also sagen wir mal über 80 Elos,da wird es kritisch.
Alles darunter ist noch im Bereich Zufall einzuordnen,und deshalb nicht relevant.
Bei 10000 Spielen wären es villeicht immer noch 20 Elos,darunter wäre alles noch machbar durch den Zufall.
Statistiken werden eingesetzt  in der Industrie um Produkte zu testen,also ein Flugschreiber zB hällt durschnittlich 500 Stunden bevor er irgeneinen Fehler ,wenn auch klein produziert.
Dann wird er um die Sicherheit zu erhalten schon nach 200 Stunden ersetzt.Es gibt ja mehrere Schreiber in einem Flugzeug,also wenn einer nicht richtig funktioniert habe ich noch andere.Alle werden nach zB nach 200 ersetzt.Trotzdem stürzen Flugzeuge ab! Obwohl sie statistisch eigentlich sicher sein müssten.
Das passiert bei Computerschach auch,nur das scheint hier keinen zu interessieren.
Als Abschluss,ich würde lieber gegen einen Super Gm verlieren als gegen Fritz.
Leider spielt keiner von denen gegen mich.
Gruss Willi
Parent - - By ernst happe Date 2010-10-04 19:24
[quote="Willi Prinz"]
...
Wenn dann 475 mal 0 kommt und 525 mal 1 entpricht das etwa 50 Elo.
Das ist aber nicht relevant,weil es kann sich in noch mal tausend Spielen auch wieder drehen.
Wenn du allerdings 400 mal 0 erhällst und 600 mal 1 ist das schon relevant,und wird sich auch kaum noch ändern.

Zitat:
wie zufällig ist der zufall???

Deshalb sind geringe Unterschiede bei Engines auch nicht relevant,alle Testergebnisse die weniger als sagen wir mal 80 Elo haben können sich noch drehen.
Die Testerei mit den Engines ist deshalb nur Sinnvoll wenn grosse Unterschiede bestehen.Also sagen wir mal über 80 Elos,da wird es kritisch.
Alles darunter ist noch im Bereich Zufall einzuordnen,und deshalb nicht relevant.
Bei 10000 Spielen wären es villeicht immer noch 20 Elos,darunter wäre alles noch machbar durch den Zufall.
...
Zitat:
aua aua bei dieser aussage


Als Abschluss,ich würde lieber gegen einen Super Gm verlieren als gegen Fritz.
Leider spielt keiner von denen gegen mich.

Zitat:
viele gm`s haben mich noch nicht besiegt. habe aber schon gegen etliche gespielt, darunter auch super super gm`s

Gruss Willi

Zitat:
ernst happe
Parent - - By Willi Prinz Date 2010-10-05 16:02
Wenn du es nicht verstehts kann ich dir auch nicht helfen.
Die 475 auf 525 sind durchaus im Bereich des Zufalls.
Die 600 zu 400 sind kein Zufall,und es wird dir auch nicht gelingen diese Unterschiede mit Zufallszahlen zu produzieren.
Das würde bedeuten die Engine mit 600 Treffern ist besser als die Engine mit 400.
Die Engine mit 475 ist nach eurer Berechnung schlechter als die mit 525,das ist aber statistisch falsch,da der Unterschied auch bei Zufallszahlen auftreten kann.
Villeicht versteht du es jetzt besser.
Solange du Elounterschiede hast,die sich mit Zufallszahlen auch erzeugen lassen,ist eine genaue Bewertung nicht möglich,da sich alles auch wieder drehen kann.
Gruss Willi
Parent - By ernst happe Date 2010-10-05 17:18
hallo willi,

deine äusserungen zu dieser problematik sind zu unspezifisch und helfen nicht weiter.
auch wenn deine zahlenspeispiele zutreffend sein sollten.

es muss genauer recherchiert werden!

ernst
Parent - - By Frank Quisinsky Date 2010-10-04 20:39 Edited 2010-10-04 20:44
Hi Willi,

kannst ja mal am Mittwoch auf meine News bzw. Aktuell Seite schauen (Eintrag 054).
Derzeit läuft ein kleiner Test mit Shredder 12 x64. Die Engine liegt in der SWCR-64 14 ELO hinter Shredder 12 w32.

Lt. Ingo dürfte das nicht sein.
Auch in der CEGT liegt Shredder 12 w32 ca. 8-10 ELO vor Shredder 12 x64, siehe SWCR zu CEGT Vergleich.

Shredder 12 x64 hat bereits 1.080 Partien gespielt. Nun spiele ich weitere 520 Partien. Glaube zwar nicht, dass sich die ELO um größer als 5 noch bewegt aber möglich wäre das.

Zurück zum erwähnten SWCR zu CEGT Vergleich:
Auch BugChess wird bei mir deutlich höher bewertet als in der CEGT. Mit weiteren 120 Partien ging es bei mir um 4 ELO nach unten
Als ob es klar wäre und ich bin mir sicher das wenn die CEGT mehr Partien spielen würde ... dass die Engine dort noch etwas steigen wird.
Letztendlich treffen wir uns dann bei der irgendwo bei der ELO

Scorpio 2.6 wurde in der CEGT deutlich höher bewertet als in der SWCR, mit weiteren Partien ging es in der CEGT um 8 ELO nach unten.

Diese kleinen Spielchen mit Statistiken machen dann Spass, wenn Listen wirklich vergleichbar sind.
Die Mutmaßungen zu Entwicklungen bei vielen Partien treffen dann ins Schwarze.
Sicherlich alles sehr interessant für die CEGT Tester oder für mich, denn auch die Listenbetreiber schauen immer ein wenig auf die Arbeit der anderen!

Wie dem auch ist ... jetzt bin ich wirklich mal gespannt ob Shredder 12 x64 nach schon gespielten 1.080 Partien bei mir noch zulegen wird!
Da die CEGT mehr Shredder 12 x64 Partien muss ich davon ausgehen und erwarte eine Steigerung von bis zu +7 ELOstat ELO.

Gruß
Frank
Parent - - By Ingo Bauer Date 2010-10-04 20:47 Edited 2010-10-04 20:52
Hallo Frank,

[quote="Frank Quisinsky"]

Lt. Ingo dürfte das nicht sein.
Auch in der CEGT liegt Shredder 12 w32 ca. 8-10 ELO vor Shredder 12 x64, siehe SWCR zu CEGT Vergleich.

[/quote]

Du hast angefangen: Ich fordere dich auf mir eine Stellung zu zeigen, in denen bei gleichen Bedingungen Shredder 12 in 32 und 64 bit, bei einem Thread, unterschiedliche HV zeigen und diese hier zu posten damit jeder das prüfen kann - ich konnte bis heute keine finden! (Nicht vergessen Lernfile und Hash löschen)

Das maximal was du auf einem Intel feststellen wirst, ist ein minimaler Geschwindigkeitsunterschied, der aber niemals für 10 Elo langt!

Alles was die unterschiedlichen Elos zeigen ist, das mit Büchern eben nicht identisch getestet wird!

Gruß
Ingo

PS: Es ist übrigens der Programmier der mir das was ich behaupte mal verraten hat
Parent - - By Frank Quisinsky Date 2010-10-04 20:54 Edited 2010-10-04 21:00
Hi Ingo,

ich hatte ein paar von den Stellungen. Aber irgend etwas habe ich falsch gemacht, bei Analysen habe ich auch gleiche Ergebnisse.
Insofern gibt es kein Einspruch zu dem was Du geschrieben hast. Auch hast Du für einen solchen Vergleich wesentlich mehr Partien als ich oder die CEGT.

Es ist nur merkwürdig das auch die CEGT diese Abweichung hat bzw. Shredder 12 w32 besser bewertet.
Also sind es schon 2 Listen die sich hier einig sind.

Oftmals liegt der Hase im Detail verborgen, wahrscheinlich wird es aber so sein ... das dies ein Zufall ist.

Also, keinerlei Einspruch zu Deinen Äußerungen ... werde mich hüten ... hast deutlich mehr Partien und in den angesprochenen Analysen wirds auch klar.
Wenn ich aber auch nach weiteren 500 Partien wieder zu dem Ergebnis komme, dass dann schon nach 1.500 Partien der Unterschied um 10 ELO liegt ... ja dann ... dann heißt das auch nichts
Sind heit nur 10 ELO, so genau misst meine Ratingliste nicht und solche Abweichungen sind auch nicht sonderlich wichtig.

Aber dennoch ...
Die 520 Partien laufen ...
Bin dennoch neugierig!

Gruß
Frank

Sofern ein Interesse besteht kann ich die Ratingliste nach den 120 Partien mit BugChess und 520 Partien mit Shredder 12 x64 hier mal posten bzw. vergleichen mit der Ratingliste vorher.
Irgendwie eine Schnapsidee dafür die laufende SWCR zu unterbrechen aber das beschäftigt mich gerade und Punkt und Basta
Parent - - By Ingo Bauer Date 2010-10-04 20:59
[quote="Frank Quisinsky"]

Es ist nur merkwürdig das auch die CEGT diese Abweichung hat bzw. Shredder 12 w32 besser bewertet.
Also sind es schon 2 Listen die sich hier einig sind.

[/quote]

Nicht das ich viel davon halte, aber wie ist das nochmal bei der 40/40 CCRL - und zwar ziemlich deutlich mehr als 10 Elo?

Alles was das zeigt ist das mit Bücher nicht identisch getestet wird!

Gruß
Ingo
Parent - - By Frank Quisinsky Date 2010-10-04 21:03 Edited 2010-10-04 21:07
Hi Ingo,

Bücher
Das Gespenst in den Köpfen der User weil ... hier können User beeinflussen und Glauben fest an Ihre Arbeiten.
Aber dies alles gleicht sich mit der Partieanzahl aus.

Wenn ich auf den Vergleich CEGT zu SWCR schaue (beide Listen spielen mit komplett anderen Eröffnungssystmen) ist die durchschnittliche Abweichung 0.5 ELO.
Soweit zum Einfluss von Büchern nach x hundert Partien.

Der Bucheinfluss ist maximal dann interessant wenn zwei Engines gegeneinander spielen und ein Buch dann wirklich auf eine Engine getunt wurde.
Speilen aber x Engines gegeneinander ist der Bucheinfluss = 0 ELO. Spätestens wenn ein getuntes Buch gegen Engine x auf Engine y trifft ... tja dann ist dieses Buch schon wieder mit dem Latain am Ende.

Auch wenn das jetzt nicht für eine Pro-User-Stimmung sorgt aber der CEGT zu SWCR Vergleich ist so gewaltig und haut jegliche andere Meinung eindrucksvoll in die Tonne. Wichtig ist einfach nur, dass die verwendeten Eröffnungssysteme gut ausgewählt wurden, weitestgehend fehlerfrei sind ... das erstellte Random Buch leistet hervorragende Dienste nach nun fast 10.000 neuen SWCR Partien. Eine gigantisch gute Statistik, so habe ich ein für mich perfektes Buch (und perfekt ist da noch untertrieben formuliert) für die Ratingliste.

Gruß
Frank
Parent - - By Ingo Bauer Date 2010-10-04 21:08 Edited 2010-10-04 21:11
Moin

[quote="Frank Quisinsky"]

Bücher
Das Gespenst in den Köpfen der User weil ... hier können User beeinflussen und Glauben fest an Ihre Arbeiten.
[/quote]

Ausdrücklich: Ich glaube nicht das du oder die CEGt irgendetwas beeinflußt, absichtlich schon gar nicht. Ihr öffnet nur dem Zufall Tür und Tor! Bei der einen Lsite nach oben, bei der anderen nach unten ...

[quote="Frank Quisinsky"]
Aber dies alles gleich sich aus.
[/quote]

Auch da meine Zustimmung, und du führst gerade den Beweis das dazu 1000 und wahrscheinlcih auch 1500 Spiele nicht ausreichen! Danke!

[quote="Frank Quisinsky"]
Der Bucheinfluss ist maximal dann interessant wenn zwei Engines gegeneinander spielen und ein Buch dann wirklich auf eine Engine getunt wurde.
Speilen aber x Engines gegeneinander ist der Bucheinfluss = 0 ELO.

Auch wenn das jetzt nicht für eine Pro-User-Stimmung sorgt aber der CEGT zu SWCR Vergleich ist so gewaltig und haut jegliche andere Meinung eindrucksvoll in die Tonne.

[/quote]

Ich freue mich das du an etwas glauben kannst. Fakt ist, beide Enignes sind identisch (auf Intel). Eventuelle Unterschiede kommen von aussen. Woher? Mir egal, wenns nicht die Bücher sind müßt 'ihr' das klären!

Gruß
Ingo
Parent - - By Frank Quisinsky Date 2010-10-04 21:15
Hi Ingo,

mit beeinflussen meinte ich eher ...
Bei der Erstellung eines Buches Systeme bevorzugt ausspielen lassen oder nicht.
Mit beeinflussen war jetzt nicht gemeint eine Ratingliste zu beeinflussen

Und zu der Anzahl der Partien ...
Du kennst meine Meinung. Bei ca. 500 Partien hast Du einen 1/50 Fall das eine ELO von mir als +-15 also 30 ELO abweicht. Das geht aus jeder meiner Statistiken hervor und glaube mir ... in 15 Jahren Eng-Eng und Ratinglisten hat sich so einiges angesammelt.

Deswegen poste ich so oft die ELO-Entwicklungen von laufenden Turnieren. Beim derzeit laufenden Turnier war die ELO von Hiarcs 13.1 nach 90 Partien stabil, von GullChess 1.0a nach ca. 320 Partien. Aufgrund der hohen Remisquote schwankt alles ein wenig bei Firebird 1.1 (je nach Berechnungsgrogramm) und bei IvanHoe geht es beständig nach oben. Selbst nach 506 Partien kann ich noch nicht sagen ab wann die ELO stabil war. Bei Naum 4.2 w32 waren es 620 Partien (Rekord) ... der 1/50 Fall lies eindrucksvoll grüßen.

Vermute die CEGT hat den 1/50 Fall bei Spark 0.4!

Aber ich stimme Dir zu, dass wenn es darum geht das eine Liste im Bereich +-5 (10 ELO) genau sein soll ... natürlich wesentlich mehr Partien notwendig sind.
Glaube hier reiben wir uns obwohl wir letztendlich die selben Statistiken sehen ... weil unser Anspruchsdenken ... wie genau soll die Liste werden ... auseinander geht.

Gruß
Frank
Parent - - By Ingo Bauer Date 2010-10-04 21:22
Hallo Frank,

[quote="Frank Quisinsky"]
Du kennst meine Meinung. Bei ca. 500 Partien hast Du einen 1/50 Fall das eine ELO von ...
[/quote]

Ja, Frank kenne ich, neulich waren es noch 1/52 die zu 1/3 Wahrscheinlichkeit eintreten ...

Sorry, ich glaube eher Johann Carl Friedrich Gauß (http://de.wikipedia.org/wiki/Gauss) als dir (und beides muß ich glauben weil da ich es nicht selber verstehe)

Gruß
Ingo
Parent - - By Frank Quisinsky Date 2010-10-04 21:29 Edited 2010-10-04 21:35
Hi Ingo,

1/50 ... 1/52 bei 480 Partien um ganz genau so sein!

Rechne da lieber mit Wahrscheinlichkeiten als mit irgend welchen anderen Komponenten.
Sage ja nicht, das dies die einzige Wahrheit ist, aber ich fahre ganz gut damit und komme letztendlich immer auf sehr gute Prognosen.

Die Wahrscheinlichkeit das Shredder 12 x64 von 1.080 auf 1.600 Partien um 5 ELO (Bayesian Auswertungsprogramm) zunimmt liegt bei 1 zu 28 ... mit 3x??? und 1x! versehen ... in dieser Reihenfolge.
Da ich vermute diesen Fall zu haben ... aber lassen wird das.

Meine Wahrscheinlichkeitsberechnungen hinken wenn es über 800 Partien geht.
Habe dafür nicht ausreichend Vergleichswerte zumal ich nicht weiß wie ich verschiedene Vergleichswerte vernünftig bei Wahrscheinlichkeitsberechnungen zusammenfügen soll.
Bin kein Statistiker, lese mich gerne in die Materie aber verstehe noch lange nicht alles. Sehr fazinierendes Thema wenn Interesse besteht, ansonsten sicherlich langweilig.

Und insofern ... ein wenig Statistik Spielerei.
Dem Betreiber einer Ratingliste soll es ja auch ein wenig Spass machen

Gruß
Frank
Parent - - By Frank Quisinsky Date 2010-10-04 21:48
Hi Ingo,

übrigens, habe das am WE beim Stockfish 1.9 JA Test von Dir auch mal verfolgt.
Dein Stockfish 1.9 ELO war bereits nach 190 Partien stabil, also sehr schnell!

Bei Stockfish 1.8 x64 bei mir nach 245 Partien.
Bei Stockfish 1.7.1 x64 bei mir nach 210 Partien.
Bei Stockfish also bei mir auch immer sehr schnell!
Aber das sind jetzt "wahrscheinlich" eher Zufälle

Der Durchschnittswert wann eine ELO stabil wird liegt bei 280 Partien +-15, maximale Abweichung = 30.
Oftmals dauert es wirklich bis zu Partiennummer 420, bei 480 schon sehr genau 1/52 Fall und nach 600 Partien sehr genau!

Gruß
Frank
Parent - - By Ingo Bauer Date 2010-10-04 21:59
Frank,

wie schon mal erwähnt, ich finde es faszinierend was du alles glaubst.

Ich werde jetzt beim nächsten Stockfish erst spielen lassen, dann die 189 Partien die Stockfish bei mir verloren hat raussuchen und die zuerst spielen, anschließend die 696 Remisen und dann die 1115 gewonnen Spiele (um Stockfish 1.9 als Bsp anzuführen) und schon bin ich für dich und deine Art an Statistiken zu glauben so etwas wie der Antichrist!

Gruß
Ingo
Parent - - By Frank Quisinsky Date 2010-10-04 22:05 Edited 2010-10-04 22:10
Hi Ingo,

das hat aber weniger mit Glauben zu tun Ingo.
Sondern mit den Ergebnissen und Statistiken die erzielt wurden.
Wobei jede Statistik kann selbst gestaltet und gedeutet werden, dass hat dann eher etwas mit Glauben zu tun.

Glaube noch lange nicht alles was mir auch die eigenen Statistiken vorgaukeln.
Daher beschäftige ich mich ja auch mit dem Thema.

Und so war das nicht gemeint ... Stockfish nur 189 Partien.
Aber verfolge doch mal Deine eigenen Ausgaben und fertige Dir selbst Kurven zu den Enwicklungen an.
Denke das Du das gar nicht machst und von daher ist es auch müßig mit Dir darüber zu diskutieren.

Ich weiß, ich weiß ...

Verfolge das einfach mal bei den kommenden 10 Engines Deiner Ratingliste, oder sagen wir mal bei den kommenden 20.
Wir werden so große Gemeinsamkeiten feiern können, niemand wird dann verstehen das wir eine so einheitliche Meinung haben

Mensch Alter ...
Wenn ich so lese was Du laufend schreibst muss die ErrorBar in Deinem Gebetsbuch stehen

Habe von allen 95 Engines der SWCR die ELO Entwicklungskurve aufgezeichnet.
Die aufwendigste Arbeit die ich mir bei der Erstellung der Liste gemacht habe.

Gruß
Frank
Parent - By Frank Quisinsky Date 2010-10-04 22:13 Edited 2010-10-04 22:16
Hallo zusammen,

wer ein Interesse daran hat ...
Ein wenig selbst ist der Mann.
In den SWCR Datenbanken ist zu jeder Partie natürlich das Datum gesavt.
Sehr einfach ... aber zeitaufwendig weil im Jahre 2010 immer noch keine Schach GUI solche Statistiken ausspuckt

Die wirklichen Knaller Funktionen fehlen einfach aber was solls, geht auch so!

Gruß
Frank
Parent - - By Ingo Bauer Date 2010-10-04 22:17
Frank, ich versuche es EINMAL mit einem Argument:

[quote="Frank Quisinsky"]
...
Aber verfolge doch mal Deine eigenen Ausgaben und fertige Dir selbst Kurven zu den Enwicklungen an.
Denke das Du das gar nicht machst und von daher ist es auch müßig mit Dir darüber zu diskutieren.

Verfolge das einfach mal bei den kommenden 10 Engines Deiner Ratingliste, oder sagen wir mal bei den kommenden 20.
...
[/quote]

Natürlich ändert sich das Rating nach einer Anzahl X nicht im Allgemeinen mehr sonderlich. Das ist aber keine gesicherte Aussage, sondern ein Fakt der zufälligen Anordnung der Eröffnungen. Die nächste Engine könnte durch einen dummen Zufall erst alle verlorenen Spiel spielen und dann die gewonnen. (Erst alle miesen, dann Remisen ...)
Dieser Fakt hat auch NICHTS mit der Fehlerbreite am ENDE einer Spielserie zu tun, sondern ist nur der zufälligen Folge an Spielen geschuldet. Zu denken man könnte nach 200 Spielen ein stabiles Rating erreicht ist also Grundfalsch weil dieses 200 Spiele-Rating sehr zufällig ist. Deswegen gibt es die Standardabweichung die mit mehr Spielen kleiner wird.

Ich fürchte aber das alles ficht dich und deine "Einzweiundfünfzigdrittel-Theorie" nicht an. 

Gruß und gute Nacht
Ingo
Parent - - By Frank Quisinsky Date 2010-10-04 22:32 Edited 2010-10-04 22:35
Hi Ingo,

dieser von Dir beschriebene Zufall wird aber mit jeder Partie die hinzu kommt immer kleiner und letztendlich kann dieser schon nach wenigen Partien außer Acht gelassen werden. Zumal zu diesem Zufall kommt ja noch eine zweite viel wichtigere Zufallskomponente ... Eröffnung ist schlecht oder nicht. Das eine Eröffnung schlecht für ein Programm ist, dennoch gewählt wird, ist der zweite Zufallsfaktor. Diesen zweiten Zufallsfaktor kannst du mit dem Buch minimieren. Bei dem Random Buch habe ich Stockfish 1.7.1 4 Cores je eine Minute an den Endsstellungen rechnen lassen. Das reicht im Grunde aus um diesen Zufallsfaktor stark zu minimieren. So stark, dass nach 10.000 Partien mit dem Random Buch kaum Partien durch Buchzüge verloren wurden bzw. Engines in stark schwache Eröffnungen liefen. Kommt natürlich vor aber dieser Zufallsfaktor ist so gering, so absolut gering das dieser dann mit jeder weiteren Partien immer mehr abnimmt und dann wahrscheinlich schon bei Partienummer 20 im Grunde nicht mehr vorhanden ist, keine Ahnung.

Nun spielst Du mit festen Eröffnungssystemen. Das hat auch Vorteile. So kannst Du Statistiken über die Eröffnungssysteme für jede Engine erstellen aber diese Statistiken bringen nichts bzw. spiegeln keinen wirklichen Nutzen wieder. Das z. B. franz. generell schlecht für Computerprogramme ist, ist bekannt. Das Schachprogramme zu passiv bei Skandinavisch vorgehen ist bekannt. Das Holländisch nicht gut ist, ist bekannt. Das der Sinn einer Gambit-Variante nicht errechnet werden kann ist bekannt bzw. stellen die Computerschachprogramme viele Gambit-Varianten ja selbst in den Zweifel. Möchte gar nicht wissen wie viele Neuerungen Computerschachprogramme beim Eng-Eng Spiel schon in kürzester Zeit errechnet haben.

Ich denke nicht, dass ich nach 200 Partien ein stabiles Rating habe. Das habe ich nach 200 Partien nicht, ca. nach 480 Partien habe ich dieses stabile Rating dann ... wenn mein Anspruchsdenken nicht über +-15 geht.

Ich kämpfe hier mit einem ganz anderen Problem.
Meine Statistiken sind verwischt und das selbstverschuldet.

Beispiel von meinem SWCR-64 *.sto file:

Code:
Elo=2890
[PLAYER24]
Name=Hiarcs 13.1
EngFile=C:\Chess\Shredder 12\engines\Hiarcs 13.1.eng
BookFile=C:\Documents and Settings\Administrator\My Documents\ShredderChess\Books\swcr-fq-random-book-v4.1.bkt
OwnBook=0
HashMB=256
Elo=2745
[PAIRINGS]
Hiarcs 13.1 - FireBird 1.1 x64 WD===0===00=00===0100=00=
Hiarcs 13.1 - IvanHoe B52aC x64=0=00=01==000==0001=11=XXXXXXXXXXXXXXXXXX
Hiarcs 13.1 - Equinox 0.83 x64=1==11=1===1=10==011=11XXXXXXXXXXXXXXXXXX
Hiarcs 13.1 - Umko 1.0 x64=01=011=1=1===11=0=11=1XXXXXXXXXXXXXXXXXX
Hiarcs 13.1 - GullChess 1.0a x64====1=1=1=0=1=01=001=01XXXXXXXXXXXXXXXXXX
Hiarcs 13.1 - Fruit 09_07_05 x64=0===1=1=11=01=00===0=0XXXXXXXXXXXXXXXXXX
Hiarcs 13.1 - Crafty 23.3 JA x64==1=110101110110111101=XXXXXXXXXXXXXXXXXX
Hiarcs 13.1 - Critter 0.80 x64=1==0==0=0====0=====00=XXXXXXXXXXXXXXXXXX
Hiarcs 13.1 - Zappa Mexico II x64=00010=000=1=1=0=11==1=XXXXXXXXXXXXXXXXXX
Hiarcs 13.1 - Junior 11.2 x64=011=10111===00111=1000XXXXXXXXXXXXXXXXXX
Hiarcs 13.1 - Hannibal 1.0a x64=1==1100111==0=0110=1=0XXXXXXXXXXXXXXXXXX
Hiarcs 13.1 - Komodo 1.2 JA x64===1=10=0=0=001=00=0===XXXXXXXXXXXXXXXXXX
Hiarcs 13.1 - Thinker 5.4d Inert x64==011=11==0=1=0===101==XXXXXXXXXXXXXXXXXX
Hiarcs 13.1 - Loop 2007 x64=11101=1=1111=0111=0=11XXXXXXXXXXXXXXXXXX
Hiarcs 13.1 - Stockfish 1.8.0 JA x64=0=00==00=0100==00==0=0XXXXXXXXXXXXXXXXXX
Hiarcs 13.1 - Naum 4.2 x64==000==010000=00=1==1==XXXXXXXXXXXXXXXXXX
Hiarcs 13.1 - Spark 0.5 x64=0=1==0101=1==1==1=10==XXXXXXXXXXXXXXXXXX
Hiarcs 13.1 - Onno 1.2.70 x64===1=110==1=00111001010XXXXXXXXXXXXXXXXXX
Hiarcs 13.1 - SmarThink 1.20 x64=10=1=1=1101=1===111111XXXXXXXXXXXXXXXXXX
Hiarcs 13.1 - Protector 1.3.4 JA x64====0=1=10111=0=0==1101XXXXXXXXXXXXXXXXXX
Hiarcs 13.1 - Sjeng WC-2008 x64===11=01011=11=0=11==11XXXXXXXXXXXXXXXXXX
Hiarcs 13.1 - Rybka 4 x64=0000=000=0=00==000=000XXXXXXXXXXXXXXXXXX
Hiarcs 13.1 - Shredder 12=00=010=======00==00===XXXXXXXXXXXXXXXXXX


Hiarcs 13.1 steht im Moment auf Stop daher die vielen Xse Mister X
Weil ab Mittwoch die Absturzengine Firebird 1.1 wieder spielt und ich die Abstürze korrigieren kann.

Aber das meine ich nicht ...
Hiarcs 13.1 immer mit weiß vorne
Anstatt abwechselt.

So spielt Hiarcs 23 Partien mit weiß, dann wieder 23 Partien mit schwarz und aufgrund vom Anzugsvorteil gehen bei wenigen Partien die ELOs auch laufend rauf und runter.
Das im Nachhinein rauszurechnen ist fast unmöglich.

Und so gehe ich schon seit Ewigkeiten vor wenn ich eine neue Engine per Hand in die *.sto Datei einpicke.
Tja, niemand ist perfekt und daran siehst Du ... ich schon mal gar nicht.
Auch ich mache Fehler und oftmals fallen mir diese leider erst später auf.

Gruß
Frank
Parent - By Frank Quisinsky Date 2010-10-04 22:49 Edited 2010-10-04 22:56
Hi Ingo,

wenn es Dir rein um Statistiken geht machst Du im Grunde den gleichen Fehler.
Schaue ich auf Deinen Spießroutenlauf, z. B. bei Stockfish ... steht Stockfish immer vorne.
Also erst x Partien mit weiß dann mit schwarz ...

Das meine ich.
So kommst Du nach wenigen Partien nicht zu einer genaueren Aussage (Anzugsvorteil, Gewinne weiß und schwarz, schaue in Deine Datenbank).

Habe das mal ein wenig verfolgt (mein Fehler, bzw. dieser ist mir schon länger bekannt).

Im Grunde +-15 ELO könnte schon nach 350 Partien erreicht werden und nicht erst nach 480 Partien wenn abwechselt gespielt wird.
So mein vermutestes Ergebnis aus diesem Umstand.

Habe ja auch schon Turniere gespielt und komplett von der Shredder GUI einpicken lassen ohne das die selbst das *.sto File verändert habe.

Weiß jetzt gar nicht wie Shredder GUI beim Spießroutenlauf vorgeht.
Vielleicht spielen die Engines ja mit Farbvertausch, auch wenn in der Ausgabe Stockfish immer vorne steht.
Wollte das morgen mal ausprobieren bzw. derzeit läuft ja Shredder 12 x64 520 Partien im Spießroutenlauf. Werde gleich im Anschluss mal in die Datenbank schauen.

Bei den Turnieren unter der Shredder GUI ist das nicht so. Steht Hiarcs 13.1 vorne ... immer 23 Partien mit weiß dann 23 Partien mit schwarz ... bei 24 Engiens im Turnier. Hoffe Du kommst noch mit wenn es Dich interessiert.
Vielleicht ändert das Stefan mal ... kleiner Fehler bzw. hat er sicherlich selbst nicht daran gedacht.

Das Endergebnis nach x Hundert Partien ist nicht betroffen, aber die Statisitken die dort hin führen.
Und das ist mit Verlaub gesagt ... SCHEI ... zumindest dann wenn Du so vorgehen würdest wie ich ... bzw. zu jeder Engine eine ELO Entwicklunskurve hättest.

Wird Dich aber wahrscheinlich gar nicht interessieren, vermute ich mal!

Gruß
Frank
Parent - - By Frank Quisinsky Date 2010-10-05 06:56 Edited 2010-10-05 07:05
Hi Ingo,

mal ein Zwischenstand (morgen Abend endet der Test).

VORHER

Code:
06. Shredder 12 w32              2.800   14   14  1688   63%  2.703 35%
06. Komodo 1.2 JA x64            2.800   15   15  1488   64%  2.700 40%
--. Komodo 1.0 JA x64            2.789   20   20   840   64%  2.691 40%
--. Shredder 12 x64              2.786   18   18  1080   61%  2.705 35%


156 der 520 Partien sind gespielt.
Später werden ja die IPP Familie Engines herausgeholt.
Hier noch nicht einberechnet (Shredder 12 w32 hat gegen alle IPPs gespielt, Shredder 12 x64 nicht). Ansonsten hätten dann später beide Shredder 12 Versionen 40 Partien gegen alle anderen der Liste gespielt (nur nicht gegeneinander). 45 Engines - 4x Ipp - 1x gleiche Engine = 40 Gegner x 40 Partien = 1.600 Partien.
Thema Angstgegner, wobei das 2 ELO ausmacht, gerade überprüft ...
Hätte Shredder 12 w32 also nicht gegen die IPP Familie gespielt würde Shredder x64 nochmals 2 ELO näher an die x64 dran sein.

Dennoch schön zu sehen ... nach 156 Partien 3 ELO aufgeholt (+ die gedanklichen 2 ELO wegen der IPP Familie).
Der Verdacht scheint sich zu bestätigen.
Mal abwarten ...

NACHHER

Code:
06. Shredder 12 w32              2.800   14   14  1688   63%  2.703 35%
06. Komodo 1.2 JA x64            2.800   15   15  1488   64%  2.700 40%
--. Shredder 12 x64              2.789   17   16  1236   63%  2.698 35%
--. Komodo 1.0 JA x64            2.789   20   20   840   64%  2.691 40%


Dennoch, dieser Test kann auch anders laufen ...
Diese wenigen ELO zu messen ist bekanntlich fast unmöglich!
Aber die SWCR rückt zumindest näher an die Ergebnisse der CEGT.
CEGT hat knapp über 2.000 Shredder 12 x64 und genau 1.000 Shredder 12 w32 Partien.

Interessant ist es auch die ErrorBar zu beobachten.
Während Shredder 12 x64 sich um 3 ELO verbessert hat, ist die ErrorBar um durchschnittlich (beide Werte) um 1.5 zurück gegangen.
Für die Error Bar Freaks

Gruß
Frank
Parent - - By Frank Quisinsky Date 2010-10-05 07:22 Edited 2010-10-05 07:31
Hi,

übrigens zeigt dieser Test auch auf ...
In der SWCR ist die Mindestpartieanzahl 800!
Die meisten haben aber weit über 1.000 Partien gespielt, nur Engines die oft upgdatet werden bleiben dann in der Regel bei mir bei ca. 800 Partien stehen.

Bei 800 Partien, so nach meinen Statistiken, ist es wahrscheinlich das die ELO um +-5 = ca. 10 Punkte genau ist bzw. schwanken können. Hier und da mal 15 und in ganz wenigen Fällen ... ich vermute 2 Fälle zwischen 15-20 ELO Abweichung zum wahrscheinlich tatsächlichen Endergebnis.

Damit ist mein Anspruchsdenken ... wie genau muss eine Liste sein ... erfüllt.
Ganz unabhängig von der Frage ob das ELO-System wirklich gut ist.

Interessant ist die Frage:
Wie könnte ich das Ergebnis verbessern?

Bei 800 Partien sind also Abweichungen von durchschnittlichen 10 ELO pro Engine vom wahrscheinlich tatsächlichen Endergebnis vorhanden.
Möchte ich diese 10 ELO drücken auf sage ich mal 5 ELO (immer ganz unabhängig von der ErrorBar die von Maximalwerten ausgeht, die selten eintreffen) müsste ich nach meiner Hochrechnung 4.000 Partien vorliegen haben bei der gleichen Anzahl an Gegnern oder ca. 3.500 Partien wenn ich die Anzahl der Gegner auf 25% erhöhe. Das bedeutet 6x so viele Partien wie jetzt bei der gleichen Anzahl an Gegner. Die These mit der Anzahl der unterschiedlichen Gegner wackelt etwas ... bin mir selbst nicht zu 100% sicher aber ich gehe davon aus ... das die sinnvolle Schwelle bei 23-26 Gegner erreicht wurde.

Dann wieder zurück zu der Frage ...
Macht das wirklich noch Sinn bzw. wie schaut es mit dem Anspruchsdenken aus.

Bis 620 Partien macht es Sinn, da die Kurve steiler nach oben geht. Aber ab ca. 620 Partien wirds dann wirklich sehr genau und ob nach 620 Partien eine Liste dann bei den durchschnittlichen Abweichungen 10 ELO aufweist oder nach 4.000 Partien 5 ELO ausweist ist ein Unterschied. Also mir würden auch 620 Partien ausreichen (Naum 4.2 w32 Test, Naum zeigte nach 620 als Engine die am Meisten abweichte ein stabiles Ergebnis). Es sind in der SWCR dennoch nun über 800 Partien wegen der 40 Partien Regel (immer 40 Partien gegeneinander). Selbst verfolge ich den Ansatz, dass nicht die Partiemenge ab Partie Nummer x maßgeblich alleine entscheidend ist, sondern die Anzahl der Gegner. Das heißt das auch bei weniger Partien und mehr Gegner die zweite Komponente greift und eine ELO schneller aussagekräftig wird.

Mit anderen Worten ...
Listen bei denen Engines durchschnittlich mehr als 620 Partien gespielt haben sind sehr aussagekräftig wenn viele Gegner zur Ermittlung der 620 Partien beigetragen haben. Alles andere (mehr Partien, mein Anspruchsdenken) ist meines Erachtens unnötig auch wenn letztendlich die Genauigkeit mit mehr Partien steigt, so steht das nicht mehr in einem gesunden Verhältnis zur Anzahl der notwendigen Partien.

Schreibe das mit dem Anspruchsdenken immer dabei.
Eine Liste mit einem Wert auf den ELO genau kann es nicht geben bzw. sind zu viele Partien notwendig und schwanken wirds dann immer noch wegen der Gegner ... um ca. 3 ELO, selbst bei 20.000 Partien!
Eine Liste mit unterschiedlichen Bedingungen wird auch immer knapp unterschiedliche Ergebnisse produzieren (Beeinflussungsfaktoren).

Gruß
Frank

PS:
Meine viel beschriebenen Ansätze und Erfahrungen mit Listen, jetzt mal in Kurzforum ... auch wenn schon 100x immer darauf hingewiesen.
Parent - By Frank Quisinsky Date 2010-10-05 07:37
Hi,

bevor jetzt die altbekannten Einwende von Dir kommen ...
Ich sage mal so ...

Was ich hier feststellte bei der Beobachtung der ELO-Entwicklungen der Engines ist die Praxis.
Was ELOstat oder Bayesian ausgibt die Theorie.

Die Programme gehen von Maximalwerten, also seltenen Fällen aus.
Ob diese Fälle dann wirklich eintreffen ist Theorie!

Wie wahrscheinlich ist es, dass Du in Deinem Leben vom Blitz getroffen wirst?

Gruß
Frank
Parent - - By Werner Schüle Date 2010-10-04 22:49
Hallo Ingo,
wenn ich vor jeder Analyse die engines zuücksetze, sind die Analysen absolut identisch.
Nachdem ich aber nacheinander ein paar Stellungen des WM Tests parallel analysieren ließ  ohne die Engines vorher zurückzustellen, bekam ich plötzlich unterschiedliche Ergebnisse. Das liegt also am Lernverhalten der engines und so etwas passiert sicher auch bei den Spielen.
Beispiel:
Deep Shredder 12 x64 by Stefan Meyer-Kahlen, www.shredderchess.com
Deep Shredder 12 UCI by Stefan Meyer-Kahlen, www.shredderchess.com
CPU0: AuthenticAMD AMD64 Family 15 Model 43 Stepping 1 2700 MHz
CPU1: AuthenticAMD AMD64 Family 15 Model 43 Stepping 1 2700 MHz
GUI: Tablebases mit max. 0 Steinen gefunden! [Cache: 16 MB + intern 0.00 MB]
GUI: Shredderbases mit 0 Steinen gefunden! (0 MB)
Engine: Deep Shredder 12 x64 1CPU (128 MB)
von Stefan Meyer-Kahlen
loading shredderbase C:\Users\Werner\AppData\Roaming\ShredderChess\Shredderbases\all34.tbe
shredderbases with 4 pieces found (1 MB)
20/34   0:01   +1.30   1.Kc3 Kd8 2.Lxg3 Lc5 3.Le5 b4+ 4.Kc4 Lf8 5.Lh2 Le7 6.Lg3 Kc8 7.Le5 Kd8 (889.596) 759  TB:68  SB:13
21/39   0:02   +1.30   1.Kc3 Kd8 2.Lxg3 Lc5 3.Le5 b4+ 4.Kc4 Lf8 5.Lh2 Le7 6.Lg3 Kc8 (1.573.821) 762  TB:410  SB:164
22/39   0:02   +1.26   1.Kc3 Kd8 2.Lxg3 Lc5 3.Le5 b4+ 4.Kc4 Lf8 5.Lh2 Le7 (2.330.794) 780  TB:735  SB:203
22/52   0:19   +2.88   1.Lf6 g4 2.Kc3 Ld6 3.Lg7 b4+ 4.Kc4 b3 5.Kxb3 Lf4 6.Kb4 (16.098.521) 841  TB:3.010  SB:4.203
23/44   0:21   +2.83   1.Lf6 g4 2.Kc3 Ld6 3.Lg7 b4+ 4.Kc4 b3 5.Kxb3 Lf4 6.Kb4 (17.923.763) 840  TB:3.167  SB:4.678
Bester Zug: Le5-f6 Zeit: 0:27.297 min  K/s: 863.368  CPU 97.0%   K/s(1CPU): 890.070  Knoten: 23.540.595 TB: 3.765 SB: 5.065
19/43   0:01   +0.91   1.Sf5 Sxf5 2.exf5 Kc7 3.bxc5 bxc5 4.Kc3 Kd7 5.Kd3 Ke7 6.Kd2 Kf8 7.Ke3 Kf7 (1.164.251) 866  SB:19
20/45   0:01   +0.91   1.Sf5 Sxf5 2.exf5 Kc7 3.bxc5 bxc5 4.Kc3 Kd7 5.Kd3 Ke7 6.Kd2 Kf8 7.Ke3 Kf7 (1.672.502) 856  SB:33
21/49   0:02   +0.91   1.Sf5 Sxf5 2.exf5 Kc7 3.bxc5 bxc5 4.Kc3 Kd7 5.Kd3 Ke7 6.Kd2 Kf8 7.Ke3 Kf7 (2.465.435) 830  SB:90
22/49   0:04   +0.91   1.Sf5 Sxf5 2.exf5 Kc7 3.bxc5 bxc5 4.Kc3 Kd7 5.Kd3 Ke7 6.Kd2 Kf8 7.Ke3 Kf7 (3.750.551) 810  SB:319
23/50   0:07   +0.91   1.Sf5 Sxf5 2.exf5 Kc7 3.bxc5 bxc5 4.Kc3 Kd7 5.Kd3 Ke7 6.Kd2 Kf8 7.Ke3 Kf7 (6.053.479) 795  SB:1.465
24/56   0:13   +0.91   1.Sf5 Sxf5 2.exf5 Kc7 3.bxc5 bxc5 4.Kc3 Kd7 5.Kd3 Ke7 6.Kd2 Kf8 7.Ke3 Kf7 (10.485.594) 769  TB:1  SB:3.568
Bester Zug: Se3-f5 Zeit: 0:14.516 min  K/s: 771.973  CPU 98.5%   K/s(1CPU): 783.728  Knoten: 11.182.035 TB: 1 SB: 3.568
24/51   0:01   +1.03   1.Ka4 Kc8 2.Sf5 Sxf5 3.exf5 Kd7 4.Kb3 Ke7 5.Kc2 Kf7 6.Kd1 Kg7 7.Ke2 Kf7 8.Ke1 (1.213.263) 808  SB:156
25/52   0:02   +1.03   1.Ka4 Kc8 2.Sf5 Sxf5 3.exf5 Kd7 4.Kb3 Ke7 5.Kc2 Kf7 6.Kd1 Kg7 7.Ke2 Kf7 8.Ke1 (1.923.856) 810  TB:1  SB:474
26/55   0:03   +1.03   1.Ka4 Kc8 2.Sf5 Sxf5 3.exf5 Kd7 4.Kb3 Ke7 5.Kc2 Kf7 6.Kd1 Kg7 7.Ke2 Kf7 8.Ke1 (3.104.903) 785  TB:3  SB:1.602
27/57   0:07   +1.03   1.Ka4 Kc8 2.Sf5 Sxf5 3.exf5 Kd7 4.Kb3 Ke7 5.Kc2 Kf7 6.Kd1 Kg7 7.Ke2 Kf7 8.Ke1 (5.442.998) 774  TB:42  SB:3.287
28/60   0:11   +1.03   1.Ka4 Kc8 2.Sf5 Sxf5 3.exf5 Kd7 4.Kb3 Ke7 5.Kc2 Kf7 6.Kd1 Kg7 7.Ke2 Kf7 8.Ke1 (8.715.752) 765  TB:76  SB:6.988
Bester Zug: Ka5-a4 Zeit: 0:12.594 min  K/s: 781.945  CPU 98.6%   K/s(1CPU): 793.047  Knoten: 9.823.581 TB: 87 SB: 7.467

und

Engine: Deep Shredder 12 w32 1CPU (128 MB)
von Stefan Meyer-Kahlen
loading shredderbase C:\Users\Werner\AppData\Roaming\ShredderChess\Shredderbases\\all34.tbe
shredderbases with 4 pieces found (1 MB)
20/34   0:01   +1.30   1.Kc3 Kd8 2.Lxg3 Lc5 3.Le5 b4+ 4.Kc4 Lf8 5.Lh2 Le7 6.Lg3 Kc8 7.Le5 Kd8 (889.596) 729  TB:68  SB:13
21/39   0:02   +1.30   1.Kc3 Kd8 2.Lxg3 Lc5 3.Le5 b4+ 4.Kc4 Lf8 5.Lh2 Le7 6.Lg3 Kc8 (1.573.821) 729  TB:410  SB:164
22/39   0:03   +1.26   1.Kc3 Kd8 2.Lxg3 Lc5 3.Le5 b4+ 4.Kc4 Lf8 5.Lh2 Le7 (2.330.794) 745  TB:735  SB:203
22/52   0:20   +2.88   1.Lf6 g4 2.Kc3 Ld6 3.Lg7 b4+ 4.Kc4 b3 5.Kxb3 Lf4 6.Kb4 (16.098.521) 802  TB:3.010  SB:4.203
23/44   0:22   +2.83   1.Lf6 g4 2.Kc3 Ld6 3.Lg7 b4+ 4.Kc4 b3 5.Kxb3 Lf4 6.Kb4 (17.923.763) 799  TB:3.167  SB:4.678
Bester Zug: Le5-f6 Zeit: 0:27.296 min  K/s: 813.807  CPU 97.0%   K/s(1CPU): 838.976  Knoten: 22.188.453 TB: 3.614 SB: 4.876
19/43   0:01   +0.91   1.Sf5 Sxf5 2.exf5 Kc7 3.bxc5 bxc5 4.Kc3 Kd7 5.Kd3 Ke7 6.Kd2 Kf8 7.Ke3 Kf7 (1.164.251) 836  SB:19
20/45   0:02   +0.91   1.Sf5 Sxf5 2.exf5 Kc7 3.bxc5 bxc5 4.Kc3 Kd7 5.Kd3 Ke7 6.Kd2 Kf8 7.Ke3 Kf7 (1.672.502) 810  SB:33
21/49   0:03   +0.91   1.Sf5 Sxf5 2.exf5 Kc7 3.bxc5 bxc5 4.Kc3 Kd7 5.Kd3 Ke7 6.Kd2 Kf8 7.Ke3 Kf7 (2.465.435) 788  SB:90
22/49   0:04   +0.91   1.Sf5 Sxf5 2.exf5 Kc7 3.bxc5 bxc5 4.Kc3 Kd7 5.Kd3 Ke7 6.Kd2 Kf8 7.Ke3 Kf7 (3.750.551) 769  SB:319
23/50   0:08   +0.91   1.Sf5 Sxf5 2.exf5 Kc7 3.bxc5 bxc5 4.Kc3 Kd7 5.Kd3 Ke7 6.Kd2 Kf8 7.Ke3 Kf7 (6.053.479) 756  SB:1.465
Bester Zug: Se3-f5 Zeit: 0:14.218 min  K/s: 729.445  CPU 97.6%   K/s(1CPU): 747.382  Knoten: 10.337.707 TB: 1 SB: 3.564
23/41   0:01   +1.53   1.Kb5 Kc7 2.Ka6 Kd8 3.Kb6 Kd7 4.Kb7 (984.837) 778  SB:17
24/47   0:04   +3.01   1.Kb5 Kc7 2.Ka6 Kd8 3.Kb6 Kd7 4.Kb7 (3.421.117) 796  TB:155  SB:299
25/48   0:05   +3.02   1.Kb5 Kc7 2.Ka6 Kd8 3.Kb6 Kd7 4.Kb7 (4.638.479) 793  TB:246  SB:516
26/51   0:10   +2.92   1.Kb5 Kc7 2.Ka6 Kd8 3.Kb6 Kd7 4.Kb7 (7.927.020) 782  TB:1.019  SB:1.593
Bester Zug: Ka5-b5 Zeit: 0:12.515 min  K/s: 787.940  CPU 96.1%   K/s(1CPU): 819.916  Knoten: 9.824.037 TB: 1.255 SB: 1.757

Ich habe nacheinander die Stellungen 36, 37 und 38 des WM Tests geladen und analysieren lassen, wie du siehst, nicht mal sehr lange. Das war die letzte Stellung:
8/1k4n1/3p3p/K1pPp1pP/2P1P1P1/4N3/8/8 w - -

Gruß
Werner
Parent - - By Ingo Bauer Date 2010-10-05 08:14
Moin Werner,

Wenn ich dich richtig verstanden habe erscheint mir was du schreibst logisch.

Du hast eine GUI und schaltest hin und her. Gleichzeitig sendet die GUI ihre Kommandos nicht an die Engines. Irgendwann laufen die beiden auseinander. Dazu kommt noch das der Hash nicht an der selben Stelle im Speicher steht, das OS mal irgendwann kurz auf die Platte zugreift, irgendein anderer Hardware Interrupt einen Kern kurz was anderes machen läßt (Dual Rechner, richtig?), die 64bit Version 2% schneller ist (wieviel ELo sind das?). Ansonsten, warum lernen? Ich hoffe dein Lernfile war/ist leer und auf schreibgeschützt gesetzt (wie bei meinen Tests).

Die zwei Engines sind identisch, weiß ic hund wurde mir gesagt! Das heißt natürlich nicht das sie gleiche Spiele abliefern, dazu muß man nur mal meine Statistik bemühen um zu sehen das die Einzelergebnisse differieren. Die Unterschiede die von aussen einfließen sollten aber so minimal wie möglich gehalten werden und sich auf lange Sicht ausgleichen.

Ich habe übrigens heute Nacht die 100 Spiele Stockfish 1.9 gegen Shredder 12 64bit nachgeholt und Bayes stuft jetzt beide Enignes wieder auf die selbe Elozahl (Heute Abend online). Da ja ein Prinzip meiner Liste ist die Liste nicht mit identischen engines zu fluten (z. B. Keine 5 fast identischen Settings einer Engine) werde ich die 32bit Version aus meiner offiziellen Liste löschen um auch diese Verzerrung zu elliminieren.

Gruß
Ingo
Parent - - By Frank Quisinsky Date 2010-10-05 08:28 Edited 2010-10-05 08:30
Hi Ingo,

diese Verzerrung hast Du aber nur dann wenn ...

Beispiel:
Stockfish 1.6.0 hat 800 Partien und wird upgedatet ...
Neuer Stockfish 1.7.1 hat 800 Partien und wird upgedatet ...
Neuer Stockfish 1.80 hat 1.000 Partien und wird upgedatet ...

Also haben die Stockfische 2.600 Partien gespielt.
Spielen mit älteren Versionen wird eingestellt.

Eine nicht upgedatete Engine hat in dieser Zeit auch 2.600 Partien gespielt.
SWCR Prinzip!

Also, egal ... alles schon ausgetestet anhand der Ratingzahlen.

Anders wäre es wenn ...

Shredder 12 w32 hat 4.000 Partien
Shredder 12 x64 hat 4.000 Partien

Dann also 8.000 Partien da 2x der gleiche Shredder !!

In der SWCR auch nicht wichtig, da auf Shredder geeicht wird und Shredder 12 w32 für die SWCR-32 und SWCR-64 benötigt wird.
Für die SWCR-64 natürlich auch der Shredder 12 x64.

Recht hast Du z. B. bei der IPP Familie die ich teste ...
Im Grunde später 6x die gleichen Engines ... daher fliegen nach dem Test auch wiedre 5 raus.
Aber die Engines wurden dann zumindest mal getestet.

Die CEGT hatte früher das Problem mit den ganzen TheKing Settings.

Auch bei Listen die z. B. 4x einen Critter drin haben, es bleibt ein Critter und wenn Du immer die gleiche Anzahl an Partien spielst ist Deine Liste Critter lastig, oder Stockfish lastig. Das bekommst Du nur dann in etwa raus, wenn die Engines stehen bleiben, bzw. mit neuen Versionen keine weiteren Partien gespielt werden.

Du gehst aber hin und versuchst sämtliche Engines auf Partiemenge x zu heben und Bingo ...
Das ist im Grunde mein zweiter Kritikpunkt an IPON.

1. So viele Partien machen keinen Sinn
2. Riesige Partienmengen gleicher Engines, ohne das diese irgend wann stehen bleiben ... und eine Liste wird lastig zu einer oder mehreren Engines.

Da Shredder nicht oft upgedatet wurde kannst Du die Ergebnisse von Shredder 12 w32 auch in der Liste lassen, wird keine Rolle spielen ...

Und bevor ich falsch verstanden werde, die perfekte Ratingliste gibt es nicht, mein System hat auch Probleme hier und dort ...

Gruß
Frank
Parent - - By Ingo Bauer Date 2010-10-05 08:36
Moin,

ich bin nicht sicher ob ich dir folgen kann.

Ich werfe einen Shredder raus weil eine Enigne die überhaupt nicht mit Shredder zurechtkommt mit 2mal derselben Engine bestraft (Elo runter) wird und eine Engine die mit Shredder sehr gut klar kommt mit 2mal der selben Engine belohnt wird (Elo rauf).
Mir ist klar das das System, bei einer Liste nicht 100% richtig sein kann, aber 2 identische Engines mach nun wirklich keinen Sinn.

Gruß
Ingo
Parent - - By Frank Quisinsky Date 2010-10-05 08:43
Hi Ingo,

in dem FALL von IPON macht das keinen rechten Sinn, ja!
Dennoch, glaube nicht, dass sich so viel verschieben wird aufgrund der Anzahl der von Dir gespielten Partien pro Engine (bei diesem Fall ja gar wieder positiv).
Vielleicht fällt die eine oder andere Engine um maximal 2 ELO. Siehst das ja, kannst ja mal berichten ob sich eine Engine um mehr als 2 ELO verschoben hat.

Im Fall der SWCR macht es Sinn ... da die Listen aufgeteilt sind (SWCR-32 und SWCR-64).
Die Liste aller Partien ist eher eine Zugabe, welche aber auch ganz interessant ist.

Gruß
Frank
Parent - - By Ingo Bauer Date 2010-10-05 09:05
Moin,

Klar, viel wird sich nicht verschieben - aber es geht darum eine saubere Liste zu erzeugen die möglichst frei von allen äusseren Einflüssen ist ...

Gruß
Ingo
Parent - By Frank Quisinsky Date 2010-10-05 09:12
Hi Ingo,

wir sind schon ein Volk ...
Musste lachen als ich das las ... frei von äußeren Einflüssen

Schreibe ja selbst laufend so ein Zeug.

Wird schon nicht reinregnen, Hagel oder Schnee wirds auch nicht geben
Und tausende stehen an den Hängen und Pisten.

Wir treffen uns in 15 Jahren in der Klapse, das steht fest

Muss jetzt auch mal wieder was anderes machen als diese SWCR.
Die läuft ja, bis auf die Arbeit mit den Downloads und dessen Updates auf meine Seite 1-2 im Monat habe ich kaum Arbeit.
Einpicken von neuen Engines und übers Netzwerk verteilen ist auch schnell erledigt.

Mich reizen jetzt die Pocket PC Programme
Die SWCR wird hinsichtlich Ergebnisse und Statistiken schon wieder langweilig, gibt kaum noch neue Erkenntnisse für mich zu sammeln.
Zusehen bei den Partien reizt aber immer ...

Morgen dann wieder die Schachcomputer und übermorgen fühle ich mich dann in meiner freien Zeit genötigt Schachbücher zu lesen.
So ist das mit einem Hobby!
Problem ist nur, dass nicht immer so viel Zeit zur Verfügung steht.

Und wenn andere mit den vielen Beiträgen zu dem Themenkomplex etwas anfangen können, um so besser!
Hatte das wenigstens auch einen öffentlichen Nutzen!

Gruß
Frank
Parent - - By Benno Hartwig Date 2010-10-05 16:21
[quote="ernst happe"]gibt es ein programm mit der man die standardabweichung der gerade berechneten elo zahl ausgeben kann?[/quote]Niemand kann dir zu einer erspielten ELO-Zahl einfach so die Standardabweichung angeben. Auch nicht, wenn du die Anzahl der Partien kennst.
Standardabweichungen kann man zu Verteilungen angeben, die hier aber streng genommen unbekannt ist.
Die erspielte ELO-Zahl ist nur eine Schätzwert für einen wichtigen Parameter dieser unbekannten Verteilung.
Bestenfalls kannst du auch einen Schätzwert für diese Standardabweichung erhalten, der genau so wie die ELO-Zahl mehr oder weniger falsch sein kann.
Und dieser Schätzwert wird um so besser sein können, je mehr Informationen du beisteuerst:
- Anzahl der Partien,
- Anzahl der Siege, Remis, Niederlagen
- Spielstärke der einzelnen Gegner,
- am besten vielleicht auch, wie man gegen konkret gegen jeden einzelnen spielte
...

Nimm mal an ich hätte 1600 ELO erspielt in 100 Partien gegen Gegner mit im Mittel 1600 ELO (50 gewonnen, 50 verloren).
Das gestattet eine anständige Abschätzung.Zumindest wenn jeder Gegner so ungefähr 1600 ELO hatte.
Wenn aber die Hälfte bei 800 ELO lag und die andere bei 2400? Rate mal, gegen wen ich gewann, gegen wen ich verlor   

Benno
Parent - - By ernst happe Date 2010-10-05 16:53
[quote="Benno Hartwig"]
[quote="ernst happe"]gibt es ein programm mit der man die standardabweichung der gerade berechneten elo zahl ausgeben kann?
Niemand kann dir zu einer erspielten ELO-Zahl einfach so die Standardabweichung angeben. Auch nicht, wenn du die Anzahl der Partien kennst.
Standardabweichungen kann man zu Verteilungen angeben, die hier aber streng genommen unbekannt ist.
Die erspielte ELO-Zahl ist nur eine Schätzwert für einen wichtigen Parameter dieser unbekannten Verteilung.
Bestenfalls kannst du auch einen Schätzwert für diese Standardabweichung erhalten, der genau so wie die ELO-Zahl mehr oder weniger falsch sein kann.
Und dieser Schätzwert wird um so besser sein können, je mehr Informationen du beisteuerst:
- Anzahl der Partien,
- Anzahl der Siege, Remis, Niederlagen
- Spielstärke der einzelnen Gegner,
- am besten vielleicht auch, wie man gegen konkret gegen jeden einzelnen spielte
...
Zitat:
und denn, diese daten gibts es zuhauf. frank hat ja seine daten zum download angeboten

Zitat:
und statistikprogramme gibt es auch

Zitat:
nur ich kann nicht damit umgehen, o.k. ich könnte es lernen


Nimm mal an ich hätte 1600 ELO erspielt in 100 Partien gegen Gegner mit im Mittel 1600 ELO (50 gewonnen, 50 verloren).
Das gestattet eine anständige Abschätzung.Zumindest wenn jeder Gegner so ungefähr 1600 ELO hatte.
Zitat:
eben nicht, da fehlt entscheidend die remis - quote. 50x 0 und 50x 1 ist vollkommen unrealistisch

Wenn aber die Hälfte bei 800 ELO lag und die andere bei 2400? Rate mal, gegen wen ich gewann, gegen wen ich verlor   
Zitat:
das ist einfach zu beantworten

Benno

hi benno,

man muss das mit "der" standardabweichung weiter aufdröseln:

- standardabweichung für jeden gegner
- für jede eröffnung
- und als krönung die standardabweichung über die ermittelten standardabweichungen

ich könnte mich dafür durchaus begeistern, nur ob es wirklich weiterhilft gemeinsamkeiten von diversen engines zu ermitteln?
ich weiss es nicht.

prof. dr. ingo althöfer könnte hier vielleicht mal aufkären, aber er versteckt sich, schade

ernst
Parent - - By Benno Hartwig Date 2010-10-05 18:29
[quote="ernst happe"]- und als krönung die standardabweichung über die ermittelten standardabweichungen[/quote]Nett, dein Scherzen.
Ob du auch verstanden hast, wovon tatsächlich die Standardabweichung und deren sinnvolle Schätzung abhängt?
Vielleicht eher nicht. Deine Frage und nun erst recht dein Scherzen weckten Zweifel.
Benno
Parent - By ernst happe Date 2010-10-05 18:47
oh benno,

du verkennst meine ernsthaftigkeit in dieser frage. ich bin genau wie du auch sehr an
der fragestellung interessiert, sind ippo rüby und co clones, oder ob es noch andere
engines gibt,die in diesem zusammenhang zu erwähnen sind, und um aussagekräftige
antworten, die uns vielleicht nur die statistik beantworten kann.

ernst
Parent - By Gerhard Sonnabend Date 2010-10-05 20:21
Benno, der Thor... ääähh Ernst will Dich
lediglich in ein Gespräch verwickeln.
Da steckt nichts ernsthaftes dahinter.

Viele Grüsse,
G.S.
Parent - By Werner Mueller Date 2010-10-05 18:29
[quote="Benno Hartwig"]
[quote="ernst happe"]gibt es ein programm mit der man die standardabweichung der gerade berechneten elo zahl ausgeben kann?[/quote]Niemand kann dir zu einer erspielten ELO-Zahl einfach so die Standardabweichung angeben. Auch nicht, wenn du die Anzahl der Partien kennst.
Standardabweichungen kann man zu Verteilungen angeben, die hier aber streng genommen unbekannt ist.
Die erspielte ELO-Zahl ist nur eine Schätzwert für einen wichtigen Parameter dieser unbekannten Verteilung.
Bestenfalls kannst du auch einen Schätzwert für diese Standardabweichung erhalten, der genau so wie die ELO-Zahl mehr oder weniger falsch sein kann.
Und dieser Schätzwert wird um so besser sein können, je mehr Informationen du beisteuerst:
- Anzahl der Partien,
- Anzahl der Siege, Remis, Niederlagen
- Spielstärke der einzelnen Gegner,
- am besten vielleicht auch, wie man gegen konkret gegen jeden einzelnen spielte
...

Nimm mal an ich hätte 1600 ELO erspielt in 100 Partien gegen Gegner mit im Mittel 1600 ELO (50 gewonnen, 50 verloren).
Das gestattet eine anständige Abschätzung.Zumindest wenn jeder Gegner so ungefähr 1600 ELO hatte.
Wenn aber die Hälfte bei 800 ELO lag und die andere bei 2400? Rate mal, gegen wen ich gewann, gegen wen ich verlor   

Benno
[/quote]
Nein Benno, das siehst Du falsch.
Prof. Elo ist da sehr demokratisch und spendiert jedem von uns exakt dieselbe Gaußsche Glocke mit einer Standardabweichung von 200 ELO und diese Glocke schleppst Du Dein Leben lang mit Dir herum, ohne dass sich ihre Form im geringsten ändert, Du verschiebst sie lediglich auf der x- bzw. ELO-Achse, so dass ihr Maximum immer über Deiner aktuellen ELO-Zahl liegt.
Up Topic Hauptforen / CSS-Forum / wie genau sind elo auswertungen wirklich?

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill