Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / CEGT - Ranglisten vom 11. Oktober 2009
- - By Werner Schüle Date 2009-10-11 11:45
Hallo zusammen,

unsere aktuellen Listen sind wie üblich unter den angehängten Links verfügbar.

40/4
Neue Spiele: 5910
Datenbank: 535.678

40 / 20:
Neue Spiele: 1295
Gesamt: 354.246

Dies ist heute hauptsächlich ein Update mit der neuen Deep Shredder 12 Engine in beiden Listen:

Deep Shredder 12 x64 4CPU
Code:
40/4: 10 Deep Shredder 12 x64 4CPU 3101 +23 -23 600 Spiele (+120 zu Version 11)
40/20: 6 Deep Shredder 12 x64 4CPU 3083 +24 -24 483 Spiele (+113 zu Version 11)


Deep Shredder 12 x64 2CPU
Code:
40/4: 18 Deep Shredder 12 x64 2CPU 3040 +17 -17 1000 Spiele (+98 zu Version 11)
40/20: 9 Deep Shredder 12 x64 2CPU 3054 +24 -24 419  Spiele (+117 zu Version 11)


Deep Shredder 12 x64 1CPU
Code:
40/4:  27 Deep Shredder 12 x64 1CPU 3019 +15 -15 1500 Spiele (+130 zu Version 11)
40/20: 16 Deep Shredder 12 x64 1CPU 3015 +35 -35 200 Spiele (+112 zu Version 11)


Deep Shredder 12 w32 (nur 40/4)
Code:
28 Deep Shredder 12 w32 2CPU 3015 +28 -28 400 Spiele (+94 zu Version 11)
56 Deep Shredder 12 w32 1CPU 2972 +16 -16 1260 Spiele (+112 zu Version 11)


In unserer Bltz-Liste hat die x64 1CPU-Version besonders gut abgeschnitten. Hier ist sie vor Naum 4 platziert (bei 2 und 4CPU nicht).
Für die 40/20er Liste haben wir natürlich noch nicht so viele Spiele - für eine Einstiegsbeurteilung reichen die aber aus: Alle Versionen haben über 110 Elos im Vergleich zur Version 11. In unserem Forum schrieb ein Tester: SMK ist zurück!
Wir gratulieren Stefan zu diesem tollen Ergebnis!!

Updates:
Code:
40/4:   84 Fritz 12 2941 +10 -10 2800 Spiele (-4)
40/20: 70 Fritz 12 2929 +18 -18 778 Spiele (-2)


Wie immer ein herzliches "Danke" an alle Tester!!

links:
40/20: http://www.husvankempen.de/nunn/rating.htm
Blitz: http://www.husvankempen.de/nunn/blitz.htm
40/120: http://www.husvankempen.de/nunn/rating120.htm
Tester: http://www.husvankempen.de/nunn/testers/testers.htm
Games of the week: http://www.husvankempen.de/nunn/40_40%20Rating%20List/Coordination/gow.JPG
Elo-comparison: http://www.husvankempen.de/nunn/Replay/ELOcomparison.htm

Werner
CEGT-Team
Parent - - By Ingo Bauer Date 2009-10-11 12:15
Hallo Werner

[quote="Werner Schüle"]
... In unserem Forum schrieb ein Tester: SMK ist zurück!..
[/quote]

Ich möchte eher auf die dritte und vierte Zeile des Refrains verweisen
http://www.youtube.com/watch?v=1ZMwieoUuJo

Ansonsten fällt mir auf das wir wirklich Unterschiede haben zw. Ponder on und off. Abstand ist der gleiche bei mir wie bei euch, aber der ganze Shredder (11/Bonn/12) ist etwas nach oben geshiftet bei mir. (z.B. bekomme ich auch bei Wiederholung mit dem 32bit Single S12 einen Sieg gegen Naum4 hin)

Gruß
Ingo
Parent - By Frank Quisinsky Date 2009-10-13 13:46
Hallo,

spiele ja gerade auch an einer Ratingliste.
5 Turniere mit 40 in 20 bei Ponder = on, XP Pro x32.

Zur Zeit bzw. nach ca. 75 / 520 Partien liegt Shredder (wenn ich auf 3.053 CEGT Rybka 3 ELO eiche) bei 3.056 und sogar 3 ELO vor Rybka 3.0.

Es sind ein paar Engines die bei mir deutlich besser nach 75 Partien spielen als in der CEGT mit Ponder = Off.
Aber ich habe erst die besagten 75 Partien und Rybka ist auch verhältnismäßig schlecht gestartet und von daher rutschen alle Engines ein wenig höher beim Eichen.
Aber erkennbar ist das sensationell Shredder 3 ELO vor Rybka liegt und das nach 75 Partien in der Tabelle sich alles so langsam vergleichbar zur CEGT Listenmäßig einordnet (bis auf Shredder).

Brauche noch ca. 33 Tage bis ich ein Endergebnis nach 520 Partien habe.

Gruß
Frank
Parent - - By Roland Rösler Date 2009-10-11 20:43
[quote="Werner Schüle"]
Deep Shredder 12 x64 1CPU
Code:
40/4:  27 Deep Shredder 12 x64 1CPU 3019 +15 -15 1500 Spiele (+130 zu Version 11)
[/quote]
Mir ist schleierhaft, wie Ihr auf eine Elozahl von 3019 kommt! Wenn ich nachrechne, komme ich auf 3029!
Parent - - By Gerhard Sonnabend Date 2009-10-13 11:00
[quote="Roland Rösler"]
[quote="Werner Schüle"]
Deep Shredder 12 x64 1CPU
Code:
40/4:  27 Deep Shredder 12 x64 1CPU 3019 +15 -15 1500 Spiele (+130 zu Version 11)
[/quote]
Mir ist schleierhaft, wie Ihr auf eine Elozahl von 3019 kommt! Wenn ich nachrechne, komme ich auf 3029!
[/quote]

Hi !

Hhm, wenn ich in ELOSTAT1_3.exe (vom 01/2005) folgendes eingebe:
Code:

Wins   = 821
Draws  = 454
Losses = 225
Av.Op. Elo = 2873

Result     : 1048.0/1500 (+821,=454,-225)
Perf.      : 69.9 %
Margins    :
68 %      : (+  0.9,-  1.0 %) -> [ 68.9, 70.8 %]
95 %      : (+  1.8,-  1.9 %) -> [ 68.0, 71.7 %]
99.7 %    : (+  2.8,-  2.9 %) -> [ 67.0, 72.6 %]

Elo        : 3019
Margins    :
68 %      : (+  8,-  8) -> [3011,3027]
95 %      : (+ 15,- 15) -> [3004,3034]
99.7 %    : (+ 23,- 23) -> [2996,3042]


dann erhalte ich ELO 3019, also
den selben Wert welcher in der Liste steht.

Wo nun ist das Problem ?

Viele Grüsse,
G.S.
Parent - - By Roland Rösler Date 2009-10-13 12:04
[quote="Gerhard Sonnabend"]Wo nun ist das Problem ?[/quote]
Wenn ich die 15 Einzel-Performances (es waren 15 Matches a 100 Spiele) von S12 aufaddiere und dann durch 15 teile, komme ich auf 3029.
Warum ist diese Überlegung falsch? Hätte S12 in den 15 Matches jedesmal eine Performance von exakt 3029 Elo gehabt gegen die gleichen Gegner, könnte er dann auch eine Gesamtperformance von 3019 haben?
Irgenwas verstehe ich nicht!
Parent - - By Gerhard Sonnabend Date 2009-10-13 12:21
[quote="Roland Rösler"]
[quote="Gerhard Sonnabend"]Wo nun ist das Problem ?[/quote]
Wenn ich die 15 Einzel-Performances (es waren 15 Matches a 100 Spiele) von S12 aufaddiere und dann durch 15 teile, komme ich auf 3029.
Warum ist diese Überlegung falsch? Hätte S12 in den 15 Matches jedesmal eine Performance von exakt 3029 Elo gehabt gegen die gleichen Gegner, könnte er dann auch eine Gesamtperformance von 3019 haben?
Irgenwas verstehe ich nicht!
[/quote]

Weil "Extremergebnisse" anders gewichtet werden,
resp. die Flanken bei der Berechnung abgeschwächt werden.
Es gibt einige Beispiele hierzu i.d. Liste.

Viele Grüsse,
G.S.
Parent - - By Benno Hartwig Date 2009-10-13 12:35
[quote="Gerhard Sonnabend"]Weil "Extremergebnisse" anders gewichtet werden, resp. die Flanken bei der Berechnung abgeschwächt werden.[/quote]
Mag sein, dass das so vorgeschrieben ist. Thanx für die Info.
Nur: ist das eigentlich wirklich gerechtfertigt?
wenn ich die Spielstärke einer Engine berechnen möchte, käme ich nciht auf die Idee, besonders erfolgreiche oder erfolglose Serien stärker (oder schwächer?) zu gewichten.


Wenn ich eine längere Serie einer Engine spielen lasse, und die Engine hatte nach 20 Spielen vielleicht 60%, nach 100 Spielen aber 50%, dann ist eben 50% der von mir gemessene Wert. Ob sie am Anfang mal erfolgreicher war (60%), dann aber schwächer spielte ((50-12)/80=48%) spielt keine Rolle. Es gibt keinen Grund für eine "eigentlich 48%"-Vermutung, und schon gar nicht für "eigentlich stärker als 50%"-These.
Warum betrachtet man das bei der ELO-Berechnung ggf. anders?

Benno
Parent - - By Felix Kling Date 2009-10-13 13:03
immer dran denken, daß die Elo logarithmisch ist. Einfaches aufaddieren und Teilen geht leider nicht
Parent - - By Benno Hartwig Date 2009-10-13 13:39
[quote="Felix Kling"]immer dran denken, daß die Elo logarithmisch ist. Einfaches aufaddieren und Teilen geht leider nicht [/quote]
Die Chance für mich, etwas zu lernen:

Angenommen X macht 4 Serien a 100 Spiele gegen A, B, C und D mit jeweils 2000 ELO, und holt dabei jeweils 50%, insgesamt 200 Punkte, dann bekommt X wohl auch 2000 ELO zugewiesen. Richtig?

Angenommen auch Y macht 4 Serien a 100 Spiele gegen diese A, B, C und D, und holt dabei gegen A, B und C jeweils 40% (das sind 120 Punkte), gegen D aber 80% (also nochmal 80 Punkte), welchen ELo_Wert hätte sich Y denn dann verdient?
(Aus dem Bauch heraus möchte ich auch rufen 2000. Falsch? Und was ist richtig? Und dann mache ich mir Gedanken darüber, ob ich das auch gerecht finde...)

Benno
Parent - By Gerhard Sonnabend Date 2009-10-13 14:04
[quote="Benno Hartwig"]
[quote="Felix Kling"]immer dran denken, daß die Elo logarithmisch ist. Einfaches aufaddieren und Teilen geht leider nicht [/quote]
Die Chance für mich, etwas zu lernen:
Angenommen X macht 4 Serien a 100 Spiele gegen A, B, C und D mit jeweils 2000 ELO, und holt dabei jeweils 50%, insgesamt 200 Punkte, dann bekommt X wohl auch 2000 ELO zugewiesen. Richtig?
Angenommen auch Y macht 4 Serien a 100 Spiele gegen diese A, B, C und D, und holt dabei gegen A, B und C jeweils 40% (das sind 120 Punkte), gegen D aber 80% (also nochmal 80 Punkte), welchen ELo_Wert hätte sich Y denn dann verdient?
(Aus dem Bauch heraus möchte ich auch rufen 2000. Falsch? Und was ist richtig? Und dann mache ich mir Gedanken darüber, ob ich das auch gerecht finde...)
[/quote]

Hi Benno !

Zieh Dir ELOSTAT_13 aus dem Netz und gebe
Dein Beispiel ein und schon weist Du mehr !

Viele Grüsse,
G.S.
Parent - - By Gerhard Sonnabend Date 2009-10-13 17:11
[quote="Benno Hartwig"]
[quote="Felix Kling"]immer dran denken, daß die Elo logarithmisch ist. Einfaches aufaddieren und Teilen geht leider nicht [/quote]
Die Chance für mich, etwas zu lernen:

Angenommen X macht 4 Serien a 100 Spiele gegen A, B, C und D mit jeweils 2000 ELO, und holt dabei jeweils 50%, insgesamt 200 Punkte, dann bekommt X wohl auch 2000 ELO zugewiesen. Richtig?

Angenommen auch Y macht 4 Serien a 100 Spiele gegen diese A, B, C und D, und holt dabei gegen A, B und C jeweils 40% (das sind 120 Punkte), gegen D aber 80% (also nochmal 80 Punkte), welchen ELo_Wert hätte sich Y denn dann verdient?
(Aus dem Bauch heraus möchte ich auch rufen 2000. Falsch? Und was ist richtig? Und dann mache ich mir Gedanken darüber, ob ich das auch gerecht finde...)
[/quote]

Du liegst doch richtig mit der Gesamtperfomance (2000) !

Dein Beispiel # 2 (in Einzelaufstellung):
Code:

Y vs A 40-60 perf=1930
Y vs B 40-60 perf=1930
Y vs C 40-60 perf=1930
Y vs D 80-20 perf=2241


Würdest Du jedoch die Performance von Y gegen A,B,C und D
zusammenzählen und durch 4 teilen, so würdest Du auf
2007.5 kommen !

Verstanden ?

Viele Grüsse,
G.S.
Parent - By Roland Rösler Date 2009-10-13 19:06 Edited 2009-10-13 19:09
[quote="Gerhard Sonnabend"]Würdest Du jedoch die Performance von Y gegen A,B,C und D zusammenzählen und durch 4 teilen, so würdest Du auf 2007.5 kommen !

Verstanden ?[/quote]
Und das Allerbeste: In der nächsten FIDE-Elo-Rangliste hätte Spieler Y tatsächlich 2008 Elopunkte! Und das zu Recht (angenommen alle seine Opponenten halten ihre 2000 Elopunkte)!
Parent - - By Benno Hartwig Date 2009-10-13 19:23
[quote="Gerhard Sonnabend"]Verstanden ?[/quote]Thanx und ja. Und in dieser Weise werden ELO-Werte berechnet?
Das finde ich interessant, da aus Sicht der Stochastik ganz eindeutig erklärt würde:

Y macht 400 Partien, jeder Gegner hat ELO 2000, dann ist es ganz egal, gegen welchen ELO-2000-Gegner die 200 Punkte eingefahren werden: Der Schätzwert für den Punkte-Erwartungswert in einer Partie dieser Engine gegen ELO-2000-Gegner ist dann 0,5. Und von daher hielte ich dann auch ELO 2000 für Engine Y für angemessen.

Aber, OK, mathematisch wid es stimmen, bei der amtlichen ELO-Bewertung können trotzdem andere Regeln gelten.

Benno
Parent - - By Roland Rösler Date 2009-10-13 19:31
[quote="Benno Hartwig"]Aber, OK, mathematisch wid es stimmen, bei der amtlichen ELO-Bewertung können trotzdem andere Regeln gelten.[/quote]
Es stimmt weder mathematisch noch nach FIDE-Regeln!
Es stimmt (nur) als "einfaches" Näherungsverfahren! Pi x Daumen!
Parent - - By Gerhard Sonnabend Date 2009-10-13 19:37
[quote="Roland Rösler"]
[quote="Benno Hartwig"]Aber, OK, mathematisch wid es stimmen, bei der amtlichen ELO-Bewertung können trotzdem andere Regeln gelten.[/quote]
Es stimmt weder mathematisch noch nach FIDE-Regeln!
Es stimmt (nur) als "einfaches" Näherungsverfahren! Pi x Daumen!
[/quote]

?
FIDE-Regeln kommen bei dieser Art der Berechnung (ELO-Stat, Bayanes...)
überhaupt nicht in Betracht. Weshalb auch ?

Zeige mir doch mal ein Verfahren, welches aus mathematischer Sicht
besser ist als das von Dr. Schubert.

Viele Grüsse,
G.S.
Parent - - By Roland Rösler Date 2009-10-13 21:15
Zitat:
FIDE-Regeln kommen bei dieser Art der Berechnung (ELO-Stat, Bayanes...) überhaupt nicht in Betracht. Weshalb auch ?

Die FIDE hat das Elo-System übernommen und Frank Schubert hat das Elo-System übernommen. Da muß bei der Elozahl das gleiche rauskommen!

Zitat:
Zeige mir doch mal ein Verfahren, welches aus mathematischer Sicht besser ist als das von Dr. Schubert.

Das Ken Thomson Iterationsverfahren! Komplette Neuberechnung aller Spiele! Elostat kann das auch! Wie häufig lasst ihr eine komplette Neuberechnung der Rangliste durchlaufen?
Parent - By Michael Scheidl Date 2009-10-14 05:18
Ich glaube, Bayesian Elo ist auch besser. Unter folgendem Link sind einige Vorteile angeführt (z.B. Berücksichtigung der Farben!):

http://remi.coulom.free.fr/Bayesian-Elo/#elostat
Parent - By Gerhard Sonnabend Date 2009-10-14 07:03
[quote="Roland Rösler"]
Zitat:
Zeige mir doch mal ein Verfahren, welches aus mathematischer Sicht besser ist als das von Dr. Schubert.

Das Ken Thomson Iterationsverfahren! Komplette Neuberechnung aller Spiele! Elostat kann das auch! Wie häufig lasst ihr eine komplette Neuberechnung der Rangliste durchlaufen?


Mit jedem Update, also immer.
Ich habe das Gefühl wir reden aneinander vorbei.

Viele Grüsse,
G.S.
Parent - - By Benno Hartwig Date 2009-10-13 21:46
[quote="Gerhard Sonnabend"]Zeige mir doch mal ein Verfahren, welches aus mathematischer Sicht besser ist als das von Dr. Schubert.[/quote]Hui, da verlangst du viel, so auf die Schnelle. Arpad und Schubert hatten sich sicher viele Gedanken gemacht.
Mein Beispiel zeigte dir aber eine konkrete Situation, in der deine Rechnung, die vermutlich der Schubert-Methode entsprícht, einen Schätzwert für die Spielstärke liefert, die dem in diesem Fall einfach zu bestimmenden und sicher verlässlicheren Schätzwert aus der Stochastik widerspricht.

Ich hatte schon vermutet, dass man mit den ELO-Werten so umgehen kann, dass dies nicht in Konflikt mit den elementaren Aussagen der Stochastik steht.
Soll das wirklich nicht gehen?

Benno
Parent - By Gerhard Sonnabend Date 2009-10-14 07:06
[quote="Benno Hartwig"]
[quote="Gerhard Sonnabend"]Zeige mir doch mal ein Verfahren, welches aus mathematischer Sicht besser ist als das von Dr. Schubert.[/quote]Hui, da verlangst du viel, so auf die Schnelle. Arpad und Schubert hatten sich sicher viele Gedanken gemacht.
Mein Beispiel zeigte dir aber eine konkrete Situation, in der deine Rechnung, die vermutlich der Schubert-Methode entsprícht, einen Schätzwert für die Spielstärke liefert, die dem in diesem Fall einfach zu bestimmenden und sicher verlässlicheren Schätzwert aus der Stochastik widerspricht.

Ich hatte schon vermutet, dass man mit den ELO-Werten so umgehen kann, dass dies nicht in Konflikt mit den elementaren Aussagen der Stochastik steht.
Soll das wirklich nicht gehen?

Benno
[/quote]

Ich glaube hier liegt ein Missverständnis vor.
Auch wir (resp. ELO-Stat) kommen in Deinen 2 Beispielen auf ELO 2000.

Ich wollte Dir lediglich aufzeigen was passiert, wenn man die
Einzelperfomance addiert und durch die Anzahl der Gegner teilt.
Dann (nur dann) kann ein anderes Resultat heraus kommen.

Viele Grüsse,
G.S.
Parent - By Peter Struwel Date 2009-10-13 19:43
Ich kläre mal hier einmal auf:

Berechnung der DWZ
2. Berechnung einer Turniererfolgszahl

* In den weiteren Ausführungen werden folgende Abkürzungen verwendet :
* Ro = eigene DWZ vor der Auswertung
* Rh = Turniererfolgszahl (Performance)
* Rc = Durchschnitt der DWZ der Gegner
* Rn = neue Wertungszahl nach Auswertung
* D = Differenz der eigenen DWZ und DWZ des jeweiligen Gegners
* P(D) = Gewinnerwartung pro Partie in Punkten bezogen auf Ro des jeweiligen Gegners
* W = Summe der erziehlten Punkte
* We = Summe der einzelnen Gewinnerwartungen P(D)
* n = Anzahl der wertbaren Partien
* E = Entwicklungskoeffizient (abhängig von Alter und Spielstärke)
* K = Änderungskonstante in den Formeln (3) und (4)
* J = Alterskonstante

2.1 Voraussetzungen für die Wertung von Partien
1. Bei der Auswertung ist zu beachten :
2. Bei Spielern mit Wertungszahl werden alle Partien gegen Spieler ohne Wertungszahl nicht berücksichtigt !!
3. Kampflos gewertete Partien weden nicht berücksichtigt.
4. Partien gegen Schachcomputer werden gestrichen.
5. Nachträglich genullte Partien, die jedoch ordnungsgemäß beendet worden sind, müssen regulär berücksichtigt werden.

2.2 Die Turniererfolgszahl Rh
Nach folgender Formel wird die Turniererfolgszahl Rh berechnet:
2.3 Die Gewinnerwartung P(D)

Die im Anhang aufgeführte Wahrscheinlichkeitstabelle f�r Gewinnerwartungen P(D) beruht auf der sog. Normalverteilung. Sie ist mit der von der FIDE verwendeten Tabelle identisch. Die DWZ-Differenzen ergeben sich aus dem Absolutwert der Differenz zwischen eigener und gegnerischer DWZ. Ist der zu berechnende Spieler besser als sein Gegner, so findet man die Gewinnerwartung P(D) in der Spalte "besser", im umgekehrten Fall in der Spalte "schlechter". Die Gewinnerwartung P(D) kann auch mit der folgenden, hinreichend genauen Näherungsformel berechnet werden :
Für Spieler ohne DWZ erfolgt die Berechnung einer ersten Turniererfolgszahl nach dem unter 2.5 dargestellten Verfahren.
2.4 Besondere Berücksichtigung der Turniererfolgszahl Rh
Wenn ein Spieler in einem Turnier eine Turniererfolgszahl Rh erreicht, die mindestens 200 DWZ-Punkte größer ist als seine alte Wertungszahl Ro und aus mindestens 5 Partien stammt, dann wird bei allen Gegnern bei denen dies nicht zutrifft, seine Turniererfolgszahl anstelle der alten Wertungszahl eingesetzt. Diese besondere Verwendung einer Turniererfolgszahl wird als Sonderwertung bezeichnet.

2.5 Berechnung der Turniererfolgszahl für Spieler ohne DWZ
Seine erste Turniererfolgszahl erhält ein Spieler, wenn mindestens 5 wertbare Partien vorliegen und er dann mehr als 0% der möglichen Punkte erziehlt hat. Als wertbar gelten nur Partien gegen Spieler mit Wertungszahlen, wobei auch gesammelte Partien aus früheren Turnieren berücksichtigt werden müssen. Die gesuchte Turniererfolgszahl Rh wird mit Hilfe von Formel (1) berechnet. Die Berechnung von Rh erfolgt über ein Iterationsverfahren, in dem mit einem Schätzwert für Ro begonnen wird. Mit diesem Schätzwert, in die Gleichung (1) eingesetzt, erhält man dann eine verbesserte Näherung für Rh. Selbstverständlich muss man bei jedem neuen Berechnungsgang auch den neuen Wert für We, bezogen auf den letzten Näherungswert von Rh, verwenden. Dieses Verfahren wird solange wiederholt, bis sich die auf eine ganze Zahl gerundete Turniererfolgszahl Rh nicht mehr ändert.

Eingabehinweis: Zuerst eine gesch�tzte DWZ in das Feld Alte DWZ eingeben und Index auf 1 setzen. Danach solange die berechnete Leistung in das Eingabefeld Alte DWZ einsetzen und die Berechnung wiederholen, bis Neue DWZ und Leistung übereinstimmen.

Bei Spielern ohne DWZ, die aus mindestens 5 Partien 100% gegen Gegner erziehlt haben,kann nach der Formel :
* Rh = Rc + 677 bei Auswertungen eine provisorische Turniererfolgszahl (Rh) ausgegeben werden, aus der sich aber keine erste DWZ ergibt.

3. Berechnung einer neuen Wertungszahl
3.1 Berechnung von Rn
Die neuen Wertungszahl Rn kann aus dem Turnierergebnis und der alten Wertungszahl Ro mit folgender, von der FIDE verwendeten Formel, berechnet werden :
wobei K durch :
definiert ist und E mit der Formel (5) berechnet wird.
3.2 Berechnung von Rn aus der Turniererfolgszahl Rh
Die Berechnung von Rn kann auch aus der Turniererfolgszahl Rh mit folgender Formel berechnet werden :
Rn = Ro + [(Rh - Ro) · K · n / 800 ]
3.3 Berechnung des Entwicklungskoeffizienten E
Der Entwicklungskoeffizient E wird abhängig vom Alter und der Spielstärke nach folgender Formel berechnet :
wobei gilt:
* J = 5 für Jugendliche bis 20 Jahre
* J = 10 für Junioren 21 bis 25 Jahre
* J = 15 für alle Spieler ab 26 Jahre

Hieraus ergibt sich dann K aus Formel (4)

E bewirkt eine stärkere Berücksichtigung der neuen Spielerfolge bei jüngeren Spielern und bei solchen mit niedriger DWZ, eine geringere in den umgekehrten Fällen. Für E gibt es folgende Begrenzungen: E < 5 x Index (Index "0" = "1") und E < 30 Demnach liegen die Werte zwischen 5 und 30. E ist stets ganzzahlig gerundet anzuwenden. Es kann aus Tabelle Anhang 5.2 entnommen werden.
3.4 Spieler ohne DWZ
Für Spieler ohne DWZ ist die nach dem Verfahren von 2.5 ermittelte Turniererfolgszahl Rh die erste DWZ.
4. Anmerkungen
Aufgrund der Vereinfachung rechnet mein Programm mit dem n-fachen der Gewinnerwartung bezogen auf den Durchschnitt der Wertungszahlen der Gegner (Rc) anstelle von We (= Summe der einzelnen Gewinnerwartungen). Die Gewinnerwartung kann man dem Bild aus Abschnitt 2.3 entnehmen. Für die Berechnung von Rc sollte eine Begrenzung der einzelnen Spielstärkedifferenzen (= Ro - DWZ des Gegners) auf 350 festgelegt werden. Das Programm läßt höhere Differenzen zu , was jedoch einen Anstieg des Fehlers in der Berechnung zur Folge hat.

5. Anhang
5.1 Wahrscheinlichkeitstabelle
DWZ-Diff.P(D) besserP(D) schlechter DWZ-Diff.P(D) besserP(D) schlechter
0-3 0,50 0,50 189-197 0,75 0,25
4-10 0,51 0,49 198-206 0,76 0,24
11-17 0,52 0,48 207-215 0,77 0,23
18-25 0,53 0,47 216-225 0,78 0,22
26-32 0,54 0,46 226-235 0,79 0,21
33-39 0,55 0,45 236-245 0,80 0,20
40-46 0,56 0,44 246-256 0,81 0,19
47-53 0,57 0,43 257-267 0,82 0,18
54-61 0,58 0,42 268-278 0,83 0,17
62-68 0,59 0,41 279-290 0,84 0,16
69-76 0,60 0,40 291-302 0,85 0,15
77-83 0,61 0,39 303-315 0,86 0,14
84-91 0,62 0,38 316-328 0,87 0,13
92-98 0,63 0,37 329-344 0,88 0,12
99-106 0,64 0,36 345-357 0,89 0,11
107-113 0,65 0,35 358-374 0,90 0,10
114-121 0,66 0,34 375-391 0,91 0,09
122-129 0,67 0,33 392-411 0,92 0,08
130-137 0,68 0,32 412-432 0,93 0,07
138-145 0,69 0,31 433-456 0,94 0,06
146-153 0,70 0,30 457-484 0,95 0,05
154-162 0,71 0,29 485-517 0,96 0,04
163-170 0,72 0,28 518-559 0,97 0,03
171-179 0,73 0,27 560-619 0,98 0,02
180-188 0,74 0,26 620-735 0,99 0,01

>735 1,00 0,00

5.2 Der Entwicklungskoeffizient E

Die sich daraus ergebenden Werte von E unterliegen nach oben und unten Begrenzungen: E < 30 und E > 5 x Index
(hierbei wird Index "0" = "1")

Ro bis 20 J. Ro f&#65533;r 21 bis 25J. Ro f&#65533;r > 25J. Index:1 2 3 4 5 >5

E=

1 - 840 5 5 5 5 5 5
841 - 1106 5 6 6 6 6 6
1107 - 1257 5 7 7 7 7 7
1258 - 1367 5 8 8 8 8 8
1368 - 1456 5 9 9 9 9 9
1457 - 1531 1 - 840 5 10 10 10 10 10
1532 - 1596 841 - 1106 5 10 11 11 11 11
1597 - 1654 1107 - 1257 5 10 12 12 12 12
1655 - 1707 1258 - 1367 5 10 13 13 13 13
1708 - 1755 1368 - 1456 5 10 14 14 14 14
1756 - 1800 1457 - 1531 1 - 840 5 10 15 15 15 15
1801 - 1841 1532 - 1596 841 - 1106 5 10 15 16 16 16
1842 - 1880 1597 - 1654 1107 - 1257 5 10 15 17 17 17
1881 - 1916 1655 - 1707 1258 - 1367 5 10 15 18 18 18
1917 - 1951 1708 - 1755 1368 - 1456 5 10 15 19 19 19
1952 - 1984 1756 - 1800 1457 - 1531 5 10 15 20 20 20
1985 - 2015 1801 - 1841 1532 - 1596 5 10 15 20 21 21
2016 - 2045 1842 - 1880 1597 - 1654 5 10 15 20 22 22
2046 - 2073 1881 - 1916 1655 - 1707 5 10 15 20 23 23
2074 - 2101 1917 - 1951 1708 - 1755 5 10 15 20 24 24
2102 - 2127 1952 - 1984 1756 - 1800 5 10 15 20 25 25
2128 - 2153 1985 - 2015 1801 - 1841 5 10 15 20 25 26
2154 - 2177 2016 - 2045 1842 - 1880 5 10 15 20 25 27
2178 - 2201 2046 - 2073 1881 - 1916 5 10 15 20 25 28
2202 - 2224 2074 - 2101 1917 - 1951 5 10 15 20 25 29

>2224 >2101 >1951 5 10 15 20 25 30
Parent - By Gerhard Sonnabend Date 2009-10-13 19:35
[quote="Benno Hartwig"]
[quote="Gerhard Sonnabend"]Verstanden ?[/quote]Thanx und ja. Und in dieser Weise werden ELO-Werte berechnet?
[...snip...]
[/quote]

Nein !

Lediglich Computer-ELO wird so berechnet, zumindest
von den grossen Testergruppen. Man könnte genauso
das FIDE-System anwenden, nur wäre das wesentlich
umständlicher und für diesen Fall auch falsch !
Weshalb ?
Weil Engines i.d.R. eine gleichbleibende Spielstärke
(im Unterschied zu Menschen) haben (sollten).
Lediglich Lernen/Buchlernen/Stellungslernen kann diese
"gleichbleibende" Spielstärke manipulieren.

"Human-ELO" hingegen wird, zu Recht, vollkommen anders berechnet.

Viele Grüsse,
G.S.
Parent - - By Roland Rösler Date 2009-10-13 15:23
Dann schau Dir Gerhards Beispiel mal genauer an! Da wird die durchschnittliche Elozahl der Gegner eingegeben! Was glaubst Du, wie er das macht? Ich wette, er addiert die Elozahl der 15 Gegner und teilt dann durch 15!
Und wie sieht die Rechnung dann aus? Es wird das score ausgerechnet (69,9%) und dann +146 Elo (nach Tabelle müssten es eigentlich 149 sein) auf die durchschnittliche! Elozahl der Gegner aufaddiert!
Wenn das erlaubt ist, warum soll man dann nicht die 15 Performancewerte aufaddieren können und dann durch 15 teilen?
Da kannst Du den ganzen Logarithmus vergessen, denn der kommt erst richtig zum Tragen bei einem score von >78% (>+220 Elo). Vorher ist ein Halbpunkt mehr bei 100 Spielen 3,5-4,5 Elopunkte wert. Und richtig interessant wird es dann ab >90%!
Parent - - By Gerhard Sonnabend Date 2009-10-13 15:48
[quote="Roland Rösler"]
Dann schau Dir Gerhards Beispiel mal genauer an! Da wird die durchschnittliche Elozahl der Gegner eingegeben! Was glaubst Du, wie er das macht? Ich wette, er addiert die Elozahl der 15 Gegner und teilt dann durch 15!
Und wie sieht die Rechnung dann aus? Es wird das score ausgerechnet (69,9%) und dann +146 Elo (nach Tabelle müssten es eigentlich 149 sein) auf die durchschnittliche! Elozahl der Gegner aufaddiert!
Wenn das erlaubt ist, warum soll man dann nicht die 15 Performancewerte aufaddieren können und dann durch 15 teilen?
Da kannst Du den ganzen Logarithmus vergessen, denn der kommt erst richtig zum Tragen bei einem score von >78% (>+220 Elo). Vorher ist ein Halbpunkt mehr bei 100 Spielen 3,5-4,5 Elopunkte wert. Und richtig interessant wird es dann ab >90%!
[/quote]

Dr. Frank Schubert hat sein Modell der Berechnung im
Jahr 2000 in 2 CSS-Ausgaben vorgestellt und erläutert.

Soweit ich mich noch erinnern kann, ist (war) sein Verfahren
allen anderen deutlich überlegen und ich habe noch nie
wahrgenommen, dass dies bezweifelt wird.

Erst einiges später kam dann Bayanes von Remi Coulom,
nach welchem die CCRL auswertet.

Unterschiede haben wir bisher jedoch noch keine festgestellt.

Die CEGT hat vor einiger Zeit beschlossen nach diesem
Verfahren auszuwerten, nicht mehr, aber auch nicht weniger.

Viele Grüsse,
G.S.
Parent - - By Roland Rösler Date 2009-10-13 18:16
Vielen Dank für die Quellenangabe. Es macht immer wieder Spaß, in den alten CCS Artikeln zu schmökern!

Zitat:
(CSS 2/00, Seite 30f, Zusammenfassung von Zweikämpfen):
... wollen wir uns nun überlegen, wie man die Ergebnisse mehrerer Zweikämpfe, an denen Programm A beteiligt ist, geeignet zusammenfasst.

Das genaueste Vorgehen bestünde darin, jeden einzelnen Zweikampf gesondert auszuwerten, d. h. Elo-Mittelwert und Fehlergrenzen einzeln zu bestimmen und diese Größen dann wiederum über alle Zweikämfe zu mitteln. Dieses Verfahren erweist sich allerdings als vergleichsweise aufwendig.

Dem habe ich nichts hinzuzufügen!

PS: Ich kann aber auch mit dem weiter unten beschriebenen Näherungsverfahren leben, auch wenn S12 x64 da um 10 Elopunkte "betrogen" wird.
Parent - - By Gerhard Sonnabend Date 2009-10-13 20:14
[quote="Roland Rösler"]
[...snip...]
PS: Ich kann aber auch mit dem weiter unten beschriebenen Näherungsverfahren leben,
auch wenn S12 x64 da um 10 Elopunkte "betrogen" wird.
[/quote]

Schau Dir die Artikel noch mal gründlich an und
Du wirst verstehen, dass niemals eine einzige
oder auch ein paar oder eine Handvoll Engines
um irgend etwas betrogen werden kann (können) !
Es gilt immer: "Alle oder Keine(r)".

Viele Grüsse,
G.S.
Parent - By Roland Rösler Date 2009-10-13 20:55
Hallo Gerhard,
ich glaube ich muss mal ein ernstes Wort mit Dir reden!

Ich hab den Artikel gelesen! Vielleicht holst Du das jetzt mal nach. Der Autor zeigt sehr schön auf, wo die Probleme liegen mit dem Annäherungsverfahren. Die Elozahlen steigen nämlich nicht linear an, sondern liegen bei 7 Elopunkten bei einem score von 51% auf 52% und bei 32 Elopunkten bei einem score von 95% auf 96%. Und hier liegt auch der Hund begraben, worum ein Durchschnittwert über die Elo-Zahl der Gegner nicht funtionieren kann!

Gruß Roland
Parent - - By Udo Kaiser Date 2009-10-12 00:58
sagte ich nicht schon im Vorfeld das diese Version von Shredder Rybka-Technologie verbaut hat.
Und das ganz ohne eine einzige Partie. Nichtmals das Programm hatte ich.

Und noch eins:Westernhagen... den kann ich nicht leiden.

Der ist sowas von out.
Parent - By Michael Scheidl Date 2009-10-12 02:35
Um auf "Rybkatechnologie", also dieselben oder ähnliche Ideen, Entdeckungen, Algorithmen usw. zu schließen, braucht man aber mehr als einen großen Spielstärkesprung als Anhaltspunkt. Möglicherweise läßt sich das anhand von Partien, Zügen und/oder Bewertungen überhaupt nicht diagnostizieren.

Ich zweifle eher daran... es gab in der Vergangenheit mitunter auch große Fortschritte, aber nicht immer wegen derselben Ursachen. Also wenn seinerzeit irgendwann M-Chess sehr überlegen war, war es ebensowenig logisch zu sagen, jedes starke bzw. stärkere Progamm nachher muß "M-Chess-Technologie" gehabt haben.
Parent - By Ingo Bauer Date 2009-10-12 07:18 Edited 2009-10-12 07:23
Hallo Udo

[quote="Udo Kaiser"]
...
Und noch eins:Westernhagen... den kann ich nicht leiden.
Der ist sowas von out.

[/quote]

Da hast du Recht, der ist ziemlich daneben manchmal, aber nicht nur der!

Gruß
Ingo
Parent - By Benno Hartwig Date 2009-10-12 08:59
[quote="Udo Kaiser"]sagte ich nicht schon im Vorfeld das diese Version von Shredder Rybka-Technologie verbaut hat.
Und das ganz ohne eine einzige Partie. Nichtmals das Programm hatte ich.[/quote] Ja, du und dein 'Wissen' über die in den kommerziellen Engines verbaute Technologie. Doch, da staunt man sicher, Udo.
Benno
Parent - By Georg Hutschenreuter Date 2009-10-12 10:08
[quote="Werner Schüle"]
Für die 40/20er Liste haben wir natürlich noch nicht so viele Spiele - für eine Einstiegsbeurteilung reichen die aber aus: Alle Versionen haben über 110 Elos im Vergleich zur Version 11. In unserem Forum schrieb ein Tester: SMK ist zurück!
Wir gratulieren Stefan zu diesem tollen Ergebnis!!

Werner
CEGT-Team
[/quote]
Dem schliesse ich mich an!    Jetzt ist Shredder zwar "nur" Zweiter/Dritter, damit auf Augenhöhe mit Naum 4 und damit noch immer 100 Punkte hinter Rybka, aber einen Satz von über 100 ELO - das soll erst mal einer nachmachen. :applause:
Parent - By Benno Hartwig Date 2009-10-12 10:49
Zitat:
Wir gratulieren Stefan zu diesem tollen Ergebnis!!

Ja, dem schließe ich mich an.
Super.
(An Schrauben gedreht? Ganz neue Ideen gehabt? Bei so viel +ELO möchte ich lieber das Zweite glauben.
Zu gern würde man halt die Algorithmen der Top-Engines und besonders die Neuerungen darin erklärt bekommen.

Konkurrenz belebt das Geschäft. OK. Wer würde schon Lust haben seine Engine stärker zu machen, wenn es nicht andere (annähernd) ähnlich starke Engines gäbe.
Aber mglw. gibt es doch auch 'geheime' Ideen bei Frans, Vas, Stefan..., die zusammengeworfen noch mehr leisten könnten.
OK. dass die in eine Engine passen würden, ist natürlich nicht selbstverständlich.
Andererseits bieten Toga und jetzt vor allem Stockfish so viel Leistung, dass man auch ins Staunen gerät.
Darum an dieser Stelle: Gratulation und dickes_Danke auch an euch Autoren dieser Super-Engines!)


Benno
Up Topic Hauptforen / CSS-Forum / CEGT - Ranglisten vom 11. Oktober 2009

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill