Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Erste interessante Ergebnisse meiner Ranglisten
- - By Andreas Strangmüller Date 2013-07-02 12:49
Nachdem die ersten Ergebnisse meiner Rangliste nun für alle Bedenkzeiten vorliegen, habe ich mal die errechnete Eloleistung tabellarisch dargestellt.
Die Zahl unter ELO ist die Bedenkzeit in Sekunden pro Partie.
Die Werte für 60 bzw. 240 Sek. werden noch innerhalb der Elo-Margins variieren, da die Ergebnisse hier nur auf jeweils 4500 von insgesamt 135000 Partien beruhen.
Eine Tendenz läßt sich aber auch aus diesen Ergebnissen bereits ablesen.

ELOStat Start Elo: 3000

Programm                 | ELO  |  ELO |  ELO |  ELO | Max.
                         | 3.75 |  15  |  60  |  240 | Diff.
-------------------------+------+------+------+------+------
Houdini 3 x64            | 3215 | 3180 | 3164 | 3145 | -70
Critter 1.6a 64-bit      | 3125 | 3086 | 3064 | 3047 | -78
Komodo CCT 64-bit        | 3099 | 3088 | 3098 | 3085 | -14
Bouquet 1.6 pop64        | 3074 | 3049 | 3021 | 3013 | -61
Deep Rybka 4.1 SSE42 x64 | 3056 | 3033 | 3032 | 3025 | -31
Gull R375 x64            | 2980 | 3000 | 3011 | 2997 | +31
Stockfish 3 Ja 64bit     | 2970 | 3012 | 3017 | 3030 | +60
Hannibal 1.3 x64         | 2878 | 2877 | 2864 | 2876 | -14
Naum 4.2 x64             | 2823 | 2869 | 2864 | 2893 | +70
Protector 1.5.0 x64      | 2781 | 2806 | 2864 | 2889 | +108
-------------------------+------+------+------+------+-----
              Max. Diff. |  434 |  374 |  300 |  269 | 
                                  
Die Ranglisten sind unter http://www.fastgm.de online.
Parent - - By Andreas Strangmüller Date 2013-07-02 13:10
Diagramm dazu:

Parent - - By Ingo Bauer Date 2013-07-02 15:15
Nett.

Von 3.75 auf 15 noch große Sprünge, dann flacht es schon ab (soweit man das jetzt schon sagen kann). Zw. 60 und 240 wenig Änderung (der ein oder andere Tausch von dicht zusammensthenden Engines aber nichts weltbewegendes).
Meine Theorie ist ja, dass Ultakurz Mist mist (für eine Rangliste) und so ab 1min auf moderner HW (oder zw. 1 min und 240) eine Sättigung eintritt und sich nicht mehr viel tut. Ein Messpunkt hinten dran wäre schön, ist aber wohl kaum machbar.

Warten wir mal das volle Endergebniss ab.

Gruß
Ingo

PS: Das Argument das bei 'unendlicher' Bedenkzeit vielleicht alle zusammenlaufen ist aber auch nicht von der Hand zu weisen ... allerdings gehe ich davon aus das praktischerweise dazwischen ein ewig langes Plateau ist.

Gruß
Ingo
Parent - By Ingo Bauer Date 2013-07-02 15:25 Edited 2013-07-02 15:28
.
Parent - - By Franz-Josef Hindelang Date 2013-07-02 18:28
Dies deckt sich mit meinen, natürlich sehr bescheidenen eigenen Erhebungen (knapp 80.000 Spiele).
Games mit weniger als 2-3 Minuten pro ganzer PARTIE, schlimmer noch 30, 40, 50 oder 60 SEKUNDEN,
messen nichts und/oder tatsächlich nur "Mist/Dreck".
Danach jedoch wird es recht zuverlässig, so denn die Bedingungen gut ausgewählt sind, soll heißen:
alles nähert sich an und wird "relativ" genau.
In meiner kleinen privaten "Liste" liegt Houdini Nummer 3 38 Punkte vor Komodo CCT 1Core each.
Franz-Josef
Parent - By Andreas Strangmüller Date 2013-07-03 18:58
Hallo Franz-Josef,

dass Partien mit einer Bedenkzeit =< 60 Sek. pro Partie nichts messen bzw. Mist/Dreck sind ist eher eine subjektive Sicht.
Sie messen die Spielstärke die ein Programm unter diesen Bedingungen hat, nicht mehr und nicht weniger.

Praxisrelevanter sind selbstverständlich Partien mit einer höheren Bedenkzeit als 60 Sek. und dann auch nicht Single- sondern Multicore.
Aber vergleichen wir mal die reinen Ranglistenpositionen einer Liste mit 60 Sek./Partie und einer Liste mit höherer Bedenkzeit.

z.B. CEGT Single-Liste 40/20 Min. und meine vorläufige Liste 60+0.60 Sek.
Habe nur die Engines gelistet, die in beiden Listen getestet wurden.

  CEGT                 |   FGRL
--------------------------------------------------------
1 Houdini 3       3046 | 1 Houdini 3      3164
2 Komodo CCT      3013 | 2 Komodo CCT     3098
3 Critter 1.6a    2981 | 3 Critter 1.6a   3064
4 Stockfish 3     2967 | 4 Rybka 4.1      3032
5 Rybka 4.1       2948 | 5 Stockfish 3    3021
6 Gull II         2932 | 6 Gull R375      3017
7 Protector 1.5   2842 | 7 Naum 4.2       2864
8 Naum  4.2       2832 | 8 Hannibal 1.3   2864
9 Hannibal 1.3    2815 | 9 Protector 1.5  2864

Zumindest von der reinen Position sind die Unterschiede eher gering.
Ranglisten mit kurzer Bedenkzeit haben daher m.M. nach schon eine gewisse Aussagekraft und Daseinsberechtigung.

Viele Grüße,
Andreas
Parent - - By Longo Longwhile Date 2013-07-02 13:57
Hallo Herr Strangmüller,

ich entnehme keinerlei neue Erkenntnisse aus diesen Daten.
Kann man aus dem Diagramm erkennen, dass bei unendlicher Rechenzeit
alle Programme dem gesetzten Mittelwert, hier Elo=3000 annähern?
Für nicht grob fehlerhafte Programme müsste es so sein!
Parent - - By Benno Hartwig Date 2013-07-02 17:49 Edited 2013-07-02 17:53
[quote="Longo Longwhile"]Kann man aus dem Diagramm erkennen, dass bei unendlicher Rechenzeit
alle Programme dem gesetzten Mittelwert, hier Elo=3000 annähern?[/quote]Nein!
[quote="Longo Longwhile"]Für nicht grob fehlerhafte Programme müsste es so sein![/quote]Die Aussage entnimmst du nur deinem Bauch!
Ob der Abstand der Kurven gegen 0 geht,
ob sie sich ggf. sogar überschneiden
oder ob sie sich nur einem Grenzwert>0 annähern ist vollkommen offen.
Wir haben nur einen starken, belastbaren Hinweis für die eh vertretene These erhalten, dass bei längeren Zeiten die ELO-Differenzen tendenziell kleiner werden.
Und SF scheint mir sehr beobachtenswert: Mal gucken ob SF bei noch längeren Zeiten noch mehr Boden auf Houdini gut machen kann.

Benno
Parent - - By Longo Longwhile Date 2013-07-03 17:05
[quote="Benno Hartwig"]
[quote="Longo Longwhile"]Kann man aus dem Diagramm erkennen, dass bei unendlicher Rechenzeit
alle Programme dem gesetzten Mittelwert, hier Elo=3000 annähern?[/quote]Nein!
...
[/quote]
Und warum nicht? Deine Aussage ist ohne Begründung! Hast Du eine aussagekräftige?

MfG

Longo
Parent - By Benno Hartwig Date 2013-07-03 17:37 Edited 2013-07-03 17:40
[quote="Longo Longwhile"]Und warum nicht? Deine Aussage ist ohne Begründung! Hast Du eine aussagekräftige?[/quote]Nein. So ein formaler Beweis für "eine Aussage ist nicht möglich" ist mitunter auch schwierig.
Wir haben es mathematisch mit mehreren Extrapolationsaufgaben zu tun, jeweils mit nur einer Hand voll von nicht exakten Stützpunkten.
Wir haben keine Vorstellung davon, welcher Funktionstyp hier unterstellt werden sollte.
Und wir wollen Aussagen, die einigermaßen weit von diesen Stützpunkten entfernt liegen.
Nach meiner Erfahrung mit derartigen Problemen ist da mit auch nur vager Verlässlichkeit überhaupt nichts zu machen. Mehr als Kaffeesatzleserei ist nicht drin.

Benno
Parent - - By Stefan Pohl Date 2013-07-02 14:00
[quote="Andreas Strangmüller"]
Nachdem die ersten Ergebnisse meiner Rangliste nun für alle Bedenkzeiten vorliegen, habe ich mal die errechnete Eloleistung tabellarisch dargestellt.
Die Zahl unter ELO ist die Bedenkzeit in Sekunden pro Partie.
Die Werte für 60 bzw. 240 Sek. werden noch innerhalb der Elo-Margins variieren, da die Ergebnisse hier nur auf jeweils 4500 von insgesamt 135000 Partien beruhen.
Eine Tendenz läßt sich aber auch aus diesen Ergebnissen bereits ablesen.

ELOStat Start Elo: 3000

Programm                 | ELO  |  ELO |  ELO |  ELO | Max.
                         | 3.75 |  15  |  60  |  240 | Diff.
-------------------------+------+------+------+------+------
Houdini 3 x64            | 3215 | 3180 | 3164 | 3145 | -70
Critter 1.6a 64-bit      | 3125 | 3086 | 3064 | 3047 | -78
Komodo CCT 64-bit        | 3099 | 3088 | 3098 | 3085 | -14
Bouquet 1.6 pop64        | 3074 | 3049 | 3021 | 3013 | -61
Deep Rybka 4.1 SSE42 x64 | 3056 | 3033 | 3032 | 3025 | -31
Gull R375 x64            | 2980 | 3000 | 3011 | 2997 | +31
Stockfish 3 Ja 64bit     | 2970 | 3012 | 3017 | 3030 | +60
Hannibal 1.3 x64         | 2878 | 2877 | 2864 | 2876 | -14
Naum 4.2 x64             | 2823 | 2869 | 2864 | 2893 | +70
Protector 1.5.0 x64      | 2781 | 2806 | 2864 | 2889 | +108
-------------------------+------+------+------+------+-----
              Max. Diff. |  434 |  374 |  300 |  269 | 
                                  
Die Ranglisten sind unter http://www.fastgm.de online.
[/quote]

Schön. Im Prinzip sind die Ergebnisse so, wie sie zu erwarten waren. Das prinzipielle Problem bei dieser Art von Ranglistenvergleich mit unterschiedlicher Bedenkzeit ist, daß hier 2 Effekte aufeinandertreffen und es schwer ist diese voneinander zu trennen:
1. Änderung der relativen Spielstärke der Engines mit mehr oder weniger Bedenkzeit (also den Effekt, den man hier herausfinden will)
2. Den von mir so getauften Zieharmonikaeffekt, der besagt, daß mit mehr Rechenzeit generell alle Einzelwettkämpfe der Engines näher an die 50%-Marke heranrücken, was Ranglisten mit mehr Zeit insgesamt zusammenstaucht bzw. Ranglisten mit weniger Bedenkzeit spreizt. Houdini 3 z.B. wird immer als Ranglistenerster mit mehr Bedenkzeit stärker abbauen, einfach weil alle seine Ergebnisse näher an die 50%-Marke heranrücken und da alle seine Einzerlergebnisse ja deutlich über 50% liegen, wirde er Elos mit mehr Zeit verlieren, selbst wenn er eigentlich gar nicht schwächer spielen würde. Bei Stockfish ist der Effekt gegenteilig, weil Stockis Ergebnisse mit mehr Zeit tendenziell ebenfalls näher an die 50%-Marke heranrücken, was aber in seinem Fall hier ein scheinbares Eloplus bedeuten würde.
Diese hier beschriebenen Effekte treten eben unabhängig davon auf, ob eine Engine mit mehr Zeit eigentlich über- oder unterproportional zulegen würde. Und es kann eben sein, daß sich 1. und 2. addieren (im positiver oder Negativer Hinsicht) oder auch gegenseitig aufheben bzw. vermindern. Leider wird man dieses Problem kaum lösen können, ich wüßte jedenfalls nicht wie...

Stefan
Parent - - By Michael Scheidl Date 2013-07-02 14:56
Möglicherweise verschwindet der Ziehharmonikaeffekt, wenn man die Remispartien aus den Ergebnissen herausnimmt, was jedoch die Datenbasis verkleinern und somit unverläßlicher machen, und die Ratings (vermutlich) verzerren würde.
Parent - - By Stefan Pohl Date 2013-07-03 10:14
[quote="Michael Scheidl"]
Möglicherweise verschwindet der Ziehharmonikaeffekt, wenn man die Remispartien aus den Ergebnissen herausnimmt, was jedoch die Datenbasis verkleinern und somit unverläßlicher machen, und die Ratings (vermutlich) verzerren würde.
[/quote]

Hi Michael,

das ist ein genialer Einfall!!! Das könnte das Problem des Zieharmonikaeffekts, welches ja in diesem konkreten Fall die eigentlich zu messenden Abweichungen überlagert/verschmiert, eliminieren oder zumindest stark minimieren. Die Frage wird nur sein - wie du richtig sagst - wieviele nicht-Remis-Partien (gerade bei längeren Bedenkzeiten) dann noch übrig bleiben (denke da an TCEC...).

Auf jeden Fall eine super Idee, ich hoffe Andreas Strangmüller greift sie auf, wenn die Partien alle durch sind (was aber noch einige Monate brauchen wird, wenn ich ihn da richtig verstanden habe) und macht einen Ranglistenvergleich mit Remisen und ohne Remis-Partien. Das wäre sicher sehr, sehr interessant!

Stefan
Parent - By Michael Scheidl Date 2013-07-03 18:46
Absolut, andererseits, so genial war der Einfall auch wieder nicht: Schon seit langem war die Rede davon daß dieser Effekt auf den steigenden Remisquoten basiert. - Ich nehme an, Ranglisten ohne Remis begünstigen "kämpferische" Engines und benachteiligen "solide" Engines. Dann liegt es am User, das einzuschätzen und seine bevorzugten Analyseengines - sei es auch nur für die zweite oder dritte Meinung - auszuwählen...

Da kommen sicherlich auch Spark 1.0 oder die Traditionsengines Fritz & Co in Betracht.
Parent - - By Benno Hartwig Date 2013-07-03 17:49
[quote="Michael Scheidl"]Möglicherweise verschwindet der Ziehharmonikaeffekt..,[/quote]Warum sollte man ihn den verschwinden lassen?
Die bei längeren Zeiten geringere Überlegenheit ist doch Realität. Dann soll doch bitte auch genau die durch die ELO-Werte ausgedrückt werden.

Man könnte natürlich versuchen generell abzuschätzen, wie stark dieser Effekt im Mittel ist.
Aussagen der Art "Eine x-ELO-Überlegenheit bei 3min/Partie wird durchschnittlich zu einer y-ELO-Überlegenheit bei 3min/Zug" oder so.
Dann hätte man zumindest einen Schätzwert, wie eine Turnierstufenüberlegenheit sein könnte, wenn die Blitz-Überlegenheit bekannt wäre. Aber hier sind wohl reichlich große Unsicherheiten, die einem den Spaß schnell verderben würden.

Benno
Parent - - By Ingo Bauer Date 2013-07-03 18:47
[quote="Benno Hartwig"]
[quote="Michael Scheidl"]Möglicherweise verschwindet der Ziehharmonikaeffekt..,[/quote]Warum sollte man ihn den verschwinden lassen?
Die bei längeren Zeiten geringere Überlegenheit ist doch Realität. Dann soll doch bitte auch genau die durch die ELO-Werte ausgedrückt werden.
...
[/quote]

Dem kan ich mich nur anschließen. Remis ist ein reguläres Ergebniss des Schachs. Je länger die Bedenkzeit, desto wahrscheinlicher ist es. Je wahrscheinlicher es wird, desto wichtiger ist es auch. Und dann soll man genau diesen wichtiger werdenden Teil weglassen. Wozu, warum?

Gruß
Ingo
Parent - By Stefan Pohl Date 2013-07-04 04:09
[quote="Ingo Bauer"]
[quote="Benno Hartwig"]
[quote="Michael Scheidl"]Möglicherweise verschwindet der Ziehharmonikaeffekt..,[/quote]Warum sollte man ihn den verschwinden lassen?
Die bei längeren Zeiten geringere Überlegenheit ist doch Realität. Dann soll doch bitte auch genau die durch die ELO-Werte ausgedrückt werden.
...
[/quote]

Dem kan ich mich nur anschließen. Remis ist ein reguläres Ergebniss des Schachs. Je länger die Bedenkzeit, desto wahrscheinlicher ist es. Je wahrscheinlicher es wird, desto wichtiger ist es auch. Und dann soll man genau diesen wichtiger werdenden Teil weglassen. Wozu, warum?

Gruß
Ingo
[/quote]

Warum muß man sich hier eingentlich ständig wiederholen, das macht langsam keinen Spaß mehr hier. Aber nun gut. Also nochmal, für alle, die es nicht begreifen (wollen): Dieses Testprojekt will keine neue Rangliste werden, sondern ermitteln, ob und wie stark Engines mit mehr Bedenkzeit über- oder unterproportional an Spielstärke gewinnen. Und der von mir beschriebene Zieharmonikaeffekt stört diese Messungen, also sollte man nach Möglichkeiten suchen, ihn zu eliminieren (in diesem Test, nicht generell). Und Michaels brillante Idee, die Remisen aus den Ergebnissen rauszurechnen, ist die einzige, die hier bisher jemand hatte, um das zu tun.

Stefan
Parent - - By Michael Scheidl Date 2013-07-03 19:31
Schon, die Frage ist nur welche Info möchte man von einer Rangliste bekommen? Interessiert sich ein ambitionierter Schachspieler der bestmöglich analysieren will, in welcher Funktion auch immer, wirklich für geschrumpfte Spielstärkeabstände die nur auf einer größeren Remisquote basieren? Der interessiert sich hingegen dafür, welche Engines - zusätzlich zu den ein, zwei stärksten - ihm interessante Alternativen aufzeigen können. Glaube ich zumindest, aber ich bin naiv und kann mich irren. Vielleicht nimmt jeder einfach Houdini 3 und der Rest ist wurscht
Parent - By Andreas Aicher Date 2013-07-03 21:08
Remis gehört zum Schach, ist m.M. nicht wegzudenken.
Ich weiss nicht ob Du Dich irrst, ich kann nur für mich selbst sprechen, aber wenn ich mit einer Engine analysieren will, mach ich das nicht in ms ode s.
Aus diesem Grunde sind für mich nur Ranglisten mit längeren Bedenkzeiten und mit mehreren Kernen von Bedeutung.
Ich will ein Beispiel nennen:
Komodo CCT ist stärker als Komodo 5.1 auf einem Singlecore, aber ich verwende für Analysen einen Quad und da ist es dann ziemlich eindeutig, was die bessere Wahl für Analysen ist!
Also wenn Du jetzt, wie Du schreibst bestmöglich analysieren willst, glaube ich, dass Du in den Blitzlisten keine Alternativen für Houdini findest.
Als Mac User bin ich ja auf diese Alternativen angewiesen, denn Houdini ist inzwischen die einzige int. engine, die nicht auf mac läuft (mal abgesehen von Critter 1.6a, der soll ja irgendwie Houdini 1.5 sein)
Parent - - By Stefan Pohl Date 2013-07-04 04:13 Edited 2013-07-04 04:17
[quote="Benno Hartwig"]
[quote="Michael Scheidl"]Möglicherweise verschwindet der Ziehharmonikaeffekt..,[/quote]Warum sollte man ihn den verschwinden lassen?
Die bei längeren Zeiten geringere Überlegenheit ist doch Realität. Dann soll doch bitte auch genau die durch die ELO-Werte ausgedrückt werden.

Man könnte natürlich versuchen generell abzuschätzen, wie stark dieser Effekt im Mittel ist.
Aussagen der Art "Eine x-ELO-Überlegenheit bei 3min/Partie wird durchschnittlich zu einer y-ELO-Überlegenheit bei 3min/Zug" oder so.
Dann hätte man zumindest einen Schätzwert, wie eine Turnierstufenüberlegenheit sein könnte, wenn die Blitz-Überlegenheit bekannt wäre. Aber hier sind wohl reichlich große Unsicherheiten, die einem den Spaß schnell verderben würden.

Benno
[/quote]

Das Problem ist, daß der Zieharmonikaeffekt keinen brauchbaren Mittelwert hat. Es hängt davon ab, wieviele Einzelvergleiche eine Engine mit mehr Als 50% abschließt und wieviele unter 50%. Hat eine Engine nur Ergebnisse über 50% (z.B Houdini) so wird der Zieharmonikaeffekt sehr stark sein, hat sie einige über und einige unter 50%, so kann er praktisch gleich null sein, weil sich die Abweichungen in den Einzelergebnissen dann ggf. gegenseitig ausgleichen. Hat eine Engine nur Einzelwrgebnisse unter 50%, so ist der Zieharmonikaeffekt wiederum sehr stark, nur eben in die entgegengesetzte Richtung.

Stefan
Parent - - By Benno Hartwig Date 2013-07-04 06:00 Edited 2013-07-04 06:03
[quote="Stefan Pohl"]Das Problem ist, daß der Zieharmonikaeffekt keinen brauchbaren Mittelwert hat...[/quote]Die ELO-Werte taugen ja auch nur, um Spielstärkeunterschiede zu beschreiben. Auf welchem Niveau diese Werte liegen ist einigermaßen willkürlich. "So wie es ungefähr plausibel scheint". Wer will, kann das Turnierzeit-Niveau etwas hochsetzen, H3 bliebe dann bei den vom Blitzen bekannten ELO-Werten, die Schwächeren würden aufgewertet. Aber wozu sollte sowas gut sein?
Die geringeren Unterschiede bei längeren Zeitensind schlicht und einfach Realität. Sie spiegeln genau das wieder, was in den H3-Partien gegen schwächere Gegner passiert. H3 ist auf Turnierstufe nicht so sehr überlegen wie bei kürzeren Zeiten.

Dir schwebt ggf. eine Kennzahl für jede Engine vor, die Ihre 'Stärkequalität' beschreibt, und aus der man die effektive Über- bzw. Unterlegenheit bei verschiedenen Zeiten einschätzen kann. Denkst du an so was?
Dann könnte man ggf. die 40/20 (siehe CEGT) nehmen und hier die vielen, vielen ELO-Differenzen betrachten, man könnte sie vergleichen mit den entsprechenden Differenzen von 40/4 und 40/120 und versuchen aus diesen Mittelwerten der Unterschiede eine Funktion zu kreieren, die die Ergebnisse vergleichbar macht.
ZielEloDifferenz(AusgangsEloDifferenz, AusgangsZeitProZug, ZielZeitProZug)
Man gibt der Funktion also eine ELO-Differenz für eine bestimmte Bedenkzeit, und sie liefert einen Schätzwert für die ELO-Differenz bei einer anderen Bedenkzeit.
Dann könntest du z.B. die ELO-Werte bei 40/20 als 'Stärkequalität' betrachten. So irgendwie?
Auch Andreas' Liste (thanx!) wäre natürlich eine gute und vor allem sehr gut handhabbare Basis.

Benno
Parent - - By Stefan Pohl Date 2013-07-04 06:12
[quote="Benno Hartwig"]

Die geringeren Unterschiede bei längeren Zeitensind schlicht und einfach Realität. Sie spiegeln genau das wieder, was in den H3-Partien gegen schwächere Gegner passiert. H3 ist auf Turnierstufe nicht so sehr überlegen wie bei kürzeren Zeiten.

[/quote]

Ja sicher, das ist klar. Das Problem ist doch, daß der Zieharmonikaeffekt Houdini nur im Moment stärker als andere nach unten zieht, eben weil er anderen aktuellen Engines so überlegen ist - aber das muß ja nicht so bleiben. Was passiert denn, wenn Houdini irgendwann nur noch mittelmäßig ist, wie jetzt Rybka 4.1? Oder nur noch untermittelmäßig? Dann würde der Zieharmonikaeffekt bei Houdini plötzlich verschwinden oder Houdinis Elowert gar nach oben ziehen, wenn die Bedenkzeit länger wird. Deshalb meine ich ja, daß man den Zieharmonikaeffekt aus Andreas Strangmüllers ausgezeichnetem Experiment möglichst eliminieren muß (sofern möglich), denn die Testumgebung für alle Engines ist nur eine Momentaufnahme, die sich jederzeit ändern kann und es soll ja ermittelt werden, ob eine Engine generell mit mehr Bedenkzeit über- oder unterproportional an Spielstärke zulegt und das unabhängig von der relativen Stärke, die sie momentan im zur Verfügung stehenden Gegnerfeld hat.

Stefan
Parent - - By Benno Hartwig Date 2013-07-04 14:57
[quote="Stefan Pohl"]Was passiert denn, wenn Houdini irgendwann nur noch mittelmäßig ist, wie jetzt Rybka 4.1? Oder nur noch untermittelmäßig? Dann würde der Zieharmonikaeffekt bei Houdini plötzlich verschwinden oder Houdinis Elowert gar nach oben ziehen, wenn die Bedenkzeit länger wird.[/quote]bei länger werdenden Zeiten werden ggf. die Abstände zwischen zwei Engines immer noch etwas kleiner. Ob beide nach oben gehen, oder ob beide nach unten gehen, oder ob ggf. die bessere Engine etwas nach unten und die andere etwas nach oben, ist nur ein Resultat der recht willkürlichen Anlage des Niveaus des Teilnehmerfeldes.
Real sind die kleiner werdenden Abstände. Das Nachuntengehen und Nachobengehen oder Aufeinanderzugehen (und bei welchem ELO-Wert dann ggf. ein Fixpunkt sein soll) wird maßgeblich einfach durch die allgemeine Niveau-Vorgabe festgelegt.

Benno
Parent - - By Werner Mueller Date 2013-07-04 18:28
[quote="Benno Hartwig"]
bei länger werdenden Zeiten werden ggf. die Abstände zwischen zwei Engines immer noch etwas kleiner. Ob beide nach oben gehen, oder ob beide nach unten gehen, oder ob ggf. die bessere Engine etwas nach unten und die andere etwas nach oben, ist nur ein Resultat der recht willkürlichen Anlage des Niveaus des Teilnehmerfeldes.
Real sind die kleiner werdenden Abstände. Das Nachuntengehen und Nachobengehen oder Aufeinanderzugehen (und bei welchem ELO-Wert dann ggf. ein Fixpunkt sein soll) wird maßgeblich einfach durch die allgemeine Niveau-Vorgabe festgelegt.

Benno
[/quote]
Wenn das Teilnehmerfeld ledglich aus diesen beiden Engines bestünde, müsste man sich im ersten sowie im zweiten Fall dann allerdings ernsthafte Gedanken machen.

Sorry, kleiner Scherz
Parent - By Benno Hartwig Date 2013-07-05 06:54
[quote="Werner Mueller"]Wenn das Teilnehmerfeld ledglich aus diesen beiden Engines bestünde, müsste man sich im ersten sowie im zweiten Fall dann allerdings ernsthafte Gedanken machen.[/quote]Ganz ohne Scherz: Welche denn?
Ggf. ist immer noch die These richtig, dass Engines meistens in ernsthaften Partien mit Menschen im Blitzen erfolgreicher sind als bei Turnierpartien. Und das unabhängig davon, ob sie stärker sind als die Menschen.
Dann wäre doch durchaus gerechtfertigt, die durchschnittliche ELO-Zahl der Engines bei langen Zeiten niedriger anzusetzen als bei kurzen Zeiten.
Und dann wäre die Vorstellung (also: der zweite Fall), dass eben beide ELO-Werte auch in einem 2-Engines-Feld etwas nach unten gehen sollten, durchaus ein recht plausibler Standpunkt. Finde ich.

Benno
Parent - By Ingo Althöfer Date 2013-07-02 17:51
Hallo Herr Strangmüller,

danke für die Mühe und die interessanten Ergebnisse.

Ingo Althöfer.
Parent - - By Andreas Strangmüller Date 2013-07-02 19:54
...und die vier Ranglisten als Vergleich nebeneinander dargestellt:

Parent - - By Clemens Keck Date 2013-07-02 21:32
Hallo

haben alle 4 Listen die selbe Partienanzahl?

das wäre schon sehr wichtig meiner Meinung nach.

C.K.
Parent - - By Andreas Strangmüller Date 2013-07-02 21:49
Hallo!

In meinem Eingangsposting des Threads habe ich das bereits ausgeführt.

Die Ergebnisse der Listen 60+0.60 und 240+2.40 sind nur vorläufige Ergebnisse und basieren auf jeweils 4500 Partien.
Die Listen 3.75+0.0375  und 15+0.15 sind komplett mit 135000 Partien bzw. 27000 Partien je Engines.

Viele Grüße,
Andreas Strangmüller
Parent - By Horst Sikorsky Date 2013-07-02 22:31
Warum darf Houdini 3 Pro nicht mitmachen?
ist der zu Blind oder gedobt
Parent - By Rudolf Rohs Date 2013-07-03 09:28
Hallo Andreas,

vielen Dank für deine interessante Fleißarbeit!

Sie läßt vor allem in Verbindung mit längeren Bedenkzeitlisten wie Ingo's IPON schöne
Rückschlüsse zu, welche Engine nur schnell ist und welche von zusätzlicher Bedenkzeit
besonders profitiert.

Dabei ist vor allem der Eloabstand zwischen den Engines bei den einzelnen Stufen sehr
interessant. So wird z.B. der Eloabstand zwischen Houdini 3.0 und Komode CCT bei
steigender Zeit immer kleiner, was ja auch Clemens Kecks kleines Turnier bestätigt,
welches Houdini ja nur knapp gewann.

Critter hingegen kann auf Zeit nicht gegenüber Houdini aufholen, etc.

Deine Arbeit bestätigt also viele Vermutungen.

Gruß

Rudolf
Up Topic Hauptforen / CSS-Forum / Erste interessante Ergebnisse meiner Ranglisten

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill