FGRL-Rating List: 60+0.60

By Stefan Pohl Date 2016-01-09 06:32

Thomas Müller schrieb:

ui... +44 zu K9.3 ist sogar recht deutlich.
Mal schauen was bei dir bei den anderen zeitkontrollen rauskommt?!
Danke!

gruß
thomas

Genau. Bin schon gespannt, wie deine Ergebnisse bei den längeren Zeiten aussehen werden. Was auffällt ist, daß sowohl bei dir, als auch bei Ingo, der Elozuwachs von Stockfish 6 auf 7 deutlich größer ist, als bei mir. Das scheint darauf hinzudeuten, daß Stockfish 7 gegen schwächere Gegner besser scort, als Stockfish 6 (bei euch beiden gibt es ja sehr viel mehr und damit auch sehr viel mehr schwächere Gegner als bei mir). Bei Ingos Ergebnis hatte ich zunächst noch auf einen statistischen Ausreißer getippt, bei nur 3300 Partien ist das immer denkbar. Aber bei dir ist das Ergebnis ähnlich gut und es sind ja 15000 Partien. Und damit ist das Ergebnis über jeden Zweifel erhaben. Schon erstaunlich! Ich habe ja andererseits Stockfish 7 mit 7000 Partien getestet (nur gegen starke Gegner) und zuvor eine praktisch identische Version vom 22.12. ebenfalls mit 7000 Partien und das Ergebnis war beide Male exakt gleich. Also kann ich auch bei mir einen statistischen Unfall sicher ausschließen.
Ergo scheint Stockfish 7 gegen schwache Gegner besser zu scoren, als gegen starke. Und das ist für Stockfish bisher völlig untypisch gewesen.

Gruß - Stefan

By Thomas Müller Date 2016-01-09 09:55

Habe bei Andreas gerade noch mal die liste angeschaut....
remisquote ist von 24.4% zu 18.7% von SF6 zu SF7 gesunken.
Evtl. eben gegen die "schwächeren"

gruß
thomas

By Andreas Strangmüller Date 2016-01-09 10:22

Hier der direkte Vergleich:

                                         Stockfish 7                 Stockfish 6         
                                  (    +     =     -)     %    (    +     =      -)     % 
Andscacs 0.84n           :    250 (   197,   45,   8),  87.8   (   184,   63,    3),  86.2
Arasan 17.5              :    250 (   241,    8,   1),  98.0   (   238,   11,    1),  97.4
Arasan 18.1              :    250 (   238,   12,   0),  97.6   (   233,   17,    0),  96.6
Booot 5.2.0 x64          :    250 (   238,   12,   0),  97.6   (   229,   16,    5),  94.8
Bouquet 1.8 x64          :    250 (   175,   60,  15),  82.0   (   155,   88,    7),  79.6
Cheng 4.39               :    250 (   230,   19,   1),  95.8   (   217,   30,    3),  92.8
cheng4 0.38              :    250 (   231,   19,   0),  96.2   (   225,   24,    1),  94.8
Chiron 2 64bit           :    250 (   211,   36,   3),  91.6   (   201,   41,    8),  88.6
Critter 1.6a 64-bit      :    250 (   158,   82,  10),  79.6   (   127,  104,   19),  71.6
Deep HIARCS 14 WCSC      :    250 (   223,   26,   1),  94.4   (   201,   46,    3),  89.6
Deep Junior Yokohama     :    250 (   242,    8,   0),  98.4   (   239,   10,    1),  97.6
Deep Rybka 4.1 x64       :    250 (   178,   66,   6),  84.4   (   171,   70,    9),  82.4
Deep Shredder 12 x64     :    250 (   215,   32,   3),  92.4   (   212,   33,    5),  91.4
Deep Sjeng c't 2010      :    250 (   237,   11,   2),  97.0   (   227,   21,    2),  95.0
DeepSaros eXp            :    250 (   182,   59,   9),  84.6   (   161,   80,    9),  80.4
Deuterium v14.3.34.130   :    250 (   237,   12,   1),  97.2   (   243,    7,    0),  98.6
DiscoCheck 5.2           :    250 (   240,    8,   2),  97.6   (   225,   25,    0),  95.0
DON 1.0b x64             :    250 (   168,   78,   4),  82.8   (   124,  115,   11),  72.6
Equinox 3.30 x64mp       :    250 (   163,   77,  10),  80.6   (   138,   93,   19),  73.8
Fire 4 x64               :    250 (   142,   94,  14),  75.6   (   128,  106,   16),  72.4
Gaviota v1.0             :    250 (   240,    9,   1),  97.8   (   234,   14,    2),  96.4
Gull 3 x64               :    250 (   130,  105,  15),  73.0   (   117,  102,   31),  67.2
Hannibal 1.5 x64         :    250 (   207,   39,   4),  90.6   (   182,   62,    6),  85.2
Houdini 4 x64            :    250 (   134,   92,  24),  72.0   (    98,  116,   36),  62.4
iCE 2.0 v2240 x64        :    250 (   208,   39,   3),  91.0   (   227,   22,    1),  95.2
Jonny 4.00               :    250 (   232,   18,   0),  96.4   (   234,   16,    0),  96.8
Komodo 8 64-bit          :    250 (   104,  111,  35),  63.8   (    94,  111,   45),  59.8
Komodo 9 64-bit          :    250 (   106,  117,  27),  65.8   (    79,  118,   53),  55.2
Komodo 9.1 64-bit        :    250 (    79,  133,  38),  58.2   (   125,  277,   98),  52.7
Komodo 9.2 64-bit        :    250 (    89,  128,  33),  61.2   (    72,  128,   50),  54.4
Komodo 9.3 64-bit        :    250 (    80,  125,  45),  57.0   (    66,  122,   62),  50.8
Loop 2007 64-Bit         :    250 (   241,    8,   1),  98.0   (   238,   12,    0),  97.6
Mars 3.35 x64            :    250 (   171,   73,   6),  83.0   (   144,   91,   15),  75.8
MinkoChess 1.3 x64       :    250 (   242,    8,   0),  98.4   (   228,   21,    1),  95.4
Murka 3 x64              :    250 (   235,   12,   3),  96.4   (   235,   14,    1),  96.8
Naum 4.6                 :    250 (   213,   35,   2),  92.2   (   196,   45,    9),  87.4
Nirvanachess 1.8         :    250 (   238,   11,   1),  97.4   (   231,   19,    0),  96.2
Nirvanachess 2.0a        :    250 (   231,   19,   0),  96.2   (   212,   36,    2),  92.0
Nirvanachess 2.1c        :    250 (   210,   39,   1),  91.8   (   204,   46,    0),  90.8
Nirvanachess 2.2         :    250 (   196,   53,   1),  89.0   (   173,   74,    3),  84.0
Octochess r5190          :    250 (   237,   12,   1),  97.2   (   239,   11,    0),  97.8
PanChess 00.611 x64      :    250 (   173,   74,   3),  84.0   (   138,   93,   19),  73.8
Protector 1.7.0          :    250 (   212,   34,   4),  91.6   (   189,   60,    1),  87.6
Protector 1.8.0          :    250 (   200,   50,   0),  90.0   (   190,   55,    5),  87.0
Protector 1.9.0          :    250 (   211,   38,   1),  92.0   (   173,   69,    8),  83.0
Quazar 0.4 x64           :    250 (   235,   12,   3),  96.4   (   231,   17,    2),  95.8
Rodent 1.7               :    250 (   235,   14,   1),  96.8   (   239,   10,    1),  97.6
Senpai 1.0               :    250 (   213,   35,   2),  92.2   (   203,   43,    4),  89.8
SmarThink 1.70           :    250 (   240,   10,   0),  98.0   (   227,   23,    0),  95.4
Spark 1.0                :    250 (   223,   26,   1),  94.4   (   224,   21,    5),  93.8
Spike 1.4                :    250 (   228,   21,   1),  95.4   (   229,   21,    0),  95.8
Sting SF 4.8.4 64bit     :    250 (   215,   34,   1),  92.8   (   189,   53,    8),  86.2
Stockfish 150613 64      :    250 (    54,  175,  21),  56.6   (    29,  171,   50),  45.8
Strelka 6                :    250 (   140,   87,  23),  73.4   (   115,  103,   32),  66.6
Texel 1.05 64-bit        :    250 (   206,   43,   1),  91.0   (   198,   47,    5),  88.6
Toga II 3.0              :    250 (   240,   10,   0),  98.0   (   225,   22,    3),  94.4
Tornado 4.88 x64         :    250 (   246,    4,   0),  99.2   (   239,   11,    0),  97.8
Vajolet2 1.43            :    250 (   231,   19,   0),  96.2   (   236,   13,    1),  97.0
Zappa Mexico II          :    250 (   243,    7,   0),  98.6   (   235,   14,    1),  96.8

By Stefan Pohl Date 2016-01-10 07:07

Thomas Müller schrieb:

Habe bei Andreas gerade noch mal die liste angeschaut....
remisquote ist von 24.4% zu 18.7% von SF6 zu SF7 gesunken.
Evtl. eben gegen die "schwächeren"

gruß
thomas

Das glaube ich nicht. Daß die Remisqoute abnimmt, wenn der Erfolgsscore einer neuen Engineversion gegenüber der alten Version zunimmt, ist vollkommen normal und logisch, sofern schon die ältere Engineversion sich im oberen Bereich der Tabelle aufhielt. Irgendwoher muss das Plus an vollen Punkten/Gewinnpartien ja herkommen, ergo nimmt dann die Zahl der Verlustpartien und auch die Zahl der Remispartien tendenziell ab.

Gruß - Stefan

By Thomas Müller Date 2016-01-10 10:09

nee ist es auch nicht wie man an der oberen tab sehen kann.
Das plus wird auch gegen starke engines geholt.
Gegen K9.x ist es recht viel an + von den %ten her.

Komodo 9 64-bit          :    250 (   106,  117,  27),  65.8   (    79,  118,   53),  55.2
Komodo 9.1 64-bit        :    250 (    79,  133,  38),  58.2   (   125,  277,   98),  52.7
Komodo 9.2 64-bit        :    250 (    89,  128,  33),  61.2   (    72,  128,   50),  54.4
Komodo 9.3 64-bit        :    250 (    80,  125,  45),  57.0   (    66,  122,   62),  50.8

Bei einem erziehlten plus und weniger draw sind es dann eben auch mehr gewinne.

By Ingo B. Date 2016-01-09 11:47

Stefan Pohl schrieb:

... Was auffällt ist, daß sowohl bei dir, als auch bei Ingo, der Elozuwachs von Stockfish 6 auf 7 deutlich größer ist, als bei mir. Das scheint darauf hinzudeuten, daß Stockfish 7 gegen schwächere Gegner besser scort, ...
Ergo scheint Stockfish 7 gegen schwache Gegner besser zu scoren, als gegen starke. Und das ist für Stockfish bisher völlig untypisch gewesen.

Weil du hier Schlüsse aus meinen Spielen ziehst:
Das "ergo" stimmt so nicht. Sorry das ich da Salz in die Suppe schütten muß.

Hier mein Originalrun von SF7. Einmal ausgewertet gegen die schwächsten 8 und gegen die stärksten 8 mit Protector als Mittelanker in beiden Gruppen:
(Auszug aus einer Auswerteemail nach dem Testrun)



SF 7 against the lower half of my opponents:

   1 Stockfish 7         :   3221     15   1515.5    1760   86.1%     100
   2 Protector 1.9.0     :   2942     10    921.0    1760   52.3%     100
   3 Nirvanachess 2.2    :   2919     11    860.5    1760   48.9%      82
   4 Andscacs 0.84       :   2912     11    841.5    1760   47.8%      97
   5 Jonny 7.01          :   2897     10    803.5    1760   45.7%      82
   6 Texel 1.05          :   2890     10    784.5    1760   44.6%      86
   7 Chiron 2            :   2881     11    762.0    1760   43.3%      95
   8 Naum 4.6            :   2867     11    726.5    1760   41.3%      84
   9 Hannibal 1.4b       :   2859     11    705.0    1760   40.1%     ---

and against the upper half:

   1 Stockfish 7        :   3258     11   1323.5    1760   75.2%     100
   2 Komodo 9.2         :   3215     11   1230.0    1760   69.9%     100
   3 Houdini 4          :   3125     10   1014.0    1760   57.6%     100
   4 Gull 3             :   3079     10    897.5    1760   51.0%     100
   5 Ginkgo 1.5         :   3030     10    771.0    1760   43.8%     100
   6 Equinox 3.30       :   3010     10    721.0    1760   41.0%      75
   7 Fritz 15           :   3005     10    708.0    1760   40.2%      65
   8 Critter 1.6a       :   3002     11    700.5    1760   39.8%     100
   9 Protector 1.9.0    :   2942     11    554.5    1760   31.5%     ---

Protector 1.9.0 as the middle anchor.

Sicherlich ist das nicht 100% (die Spreizung der Gegnerelo ist nicht identisch), aber immerhin ist es so viel, das es ausserhalb beider Errorbars liegt! Das ist signifikant. SF7 performt gegen schwächere Engines schlechter als gegen bessere. (Übrigens mehr als SF6!)

Der größere Abstand ist entweder die Zeitkontrolle oder Zufall oder beides. Ich kann so viele Spiele spielen wie ich will, ein bisschen Unwägbarkeit bleibt immer.

Ingo

By Stefan Pohl Date 2016-01-10 06:58

Ingo B. schrieb:

Stefan Pohl schrieb:

... Was auffällt ist, daß sowohl bei dir, als auch bei Ingo, der Elozuwachs von Stockfish 6 auf 7 deutlich größer ist, als bei mir. Das scheint darauf hinzudeuten, daß Stockfish 7 gegen schwächere Gegner besser scort, ...
Ergo scheint Stockfish 7 gegen schwache Gegner besser zu scoren, als gegen starke. Und das ist für Stockfish bisher völlig untypisch gewesen.

Weil du hier Schlüsse aus meinen Spielen ziehst:
Das "ergo" stimmt so nicht. Sorry das ich da Salz in die Suppe schütten muß.

Hier mein Originalrun von SF7. Einmal ausgewertet gegen die schwächsten 8 und gegen die stärksten 8 mit Protector als Mittelanker in beiden Gruppen:
(Auszug aus einer Auswerteemail nach dem Testrun)
<code>

SF 7 against the lower half of my opponents:

   1 Stockfish 7    :   3221    15   1515.5 1760   86.1%    100
   2 Protector 1.9.0    :   2942    10 921.0 1760   52.3%    100
   3 Nirvanachess 2.2 :   2919    11 860.5 1760   48.9% 82
   4 Andscacs 0.84    :   2912    11 841.5 1760   47.8% 97
   5 Jonny 7.01 :   2897    10 803.5 1760   45.7% 82
   6 Texel 1.05 :   2890    10 784.5 1760   44.6% 86
   7 Chiron 2 :   2881    11 762.0 1760   43.3% 95
   8 Naum 4.6 :   2867    11 726.5 1760   41.3% 84
   9 Hannibal 1.4b    :   2859    11 705.0 1760   40.1%    ---

and against the upper half:

   1 Stockfish 7 :   3258    11   1323.5 1760   75.2%    100
   2 Komodo 9.2    :   3215    11   1230.0 1760   69.9%    100
   3 Houdini 4 :   3125    10   1014.0 1760   57.6%    100
   4 Gull 3    :   3079    10 897.5 1760   51.0%    100
   5 Ginkgo 1.5    :   3030    10 771.0 1760   43.8%    100
   6 Equinox 3.30    :   3010    10 721.0 1760   41.0% 75
   7 Fritz 15    :   3005    10 708.0 1760   40.2% 65
   8 Critter 1.6a    :   3002    11 700.5 1760   39.8%    100
   9 Protector 1.9.0 :   2942    11 554.5 1760   31.5%    ---

Protector 1.9.0 as the middle anchor.</code>

Sicherlich ist das nicht 100% (die Spreizung der Gegnerelo ist nicht identisch), aber immerhin ist es so viel, das es ausserhalb beider Errorbars liegt! Das ist signifikant. SF7 performt gegen schwächere Engines schlechter als gegen bessere. (Übrigens mehr als SF6!)

Der größere Abstand ist entweder die Zeitkontrolle oder Zufall oder beides. Ich kann so viele Spiele spielen wie ich will, ein bisschen Unwägbarkeit bleibt immer.

Ingo

Sehr interessant. Also verhält sich auch Stockfish 7 in dieser Hinsicht Stockfish-typisch. Das ist gut zu wissen und ich fand es auch merkwürdig, daß Stockfish mit Version 7 plötzlich anfangen würde, gegen schwächere Gegner besser zu scoren als gegen stärkere. Nur verstehe ich dann nicht, warum Stockfish 7 bei mir deutlich weniger zulegt als bei dir und besonders bei Andreas. Denn dessen Bedenkzeit ist praktisch identisch zu meiner (ich habe meine Testbedenkzeit ja seinerzeit an Andreas Bedenkzeit und seinen leicht schnelleren Kernen geeicht). Daran kann es also auch nicht liegen.

Gruß - Stefan

By Ingo B. Date 2016-01-10 10:31

Stefan Pohl schrieb:

Sehr interessant. Also verhält sich auch Stockfish 7 in dieser Hinsicht Stockfish-typisch. Das ist gut zu wissen und ich fand es auch merkwürdig, daß Stockfish mit Version 7 plötzlich anfangen würde, gegen schwächere Gegner besser zu scoren als gegen stärkere. Nur verstehe ich dann nicht, warum Stockfish 7 bei mir deutlich weniger zulegt als bei dir und besonders bei Andreas. Denn dessen Bedenkzeit ist praktisch identisch zu meiner (ich habe meine Testbedenkzeit ja seinerzeit an Andreas Bedenkzeit und seinen leicht schnelleren Kernen geeicht). Daran kann es also auch nicht liegen.

Wenn ich das richtig sehe wird auch die CEGT sich in Andreas und meine Abstände einreihen. Bleibt die Frage warum das bei dir nicht der Fall ist.

Mir fallen zwei Möglichkeiten ein, vielleicht gibt es noch andere:

1.

Zitat:

Ich(du/man) kann so viele Spiele spielen wie ich will, ein bisschen Unwägbarkeit bleibt immer.

2. Dein Eröffnungsset.

Allerdings verstehe ich deinen Einwand nicht wirklich. Ich habe jetzt mal auf deine Seite geschaut. Du hast 48 Elo Abstand zw. SF6 und 7. Ich hatte initial 58Elo, mit einer Engine mehr jetzt "runter" auf 56 Elo (wobei natürlich SF6 keine Chance hatte Elo zu verlieren). Das sind gerade mal 10 Elo Unterschied ... da kommt mir nur wieder Punkt 1. in den Sinn. Andreas hat 63 ELo Abstand ... der eine vielleicht ein bisschen hoch, der andere niedrig ... so what (oder du nimmst doch Punkt 2

)
(was aber zeigen würde, dass man unnötigerweise "übertesten" kann. Es bringt einfach nichts mehr - irgendwann).

Die Tatsache das SF gegen schächere Gegner schlechter punktet ist aber interessant. Ich habe keine andere Engine die das so macht (keine die das überhaupt macht, komplett ausserhalb der entstehenden beiden Errorbars). Ich würde das als eine Schwäche der Engine deuten. Es erhöht die Wahrscheinlichkeiten in Turnieren die nach menschlichem Vorbild ablaufen (WM, Swiss, ...) schlechter abzuschneiden ...
Auch Analyse damit ist kritisch. In schlechteren (ungewöhnlichen) Stellungen, die gute Engines nicht anstreben (dummerweise aber Menschen häufiger erreichen) weiß die Engine weniger gut Bescheid als z.B. Komodo. Die Analyse menschlicher Partien wird ein kleines bisschen riskanter mit SF.

Eine Sache ist mir noch aufgefallen, dein Eröffnungsset soll doch höhere Remisquoten verhindern. Ich würde sagen dieses Ziel hat es nicht erreicht. SF7 hat mit diesem Set eine Remisquote von 36.9%, bei mir sind es 34.8%. zugegeben gegen schwächere Engines, dafür mit mehr Bedenkzeit, was die Remisquote anhebt ... Man könnte es so sehen, dass sich dein Set nicht anders verhält als jedes andere normale Buch oder Testset ...

Gruß
Ingo

By Thomas Müller Date 2016-01-10 10:43 Upvotes 1

Kann es nicht einfach auch an der gegnerschaft liegen?
Stefan hat wenige und praktisch nur gute.
Bei dir und den anderen ist die streuung viel größer.

By Ingo B. Date 2016-01-10 11:44

Thomas Müller schrieb:

Kann es nicht einfach auch an der gegnerschaft liegen?
Stefan hat wenige und praktisch nur gute.
Bei dir und den anderen ist die streuung viel größer.

Nein, dann müßte das Ergebniss bei SP besser sein als bei uns und nicht anders herum, siehe oben.

Gruß
Ingo

By Stefan Pohl Date 2016-01-10 13:16

Ingo B. schrieb:

Stefan Pohl schrieb:

Sehr interessant. Also verhält sich auch Stockfish 7 in dieser Hinsicht Stockfish-typisch. Das ist gut zu wissen und ich fand es auch merkwürdig, daß Stockfish mit Version 7 plötzlich anfangen würde, gegen schwächere Gegner besser zu scoren als gegen stärkere. Nur verstehe ich dann nicht, warum Stockfish 7 bei mir deutlich weniger zulegt als bei dir und besonders bei Andreas. Denn dessen Bedenkzeit ist praktisch identisch zu meiner (ich habe meine Testbedenkzeit ja seinerzeit an Andreas Bedenkzeit und seinen leicht schnelleren Kernen geeicht). Daran kann es also auch nicht liegen.

Wenn ich das richtig sehe wird auch die CEGT sich in Andreas und meine Abstände einreihen. Bleibt die Frage warum das bei dir nicht der Fall ist.

Mir fallen zwei Möglichkeiten ein, vielleicht gibt es noch andere:

1.

Zitat:

Ich(du/man) kann so viele Spiele spielen wie ich will, ein bisschen Unwägbarkeit bleibt immer.

2. Dein Eröffnungsset.

Allerdings verstehe ich deinen Einwand nicht wirklich. Ich habe jetzt mal auf deine Seite geschaut. Du hast 48 Elo Abstand zw. SF6 und 7. Ich hatte initial 58Elo, mit einer Engine mehr jetzt "runter" auf 56 Elo (wobei natürlich SF6 keine Chance hatte Elo zu verlieren). Das sind gerade mal 10 Elo Unterschied ... da kommt mir nur wieder Punkt 1. in den Sinn. Andreas hat 63 ELo Abstand ... der eine vielleicht ein bisschen hoch, der andere niedrig ... so what (oder du nimmst doch Punkt 2

)
(was aber zeigen würde, dass man unnötigerweise "übertesten" kann. Es bringt einfach nichts mehr - irgendwann).

Die Tatsache das SF gegen schächere Gegner schlechter punktet ist aber interessant. Ich habe keine andere Engine die das so macht (keine die das überhaupt macht, komplett ausserhalb der entstehenden beiden Errorbars). Ich würde das als eine Schwäche der Engine deuten. Es erhöht die Wahrscheinlichkeiten in Turnieren die nach menschlichem Vorbild ablaufen (WM, Swiss, ...) schlechter abzuschneiden ...
Auch Analyse damit ist kritisch. In schlechteren (ungewöhnlichen) Stellungen, die gute Engines nicht anstreben (dummerweise aber Menschen häufiger erreichen) weiß die Engine weniger gut Bescheid als z.B. Komodo. Die Analyse menschlicher Partien wird ein kleines bisschen riskanter mit SF.

Eine Sache ist mir noch aufgefallen, dein Eröffnungsset soll doch höhere Remisquoten verhindern. Ich würde sagen dieses Ziel hat es nicht erreicht. SF7 hat mit diesem Set eine Remisquote von 36.9%, bei mir sind es 34.8%. zugegeben gegen schwächere Engines, dafür mit mehr Bedenkzeit, was die Remisquote anhebt ... Man könnte es so sehen, dass sich dein Set nicht anders verhält als jedes andere normale Buch oder Testset ...

Gruß
Ingo

Ich stimme zu, wahrscheinlich ist das Ergebnis in den 3 fraglichen Testumgebungen einfach leichten Schwankungen unterworfen.

Das SALC-Eröffnungsset hat bei mir sowohl im Bullet als auch im EndlessRoundRobin mit 15'+3'' die Remisqouten ganz erheblich gesenkt. Bei meinen Stockfish-Testruns (70''+700ms) war die Remisquote mit einem normalen Eröffnungsset bei sonst gleichen Bedingungen so um die 47% (die Gegner sind eben stark und viele sind Ippolit-Derivate (Critter, Houdini, Fire, Equinox, Mars) und daher sehr remisfreudig). Und jetzt liegt die Remisqoute, die Stockfish in einem Run hat, bei ca. 37%. Ich kann nur jedem raten, die SALC-Vorgaben mal auszuprobieren. Der Effekt ist verblüffend.

Gruß - Stefan

By Ingo B. Date 2016-01-10 14:26

Stefan Pohl schrieb:

Ich stimme zu, wahrscheinlich ist das Ergebnis in den 3 fraglichen Testumgebungen einfach leichten Schwankungen unterworfen.

Das SALC-Eröffnungsset hat bei mir sowohl im Bullet als auch im EndlessRoundRobin mit 15'+3'' die Remisqouten ganz erheblich gesenkt. Bei meinen Stockfish-Testruns (70''+700ms) war die Remisquote mit einem normalen Eröffnungsset bei sonst gleichen Bedingungen so um die 47% (die Gegner sind eben stark und viele sind Ippolit-Derivate (Critter, Houdini, Fire, Equinox, Mars) und daher sehr remisfreudig). Und jetzt liegt die Remisqoute, die Stockfish in einem Run hat, bei ca. 37%. Ich kann nur jedem raten, die SALC-Vorgaben mal auszuprobieren. Der Effekt ist verblüffend.

Wenn du vorher gleiche Remisquoten hattest (was bei 15 facher Beenkzeit sehr seltsam ist, egal welches Set man wählt) und jetzt plötzlich verschiedene Remisquoten würde es micht nicht wundern wenn das Set auch für den von dir gesehenen geringeren Abstand zuständig wäre.

Für mich sieht alles halbwegs normal aus, aber wenn man etwas sehen will würde ich auf das Set tippen.

Gruß
INgo

By Stefan Pohl Date 2016-01-10 17:15

Ingo B. schrieb:

Stefan Pohl schrieb:

Ich stimme zu, wahrscheinlich ist das Ergebnis in den 3 fraglichen Testumgebungen einfach leichten Schwankungen unterworfen.

Das SALC-Eröffnungsset hat bei mir sowohl im Bullet als auch im EndlessRoundRobin mit 15'+3'' die Remisqouten ganz erheblich gesenkt. Bei meinen Stockfish-Testruns (70''+700ms) war die Remisquote mit einem normalen Eröffnungsset bei sonst gleichen Bedingungen so um die 47% (die Gegner sind eben stark und viele sind Ippolit-Derivate (Critter, Houdini, Fire, Equinox, Mars) und daher sehr remisfreudig). Und jetzt liegt die Remisqoute, die Stockfish in einem Run hat, bei ca. 37%. Ich kann nur jedem raten, die SALC-Vorgaben mal auszuprobieren. Der Effekt ist verblüffend.

Wenn du vorher gleiche Remisquoten hattest (was bei 15 facher Beenkzeit sehr seltsam ist, egal welches Set man wählt) und jetzt plötzlich verschiedene Remisquoten würde es micht nicht wundern wenn das Set auch für den von dir gesehenen geringeren Abstand zuständig wäre.

Für mich sieht alles halbwegs normal aus, aber wenn man etwas sehen will würde ich auf das Set tippen.

Gruß
INgo

Natürlich hatte ich bei 15'+3'' immer höhere Remisquoten als bei 70''+700ms. Das ist doch klar. Mit SALC sind es so um die 59%. Vorher waren es so um die 66%.

Also nochmal beide Bedenkzeiten aufgelistet, um Mißverständnissen vorzubeugen:
70''+700ms, singlecore: Remisquoten:ca. 47% (normales Vorgabeset) und ca. 37% (SALC)
15'+3'', 4 cores: Remisquoten: ca.66% (normales Vorgabeset) und ca. 59% (SALC)

Stefan

By Michael Scheidl Date 2016-01-28 03:00

Ich seh das so: SF7 hat gegen die lower half - und das sind ja auch keine Bloßfüßigen - eine Percentage erspielt, die etwa 8,5/10 entspricht. Also zum Beispiel +7=3-0. Das wird sich auch in Hinkunft kaum verbessern lassen. Diese Gegner sind bärenstark und erlauben keine 100%, vermutlich nicht einmal 90%, egal wie stark der Angreifer ist.

By Benno Hartwig Date 2016-01-28 07:54

85% hat du entsprechend auch bei +70 =30 -0
Und ein Übergang zu +71 =29 =0 brächte dir dann bereits ein Plus von 12 Elo!

Einzelne Mehr-Punkte wirken sich halt Elo-mäßig stärker aus, wenn man nicht im ungefähr ausgeglichenen Bereich ist.
siehe z.B.: http://www.schachcomputer.at/elo.htm

Benno

By Chess Player Date 2016-01-28 10:19

Du weißt, daß Du da gerade Unsinn geschrieben hast? Das Gegenteil ist richtig.

By Benno Hartwig Date 2016-01-28 11:48

Das solltest du dann den Leuten von
http://www.schachcomputer.at/elo.htm
mitteilen.

Hier lesen wir halt:
Der Übergang von 51% auf 52% bringt dir 7 Elo mehr
Der Übergang von 75% auf 76% bringt dir 9 Elo mehr
Der Übergang von 85% auf 86% bringt dir 12 Elo mehr
Der Übergang von 90% auf 91% bringt dir 17 Elo mehr
Der Übergang von 95% auf 96% bringt dir 28 Elo mehr

Vielleicht liegt der Unsinn ja doch näher bei dir, als du es dir vorstellen konntest?

Benno

By Ingo B. Date 2016-01-28 12:30

Benno Hartwig schrieb:

Der Übergang von 51% auf 52% bringt dir 7 Elo mehr
Der Übergang von 75% auf 76% bringt dir 9 Elo mehr
Der Übergang von 85% auf 86% bringt dir 12 Elo mehr
Der Übergang von 90% auf 91% bringt dir 17 Elo mehr
Der Übergang von 95% auf 96% bringt dir 28 Elo mehr

Reine Eloformel wie hier beschrieben:

https://de.wikipedia.org/wiki/Elo-Zahl

ergibt dies:

Im Prinzip hat Schachcomputer.at (oder Benno) recht.

Allerdings macht das keine Rangliste nach diesem Prinzip. Ordo und noch mehr Bayes komprimieren das.

Gruß
Ingo

By Frank Brenner Date 2016-01-30 21:15 Edited 2016-01-30 21:17

> Im Prinzip hat Schachcomputer.at (oder Benno) recht.

Benno hat hier nicht nur "Im Prinzip" recht, sondern er hat vollkommen recht.

> Allerdings macht das keine Rangliste nach diesem Prinzip. Ordo und noch mehr Bayes komprimieren das.

Jede Rangliste die mit Ordo berechnet berücksichtigt diesen Sachverhalt in voller Höhe ohne eine "Kompression".

Eine Kompression findet in der Elo Berechnung von Ordo in keiner möglichen Interpretation statt.

By Benno Hartwig Date 2016-01-28 12:50

Inzwischen ahne ich, worin wir uns missverstanden haben könnten.

Ich betrachtete die Mehr-Punkte bei gleiche Partienanzahl (also +70 =30 -0 --> +71 =29 -0 im Vergleich zu +50 =50 -0 --> +51 =49 -0)
das ist also eine Quote, die sich z.B. um 1% verbessert

und du vielleicht eine dazugewonnen Partie (also +70 =30 -0 --> +71 =30 -0 im Vergleich zu +50 =50 -0 --> +51 =50 -0)

Benno

By Stefan Pohl Date 2016-01-09 06:38 Upvotes 2

Kurt Utzinger schrieb:

Hallo Andreas
Sehr einfache aber top übersichtlich aufgemachte Homepage
mit guten Infos. Danke für diese seriöse Arbeit.
Gruss
Kurt

So ist es! Und Andreas findet noch Hardwarekapazitäten, die er dem Stockfish Framework,zur Verfügung stellt, trotz seiner vielen Tests.
Und in der privaten email-Kommunikation ist er darüberhinaus der freundlichste und hilfsbereiteste Mensch, den man sich vorstellen kann.
Für mich ist er ein Computerschach-Vorbild. In jeder Hinsicht. Die Community kann sich glücklich schätzen, das es ihn gibt.

Stefan

By GS Date 2016-01-09 11:23

Link ? Falls keine HP vorhanden, dann bitte via cundp hier einstellen.

By Dithyrambus Date 2016-01-09 16:20

Eines muss man dir lassen: Du ziehst deine nicht konstruktive linie stur und unbeirrt durch.