Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Der Kampf um Platz 1 ... die nächste Runde wird eingeleutet!
1 2 Previous Next  
- - By Frank Quisinsky Date 2016-09-16 08:44 Edited 2016-09-16 09:00
Hallo zusammen,

für die Freunde und deren Anverwandten von Extrem-Ratings startet ca. am 21.09.2016 mein nächster Kampf um Platz 1.
Komodo 10.1 und die aktuelle Stockfish Version geben sich hintereinander die Ehre.

Wer in der zweiten oder dritten Reihe sitzen möchte, um das Geschehen aus der Ferne zu beobachten, darf das dann gerne in einen taktisch ausgeprägten Angriff nehmen.
Werde die Links dann ins Forum bzw. in diesem Thread setzen, damit nicht laufend auf meine Webseite gesprungen werden muss und keine Unruhen aufkommen.

Also, nach Fizbo 1.8 BMI2 x64 ... geht es los, Komodo 10.1 läuft sich zwischenzeitlich schon warm.
Wird Stockfish die Krone erobern, die Komodo unter meinen Voraussetzungen nun schon längere Zeit beständig aber knapp halten konnte?
Diese und nur diese Frage steht dann im Mittelpunkt einer kraftaufreibenden und sicherlich, wie immer, sehr human und friedfertigen / herzlich ausgeprägten Diskussion.

Wir lesen uns ...

Gruß
Frank

Gestern dann auch der erste Zugriff auf meinen Webseiten aus franz. Polynesien ... es spricht sich rum!
Also auch die bunten Vögel, die vielleicht schon vor lauter "Herzlichkeit" aus den Schachforen verbannt wurden, werden dabei sein.

Na ja so richtig ist das nicht, in Winboard Zeiten hatte ich 12x franz. Polynesien von 2 unterschiedlichen Maschinen.
Da hagelte es Zugriffe aus 202 Ländern der Erde ... derzeit sind es 137 + Nordirland / Wales / Schottland also 140.
Nur auf den kleineren Inseln ist ein bissel Ruhe eingekehrt.
Parent - - By Benno Hartwig Date 2016-09-16 11:00
Schick!

Der Pazifik ist wohl wirklich auch schachlich aktiv:
Palau mit seinen 22.000 Insulanern war bei der Schacholympiade 2016 vertreten,
und Fidschi (900.000 Einwohner) auch.

Benno
Parent - By Frank Quisinsky Date 2016-09-17 17:46
Ja genau.
Als ich die Winboard Seiten laufen hatte, glaube das war die WM in Australien so um 2000 das schaffte Oceanien Platz 30 und lag vor England ... sofern ich das richtig in Erinnerung habe (war die Olympiade). Für einen Schachverein in Newkaledonien wollte ich auch mal eine Webseite über Schach machen aber der Kontakt verlief sich, dort waren einige Mitglieder vom hiesigen Schachverein auf der Insel öfters auf der Winboard Seite.

Finde ich immer wieder faszinierend wenn auf meiner heute sehr kleinen Aktivität solche Exoten an Länder in der Statistik auftauchen. So viele Besucher habe ich ja nicht. So ca. 50 Rechner pro Tag, früher waren es 2.000 pro Tag im Schnitt. Klar da machte ich auch mehr und hatte über 30 Programme auf den Seiten zum Download und ein riesigen News-Ticker.

Egal ... freute mich über den Zugriff und übertrieb dann etwas bei der Ankündigung des Kampfes um Platz 1.



Frank
Parent - - By Clemens Keck Date 2016-09-17 08:11
Moin Frank
wenn es so ausgeht wie bei meinen SMP matches, dann fürchte ich wird Stockfish klarer Sieger.
Stockfish spielt zur Zeit wie von einem anderen Planeten.
Beeindruckend, wirlich, aber ich hoffe das Komodo nachziehen kann und mal sehen was Houdini bringt.
Für die Anderen ist es halt fast unmöglich auf Dauer gegen ein Netzwerk aus Innovation und Tests zu bestehen.

schönes WE
Clemens
Parent - - By Frank Quisinsky Date 2016-09-17 17:43 Edited 2016-09-17 17:50
Hallo Clemens,

rechne auch mit einer neuen Nummer 1 nach ein paar Stichproben an Partien und kann es selbst kaum erwarten den Test-Lauf zu sehen.
Erst Fizbo dann Komodo ... und Fizbo liefert hier ein wahres taktisches Feuerwerk ab.

Diese Engine ist einfach unberechenbar mit dieser Bewertungsfunktion nach den Buchzügen.
Wenn andere teilweise noch bei 0,00 stehen ist Fizbo schon lange bei 3.00 ... das grenzt an ein Bewertungswunder.

Irre ... Fizbo begeistert derzeit!

Aber wie gesagt, Komodo und Stockfish werden ja folgen und auf Stockfish bin ich mehr als gespannt.
Da wenig Zeit (volles WE auch noch Dienst aber jetzt ein paar Stunden Zeit) konnte ich bei Dir noch nicht folgen. Werde ich mir heute auch noch ansehen was bei Dir so abgeht.

Lg
Frank
Parent - - By Clemens Keck Date 2016-09-17 17:46
bei mir geht so was ähnliches wie bei Dir
ist aber noch im Testlauf
http://clemens-keck.de/screen/
Parent - By Frank Quisinsky Date 2016-09-17 17:52
Hallo Klemens,

sehr gut ... muss auch irgend wie mal die Partien live einblenden.
Wenn Du magst kannst Du mir später mal ein paar Tipps geben wie Du das machst.
Schon so oft ausprobiert aber immer zu schnell aufgegeben.

Mensch mir fehlt einfach die Zeit zur Zeit.

Frank
Parent - - By Frank Quisinsky Date 2016-09-21 12:10 Edited 2016-09-21 12:18
Hallo zusammen,

in ca. drei Stunden (wird dann ca. 15:00 Uhr auf diesem Planeten in Trier sein) für die kommenden 10 Tage geht es los.
Paukenschläge geben sich die Ehre ...

Komodo 10.1 x64 gegen den Herausforderer Stockfish 18Sep2016 BMI2 x64 (schnelleres Compile, zu finden unter: http://chess.ultimaiq.net/stockfish.html).
Bei SF lasse ich Contempt weg ... Hinweis von Bram in TalkChess!

Beide spielen dann gleichzeitig ...
Heißt: 2 Test-Runs zur gleichen Zeit und in jedem Test-Run spielen dann die beiden je 50x gegeneinander.
Versuche die Ergebnisse bzw. Anzahl der Partien ca. gleich zu halten (hoffe es stürzt nichts ab).
Beide dann gegen die restlichen Engines der TOP-50 aus meiner Liste (insofern interessant weil nur ein Laser Update fehlt und sonst alle offiziellen Updates eingespielt wurden).

Wer verfolgen / mitfiebern und fluchen möchte ...
Live Links finden sich dann auf meinen Webseiten unter (kann ich aber auch hier einblenden, wenn keiner meine Seite besuchen möchte, wovon ich abrate ... passiert dort im Moment nicht viel ... Sack China in Reis)

Frank's Chess Page
http://www.amateurschach.de

Mein Tipp:
Glaube trotz vorliegender Ergebnisse das Komodo vorne bleibt. SF müsste in den letzten 5 Monaten schon 30 Elo zugelegt haben um ca. auszugleichen.
Obwohl, eigentlich ja der Fall ... wird ganz sicher ein heißer Kampf!

Viel Spaß dabei und viele Grüße
Frank

Hoffe das war jetzt nicht übertrieben ....

KOOOOOOOMOOOOOODooooooooooooooooooooBoreiiiii
vs.
StooooooockFiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiishzzzzh
Parent - - By Frank Quisinsky Date 2016-09-21 15:30
Hallo zusammen,

hier die beiden Links zum Test-Run:

1. Komodo 10.1 x64
http://www.amateurschach.de/ftptrigger/komodo_101-x64.html

2. Stockfish 18Sep2016 BMI2 x64
http://www.amateurschach.de/ftptrigger/sf_18sep2016-bmi2-x64.html

So, muss dann niemand auf meine Seite springen.
Es sei denn die grandiosen Fizbo 1.8 BMI2 x64 Ergebnisse interessieren.
Kommen so nach und nach in den nächsten 2-3 Stunden auf meinen Seiten.

Viele Grüße
Frank
Parent - - By Frank Quisinsky Date 2016-09-23 11:58 Edited 2016-09-23 12:33
Hallo zusammen,

da ja in beiden Test-Runs Stockfish und Komodo gegeneinander spielen fließen je nur die ersten 50% der Partien ein. Also nach jetzt Runde 8 die ersten 4 Partien vom Test-Run 1 und die ersten 4 Partien von Test-Run 2. Letztendlich fließen dann die ersten 25 der jeweils 50 in die Berechnung "Jeder gegen Jeden" ein.

Nach Runde 8 von 50 kann noch nicht viel gesagt werden, allerdings kann hochgerechnet werden!
Beide liegen gleichauf.

Die Elo hat sich bislang mit mehr Partien bei jedem Test-Run der Beiden Kontrahenten in der Vergangenheit gesteigert und wurde erst ca. bei Runde 30 stabil, also nach ca. 60%. Klar, die Beiden liegen klar vorne und benötigen ein paar Partien mehr, weil jedes Remis bei weniger Partien gegen Schwächere zu stark zu buche schlägt. Aber wie gesagt, in diesem Fall wird es nach ca. 60% sehr genau.

Wenn ich also hingehe und nehme den Durchschnittswert nach Runde 8 von 50 aller anderen vergleichbaren Test-Runs von Komodo und Stockfish geht für beide der Wert noch um 14 Elo nach oben. In Wirklichkeit geht der Wert für Stockfish gar um 18 Elo nach oben (komplex).

Würde bedeuten Stockfish würde um 34-38 Elo zulegen und Komodo um 7 Elo. Aber wie das so ist mit diesen Berechnungen ... kann aber als Hochrechnung gesehen werden.

Stockfish spielt ohne Contempt und hier dann erstaunlich mit sehr wenigen schnellen Remispartien. Contempt ist also wirklich nicht länger notwendig, auch nicht bei so vielen schwächeren Gegnern. Das ist sehr erfreulich, wurde in der Vergangenheit von mir so oft bemängelt und gehört der Geschichte an.

Schauen wir mal auf die schnellen Gewinnpartien ... spielt zwar keiner mit in meinem TIPP Thread aber egal, spiele auch gern gegen mich allein!
Für mich sind die schnellen Gewinnpartien beim Zusehen das Salz in der Suppe!

Komodo = 37 von 392 ... hochgerechnet auf 2450 ... 231 Partien ... hatte getippt ... 274
Stockfish = 51 von 392 ... hochgerechnet auf 2450 ... 318 Partien ... hatte getippt ... 288

War mir aber auch klar (vermutete nach Test-Partien das Komodo stärker im Übergang zum Endspiel verbessert wurde und ein wenig taktische Stärke verliert), Komodo geht etwas zurück bei dieser Statistik und Stockfish geht nach vorn. Mal schauen ob das dabei bleibt! Komodo muss kämpfen und TOP Angreifer derzeit ganz klar: Stockfish

Dafür spricht auch die Züge Statistik bis zum Matt / Remis ... ohne Aufgabefaktor ... bis zum Ende der Partie wird bei mir von Partie 1 der Ratingliste an gespielt.
Komodo derzeit bei 81 Züge durchschnittliche Partiedauer nach 456 Partien
Stockfish derzeit bei 77 Züge durchschnittliche Partiedauer nach 452 Partien ... Hinweis: 77 Züge ist absoluter Rekordwert nach allen meinen Auswertungen in der Vergangenheit!!

Musste also in der Nacht ein bissel korrigieren damit Beide ca. gleichauf mit der Anzahl an gespielten Partien liegen ...
Komodo spielte eine Zeit auf 10 der 14 cores und Stockfish auf 4 bis wieder Beide gleichauf waren.
Werde das in den nächsten Tagen öfters korrigieren müssen weil sonst Stockfish immer klar mehr Partien spielen würde.

Was für eine Arbeit ...
Egal!

Werte ich alle Hochrechnungen aus ... würde jetzt hier den Rahmen sprengen darüber zu schreiben ... wird es eine neue Nummer 1 geben ... aber sehr knapp und mithin wird Stockfish vorne stehen (bei 2 Monaten Entwicklungsvorsprung).

Und zu den Partien selbst.
Habe mir noch nicht viele angesehen aber da ich jede gespielte Partie auf Buchtauglichkeit prüfe habe ich ein paar Eindrücke. Stockfish geht spekulativer zur Sache nach den Buchzügen als Komodo und auch im Vergleich zur letzten von mir getesteten Version von April 2016. Nicht ganz zu krass wie Fizbo beim letzten Spießroutenlauf aber für Stockfish Verhältnisse schon enorm spekulative und das schöne daran ist ... die Engine behält bislang dabei immer Recht. Was bedeuten wird (Thread mit Günter) ... das Stockfish vielleicht derzeit wirklich die Nummer 1 ist hinsichtlich Einschätzung der Stellung nach den Eröffnungszügen. Dennoch, andere Engine sehen auch und keine Engine kann alles sehen. Insofern macht es der Mix aber für eine Einzelauswertung einer Engine bei der Bewertung einer Eröffnung scheint nach dem was ich gesehen habe Stockfish ganz vorne zu liegen.

Nochmals 51 von 392 unter 60 Zügen bis zum Matt gegen die TOP-49 an Gegner gewonnen.
Auch das ist absoluter jemals gesehener Höchstwert ... sage und schreibe: 13,01% ... mehr als übermenschlich diese Statistik!

Viele Grüße
Frank

Mal schauen wie es weiter geht und ob die Analysen Stand halten können!

Code:

  FCP Rating List (during a LIVE Test-Run)
  ----------------------------------------

  Date           : September 23rd, 2016 (11:15)
  Games          : 57.176
  Version        : 4.33 Beta 2
  Conditions     : http://www.amateurschach.de/main/_conditions.htm

  Generated with : Ordo 1.2.6 x64 (Ratings for chess and other games)
  https://sites.google.com/site/gaviotachessengine/ordo
  by Miguel A. Ballicora (Argentina)
 
     
  ***********************************************
  Still running after round 08/50  =  16%
  Komodo 10.1 x64                  =  -  7.57 Elo
  Stockfish 18Sep2016 BMI2 x64     =  + 19.48 Elo

   # Player                           :      Elo  Games  Score%   won  draw  lost  Points  Draw%  Error   OppAvg   OppE   OppD
  ----------------------------------------------------------------------------------------------------------------------------
   1 Komodo 10.1 x64                  :  3202.95    392    86.4   291    95     6   338.5   24.2  35.49  2845.73  11.17   49.0
   1 Komodo 10 x64                    :  3210.52   2450    86.9  1829   598    23  2128.0   24.4  14.92  2845.46  10.57   49.0
  ****************************************************************************************************************************
 
   # Player                           :      Elo  Games  Score%   won  draw  lost  Points  Draw%  Error   OppAvg   OppE   OppD
  ----------------------------------------------------------------------------------------------------------------------------
   1 Stockfish 18Sep2016 BMI2 x64     :  3202.95    392    86.4   288   101     3   338.5   25.8  36.47  2845.73  11.15   49.0
   2 Stockfish 24Apr2016 BMI2 x64 C10 :  3183.47   2450    85.1  1744   680    26  2084.0   27.8  14.29  2846.01  10.58   49.0
  ****************************************************************************************************************************

   # Player                           :      Elo  Games  Score%   won  draw  lost  Points  Draw%  Error   OppAvg   OppE   OppD
  ----------------------------------------------------------------------------------------------------------------------------
   1 Stockfish 18Sep2016 BMI2 x64     :  3202.95    392    86.4   288   101     3   338.5   25.8  36.47  2845.73  11.15   49.0
   1 Komodo 10.1 x64                  :  3202.95    392    86.4   291    95     6   338.5   24.2  35.49  2845.73  11.17   49.0
   3 Houdini 4 STD B x64              :  3096.94   2366    79.7  1520   730   116  1885.0   30.9  12.66  2835.29  10.77   47.9
   4 Fire 4 x64                       :  3044.21   2366    74.7  1324   885   157  1766.5   37.4  11.52  2836.41  10.80   47.9
   5 GullChess 3.0 BMI2 x64           :  3040.89   2366    74.3  1299   919   148  1758.5   38.8  11.53  2836.48  10.80   47.9
   6 Andscacs 0.872 BMI2 x64          :  3007.59   2366    70.8  1186   978   202  1675.0   41.3  10.99  2837.18  10.81   47.9
   7 Equinox 3.30 x64                 :  3004.52   2366    70.5  1151  1032   183  1667.0   43.6  11.12  2837.24  10.81   47.9
   8 Fizbo 1.8 BMI2 x64               :  2999.76   2366    69.9  1165   979   222  1654.5   41.4  10.88  2837.34  10.81   47.9
   9 Critter 1.6a x64                 :  2988.28   2366    68.6  1118  1012   236  1624.0   42.8  11.27  2837.59  10.80   47.9
  10 Fritz 15 x64                     :  2986.45   2366    68.4  1107  1024   235  1619.0   43.3  11.18  2837.63  10.81   47.9
  11 Nirvanachess 2.3 POP x64         :  2966.60   2366    66.1  1001  1127   238  1564.5   47.6  10.75  2838.05  10.81   47.9
  12 Hannibal 1.7 x64                 :  2961.77   2366    65.6  1023  1056   287  1551.0   44.6  10.73  2838.15  10.82   47.9
  13 Chiron 3 x64                     :  2955.22   2366    64.8   991  1083   292  1532.5   45.8  10.62  2838.29  10.82   47.9
  14 Protector 1.9.0 x64              :  2940.73   2366    63.0   946  1090   330  1491.0   46.1  10.52  2838.59  10.82   47.9
  15 Texel 1.06 x64                   :  2939.52   2366    62.9   968  1039   359  1487.5   43.9  10.67  2838.62  10.82   47.9
  16 iCE 3.0 v658 POP x64             :  2931.61   2366    61.9   947  1035   384  1464.5   43.7  10.56  2838.79  10.82   47.9
  17 Booot 6.0.2 POP x64              :  2909.96   2366    59.2   829  1143   394  1400.5   48.3  10.43  2839.24  10.82   47.9
  18 Naum 4.6 x64                     :  2895.00   2366    57.3   802  1107   457  1355.5   46.8  10.10  2839.56  10.83   47.9
  19 SmarThink 1.96 SSE4 x64          :  2888.07   2366    56.4   852   965   549  1334.5   40.8  10.19  2839.71  10.83   47.9
  20 Hakkapeliitta TCEC v2 x64        :  2886.76   2366    56.2   818  1025   523  1330.5   43.3  10.30  2839.73  10.82   47.9
  21 Vajolet2 2.2 POP x64             :  2842.83   2366    50.5   662  1067   637  1195.5   45.1  10.02  2840.66  10.83   47.9
  22 Senpai 1.0 SSE42 x64             :  2841.86   2366    50.4   659  1067   640  1192.5   45.1  10.65  2840.68  10.82   47.9
  23 Hiarcs 14 WCSC w32               :  2830.39   2366    48.9   634  1046   686  1157.0   44.2  10.20  2840.92  10.83   47.9
  24 Pedone 1.4.1 BMI2 x64            :  2822.47   2366    47.9   539  1187   640  1132.5   50.2  10.20  2841.09  10.83   47.9
  25 Cheng 4.39 x64                   :  2809.68   2366    46.2   561  1064   741  1093.0   45.0  10.20  2841.36  10.83   47.9
  ----------------------------------------------------------------------------------------------------------------------------
  26 Sjeng c't 2010 w32               :  2808.55   2366    46.0   585  1009   772  1089.5   42.6  10.36  2841.39  10.82   47.9
  27 Shredder 12 x64                  :  2805.47   2366    45.6   539  1082   745  1080.0   45.7  10.06  2841.45  10.83   47.9
  28 Arasan 19.1 POP x64              :  2804.49   2366    45.5   551  1052   763  1077.0   44.5  10.70  2841.47  10.82   47.9
  29 Junior 13.3.00 x64               :  2800.76   2366    45.0   559  1013   794  1065.5   42.8  10.36  2841.55  10.82   47.9
  30 Spike 1.4 Leiden w32             :  2791.66   2366    43.9   524  1027   815  1037.5   43.4  10.55  2841.74  10.82   47.9
  31 Quazar 0.4 x64                   :  2781.49   2366    42.5   491  1031   844  1006.5   43.6  10.20  2841.96  10.83   47.9
  32 DiscoCheck 5.2.1 x64             :  2779.35   2366    42.3   529   942   895  1000.0   39.8  10.08  2842.00  10.83   47.9
  33 Bobcat 7.6 x64                   :  2774.09   2366    41.6   449  1070   847   984.0   45.2   9.90  2842.11  10.83   47.9
  34 Deuterium 14.3.34.130 POP x64    :  2766.97   2366    40.7   430  1065   871   962.5   45.0  10.09  2842.26  10.83   47.9
  35 Zappa Mexico II x64              :  2761.99   2366    40.0   401  1093   872   947.5   46.2  10.60  2842.37  10.82   47.9
  36 Spark 1.0 x64                    :  2759.16   2366    39.7   434  1010   922   939.0   42.7  10.43  2842.43  10.82   47.9
  37 Wasp 1.01 x64                    :  2751.11   2366    38.7   371  1088   907   915.0   46.0  10.50  2842.60  10.82   47.9
  38 TogaII 280513 Intel w32          :  2745.38   2366    38.0   421   954   991   898.0   40.3  10.05  2842.72  10.83   47.9
  39 Gaviota 1.0 AVX x64              :  2742.50   2366    37.6   429   921  1016   889.5   38.9  10.20  2842.78  10.83   47.9
  40 Crafty 25.0.1 JA POP x64         :  2734.83   2366    36.6   390   954  1022   867.0   40.3  10.80  2842.94  10.81   47.9
  41 Dirty 03NOV2015 POP x64          :  2733.49   2366    36.5   372   982  1012   863.0   41.5  10.43  2842.97  10.82   47.9
  42 EXchess 7.92b x64                :  2733.29   2366    36.5   345  1035   986   862.5   43.7  10.60  2842.98  10.82   47.9
  43 Rodent II 0.9.33 x64             :  2725.88   2366    35.5   359   964  1043   841.0   40.7  10.47  2843.13  10.82   47.9
  44 Atlas 3.80 x64                   :  2723.46   2366    35.2   352   964  1050   834.0   40.7  10.76  2843.18  10.81   47.9
  45 DisasterArea 1.65 POP x64        :  2721.37   2366    35.0   313  1030  1023   828.0   43.5  10.49  2843.23  10.82   47.9
  46 Murka 3 x64                      :  2717.70   2366    34.6   312  1011  1043   817.5   42.7  11.12  2843.31  10.81   47.9
  47 Nemo 1.01 Beta POP x64           :  2711.52   2366    33.8   325   950  1091   800.0   40.2  10.96  2843.44  10.81   47.9
  48 Octochess r7533 DC x64           :  2668.79   2366    28.9   241   884  1241   683.0   37.4  11.62  2844.34  10.80   47.9
  49 Rhetoric 1.4.3 POP x64           :  2668.22   2366    28.8   260   843  1263   681.5   35.6  11.03  2844.35  10.81   47.9
  50 Laser 1.1 POP x64                :  2635.35   2366    25.3   194   808  1364   598.0   34.2  11.38  2845.05  10.80   47.9
  ----------------------------------------------------------------------------------------------------------------------------

  White advantage = 32.83 +/- 1.12
  Draw rate (equal opponents) = 51.57 % +/- 0.25

Parent - - By Frank Quisinsky Date 2016-09-24 01:21
Geht also wie beschrieben so langsam hoch zu dem Wert wo sich dann letztendlich die Beiden einpendeln werden.

Code:
  FCP Rating List (during a LIVE Test-Run)
  ----------------------------------------

  Date           : September 24th, 2016 (01:00)
  Games          : 57.564
  Version        : 4.33 Beta 3
  Conditions     : http://www.amateurschach.de/main/_conditions.htm

  Generated with : Ordo 1.2.6 x64 (Ratings for chess and other games)
  https://sites.google.com/site/gaviotachessengine/ordo
  by Miguel A. Ballicora (Argentina)
 
     
  ***********************************************
  Still running after round 12/50  =  24%
  Komodo 10.1 x64                  =  +  3.42 Elo
  Stockfish 18Sep2016 BMI2 x64     =  + 26.43 Elo

   # Player                           :      Elo  Games  Score%   won  draw  lost  Points  Draw%  Error   OppAvg   OppE   OppD
  ----------------------------------------------------------------------------------------------------------------------------
   1 Komodo 10.1 x64                  :  3213.94    588    87.0   444   135     9   511.5   23.0  30.47  2846.04  11.05   49.0
   1 Komodo 10 x64                    :  3210.52   2450    86.9  1829   598    23  2128.0   24.4  14.92  2845.46  10.57   49.0
  ****************************************************************************************************************************
 
   # Player                           :      Elo  Games  Score%   won  draw  lost  Points  Draw%  Error   OppAvg   OppE   OppD
  ----------------------------------------------------------------------------------------------------------------------------
   2 Stockfish 18Sep2016 BMI2 x64     :  3209.90    588    86.7   436   148     4   510.0   25.2  28.90  2846.12  11.08   49.0
   2 Stockfish 24Apr2016 BMI2 x64 C10 :  3183.47   2450    85.1  1744   680    26  2084.0   27.8  14.29  2846.01  10.58   49.0
  ****************************************************************************************************************************

   # Player                           :      Elo  Games  Score%   won  draw  lost  Points  Draw%  Error   OppAvg   OppE   OppD
  ----------------------------------------------------------------------------------------------------------------------------
   1 Komodo 10.1 x64                  :  3213.94    588    87.0   444   135     9   511.5   23.0  30.47  2846.04  11.05   49.0
   2 Stockfish 18Sep2016 BMI2 x64     :  3209.90    588    86.7   436   148     4   510.0   25.2  28.90  2846.12  11.08   49.0
   3 Houdini 4 STD B x64              :  3097.11   2374    79.5  1520   735   119  1887.5   31.0  12.51  2836.79  10.83   48.2
   4 Fire 4 x64                       :  3044.37   2374    74.5  1324   889   161  1768.5   37.4  12.17  2837.90  10.84   48.2
   5 GullChess 3.0 BMI2 x64           :  3040.86   2374    74.1  1299   922   153  1760.0   38.8  11.29  2837.97  10.85   48.2
   6 Andscacs 0.872 BMI2 x64          :  3007.49   2374    70.6  1186   980   208  1676.0   41.3  11.08  2838.68  10.86   48.2
   7 Equinox 3.30 x64                 :  3004.81   2374    70.3  1151  1036   187  1669.0   43.6  11.93  2838.73  10.84   48.2
   8 Fizbo 1.8 BMI2 x64               :  3000.25   2374    69.8  1165   984   225  1657.0   41.4  10.92  2838.83  10.86   48.2
   9 Critter 1.6a x64                 :  2988.79   2374    68.5  1119  1015   240  1626.5   42.8  11.34  2839.07  10.85   48.2
  10 Fritz 15 x64                     :  2986.78   2374    68.3  1107  1028   239  1621.0   43.3  11.05  2839.11  10.86   48.2
  11 Nirvanachess 2.3 POP x64         :  2966.97   2374    66.0  1001  1131   242  1566.5   47.6  10.76  2839.53  10.87   48.2
  12 Hannibal 1.7 x64                 :  2961.63   2374    65.4  1023  1057   294  1551.5   44.5  10.52  2839.64  10.87   48.2
  13 Chiron 3 x64                     :  2955.27   2374    64.6   991  1085   298  1533.5   45.7  10.35  2839.78  10.87   48.2
  14 Protector 1.9.0 x64              :  2940.98   2374    62.9   946  1093   335  1492.5   46.0  10.59  2840.08  10.87   48.2
  15 Texel 1.06 x64                   :  2939.60   2374    62.7   968  1041   365  1488.5   43.9  10.14  2840.11  10.88   48.2
  16 iCE 3.0 v658 POP x64             :  2931.54   2374    61.7   947  1036   391  1465.0   43.6  10.64  2840.28  10.87   48.2
  17 Booot 6.0.2 POP x64              :  2910.27   2374    59.1   829  1146   399  1402.0   48.3  10.09  2840.72  10.88   48.2
  18 Naum 4.6 x64                     :  2895.00   2374    57.1   802  1108   464  1356.0   46.7  10.07  2841.05  10.88   48.2
  19 SmarThink 1.96 SSE4 x64          :  2888.74   2374    56.3   852   970   552  1337.0   40.9   9.98  2841.18  10.88   48.2
  20 Hakkapeliitta TCEC v2 x64        :  2887.10   2374    56.1   818  1028   528  1332.0   43.3  10.38  2841.21  10.87   48.2
  21 Vajolet2 2.2 POP x64             :  2843.07   2374    50.4   662  1069   643  1196.5   45.0   9.95  2842.14  10.88   48.2
  22 Senpai 1.0 SSE42 x64             :  2841.94   2374    50.3   659  1068   647  1193.0   45.0  10.31  2842.16  10.88   48.2
  23 Hiarcs 14 WCSC w32               :  2830.32   2374    48.7   634  1046   694  1157.0   44.1  10.33  2842.41  10.87   48.2
  24 Pedone 1.4.1 BMI2 x64            :  2822.73   2374    47.7   539  1189   646  1133.5   50.1  10.45  2842.57  10.87   48.2
  25 Cheng 4.39 x64                   :  2809.79   2374    46.1   561  1065   748  1093.5   44.9   9.81  2842.84  10.89   48.2
  ----------------------------------------------------------------------------------------------------------------------------
  26 Sjeng c't 2010 w32               :  2808.82   2374    45.9   585  1011   778  1090.5   42.6  10.46  2842.86  10.87   48.2
  27 Shredder 12 x64                  :  2805.91   2374    45.6   539  1085   750  1081.5   45.7  10.46  2842.92  10.87   48.2
  28 Arasan 19.1 POP x64              :  2804.77   2374    45.4   551  1054   769  1078.0   44.4  10.29  2842.95  10.88   48.2
  29 Junior 13.3.00 x64               :  2800.88   2374    44.9   559  1014   801  1066.0   42.7  10.55  2843.03  10.87   48.2
  30 Spike 1.4 Leiden w32             :  2791.62   2374    43.7   524  1027   823  1037.5   43.3  10.37  2843.22  10.87   48.2
  31 Quazar 0.4 x64                   :  2781.63   2374    42.4   491  1032   851  1007.0   43.5  10.30  2843.43  10.88   48.2
  32 DiscoCheck 5.2.1 x64             :  2779.66   2374    42.2   529   944   901  1001.0   39.8  10.64  2843.48  10.87   48.2
  33 Bobcat 7.6 x64                   :  2774.23   2374    41.5   449  1071   854   984.5   45.1  10.48  2843.59  10.87   48.2
  34 Deuterium 14.3.34.130 POP x64    :  2767.12   2374    40.6   430  1066   878   963.0   44.9  10.22  2843.74  10.88   48.2
  35 Zappa Mexico II x64              :  2761.98   2374    39.9   401  1093   880   947.5   46.0  10.57  2843.85  10.87   48.2
  36 Spark 1.0 x64                    :  2759.15   2374    39.6   434  1010   930   939.0   42.5  10.37  2843.91  10.87   48.2
  37 Wasp 1.01 x64                    :  2751.11   2374    38.5   371  1088   915   915.0   45.8  10.28  2844.08  10.88   48.2
  38 TogaII 280513 Intel w32          :  2745.38   2374    37.8   421   954   999   898.0   40.2  10.74  2844.20  10.87   48.2
  39 Gaviota 1.0 AVX x64              :  2742.84   2374    37.5   429   923  1022   890.5   38.9  10.56  2844.25  10.87   48.2
  40 Crafty 25.0.1 JA POP x64         :  2735.18   2374    36.6   390   956  1028   868.0   40.3  10.61  2844.41  10.87   48.2
  41 Dirty 03NOV2015 POP x64          :  2733.67   2374    36.4   372   983  1019   863.5   41.4  10.56  2844.44  10.87   48.2
  42 EXchess 7.92b x64                :  2733.47   2374    36.4   345  1036   993   863.0   43.6  10.42  2844.45  10.87   48.2
  43 Rodent II 0.9.33 x64             :  2726.24   2374    35.5   359   966  1049   842.0   40.7  10.99  2844.60  10.86   48.2
  44 Atlas 3.80 x64                   :  2723.46   2374    35.1   352   964  1058   834.0   40.6  10.63  2844.66  10.87   48.2
  45 DisasterArea 1.65 POP x64        :  2721.55   2374    34.9   313  1031  1030   828.5   43.4  10.50  2844.70  10.87   48.2
  46 Murka 3 x64                      :  2717.89   2374    34.5   312  1012  1050   818.0   42.6  10.96  2844.78  10.86   48.2
  47 Nemo 1.01 Beta POP x64           :  2711.53   2374    33.7   325   950  1099   800.0   40.0  10.57  2844.91  10.87   48.2
  48 Octochess r7533 DC x64           :  2668.82   2374    28.8   241   884  1249   683.0   37.2  11.13  2845.81  10.86   48.2
  49 Rhetoric 1.4.3 POP x64           :  2668.44   2374    28.7   260   844  1270   682.0   35.6  11.34  2845.82  10.85   48.2
  50 Laser 1.1 POP x64                :  2635.39   2374    25.2   194   808  1372   598.0   34.0  11.80  2846.51  10.84   48.2
  ----------------------------------------------------------------------------------------------------------------------------

  White advantage = 33.06 +/- 1.07
  Draw rate (equal opponents) = 51.60 % +/- 0.25

Parent - - By Frank Quisinsky Date 2016-09-24 11:21
Code:
  ***********************************************
  Still running after round 14/50  =  28%
  Komodo 10.1 x64                  =  -  2.30 Elo
  Stockfish 18Sep2016 BMI2 x64     =  + 19.10 Elo

   # Player                           :      Elo  Games  Score%   won  draw  lost  Points  Draw%  Error   OppAvg   OppE   OppD
  ----------------------------------------------------------------------------------------------------------------------------
   1 Komodo 10.1 x64                  :  3208.22    686    86.7   514   161    11   594.5   23.5  27.45  2845.96  10.97   49.0
   1 Komodo 10 x64                    :  3210.52   2450    86.9  1829   598    23  2128.0   24.4  14.92  2845.46  10.57   49.0
  ****************************************************************************************************************************
 
   # Player                           :      Elo  Games  Score%   won  draw  lost  Points  Draw%  Error   OppAvg   OppE   OppD
  ----------------------------------------------------------------------------------------------------------------------------
   2 Stockfish 18Sep2016 BMI2 x64     :  3202.57    686    86.3   502   180     4   592.0   26.2  27.45  2846.07  10.97   49.0
   2 Stockfish 24Apr2016 BMI2 x64 C10 :  3183.47   2450    85.1  1744   680    26  2084.0   27.8  14.29  2846.01  10.58   49.0
  ****************************************************************************************************************************


Beide Engines hatten über Nacht einen kleinen Durchhänger und verloren ein bissel (zu viele Remispartien).
Derzeit mobilisieren die Kontrohenten neue Kräfte für neue Schandtaten ...
Wir bleiben ruhig, alles wird gut!

Gruß
Frank
Parent - By Frank Quisinsky Date 2016-09-24 11:41
Noch ein kleiner Hinweis für die Beobachter ...
Um auf das erwartete Endergebnis zu kommen brauchen Beide ca. 87.25%!

Viele Grüße
Frank
Parent - - By Kurt Utzinger Date 2016-09-24 21:02
Frank Quisinsky schrieb:

Code:
  ***********************************************
  Still running after round 14/50  =  28%
  Komodo 10.1 x64                  =  -  2.30 Elo
  Stockfish 18Sep2016 BMI2 x64     =  + 19.10 Elo

   # Player                           :      Elo  Games  Score%   won  draw  lost  Points  Draw%  Error   OppAvg   OppE   OppD
  ----------------------------------------------------------------------------------------------------------------------------
   1 Komodo 10.1 x64                  :  3208.22    686    86.7   514   161    11   594.5   23.5  27.45  2845.96  10.97   49.0
[...]


Gruß
Frank


Hallo Frank

Jetzt wird es langsam skurril ... ich meine die Elo-Werte z.B. 3208.22 !!!!!

Gruss
Kurt
Parent - - By Frank Quisinsky Date 2016-09-24 21:58
Was meist Du Kurt?
Nachkomma?

Wenn denn das gemeint ist:
Ordo kann das, für mich eigentlich hilfreich ... kann beim editieren der Liste den Platz setzen wenn 2x gleiches Ergebnis (Schönheitsfrage bei der Listendarstellung).

Oder meinst Du den Wert 3200 überhaupt?

Denke persönlich hierüber:
Eigentlich sind mir Komodo und Stockfish mit einem solchen Wert in meiner Liste schon viel zu stark. Ich komme beim beobachten der Partien kaum noch mit, meine ich verstehe die Züge immer weniger, Kombinationen erkenne ich erst in Analysen nach längerer Zeit. Insofern geht es nur noch mit Statistik überhaupt etwas herauszufinden und dann beginnt die Frage der Sinnhaftigkeit. Selbst bei Engines die bei 2.800 liegen sehe ich hier und dort mal eine Angriffskombination und kann dann folgen aber auch dieses Level ist über meinen Horizont. Verstehe daher auch den ganzen Trubel um x Cores und langen Bedenkzeiten nicht mehr. Wer auf dieser Erde kann folgen und erklären?!

Dennoch interessant diese Engines zu haben.
Ich vermute das durch das Spiel dieser starken Programme auch die Leistung der stärksten Schachspieler nach oben geht weil viele Ideen für das eigene Spiel durch die Analyse der Partien genutzt werden können. Und dennoch 1 Fehler und die Partie ist entschieden ... selbst langfristige Pläne die vielleicht zu einem Gewinn gegen Stockfish und Komodo führen dürfen nicht den kleinsten Fehler in der Planung enthalten!
Parent - - By Kurt Utzinger Date 2016-09-25 07:31 Upvotes 1
Frank Quisinsky schrieb:

Was meist Du Kurt?
Nachkomma?

Wenn denn das gemeint ist:
Ordo kann das, für mich eigentlich hilfreich ... kann beim editieren der Liste den Platz setzen wenn 2x gleiches Ergebnis (Schönheitsfrage bei der Listendarstellung).

Oder meinst Du den Wert 3200 überhaupt?


Ich meine nach dem Komma, solche Elo-Werte gibt es nicht. Und ganz grundsätzlich sind 3200 einfach viel zu hoch.

Zitat:
Denke persönlich hierüber:
Eigentlich sind mir Komodo und Stockfish mit einem solchen Wert in meiner Liste schon viel zu stark. Ich komme beim beobachten der Partien kaum noch mit, meine ich verstehe die Züge immer weniger, Kombinationen erkenne ich erst in Analysen nach längerer Zeit. Insofern geht es nur noch mit Statistik überhaupt etwas herauszufinden und dann beginnt die Frage der Sinnhaftigkeit. Selbst bei Engines die bei 2.800 liegen sehe ich hier und dort mal eine Angriffskombination und kann dann folgen aber auch dieses Level ist über meinen Horizont. Verstehe daher auch den ganzen Trubel um x Cores und langen Bedenkzeiten nicht mehr. Wer auf dieser Erde kann folgen und erklären?!


Natürlich sind die Programme riesenstark geworden und machen vielfach Züge, die man nicht auf Anhieb verstehen kann. Das
trifft jedoch ebenfalls auf Partien der Super-GM's zu. Der grosse Unterschied liegt darin, dass die menschlichen Spieler im
heutigen Hochleistungsschach kaum je in der Lage sind, eine Partie praktisch fehlerfrei zu spielen. Hingegen ist meine Chance,
als Patzer gegen einen Stockfish oder Komodo, usw. auf Turnierstufe eine Remis zu erreichen bedeutend grösser, als wenn
ich gegen einen Super-GM antreten müsste. Es gibt eben Stellungen -- z.B. gleiche Bauernstruktur, nur eine offene Linie --, da
können auch Engines nichts ausrichten, während ein GM immer in der Lage ist, gegen schwache Spieler solche Stellungen
zu vermeiden.

Zitat:
Dennoch interessant diese Engines zu haben.
Ich vermute das durch das Spiel dieser starken Programme auch die Leistung der stärksten Schachspieler nach oben geht weil viele Ideen für das eigene Spiel durch die Analyse der Partien genutzt werden können. Und dennoch 1 Fehler und die Partie ist entschieden ... selbst langfristige Pläne die vielleicht zu einem Gewinn gegen Stockfish und Komodo führen dürfen nicht den kleinsten Fehler in der Planung enthalten!


Ob die Leistung der stärksten Schachspieler wirklich zugenommen hat, ist schwierig zu beantworten. Tatsache hingegen ist, dass dank
Unterstützung der Engines in der Analyse heute in vielen Eröffnungen doch Varianten/Züge aufs Brett kommen, die man noch vor
Jahren/Jahrzehnten als nicht koscher oder gar nicht spielbar angesehen hat.

Mfg
Kurt
Parent - - By Tom Paul Date 2016-09-25 07:37 Edited 2016-09-25 07:44
Die Engines sind schon seit Kasparov 2851 stärker als alle menschlichen Spieler und das ist schon eine Ewigkeit her.
= Die Engines hatten vor Ewigkeiten schon 3000 ELO.
Dann kam Rybka und war deutlich stärker. = 3250 ELO.
Stockfish und Komodo müssten jetzt bei ~3500 ELO liegen.
Darum finde ich deine 3200 ELO viel zu niedrig.

Und z.B. Protector hat laut TCEC 3012 ELO natürlich viel zu niedrig.
Aber wenn man Stockfish als Gegner hat, dann sieht das so aus: http://tcec.chessdom.com/archive.php?se=9&rapid&ga=345
Ein sehr schöner Königsmarsch von Stockfish, dass gab es vor einem Jahr noch deutlich seltener.
Und ich hoffe das noch fleißig weiter an Königsmärschen gearbeitet wird. Man sieht immer noch Königsmärsche die Stockfish auch bei super langer Bedenkzeit nicht sieht oder falsch bewertet und darum diese nicht spielt.

Wenn der eigene König irgendwo in der 3-6 Reihe auf dem Brett steht bei vollem Brett und der Gegner kann ihn nicht angreifen, dann steht der König dort nicht nur sicher sondern auch für den Gegner gefährlich.
Parent - - By Frank Quisinsky Date 2016-09-25 09:14 Edited 2016-09-25 09:21
Hallo Tom, Hallo Kurt,

grundsätzlich schließe ich mich der Meinung von GM Meyer an. Shredder 12 mit 2.800 Elo oder der damalige Rybka 3 mit 2.850 Elo passt. Hochgerechnet auf diesen Wert gibt Ordo etwas höhere Zahlen aus als Elostat und Bayesian.

Zu beachten ist aber ...
Im Blitz geht die Elo höher im Vergleich zu Menschen und bei längeren Bedenkzeiten eher runter. Ferner ist die Elo in den Partiephasen interessant (Zügestatistiken). Im Endspiel geht die Elo deutlich runter und in der Partiephase davor deutlich höher. Liegen die TOP-50 im Endspiel gerade mal 250 Elo auseinander sind es in der Partiephase davor schon 850 Elo.

Mit einem GM, der sich für meine Liste wegen der Eröffnungsbuchoptimierungen interessiert hatte ich kürzlich die Diskussion. Er ist der Analysen der Meinung ... in der Eröffnung maximal 2.800 Elo ... im Endspiel maximal 2.900 Elo und in der Partiephase dazwischen ca. 3.200 Elo bzw. in der Gesamtspielstärke maximal 3.150 Elo. Alles andere wäre absoluter Nonsens bzw. die oftmals dargestellten Zahlen würden eher zum Gelächter führen. Er schrieb selbst im Fernschach hätten die Engines heute maximal 3.000 eher etwas drunter und gar 2.900 wären hier max. denkbar. Wobei er auch nur einen Core für Engines nutzt und auf seinem Notebook wenn er Engines einsetzt dann auch lieber mehrere mit einem Core einsetzt.

Demnach sind die dargestellten 3200 dann wirklich ca. 50 zu hoch, in Anbetracht der Bedenkzeit aber wieder OK bzw. könnten vielleicht sogar 50 zu niedrig sein. Genau wissen wir es nicht aber ich vertraue da schon auf die Aussagen von GMs, insgesamt sind mir derzeit gar 5 solcher Aussagen bekannt und diese decken sich.

Gruß
Frank
Parent - - By Tom Paul Date 2016-09-25 10:02
Naja was sollen die GMs sonst sagen, z.B.:
Stockfish kennt deutlich mehr Eröffnungen als ich.
Stockfish kennt die ganzen Haupt- und Nebenvarianten viel tiefer und genauer als ich.
Stockfish könnte mich mit den 20 möglichen Eröffnungszügen regelrecht auseinander nehmen z.B. mit 1.a4 oder 1.h4 usw., weil ich 0 Ahnung von dieser Theorie habe und Stockfish bereits nach spätestens 10 Halbzügen ausgleicht und mich von da an verdrescht, wegen der vielen unbekannten Stellungstypen.
Im Mittelspiel sehe im Vergleich zu Stockfish kaum etwas.
Am Ende bin ich sowieso in einem Endspiel mit einem Turm weniger und selbst wenn es nicht der Fall wäre, dann würde mich die Engine in 99% der Fälle auseinander rechnen und zwar ohne TBs.

Fazit: Die Engine ist nur 40 ELO stärker als Magnus Carlsen.                                                                                                       
Parent - By Frank Quisinsky Date 2016-09-25 11:23
Hallo Tom,

hatte das Problem auch mal mit Tasten auf meiner Tastatur. Benutzte dann Cherry Tastaturen, zur Zeit kommen mir nur noch Razer Tastaturen ins Haus. Niemals mehr doppelte Symbole und ich bin total glücklich mit der Entscheidung. Und da ich meist Nachts aktiv bin ... die sind auch noch beleuchtet bzw. kann ich die Stufe der Beleuchtung einstellen. So geht mir beim Schreiben hier und da auch mal ein Lichtlein auf ... aber ehrlich gesagt, passiert immer seltener ... meine das mir ein Lichtlein aufgeht.

Wir werden alle nicht jünger!

Gruß
Frank
Parent - - By Guenter Stertenbrink Date 2016-09-25 20:37
am besten sieht man es, dass da grosse Unterschiede sind, wenn man die menschlichen Partien
mit dem Computer analysiert.
Niedrige Stufe reicht aus, und dann hochrechnen mit doppelte Geschwindigkeit=50Elo

Das muesste mal jemand konsequent machen, menschliche Zuege und Computerzuege vergleichen
und daraus die Elos hochrechnen. Sollte doch moeglich sein.
Parent - - By Frank Quisinsky Date 2016-09-26 19:32 Edited 2016-09-26 19:37
Hallo Günter,

Beispiel:
Als ich mit dem Buch angefangen habe flossen die besten GM und Correspondence Partien und meine SWCR Partien ein. Meist bis Zugtiefe 6 und 8. Bei den ECO Codes die länger als 8 liefen, alles per Hand immer und immer wieder editiert. Nach einem Test-Run dann zunächst die Züge bis Zugtiefe 10 und später 12 die Engines spielen hinzugefügt, so dass der zweite Teil der Varianten in meinem Buch meisten Züge von den Engines selbst sind. Was mir hierbei oft aufgefallen ist ... da spielen zwei GMs, der eine macht einen Buchfehler und der andere sieht den nicht. Die Partie ist im Buch und wird von den Engines gekillt.

Damit meine ich:
Ich glaube das Niveau in der Eröffnung ist von Großmeistern, welche in Ihren favorisierten Systemen die Abspiele kennen höher als von den Engines. Und oftmals sind auch die Partien der GMs auf einem höheren Niveau als von den TOP-Engines aber ... es sind zu viele kleine Fehler drin. Die werden gnadenlos ausgenutzt und der GM ist heute unterlegen.

Will damit sagen, es ist fast unmöglich anhand von Züge einer GM Partien das Level abzuschätzen, weil in fast jeder dieser Partien Fehler enthalten sind und eine reicht aus um zu vergeigen. Das ist der entscheidende Vorteil heute, Engines wie Stockfish und Komodo spielen gnadenlos. Allerdings immer wieder auffällig dass wenn eine Partie weitestgehend fehlerfrei läuft, auch Engines die dann ca. 400-600 Elo weniger haben eine Remischance haben und wie meine Ratingliste zeigt nutzen. Mehr ist nicht drin.

Wenn ich in die laufende Matches schaue haben Komodo und Stockfish natürlich auch Partien verloren ... aber niemals gegen die, die ganz unten stehen bzw. sind es sehr wenige. Derzeit eigentlich nur eine die Stockfish gegen Spike verloren hat. Ansonsten sind die Niederlagen gegen Engines die sehr weit oben stehen, nicht mehr als 300 Elo schlechter sind.

Und das ist der Punkt, mehr als 300 Elo schlechter ...
Die GMs sind mehr als 300 Elo schlechter als Komodo und Stockfish und von daher ... wäre es heute schon fast sensationell wenn die Riege der GMs vielleicht von 100 Partien mal eine gewinnen (im Einzelkampf ohne Hilfsmittel). Die Wahrscheinlich wird größer auf ein Remis mit mehr Zeit für die Partie und das war es.

Das ist meine Meinung heute und im Grunde war es schon die Meinung im Schachwelt Interview mit GM Hickl und GM Meyer. Und 2010 ... das ist schon 6 Jahre her und seit dem hat sich einiges getan.

Das war so fazinierend ... Meyer gegen Shredder 12 auf meinem damaligen 7300 Dual Core Notebook gegen Shredder 12 mit einem Core. Meyer frage ob ich seine Lieblingsvariante vorgeben könnte ... und er sagte nach ca. 20 Zügen ... muss ich die Partie jetzt zu Ende spielen ...das ist nach dem letzten Zug von Shredder maximal Remis für Shredder. Ich glaube es nicht und er spielte gelangweilt die nächste Züge ohne zu überlegen und spielte locker das Ding Remis. Übrigens mit Ponder gespielt und bei 40 in 10 ... und Meyer hatte weit weniger Zeit genutzt als Shredder. Er spielte während er sich angeregt mit Hickl und mir unterhalten hat. Klar, er hatte den Vorteil er kannte die Eröffnung aus dem FF.

Wenn die Ihre Arbeit gemacht haben und in Ihren Systemen fit sind ...
Aber das ist schon 6 Jahre her und die Engines sind stärker geworden.

Also, meines Erachtens geht das nicht mit Messen anhand von GM Partien weil einfach zu viele Fehler drin sind (aus der Sicht von Komodo und Stockfish) und die Partie ist vorbei wenn diese Engines gespielt hätten. Und dennoch, den genialen Plan entwickelt der Mensch ... die Maschine mit purer Rechenpower ... und oftmals und so ist es auch noch heute werden verschiedene Eröffnungssysteme gar nicht richtig verstanden.

Daher bin ich ja so froh das Engines wie Fizbo ein wenig aufzeigen und wie gesagt durch so spekulative Spielweisen gar auch noch in 8 von 10 Fällen Recht behalten (OK, krass zu sehen bei wirklich zweischneidigen Eröffnungssystemen oder ich sage besser bei für Menschen schwierigen Systemen.

Gruß
Frank

Nur müssen wir die Kirche ein wenig im Dorf lassen.
Engines mit 3.500 Elo gibt es nicht, es sei denn die spielen mit extrem vielen Cores und die Leistung würde verglichen im Blitz mit einem GM. Vielleicht dann aber ich glaube nicht daran.
Parent - - By Guenter Stertenbrink Date 2016-09-26 19:56
ich habe mich gewundert, wie auch die engines "geniale" Plaene entwickeln ...
aber eben zumeist taktisch begruendet. Das Auffinden von Fehlern in Grossmeisterpartien
musst du statistisch sehen, es gibt ja genug Partien.
Die beste Methode wird mir Vergleich der Elo-Performancen ermittelt.
multi-pv, und bei Fehlern die viele Antworten zulassen eben auch die
schlechteren beruecksichtigen. Generell bei taktischen Sachen
die Rechentiefe erniedrigen , das waeren so meine Ideen, aber wie gesagt,
man kann's ja testen was am besten funktioniert.
Und das Nachspielen und Beurteilen vorhandener Partien ist ja einfacher
als selber gute Zuege finden zu muessen. Man sieht ja, wer gewinnt,
wer die bessere Stellung erkaempft, wer im Endspiel besser ist.
Parent - By Frank Quisinsky Date 2016-09-26 20:12
Hallo Guenter,

kannst sicherlich vieles feststellen aber Dir wird nach so einigen Versuchen die Rübe qualmen.
Was mich oft ärgert ... ich habe natürlich auch so einige Ideen für Stats und gehe immer mit voller Energie an die Sache. Aber dann nach einigen Stunden lässt die Energie nach weil ich mich einfach aufgrund eigener Unkenntnis geschlagen geben muss. Ich merke bei dem Niveau immer mehr wie hilflos ich bin im Eifer irgend etwas herausfinden zu wollen.

Irgendwann stoßen wir dann selbst mit den besten Hilfsmitteln auf Granit bzw. laufen eigentlich immer nur gegen die Wand und wollen es nicht glauben, verstehen und akzeptieren.

Gruß
Frank
Parent - - By Guenter Stertenbrink Date 2016-09-26 20:34
ach so, das Problem war Menschen und Computer Elo automatisch zu vergleichen
trotz Fehlen von Mensch-Computer Partien.
Oder sogar Menschen-Partien zu simulieren.

Als erstes misst man da , als Computer, natuerlich die Zahl der taktischen Fehler.
Dann evtl. wie oft gegen taktisch gleichwertige Gegner ein eval-Vorteil erspielt wird.

OK, mal konkret : Ich vergleiche die Zuege mit Stockfish Stufe x und messe die
Summe der evals nach den gespielten Zuegen minus die evals nach den
besten Stockfish Zuegen. Sagen wir Zuege 30-50 und nur, wenn -2<eval<+2 .

Dann der Durchschnitt pro Zug, das waere mein erster Ansatz einer stockfish-x-wertungszahl.
Kann ich ja vielleicht sogar mal machen mit den stockfish 40/40-Partien
... und wenn ich irgendwo solche stockfish-bewerteten Menschen-Partien finde.

hmm, Oder besser : bewerte nur zuege, deren eval auf stufe x-k um mehr als delta abweichen
von der eval auf stufe x - ob also der Mensch hier die "Falle" vermeiden konnte.

Nehmen wir mal x=20,k=5,delta=0.10
Parent - - By Frank Quisinsky Date 2016-09-26 21:37
Hi Guenter,

kann folgen, gute Ansätze ... sehr gute sogar.

Wenn denn 100 Partien aus der aktuellen GM Praxis nach taktischen Fehlern anhand der Eval beleuchtet werden (dafür eignet sich dann wirklich Stockfish, Fizbo und Hakkapeliitta 3.0 (nicht TCEC v2)). Diese drei finden in der Regel in Kombination fast alles weil die Taktik komplett anders definieren). Vielleicht noch Andscacs dabei!

Ansatz finde ich gut aber wie immer ...
Auch das ist wieder ein Wahnsinns Arbeitsaufwand!

Um das ganz abzusegnen ...
Sollte die zweite Hälfe der 100 GM Partien dann mit Komodo, Houdini, SmarThink und Stockfish untersucht werden.
Um schon allein die positionellen Fehler zu finden.

Frage 1 wäre dann ...
Ab wann definieren wir einen Fehler?
Wenn Eval runter geht und sich das dann in den drei folgenden Zügen bestätigt ... so mein Grundsatz bei der Buchoptimierung.

Gruß
Frank
Parent - - By Guenter Stertenbrink Date 2016-09-27 08:24 Edited 2016-09-27 08:29
es ist eigentlich erstaunlich, dass es sowas offenbar noch nicht gibt.
Das koennte doch ein Feature, eine Option des engine sein :
"Partienbewertung", mit Parametern zum einstellen.

Das waere auch gleichzeitig eine Moeglichkeit die Qualitaet
der eigenen eval zu testen durch Checken der Korrelation der
Partienbewertungen mit den Elo-Zahlen.

----------------------------------------------------

Code:


-.8094141 -.8036506 -.8826804 -.8812243 -.8641933 -.8787808 -.8145314 -.8260846  Andscacs 0.86 POP x64
-.8200394 -.8185776 -.8347510 -.8392018 -.7759667 -.7796572 -.7729903 -.7824160  Arasan 18.3 POP x64
-.8020735 -.7965739 -.8555116 -.8416198 -.7819514 -.7916195 -.7562438 -.7595320  Atlas 3.80 x64
-.7912738 -.7898599 -.8328108 -.8326155 -.7820876 -.7891728 -.7046610 -.7112754  Bobcat 7.1 x64
-.8316026 -.8315301 -.8689111 -.8651022 -.8672827 -.8630783 -.8410412 -.8369201  Booot 5.2.0 x64
-.7494743 -.7428374 -.8147914 -.8103933 -.8298640 -.8307540 -.7290272 -.7320944  BugChess2 1.9 POP x64
-.7994713 -.7822137 -.8525398 -.8477392 -.8628461 -.8626769 -.7937658 -.7890102  Cheng 4.39 x64
-.8358298 -.8338688 -.8608862 -.8624429 -.8915792 -.8891343 -.8193078 -.8208490  Chiron 3 x64
-.8345825 -.8263878 -.8696211 -.8622944 -.8065944 -.7947068 -.8238453 -.8165951  Crafty 25.0.1 JA POP x64
-.7490706 -.7533323 -.8229703 -.8256209 -.8366470 -.8303580 -.7836747 -.7802455  Critter 1.6a x64
-.8053315 -.8065898 -.8334313 -.8349814 -.7886835 -.7893454 -.7280460 -.7299383  Deuterium 14.3.34.130 POP x64
-.8243820 -.8233111 -.8331812 -.8389998 -.7901868 -.7949429 -.7695196 -.7788255  Dirty 03NOV2015 POP x64
-.8413576 -.8399495 -.8444099 -.8501116 -.6558234 -.6706928 -.7346651 -.7473830  DisasterArea 1.54 x64
-.8315364 -.8148371 -.8460416 -.8344656 -.8714519 -.8705721 -.8812158 -.8749084  DiscoCheck 5.2.1 x64
-.8136920 -.8165135 -.8825404 -.8829894 -.8352898 -.8377257 -.8074663 -.8111106  Doch 1.3.4 JA x64
-.8137801 -.8198099 -.8716991 -.8724196 -.8661439 -.8679525 -.8331743 -.8354801  Equinox 3.30 x64
-.8017366 -.8028790 -.8066703 -.8065233 -.7868043 -.7928515 -.7885345 -.7869117  EXchess 7.88b x64
-.7794898 -.7837328 -.7923825 -.7905506 -.8192473 -.8169082 -.7498427 -.7506110  Fire 4 x64
-.7469728 -.7492893 -.8511711 -.8506544 -.8602331 -.8638248 -.8481469 -.8545122  Fizbo 1.6 x64
-.8579399 -.8630762 -.8937664 -.8970062 -.8609998 -.8653290 -.8223355 -.8243746  Fritz 15 x64
-.8181131 -.8180926 -.8245215 -.8262513 -.7931333 -.7994009 -.7195232 -.7309071  Gaviota 1.0 AVX x64
-.7977741 -.7832436 -.8203312 -.8109228 -.7988423 -.8148740 -.7646000 -.7717411  Glaurung 2.2 JA x64
-.7122540 -.7179361 -.7890344 -.7982189 -.8313108 -.8343805 -.7743053 -.7806370  GNU Chess5 5.60 x64
-.8002761 -.8003455 -.8467102 -.8458511 -.7995011 -.8005838 -.8036670 -.8040838  GullChess 3.0 BMI2 x64
-.7965411 -.7973139 -.8218723 -.8248873 -.8105160 -.8091926 -.8049221 -.8054030  Hakkapeliitta 3.0 x64
-.8291932 -.8265928 -.8778954 -.8798796 -.8990917 -.9028826 -.8562761 -.8553816  Hannibal 1.5 x64
-.7685286 -.7805900 -.8195265 -.8263835 -.8371223 -.8427111 -.8138673 -.8197646  Hiarcs 14 WCSC w32
-.8053493 -.8087333 -.8797949 -.8786443 -.8012826 -.8108373 -.7709261 -.7810165  Houdini 4 STD B x64
-.8150142 -.8184863 -.8577896 -.8611422 -.8381280 -.8362156 -.7874151 -.7855692  iCE 3.0 v658 POP x64
-.7374211 -.7424625 -.8214310 -.8213301 -.8120690 -.8186731 -.7698608 -.7749349  Junior 13.3.00 x64
-.6109231 -.6287295 -.7284547 -.7369448 -.7393434 -.7440256 -.7390120 -.7426573  Komodo 10 x64
-.8450579 -.8418980 -.8363585 -.8333301 -.7497068 -.7358131 -.7950864 -.7855705  Laser 1.1 POP x64
-.8260066 -.8231953 -.8540153 -.8534942 -.8359409 -.8392244 -.7413938 -.7471173  Murka 3 x64
-.8769119 -.8773212 -.8716204 -.8701855 -.8479918 -.8613465 -.7818320 -.7932588  Naum 4.6 x64
-.8709261 -.8591724 -.8406223 -.8300984 -.8436888 -.8344968 -.8397142 -.8374781  Nemo 1.01 Beta POP x64
-.8375377 -.8401689 -.8641340 -.8642018 -.8340860 -.8277276 -.7862147 -.7859876  Nirvanachess 2.2 POP x64
-.6903521 -.6773158 -.7455777 -.7446435 -.6893727 -.6997143 -.6987166 -.7085161  Octochess r5190 SSE4 x64
-.8153248 -.8268834 -.8439203 -.8574419 -.9015656 -.9059434 -.8506914 -.8569115  Pedone 1.2 BMI2 x64
-.7813552 -.7864976 -.8500633 -.8575481 -.8415358 -.8521451 -.8441402 -.8542961  Protector 1.9.0 x64
-.8101598 -.8103598 -.8430285 -.8448134 -.8296466 -.8328915 -.8204274 -.8230032  Quazar 0.4 x64
-.7847861 -.7831755 -.8143426 -.8157301 -.7678236 -.7741001 -.7876738 -.7867323  Rhetoric 1.4.3 POP x64
-.8235767 -.8211174 -.8102690 -.8059145 -.7479001 -.7554756 -.7672458 -.7762276  Rodent II 0.8.7 x64
-.7016664 -.6960286 -.7510117 -.7443916 -.8013841 -.8041984 -.8365120 -.8345473  Scorpio 2.77 JA POP x64
-.8616521 -.8680252 -.8845938 -.8895155 -.8753845 -.8799092 -.8551459 -.8552031  Senpai 1.0 SSE42 x64
-.8183196 -.8128426 -.8536007 -.8509398 -.8127568 -.8239533 -.8406618 -.8495094  Shredder 12 x64
-.8317488 -.8282569 -.8910089 -.8883958 -.8642968 -.8697931 -.8224416 -.8225675  Sjeng c't 2010 w32
-.8171663 -.7993830 -.8602312 -.8502855 -.8363371 -.8472725 -.7723241 -.7812675  SmarThink 1.80 AVX x64
-.8387564 -.8328360 -.8679723 -.8671087 -.8315057 -.8417856 -.8094544 -.8242218  Spark 1.0 x64
-.8373258 -.8400963 -.8875743 -.8948655 -.8503261 -.8607561 -.8457699 -.8527052  Spike 1.4 Leiden w32
-.7222459 -.7320350 -.8242641 -.8282468 -.7518126 -.7609171 -.7195040 -.7248868  Stockfish 24Apr2016 BMI2 x64
-.7556981 -.7593410 -.7914979 -.7917121 -.8221853 -.8277058 -.7677583 -.7713950  Texel 1.05 x64
-.8632052 -.8630992 -.8875660 -.8893835 -.7884158 -.7931950 -.7651537 -.7670913  The Baron 3.29 x64
-.8610619 -.8651227 --------- --------- --------- --------- -.8059432 -.8088486  Thinker 5.4d Inert x64
-.8685052 -.8718892 -.8942933 -.8925882 -.8414006 -.8535602 -.8086846 -.8240928  TogaII 280513 Intel w32
-.8553562 -.8469879 -.8413382 -.8293861 -.8105550 -.8147191 -.8119091 -.8190214  Tornado 5.0 SSE4 x64
-.7703298 -.7694588 -.8123776 -.8101315 -.8441371 -.8502121 -.8277814 -.8339725  Vajolet2 2.1 POP x64
-.8038741 -.8057785 -.8259338 -.8320571 -.8327431 -.8422242 -.8272306 -.8389006  Zappa Mexico II x64



Korrelationskoeffizienten :
Evaldifferenz (Zug 30-Zug 20) in den 25 Partien gegen ein engine ,
Punkte aus allen Partien

1.eigene eval weiss - Punkte weiss
2.eigene eval weiss - Punkte schwarz
3.Gegner eval weiss - Punkte weiss
4.Gegner eval weiss - Punkte schwarz
5.Gegner eval schwarz - Punkte weiss
6.Gegner eval schwarz - Punkte schwarz
7.eigene eval schwarz - Punkte weiss
8.eigene eval schwarz - Punkte schwarz

je naeher die Werte bei -1 liegen, desto besser die Vorhersage
der Punkte aus allen Partien, die "Elo"-Bewertung der engines

Gemeint ist die Vorhersage der Gesamtpunkte aller engines, wenn man nur
die evals der Zuege 20 und 30 aus 25 Partien gegen das eine
bewertende engine (rechts am Ende der Zeile) sieht

Also, wie gut sich ein engine hier zur Vorhersage eignet.

Da koenntest du dann also nur 30 Zuege aus 25*57 Partien spielen
anstatt 79800 volle Partien und haettest bereits eine
halbwegs vernuenftige Bewertung aller engines

maximum bei Hannibal
also 25 Partien mit schwarz gegen Hannibal, davon sehen wie
sich die Bewertung Hannibals zwischen Zug 20 und 30 aendert
Durchschnitt davon aus 25 Partien.

gut geeignet auch Togall, the Baron, Spike, Sjeng, Senpai,
Pedone,Houdini,Fritz, Doch,Chiron,Andscacs

minimum bei Komodo
also die Aenderung der eigenen eval zwischen Zug 20 und 30
in Partien mit Weiss gegen Komodo, das heisst noch nicht allzuviel,
daraus laesst sich die Gesamtpunktzahl nicht so gut vorhersagen.
(vielleicht weil Komodo contempt hat und hier auch die Komplexitaet
der Stellung optimiert anstatt nur die eval zu optimieren ?
oder vielleicht weil ich Bewertungen bei 2.00 abschneide um
Domiananz duerch einige hohe Werte zu vermeiden (besser sollte
man hier eine nichtlineare Funktion benutzen) )

Programm : fcp57bew.bas

-------------------------------------------
das mit (code) -Fenstern klappt bei mir hier nicht richtig.
Eigentlich muesste der Inhalt auf ein Bildschirm-Fenster reduziert sein
mit Maus-Schiebern rechts und unten
Parent - - By Frank Quisinsky Date 2016-09-28 12:02
Hi Günter,

OK, auch wieder gut aber vielleicht dann eher solche Partien heraussuchen mit x Figuren auf dem Brett.

Bei 25 Figuren, bei 20 Figuren bei 15 Figuren ... darunter können wir uns sparen ... Engines liegen im Endspiel zu eng zusammen!
Dann sollte bei der Auswahl darauf geachtet werden, dass in 75% der Fälle die Schwerfiguren bzw. mindestens 1 Turm und Dame dabei ist.

Die Ausgangstellungen die ausgewählt sind sollten ausgeglichen sein!

Aber was würde dann später dabei herauskommen?
Letztendlich wieder die Ratingliste mit ca. gleichen Verteilungen der Plätze.

OK, könnten Zeit und Strom sparen aber hinsichtlich Spielstile nicht wirklich mehr herausfinden, oder?

Gruß
Frank
Parent - - By Guenter Stertenbrink Date 2016-09-28 17:04
Hi Frank,

geht alles, aber macht etwas mehr Muehe.
Zuege 20-30 sind kritisch, das siehmt man auch an den eval-charts.
Ziel hier war auch zu untersuchen, ob nur die Zuege <30 und nur
die Partien gegen z.B. Hannibal ausreichen, um eine vernuenftige
Ratingliste zu erstellen. Das scheint ganz gut zu funktionieren.

Also sollte es auch gehen, Menschen-Partien von z.B. Hannibal
oder Fritz oder ... zugweise zu bewerten und ihnen so ein Rating
zu geben, das mit dem Computer-rating vergleichbar ist.

Gibt es solche Datenbanken ?

Spielstilanalyse [und Eroeffnungsstatistik] mach ich dann (wahrscheinlich) spaeter ...

Dass die engines im Endspiel etwa gleichstark sind hab ich noch nicht beobachtet,
(bei den TCEC Partien, keine Statistik)
Parent - By Guenter Stertenbrink Date 2016-09-29 10:09
das mit den korrelationskoeffizienten hat doch nicht so viel gebracht, wie zuerst gedacht.
Nimmt man einfach die erzielten Punkte gegen ein engine kann man besser das Endergebnis
des Turniers vorhersagen als mit den eval-differenzen Zug 20-30 (ausser evtl. man
gewichtet die noch besonders)

Immerhin hab ich so herausgefunden, welche engines sich zur Prognose am besten eignen,
sowohl bei Punkt- wie bei eval- Prognose in einem Turnier wie das von Frank
mit 57 engines.

Hannibal,Andscacs,Senpai,
Vajolet
DiscoCheck,Sjeng,Naum
Parent - - By Frank Quisinsky Date 2016-09-25 09:48
Eine Gewinnpartien von Stockfish gegen Komodo war bis Zug 19 doppelt (musste wiederholt werden).
Daher hat Komodo eine Verlustpartie weniger als bei der letzten Auswertung!

Code:
  ***********************************************
  Still running after round 18/50  =  36%
  Komodo 10.1 x64                  =  -  6.26 Elo
  Stockfish 18Sep2016 BMI2 x64     =  + 23.43 Elo

   # Player                           :      Elo  Games  Score%   won  draw  lost  Points  Draw%  Error   OppAvg   OppE   OppD
  ----------------------------------------------------------------------------------------------------------------------------
   2 Komodo 10.1 x64                  :  3204.26    882    86.4   652   220    10   762.0   24.9  23.24  2846.27  10.90   49.0
   1 Komodo 10 x64                    :  3210.52   2450    86.9  1829   598    23  2128.0   24.4  14.92  2845.46  10.57   49.0
  ****************************************************************************************************************************
 
   # Player                           :      Elo  Games  Score%   won  draw  lost  Points  Draw%  Error   OppAvg   OppE   OppD
  ----------------------------------------------------------------------------------------------------------------------------
   1 Stockfish 18Sep2016 BMI2 x64     :  3206.90    882    86.6   651   225     6   763.5   25.5  24.49  2846.22  10.88   49.0
   2 Stockfish 24Apr2016 BMI2 x64 C10 :  3183.47   2450    85.1  1744   680    26  2084.0   27.8  14.29  2846.01  10.58   49.0
  ****************************************************************************************************************************
Parent - - By Benno Hartwig Date 2016-09-25 15:44 Edited 2016-09-25 16:11

> Eine Gewinnpartien von Stockfish gegen Komodo war bis Zug 19 doppelt (musste wiederholt werden).


Sollte man das in den Finalpartien der menschlichen Schach-WM ggf. genau so handhaben?
Wenn also Anand gegen Carlsen bis zum 19. Zug eine Partie spielt, die es schon mal im Event gab, dann nehmen wir ihnen das Brett unter den Fingern weg "So geht das aber nicht, Jungs!" und lassen sie noch mal beginnen?

Benno
Parent - - By Tom Paul Date 2016-09-25 15:47
Komodo darf doch nicht gegen Stockfish verlieren.
Parent - By Frank Quisinsky Date 2016-09-26 12:12
Hi Tom,

schaut aber im direkten Vergleich für Komodo gar nicht so gut aus:

SF - K, 14,5 : 10,5 und 12,5 zu 12,5 = 27:23

Dieses Ergebnis der ersten 50 der 100 Partien (je die ersten aus den beiden Test-Runs) gehen dann später auch in die Listenberechnung ein.
Bei dieser Matchkonstellation werden ja 2x50 Partien gespielt ... damit die Darstellung der laufenden Test-Runs einfacher wird bzw. innerhalb des laufenden Vergleichs besser verfolgt werden kann.

Gruß
Frank

PS: Und so wie es derzeit ausschaut kann Komodo 10.1 die erspielte Leistung von Komodo 10 nicht halten bzw. verbessern.
Müssen das alles mal abwarten ...

Dir weiterhin viel Spaß ... wie auch immer geartet.
Parent - By Frank Quisinsky Date 2016-09-26 12:06
Hallo Benno,

dann müsste ja nur noch eine Variante in meinem Buch sein.
Nein, aber ich spiele nicht mit Eröffnungsvorgaben und vertauschten Farben zum Zwecke einer Optimierung eines Buches welches zufällig nach Prioritäten ausspielt. Hier geht es nicht um Taktik wie beim Menschenschach von Zug 1 mit Vorbereitungen auf Varianten etc., sondern um die knallharte Messung von Ratings. Da ich alle Partien prüfe sehe ich natürlich wenn Züge nach dem Buch bis Zugtiefe x doppelt sind. Sind doppelte Varianten dabei wird grundsätzlich die Partie wiederholt.

Das passiert bei den 49 Matches innerhalb dieser Matches und den 50 Partien ca. 20x ... also gleicher ECO Code mit gleichen Ergebnis. Das wird grundsätzlich wiederholt und nervt auch ein wenig ... das ist im Grunde einer der beiden Schachpunkte an meinem Test-System. Der zweite ist das ich wirklich jede Partie prüfen muss wenn Engines immer wieder nach einem Test-Run neue Züge reinbringen ins Buch und andere die gar nicht mögen.

Gruß
Frank

Also, Ratings sind eine Sache und aus der ganzen Aktion noch andere hinten dran hängen (Optimierung von einem Buch, an dem ich drei Jahre mit der erspielten Basis der Liste arbeite) die andere. Die Stats und Spielstile dann die nächste, wie gesagt ... Ratings für sich allein und erschreckend langweilig. Der Nutzen muss vielfältiger sein!
Parent - - By Frank Quisinsky Date 2016-09-26 20:07 Edited 2016-09-26 20:29
Nachdem Komodo 10.1 zwischen Runde 18-24 mit vielen Remispartien glänzte und Punkte verspielte gab es in Runde 26 ... sage und schreibe 36 Siege in Folge!! Und diese 36 Siege in Folge machten gerade mal 0.4% aus weil schon so viele Partien gespielt sind. Und da Komodo 10.1 gar schlechter spielt als Komodo 10 ... fast unmöglich das aufzuholen.

Dennoch unglaublich ... so langsam kämpft sich Komodo zurück in den Zweikampf. Tja, oftmals spielen die Statistiken verrückt und würfeln macht mehr Sinn. Wenn wir denn auf einzelne Stats schauen ... abgerechnet wird allerdings am Ende vom Test-Run 1 und 2.

Code:
  FCP Rating List (during a LIVE Test-Run)
  ----------------------------------------

  Date           : September 26th, 2016 (19:45)
  Games          : 58.922
  Version        : 4.33 Beta 6
  Conditions     : http://www.amateurschach.de/main/_conditions.htm

  Generated with : Ordo 1.2.6 x64 (Ratings for chess and other games)
  https://sites.google.com/site/gaviotachessengine/ordo
  by Miguel A. Ballicora (Argentina)
 
     
  ***********************************************
  Still running after round 26/50  =  52%
  Komodo 10.1 x64                  =  - 13.10 Elo
  Stockfish 18Sep2016 BMI2 x64     =  + 21.75 Elo

   # Player                           :      Elo  Games  Score%   won  draw  lost  Points  Draw%  Error   OppAvg   OppE   OppD
  ----------------------------------------------------------------------------------------------------------------------------
   2 Komodo 10.1 x64                  :  3197.42   1274    86.0   930   331    13  1095.5   26.0  20.10  2845.91  10.81   49.0
   1 Komodo 10 x64                    :  3210.52   2450    86.9  1829   598    23  2128.0   24.4  14.92  2845.46  10.57   49.0
  ****************************************************************************************************************************
 
   # Player                           :      Elo  Games  Score%   won  draw  lost  Points  Draw%  Error   OppAvg   OppE   OppD
  ----------------------------------------------------------------------------------------------------------------------------
   1 Stockfish 18Sep2016 BMI2 x64     :  3205.22   1274    86.5   938   328     8  1102.0   25.7  21.05  2845.75  10.79   49.0
   2 Stockfish 24Apr2016 BMI2 x64 C10 :  3183.47   2450    85.1  1744   680    26  2084.0   27.8  14.29  2846.01  10.58   49.0
  ****************************************************************************************************************************

   # Player                           :      Elo  Games  Score%   won  draw  lost  Points  Draw%  Error   OppAvg   OppE   OppD
  ----------------------------------------------------------------------------------------------------------------------------
   1 Stockfish 18Sep2016 BMI2 x64     :  3205.22   1274    86.5   938   328     8  1102.0   25.7  21.05  2845.75  10.79   49.0
   2 Komodo 10.1 x64                  :  3197.42   1274    86.0   930   331    13  1095.5   26.0  20.10  2845.91  10.81   49.0
   3 Houdini 4 STD B x64              :  3096.44   2402    79.0  1521   751   130  1896.5   31.3  12.42  2840.91  10.77   48.7
   4 Fire 4 x64                       :  3044.75   2402    74.0  1325   906   171  1778.0   37.7  11.72  2841.99  10.79   48.7
   5 GullChess 3.0 BMI2 x64           :  3041.69   2402    73.7  1298   945   159  1770.5   39.3  11.74  2842.05  10.79   48.7
   6 Andscacs 0.872 BMI2 x64          :  3007.53   2402    70.1  1186   995   221  1683.5   41.4  11.42  2842.76  10.79   48.7
   7 Equinox 3.30 x64                 :  3004.13   2402    69.7  1152  1045   205  1674.5   43.5  11.03  2842.83  10.80   48.7
   8 Fizbo 1.8 BMI2 x64               :  3000.18   2402    69.3  1165   998   239  1664.0   41.5  11.08  2842.92  10.80   48.7
   9 Critter 1.6a x64                 :  2988.30   2402    67.9  1119  1026   257  1632.0   42.7  11.06  2843.16  10.80   48.7
  10 Fritz 15 x64                     :  2986.50   2402    67.7  1107  1040   255  1627.0   43.3  10.55  2843.20  10.81   48.7
  11 Nirvanachess 2.3 POP x64         :  2967.07   2402    65.5  1002  1142   258  1573.0   47.5  10.15  2843.61  10.82   48.7
  12 Hannibal 1.7 x64                 :  2961.42   2402    64.8  1023  1068   311  1557.0   44.5  10.67  2843.72  10.81   48.7
  13 Chiron 3 x64                     :  2954.95   2402    64.1   991  1095   316  1538.5   45.6  10.35  2843.86  10.81   48.7
  14 Protector 1.9.0 x64              :  2941.13   2402    62.4   946  1105   351  1498.5   46.0  10.55  2844.15  10.81   48.7
  15 Texel 1.06 x64                   :  2939.59   2402    62.2   968  1052   382  1494.0   43.8  10.62  2844.18  10.81   48.7
  16 iCE 3.0 v658 POP x64             :  2931.43   2402    61.2   947  1046   409  1470.0   43.5  10.22  2844.35  10.82   48.7
  17 Booot 6.0.2 POP x64              :  2910.00   2402    58.5   829  1154   419  1406.0   48.0  10.42  2844.79  10.81   48.7
  18 Naum 4.6 x64                     :  2895.00   2402    56.6   802  1117   483  1360.5   46.5  10.28  2845.11  10.82   48.7
  19 SmarThink 1.96 SSE4 x64          :  2888.79   2402    55.8   853   977   572  1341.5   40.7  10.38  2845.24  10.81   48.7
  20 Hakkapeliitta TCEC v2 x64        :  2886.67   2402    55.6   818  1034   550  1335.0   43.0  10.05  2845.28  10.82   48.7
  21 Vajolet2 2.2 POP x64             :  2843.38   2402    50.0   662  1078   662  1201.0   44.9  10.12  2846.18  10.82   48.7
  22 Senpai 1.0 SSE42 x64             :  2841.30   2402    49.7   659  1071   672  1194.5   44.6  10.20  2846.22  10.82   48.7
  23 Hiarcs 14 WCSC w32               :  2830.22   2402    48.3   634  1052   716  1160.0   43.8  10.43  2846.45  10.81   48.7
  24 Pedone 1.4.1 BMI2 x64            :  2822.67   2402    47.3   539  1195   668  1136.5   49.8  10.12  2846.61  10.82   48.7
  25 Cheng 4.39 x64                   :  2810.28   2402    45.7   561  1074   767  1098.0   44.7  10.24  2846.87  10.82   48.7
  ----------------------------------------------------------------------------------------------------------------------------
  26 Sjeng c't 2010 w32               :  2807.87   2402    45.4   585  1011   806  1090.5   42.1  10.43  2846.92  10.81   48.7
  27 Shredder 12 x64                  :  2805.61   2402    45.1   539  1089   774  1083.5   45.3  10.22  2846.97  10.82   48.7
  28 Arasan 19.1 POP x64              :  2804.96   2402    45.0   551  1061   790  1081.5   44.2  10.57  2846.98  10.81   48.7
  29 Junior 13.3.00 x64               :  2801.25   2402    44.5   559  1022   821  1070.0   42.5  10.28  2847.06  10.82   48.7
  30 Spike 1.4 Leiden w32             :  2791.88   2402    43.3   525  1032   845  1041.0   43.0  10.23  2847.25  10.82   48.7
  31 Quazar 0.4 x64                   :  2781.76   2402    42.0   491  1038   873  1010.0   43.2  10.16  2847.46  10.82   48.7
  32 DiscoCheck 5.2.1 x64             :  2779.80   2402    41.8   529   950   923  1004.0   39.6  10.57  2847.50  10.81   48.7
  33 Bobcat 7.6 x64                   :  2774.07   2402    41.1   449  1075   878   986.5   44.8  10.02  2847.62  10.82   48.7
  34 Deuterium 14.3.34.130 POP x64    :  2766.83   2402    40.2   430  1069   903   964.5   44.5  10.55  2847.77  10.81   48.7
  35 Zappa Mexico II x64              :  2761.70   2402    39.5   401  1096   905   949.0   45.6  10.62  2847.88  10.81   48.7
  36 Spark 1.0 x64                    :  2759.21   2402    39.2   434  1015   953   941.5   42.3  10.04  2847.93  10.82   48.7
  37 Wasp 1.01 x64                    :  2751.37   2402    38.2   371  1094   937   918.0   45.5  10.47  2848.10  10.81   48.7
  38 TogaII 280513 Intel w32          :  2745.33   2402    37.5   421   958  1023   900.0   39.9   9.99  2848.22  10.82   48.7
  39 Gaviota 1.0 AVX x64              :  2742.29   2402    37.1   429   924  1049   891.0   38.5  10.45  2848.28  10.81   48.7
  40 Crafty 25.0.1 JA POP x64         :  2735.34   2402    36.2   390   961  1051   870.5   40.0  10.71  2848.43  10.81   48.7
  41 Dirty 03NOV2015 POP x64          :  2733.49   2402    36.0   372   986  1044   865.0   41.0  10.20  2848.47  10.82   48.7
  42 EXchess 7.92b x64                :  2733.29   2402    36.0   345  1039  1018   864.5   43.3  10.66  2848.47  10.81   48.7
  43 Rodent II 0.9.33 x64             :  2725.74   2402    35.1   359   967  1076   842.5   40.3  10.39  2848.63  10.81   48.7
  44 Atlas 3.80 x64                   :  2723.84   2402    34.8   352   970  1080   837.0   40.4  10.53  2848.67  10.81   48.7
  45 DisasterArea 1.65 POP x64        :  2721.42   2402    34.6   313  1034  1055   830.0   43.0  10.53  2848.72  10.81   48.7
  46 Murka 3 x64                      :  2718.29   2402    34.2   312  1018  1072   821.0   42.4  10.64  2848.78  10.81   48.7
  47 Nemo 1.01 Beta POP x64           :  2712.13   2402    33.5   325   957  1120   803.5   39.8  10.75  2848.91  10.81   48.7
  48 Octochess r7533 DC x64           :  2669.04   2402    28.5   241   888  1273   685.0   37.0  11.15  2849.81  10.80   48.7
  49 Rhetoric 1.4.3 POP x64           :  2668.66   2402    28.5   260   848  1294   684.0   35.3  10.89  2849.82  10.80   48.7
  50 Laser 1.1 POP x64                :  2635.92   2402    25.0   194   813  1395   600.5   33.8  11.60  2850.50  10.79   48.7
  ----------------------------------------------------------------------------------------------------------------------------

  White advantage = 33.19 +/- 1.09
  Draw rate (equal opponents) = 51.73 % +/- 0.25

Parent - - By Frank Quisinsky Date 2016-09-26 20:57 Edited 2016-09-26 21:01
Schauen wir wieder ein wenig auf die Stats ...

Züge Durchschnitt bis zum Ende der Partie (gespielt wird bis die Partie wirklich mit Matt oder Remis nach 50 Zügen endet).
Stockfish liegt nun bei 76 Zügen (absoluter Rekordwert, noch nie gesehen)
Komodo liegt nun bei 81 Zügen

Schauen wir auf die schnellen Remispartien unter 40 Züge ...
Stockfish liegt nun bei ... 48 Partien
Komodo liegt nun bei ... 22 Partien

Die Vermutung liegt nahe das Contempt Stockfish dann weiter nach oben befördert (wird ja anschließend ausgetestet).

Schauen wir auf die schnellen Gewinnpartien (für mich das Salz in der Suppe)
Stockfish liegt nun bei ... 166 Partien aus 1.282 = 12.949% über 12.4% stellt einen Rekordwert da!
Komodo liegt nun bei ... 132 Partien aus 1.283 = 10.288%

Auffällig hier das bei Komodo "nur" 35 mit schwarz erspielt wurden und fast 100 mit weiß. Das ist deutlich mehr als der Normalwert.

Würde für meinen Tipp bedeuten:

Tipp: Frank Quisinsky

1. Wie viele Partien unter 60 Zügen bis zum Matt werden gewonnen?
Stockfish 18Sep2016 BMI2 x64 = 288
Komodo 10.1 x64 = 274

Hochgerechnet:
SF: 166 x 2450 : 1282 = 317 ... weit mehr als ich erwartet habe
Komodo: 132 x 2450 : 1283 = 252 ... weniger als ich erwartet habe

Demnach Stockfish weit besser als ich dachte und bei Komodo ... tja, offenbar geht die Leistung im Vergleich zur Version 10.0 nach unten.
Alles deutet darauf hin ... mehr Remispartien als die Verison 10.0, weniger schnelle Gewinnpartien als die Version 10.0 und der Zügedurchschnitt ... Komodo 10 hatte einen von 82 Züge. Das gibt mir Hoffnung das sich Komodo im Verlauf noch fängt und einfach schlechter gestartet ist denn Komodo spielt derzeit mit einem Zügedurchschnitt von 81 Zügen (immer ein guter Indiz für Hochrechnungen).

Fest steht aber ... es sieht alles nach einer neuen Nummer 1 aus und vielleicht kann Contempt Stockfish noch ein wenig weiter von Komodo weg befördern und der Vorsprung kann noch ausgebaut werden. Wie gesagt, wird anschließend getestet.

Gruß
Frank
Parent - - By Frank Quisinsky Date 2016-09-26 21:45 Edited 2016-09-26 21:48
Wobei ...

Es fraglich ist ob Stockfish wirklich die neue Nummer 1 wird. Es gibt ja noch Komodo 10 der bei ja offenbar stärker als Komodo 10.1 ist.
Stockfish spielt direkt gegen Komodo 10.1 und indirekt gegen Komodo 10.

Also, es bleibt spannend, so der so und wenn nicht so fabrizieren wir noch ein weiteres so dazu.
Im Grunde können wir von einem "Doppel-So" sprechen.

Gruß
Frank

Wenn also Komodo 10.1 wirklich schwächer ist ... liegt es nahe für die Liste jeder gegen Jeden einfach noch 50 Partien ... Stockfish 18Sep2016 BMI2 x64 - Komodo 10 x64 dran zu hängen und Komodo 10 in der Liste zu belassen. Stockfish muss sich halt als Herausforderer beweisen und zwar in diesem Fall auch gegen diesen Gegner. Schließlich endet meine Liste bald und wer dann oben steht bleibt oben mit dem Endresultat Ende Oktober 2016. Also, ne harte Nuss ist aus der Sicht von SF zu knacken!
Parent - - By Benno Hartwig Date 2016-09-27 15:15

> Es gibt ja noch Komodo 10 der bei ja offenbar stärker als Komodo 10.1 ist.


Dass 10 "offenbar" stärker als 10.1 ist, kann man so klar un unwiederlegbar wo erkennen?
Bei CEGT fand ich dies erst mal nicht so augenfällig.

Benno
Parent - - By Thomas Müller Date 2016-09-27 16:41 Upvotes 1
hier auch nicht....  http://inwoba.de

Code:
# PLAYER                       : RATING  ERROR     (%)    D(%)  OppAvg   CFS(next)    POINTS       W       D       L  PLAYED
1 Komodo 10.1                  :   3256     11   80.7%    29.6    2990      82        3194.0    2608    1172     180    3960
2 Komodo 10                    :   3249     10   81.0%    30.1    2979      96        3562.5    2901    1323     176    4400
Parent - - By Frank Quisinsky Date 2016-09-27 17:08 Edited 2016-09-27 17:18
Macht das Sinn auf die anderen zu schauen wenn ich 3 bis 4 mal mehr Gegner habe und Partien
auf einem höheren Level erzeuge und alle Stats genau aufzeigen warum. Drei Einzelergebnisse sind nicht gut, Engine die von anderen nicht genutzt werden.

Macht keinen Sinn.

Dann sehe ich nur Nirvana 50 Elo weniger etc.  Habe mir abgewöhnt zu vergleichen weil niemand jeder gegen jeden innerhalb der top 50 hat.

Kann ja jeder experimentieren mit den Daten. Gegner rausholen und neu berechnen lassen und sich wundern. Könnte jeder Engine nach Auswahl von 15 Gegnern 50 Elo oder mehr hinzuzufügen oder abziehen.

Also... Verlasse ich mich auf das was ich produziere...  Auch wenn ich niemanden zu Nahe treten möchte aber alles andere macht keinen Sinn aus meiner Sicht.
Parent - - By Thomas Müller Date 2016-09-27 17:38 Upvotes 1
ja macht sinn
Du schreibst -stellst in deiner testumgebung fest/vemutest), dass 10.1 schwächer sei als die 10er
Woanders ist das nicht so aufgetreten. Von dem her finde ich das nicht unbedingt korrekt.
Ja es sind andere bedingungen als bei dir bzw jede liste ist etwas anders......es ist halt knapp zwischen den versionen

gruß
thomas
Parent - - By Frank Quisinsky Date 2016-09-28 11:09 Edited 2016-09-28 11:34
Hallo Thomas,

wie gesagt, schaue heute maximal auf CEGT 5+3.

Was immer wieder unterschätzt wird ist die Anzahl der Gegner. Mit wenigen Gegnern gelingt keine gute Messung, egal wie viele Partien. Das lässt sich leicht an Experimenten ablesen wenn Du aus meiner bestehenden Datenbank Gegner wegnimmst und neu berechnen lässt.

Das Problem ist eher, es gibt nicht ausreichend Gegner für Stockfish und Komodo die auf gleichem Level spielen. Insofern ist die Messung die ich so treibe auch nicht optimal. Würde nie etwas anders behaupten wenn ich sehe das es so ist. Allerdings, wird es meines Erachtens dennoch genauer wenn wir mehr Gegner hinzufügen, genauer für alle anderen im Test-Feld.

Und je mehr ich mich mit dem Thema beschäftige desto unsinniger halte ich die Messung von Elo-Zahlen im Computerschachbereich, weil ich eher dazu neige zu perfektionieren und das gelingt mir nicht. Egal wie viel Mühe ich mir gebe. Der Grund warum mir an der eigenen Liste das Buch oder die Spielstile wichtiger sind als die blanken Zahlen.

Wir können aber Erklärungsversuche bei dem Komodo Ergebnis versuchen. Auch das Stockfish Ergebnis ist schlechter als gedacht.

Grund 1:
Mein Buch!
Stelle Dir vor Du hast 100 Positionen. Nun jagst Du permanent 50 Engines über die Stellungen in x verschiedenen Versionen. Irgend eine sagt schlecht und filtert weg. Das heißt das langfristig mein Buch höhere Remisstatistiken erzeugt. Höhere Anzahl von Remispartien wäre für Stockfish und Komodo bei über 85% Punktausbeute fatal ... die Elo schwankt gewaltig. Für diese Theorie dagegen spricht, dass ich 85.000 Varianten im Buch habe und zig hunderttausende Partien notwendig wären um wirklich alles rauszufiltern. Auch Komodo 10 ein paar Test-Runs vorher wurde durch dieses Buch mithin auch nicht groß bevorteilt.

Grund 1 scheidet meines Erachtens aus. Auch wenn von den 85.000 Varianten schon 7.000 herausgefiltert wurden und von den 7.000 ca. 4.000 dabei sind die viele Engines für ausgeglichen halten ... zumindest 3 Züge nach dem Buch ... im Verlauf aber dann kläglich scheitern.

Grund 2:
Mir ist vor ca. 2 Test-Runs aufgefallen das ich 3-4% zuviel A00-A99 im Buch hatte und 3-4% zu wenig E00-E99 Eröffnungen. Ich änderte maßgeblich mein Buch in dem ich 1. c4 und 1. f4 2-3% Prozent weniger gab, 1. d4 d5 ca. 20% weniger und 1.d4 Sf6 ca. 20% mehr. Damit kann ich einfach regulieren. Könnte sein, dass Komodo vorher mit den Varianten besser klar gekommen ist. Das könnte Auswirkungen haben, aber die werden gering sein.

Grund 3:
Komodo 10 hatte noch 26:24 gegen Stockfish aus April gewonnen. Derzeit liegt Komodo 10 klar hinten bzw. verlor ja mit 23:27. Es gibt ein paar weitere eher schwache Einzelergebnisse von Komodo 10.1. Wird Auswirkungen haben.

Grund 4:
Die bisherigen Statistiken ... Komodo spielt deutlich mehr Remis! Spielt mit schwarz deutlich verhaltener als mit weiß.

Letztendlich könnte es sein, dass wenn ich später nur die Gegner nehme die auch von anderen im Test gegen Komodo benutzt wurden ich gleiche Ergebnisse produziere. Meist ist das so, und schon sind wir wieder beim wahrscheinlichsten Punkt. Wie gesagt, mit meiner Ratingliste lässt sich alles reproduzieren wenn denn nicht andere Listenbetreiber noch irgend welches nicht verfügbare Zeug nutzten würden. Nicht nur deswegen schlecht weil wir Ergebnisse schwieriger reproduzieren können, sondern weil niemand etwas mit den Ergebnissen wirklich anfangen kann weil die Engines nicht nutzbar sind.

Das Komodo 10.1 Update kam sehr schnell nachdem noch nicht mal 60 Tage vorher Komodo 10.0 veröffentlicht wurde. In der Regel geht das in die Hose wenn ich mir ansehe wie oft das passiert ist und was dabei heraus kam. Andascas, Pedone, EXchess, Arasan Versionen ...

Innerhalb von 60 Tagen kann niemals, mit noch so vielen Maschinen getestet werden welche Auswirkungen die Änderungen bei längeren Bedenkzeiten haben. Diese Updates gehen meist gewaltig in die Hose.

Wenn im Blitz schnell mal was festgestellt wird, heißt das nicht das die Auswirkungen beim Schnellschach greifen. Auch das könnte ein Grund ein.

Fest steht, zumindest nach Leistung in Elo ... es sieht nicht nach einer Verbesserung aus und egal was ich vergleiche ... Komodo 10.0 zu Komodo 10.1 ... es wird in jeder, absolut jeder Statistik bestätigt. Und nun nach über 1600 Partien wird sich daran auch kaum noch etwas ändern. Vielleicht korrigiert sich Komodo 10.1 noch auf -10 aber das wäre auch schon Maximum bis zum Ende vom Test-Run nach 2.450 Partien.

Es werden 2.450 weitere Partien folgen ohne Contempt.
Insgesamt werden fast 5.000 Partien auf mittleren Bedenkzeiten vorliegen.

Wir können die Auswirkungen von Contempt vergleichen, können später auch alle schnellen Remispartien von unter 40 Zügen aus den beiden Test-Run weglöschen und schauen ob das ein Zufallsprodukt war.

Was kann getan werden um noch aussagekräftigere Ergebnisse ... mit dem was vorliegt ... zu erreichen?
Bin für jeden Tipp dankbar! Ich sehe nichts, absolut nichts wie ich die Messung noch verbessern könnte (innerhalb meines Test-Systems).

Gruß
Frank
Parent - By Frank Quisinsky Date 2016-09-28 11:39
Hallo zusammen,

was auch interessant ist ...

Bei meinem Test-System spielt jeder gegen jeden kontinuierlich.
Das heißt wir können die Einzelergebnisse von Komodo 10.0 und 10.1 gegenüberstellen, beide hatten also natürlich die gleichen Gegner.

Dann die Anzahl die Remis Partien hinzu für den Vergleich und es wird schon sehr deutlich warum und weshalb (maßgeblich für die niedrigere Elo nach dem was ich hier so sehe).

Gruß
Frank
Parent - - By Thomas Müller Date 2016-09-28 12:19
was mir noch gerade einfällt....kann es aber grad nicht prüfen....

Hat sich in den default-settings nicht noch ein parameterwert geändert ?!
Sowas wie king-safety oder selectivity oder so von 70 auf 65 ?!?
Das ist jetzt wirklich nur aus dem kopf grad

gruß
thomas
Parent - - By Frank Quisinsky Date 2016-09-28 12:30
Hallo Thomas,

keine Ahnung.
Habe an den Einstellungen von Komodo 10.1 nichts geändert. Aber Du hast Recht, erinnere mich schwach an den Thread in TalkChess. War mir zu lang um zu lesen. Denke so wie ausgeliefert sollte getestet werden oder wir werden vor lauter Settings gar nicht mehr fertig.

Wobei Contempt schon ein sehr wichtiges Setting ist.

Gruß
Frank
Parent - By Thomas Müller Date 2016-09-28 15:37
ja schon auf default lassen für die listen, klar!
Aber das ist halt auch evtl. ein unterschied warum es hier oder dort und zu unterschiedlichen ergebnissen kommen kann ?!
Ist auch alles nicht so wild....die unterschiede sind zu klein wenn es sich um 5-10 cElo handelt.
Parent - - By GS Date 2016-09-27 19:54 Edited 2016-09-27 19:57
Frank Quisinsky schrieb:

[...snip...]
Dann sehe ich nur Nirvana 50 Elo weniger etc.
[...snip...]


(Endlich ?) Mal wieder ein klarer "Fall" (von allerdings wirklich sehr wenigen) von pb=on/off Vergleichen !

Dein Tipspiel habe ich leider nicht mitbekommen,
ich sollte doch wenigstens 1x pro Woche hier hereinschauen ..., jedoch ... weshalb ?
Parent - - By Frank Quisinsky Date 2016-09-28 11:21 Edited 2016-09-28 11:25
Hallo Gerhard,

daran hatte ich vor lauter Blindheit in eigener Sache noch gar nicht gedacht. Klar, das könnte Auswirkungen habe (auch wenn selten in der Vergangenheit). Nun verliert Nirvana ca. 1% auf Zeit, wenn das nicht korrigiert wird ... die Eigenheiten von vielen Engines. Mittlerweile kenne ich die in und auswendig. Gerade von denen die nicht upgedatet wurden und bei mir immer wieder spielen. 23 der Top-50 in meiner Liste wurden im letzten Jahr upgedatet. Ein Normalwert im Computerschach. Schön ist, dass einige die upgedatet wurden sich so langsam nach oben spielen.

Wenn ich so lese wie weit Komodo und Stockfish schon vor den Anderen sind aber die Engines dann tatsächlich nur x Elo stark sind ... Welten dazwischen! Elo wird völlig überschätzt aufgrund der vorhandenen Spielstärke. Selbst ein 46:4 von Komodo 10 gegen Octochess ... die meisten würden sagen wow ... in Wirklichkeit spiegelt ein 46:4 160 Elo weniger als 3.210 wieder. Und das ist das Problem, Engines auf dem Level von Komodo und Stockfish werden in Elo Höhen gelobt die noch gar nicht da sind.

Ja, schade mit dem Tipp-Spiel.
Was solls, hatte ehrlich gesagt auch in diesem Forum mit keinen Reaktionen gerechnet. Oftmals ist es auch sehr mühsam sich hier Mühe zu geben. Aber ich gebe die Hoffnung nicht auf und hier und da entstehen auch immer wieder ein paar spannende Diskussionen.

Ziehe mich ja auch bald wieder zurück. Brauche eine Computerschachpause und die Flughäfen in aller Welt warten auf meine Camera. Werde wieder mehr spotten und mir den einen oder anderen Campingplatz dabei ansehen.



Gruß
Frank
Parent - By Frank Quisinsky Date 2016-09-28 15:30 Edited 2016-09-28 15:40
Code:
  ***********************************************
  Still running after round 34/50  =  68%
  Komodo 10.1 x64                  =  - 16.24 Elo
  Stockfish 18Sep2016 BMI2 x64     =  + 20.36 Elo

   # Player                           :      Elo  Games  Score%   won  draw  lost  Points  Draw%  Error   OppAvg   OppE   OppD
  ----------------------------------------------------------------------------------------------------------------------------
   2 Komodo 10.1 x64                  :  3194.28   1666    85.8  1212   434    20  1429.0   26.1  17.00  2846.21  10.71   49.0
   1 Komodo 10 x64                    :  3210.52   2450    86.9  1829   598    23  2128.0   24.4  14.92  2845.46  10.57   49.0
  ****************************************************************************************************************************
 
   # Player                           :      Elo  Games  Score%   won  draw  lost  Points  Draw%  Error   OppAvg   OppE   OppD
  ----------------------------------------------------------------------------------------------------------------------------
   1 Stockfish 18Sep2016 BMI2 x64     :  3203.83   1666    86.4  1222   435     9  1439.5   26.1  17.88  2846.01  10.69   49.0
   2 Stockfish 24Apr2016 BMI2 x64 C10 :  3183.47   2450    85.1  1744   680    26  2084.0   27.8  14.29  2846.01  10.58   49.0
  ****************************************************************************************************************************
Up Topic Hauptforen / CSS-Forum / Der Kampf um Platz 1 ... die nächste Runde wird eingeleutet!
1 2 Previous Next  

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill