Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / FCP Rating List, v. 2.05.s6 & Live-Book
- - By Frank Qy. Date 2015-03-26 19:21 Upvotes 1
Hallo zusammen,

hier mal wieder nach längerer Zeit meine aktuelle Ratingliste.
Zur Zeit läuft Pedone 1.1 BMI2 x64 (erstmaliger Test von meiner Seite).

In der letzten Zeit habe ich viel an meinem Eröffnungsbuch gearbeitet. Hunderte von Verbesserungen sind drin, z. B. heute den ECO Code E75 überarbeitet (einer der kritischen). Das Buch wird ausschließlich für die Shredder Classic GUI erstellt und soll alle Engines in ausgeglichene Stellungen entlassen. Hauptaugenmerk hier, alle 500 ECO Codes sollen dabei ausgespielt werden und zwar nach den Ausspielpräferenzen der aktuellen GM-Praxis. Wird also A02 selten gespielt, so soll es auch in dem Buch selten ausgespielt werden. Diese Auspielpräferenzen werden stetig überarbeitet, notwendig nach den vielen Änderungen. Ferner werden die gespielten Partien aus meiner Ratingliste stets bis Zugtiefe 10 in das Buch gebracht (natürlich wurden die Partien vorher gesprüft). Sinn und Zweck denn seinerzeit habe ich GM-Partien nur bis Zugnummer 6 ins Buch gebracht. Spätere Updates von aktueller GM-Theorie und aus Fernschachpartien dann bis Zug Nummer 12. So optimiert sich das Buch stetig selbst wobei ich wie gesagt jede gespielte Partie (ca. 3-5 Züge nach dem Buch) überprüfe und schlechte Varianten mittels "f" deaktiviere. Die Partien werden dann natürlich auch wiederholt. Gleiche Vorgehenseweise seit ich mit der Liste angefangen habe und das Resultat vom Buch ist schon richtig gut geworden.

Die FCP Datenbank eignet sich daher richtig gut für die Bucherstellung, da wie gesagt die Datenbank der Ratingliste optimiert ist (sicherlich ist mir hier und da mal was durchgegangen).

Viel Spaß beim Downloaden (wer mag).

Viele Grüße
Frank

Code:
"FCP Rating List"
Will be updated after ~ 1.000 new games!
----------------------------------------

Date             : March 23rd, 2015 (23:30)
Games            : 58.950
Version          : 2.05.s6
Hardware         : 2x Intel Core i7-4770K *4.3Ghz, 45-minutes games
Engines          : Maximum allowed = two / three versions of same engine, News 135
Sorted out games : http://www.amateurschach.de/main/_sgbp.htm

Calculation      : Ordo 0.9.9, "Hiarcs 14 WCSC w32" with 2.825 Elo / News 057 & News 062
Parameter        : Ordo_099.exe -a 2825 -A "Hiarcs 14 WCSC w32" -p 1.pgn -o rating.txt -W -s1000 -D -E -V
Conditions       : http://www.amateurschach.de/main/_conditions.htm

      Program                          Elo    +    -   Games   Score  Av.Op.  Draw
  01. Stockfish 6 BMI2 x64             3134   17   17  1600    83.3%   2827   29.6%, New: + 32 Elo
  02. Komodo 8 x64                     3105   16   16  1700    79.9%   2836   32.5%
  --. Stockfish 03.08.14 BMI2 x64      3102   15   15  1750    81.8%   2813   31.6%
  --. Komodo 7a x64                    3077   19   19  1200    80.8%   2805   30.5%
  03. Fire 4 x64                       3052   15   15  1800    78.3%   2803   30.7%
  04. GullChess 3.0 BMI2 x64           3042   13   13  1950    74.4%   2833   37.9%
  05. Equinox 3.30 x64                 2992   14   14  1750    71.9%   2810   40.7%
  --. Fire 3.0 AVX x64                 2952   14   14  1650    68.0%   2808   39.6%
  06. Sting SF 4.8.4 x64               2930   13   13  1700    61.5%   2842   44.1%, New
  07. Protector 1.7.0 x64              2907   14   14  1350    55.0%   2870   46.1%
  08. Texel 1.05 x64                   2898   13   13  1750    58.1%   2837   43.7%, New: + 50 Elo
  09. Hannibal 1.5 x64                 2895   13   13  1650    57.1%   2843   45.8%, New: + 33 Elo
  09. Chiron 2.0 x64                   2895   10   10  3200    62.0%   2803   40.0%
  11. Critter 0.90 SSE4 x64            2893   14   14  1550    55.6%   2851   44.8%
  12. Naum 4.6 x64                     2886   15   15  1400    63.5%   2782   41.8%, New
  --. Protector 1.6.0 x64              2882   14   14  1550    59.9%   2808   44.4%
  --. Hannibal 1.4b x64                2862   10   10  3100    58.7%   2797   42.8%
  --. Texel 1.04 x64                   2848    9    9  2900    57.0%   2797   41.4%
  13. Nirvanachess 2.0a x64            2843   14   14  1450    58.2%   2783   45.2%
  14. Senpai 1.0 SSE42 x64             2830   10   10  3200    53.7%   2805   41.6%
  15. Hiarcs 14 WCSC w32               2825    9    9  3200    53.0%   2805   42.9%
  16. Andscacs 0.72 POP x64            2813   15   15  1350    53.7%   2788   43.6%, New: +111 Elo to version 0.70 (0.71 not tested)
  17. Shredder 12 x64                  2794   12   12  1950    44.8%   2839   41.2%
  18. Junior 13.3.00 x64               2782   11   11  2400    47.5%   2804   40.8%
  --. Junior 12.5.03 x64               2779   14   14  1350    43.1%   2837   38.7%
  19. Spike 1.4 Leiden w32             2772   14   14  1450    40.3%   2854   41.1%
  --. Junior 13.8.04 Yokohama x64      2771   14   14  1300    44.0%   2824   42.0%
  20. Deuterium 14.3.34.130 POP x64    2764   13   13  1550    45.7%   2801   43.6%
  21. DiscoCheck 5.2.1 x64             2760   14   14  1450    37.0%   2869   35.8%
  ---------------------------------------------------------------------------------
  22. iCE 2.0 v2240 POP x64            2755    9    9  3750    48.5%   2770   43.8%
  23. Quazar 0.4 x64                   2753   12   12  1950    39.6%   2840   41.0%
  24. Cheng4 0.38 x64                  2751   14   14  1300    44.6%   2795   42.8%, New: + 77 Elo
  25. SmarThink 1.70 SSE3 x64          2749    9    9  3100    42.6%   2811   38.2%
  26. Spark 1.0 x64                    2748    8    8  3950    47.8%   2770   41.4%
  27. Zappa Mexico II x64              2747   14   14  1550    36.6%   2860   40.6%
  --. SmarThink 1.60 x64               2741   17   17  1050    39.2%   2830   37.0%
  28. Fizbo 1.3.1 x64                  2738   14   14  1550    42.3%   2801   42.0%
  29. Vajolet2 1.45 POP x64            2726    8    8  4050    44.5%   2773   41.6%
  --. Deuterium 14.2.33.276 x64        2721   10   10  2650    46.5%   2753   41.1%
  --. Vajolet2 1.28 POP x64            2721   16   16  1100    37.1%   2827   39.5%
  30. Gaviota 1.0 AVX x64              2720    8    8  4200    44.0%   2771   38.2%
  31. Atlas 3.80 x64                   2719   15   15  1200    41.2%   2790   42.9%, New: + 90 Elo
  32. Tornado 5.0 SSE4 x64             2715   12   12  2250    43.7%   2770   37.5%
  33. Arasan 17.5 POP x64              2714   15   15  1100    40.8%   2788   42.6%, New: + 31 Elo
  --. Andscacs 0.70 POP x64            2702   16   16  1150    39.7%   2784   41.1%
  --. Nirvanachess 1.7 x64             2693   10   10  2500    41.4%   2767   38.4%
  --. Arasan 17.4 POP x64              2683   10   10  2400    43.7%   2734   41.4%
  --. Fizbo 1.2 x64                    2681   12   12  2100    41.8%   2750   39.0%
  34. EXchess 7.51b x64                2677   14   14  1450    36.0%   2788   40.4%
  --. Cheng4 0.36c x64                 2674   11   11  2200    43.6%   2726   41.8%
  35. DisasterArea 1.54 x64            2672   15   15  1300    37.6%   2766   41.8%
  --. Nirvanachess 1.6 x64             2669   18   18  1000    29.4%   2840   34.7%
  36. Rodent 1.6 Build 6 POP x64       2658   14   14  1350    34.6%   2780   36.8%
  37. Crafty 24.1 SSE42 x64            2647   11   11  2350    39.9%   2727   36.6%
  --. EXchess 7.31b x64                2644   16   16  1100    45.0%   2688   39.0%
  38. Glaurung 2.2 JA x64              2635   16   16  1000    47.1%   2655   40.9%
  --. Rodent 1.4 Build 2 POP x64       2631   16   16  1000    46.6%   2655   40.4%
  --. Atlas 3.70em x64                 2629   16   16  1050    44.6%   2674   38.7%
  39. OctoChess r5190 SSE4 x64         2625   16   16  1000    45.9%   2656   45.5%
  40. Rhetoric 1.4.1 x64               2600   13   13  2000    31.9%   2753   35.8%
  --. Andscacs 0.64 POP x64            2597   17   17  1000    41.9%   2657   39.8%
  41. Godel 3.4.9 x64                  2586   17   17  1000    40.4%   2658   39.3%
  42. Djinn 1.021 POP x64              2517   18   18  1000    31.2%   2661   36.6%
  43. ProDeo 1.87 w32                  2510   17   17  1000    30.4%   2661   31.3%   
   

Move average                : 175.64 / 87.82
White advantage             : 38.75
Draw rate (equal opponents) : 46.80%

White Wins   :  20501 (34.8%)
Black Wins   :  14814 (25.1%)
Draws        :  23635 (40.1%)
Unfinished   :      0

White Perf.  :  54.8%
Black Perf.  :  45.2%

ECO A        =  10392 Games (17.6%)
ECO B        =  13991 Games (23.7%)
ECO C        =  12508 Games (21.2%)
ECO D        =  11531 Games (19.6%)
ECO E        =  10528 Games (17.9%)

Parent - By Clemens Keck Date 2015-03-27 09:35
boah! Was ein Projekt, Frank!
Gratulation !

Gruß, Clemens
Parent - - By Peter Martan Date 2015-03-27 10:46
In der Tat beeindruckend!
Parent - By Frank Qy. Date 2015-03-27 11:36
Hallo Clemens, Peter

wirklich sehr aufwendig und oft wollte ich schon hinschmeißen.
Drei Probleme gibt es bei der Buchstellung:

1. Die vielen Zugumstellungen und mithin Einfluss auf Prioritäten. Es gibt gar eine Eröffnung die durch 8 verschiedene Zugumstellungen erreicht wird, bzw. ein wichtiger ECO Code. Habe natürlich die vielen Zugumstellungen überwiegend nicht im Kopf und wenn ich dann an den Prios arbeite verschlimmverbessere ich das eine oder andere. Dann werden diverse Eröffnungen entgegen meiner Maßgabe wieder zu oft oder selten ausgespielt.

2. Unterschiedliche Engine Bewertungen. SmarThink oder ICE bewerten total anders. Wenn ICE dann aus der Eröffnung geht mit +1 und der Gegner sagt dann +0,20 wird es schwierig. Oftmals behält ICE nämlich Recht und die Stellung wirkt kritisch. Selbst 3-5 Züge nach dem Buch nicht zu sehen ob die Variante schlecht ist. Habe auch keine Zeit das alles immer wieder zu analysieren und wenn es gar nicht anders geht greife ich zu meinen realen Eröffnungsbüchern und bringe für die sehr kritischen ECO codes dann längere Zugfolgen (über Zug 12) in das Buch. Geht oftmals nicht anders oder mir würden ECO Codes fehlen. Gute Beispiele sind z. B. auch Eröffnungen aus C30-C39.

3. Durch die vielen neuen Züge, die laufend in das Buch fließen, schleichen sich dann auch immer wieder schlechte Varianten ein. Im Januar habe ich 25.000 neue Züge in das Buch gebracht, hauptsächlich ausgewählte Fernschachpartien und neue GM-Theorie (ca. zu gleichen Teilen).

Die Quote, dass ich derzeit per 100 Partien 1.9% mit "F" deaktivieren muss demotiviert heftig.
Dennoch denke ich mir immer weiter machen.

2 von 100 Partien die ich stetig muss neu spielen lassen ... jede 50zigste Partie = kritische Variante ... zu viel!!

Kleinere Probleme:

- deaktivierte Variante mit "F". Neue Partien kommen hinzu und plötzlich gibt es mehr Untervarianten zu einer deaktivierten mit "F". Das ist echt schei... denn ich prüfe natürlich nicht mehr wenn ich mal mit "F" deaktiviert habe. Diese Geschichten fallen zwar dann auf, wenn ich mal einen ECO Code komplett optimiere oder überprüfe bei den vielen Überprüfungen auch noch stetig auf das selbst gesetzte "F" zu achten, da wirst Du ja dann total bekloppt.

- so richtig bekomme ich mit den Möglichkeiten der Shredder GUI 1. d4 / 1.e4 nicht hin, vernünftig Prios für 1.d4 und 1. e4 zu setzen. 1. d4 als "A" und 1. e4 als "B" ... dann würde das Verhältnis zur aktuellen GM-Theorie stimmen aber es wird mir dann deutlich zu wenig 1.e4 gespielt. Das bekomme ich nicht richtig in den Griff. Daher ist meine Ratingliste etwas zu 1.e4 lastig. Zwecks besserer Optimierung fehlt eine Zwischenstufe zwischen A und B ... bei C wird zu selten ausgespielt. Was solls, muss gehen mit den Möglichkeiten die vorhanden sind.

Was aber richtig perfekt ist:
Spiele ich 1.000 Partien habe ich eine schon fast zu 90% optimale Aufteilung nach Eröffnungen. Es gibt keine doppelten Partien, maximal per 1.000 Partien 4-5 ECO Codes die dann Engines bei 50 Partien Matches doppelt gespielt haben bzw. eine dann bis ca. Zugnummer 8 oder höher doppelt gespielt hat. Das Buch ist mittlerweile so breit und so gut bestückt mit spielbaren Varianten das ein großes Ziel ... ja schon fast beeindruckend ... gelöst ist.

Für mich ist trotz der etwas C00-C99 lastigen Aufteilung ist dennoch alles nahe an der Perfektion.  Im Grunde entspricht das Buch eher der GM-Theorie Prioritäten aus den Jahren 1970-1990. In der modernen Theorie werden C00-C99 und A00-A99 immer seltener gespielt. Alles OK wie ich finde ...

Im Moment filtere ich Varianten aus dem Buch, die zu sehr schnellen Remispartien führen.
Auch sehr aufwendig aber sicherlich lohnend.

In 0.3% der Partien entstehen kurze Remispartien unter 20 Züge.
Diese Quote muss runter auf 0.15% maximal.
Kleiner Schwachpunkt ... aber der ist sicherlich auch bald draußen.
Vielleicht schon kommende Woche.

So ...
Genug des Guten!

Viele Grüße
Frank
Parent - - By Ralf Mueller Date 2015-03-27 10:53
Und was ist dein Spielstil-Eindruck von Pedone? Version 1.0 war mir sehr positiv aufgefallen.
Parent - - By Frank Qy. Date 2015-03-27 11:08
Hi Ralf,

bin mir nicht so sicher!
Hatte auch kaum Zeit richtig zu beobachten.
Einige habe ich nachgespielt.

Endspiel ist nicht so stark wie bei vielen anderen Amateuren. Gerade bei den spielschwächeren in meiner Liste glänzen einige durch ein besonders gutes Endspiel und holen hier die Punkte. Würde mal sagen minimal unterdurchschnittlich. Im späten Mittelspiel sind die Stats bislang eher leicht überdurchschnittlich (im Verhältnis zur Spielstärke). Auffällig die vielen schnellen Verlustpartien, sind derzeit sage und schreibe schon 12 Verlustpartien unter 50 Zügen, gewonnen unter 50 Züge wurde noch keine. Bei den Partien die ich beobachtet habe fällt das auch sehr schön auf. Die Engine spielt eher passiv nach den Eröffnungszügen.

Technisch läuft die Engine sehr gut, gab bislang keine Probleme. Die Zeiteinteilung ist auch gut.

Kein Taktiker, kein Endspielmonster ... aber oftmals überraschend bei dem späten Mittelspiel.
So meine bisherigen Eindrücke.

Fest steht, Level von Crafty wurde überboten, Level von EXchess, Rodent und DisasterArea mit ca. 2660 - 2.675 ca. erreicht. Die Aufnahme in mein FCT1 Turnier mehr als berechtigt. Hier spielen ja, aktuelle Amateure (nicht älter als drei Jahren), Programme die ca. bei 2.900 werden bei dem Turnier ausgegliedert. Im Grunde spielen hier die aktuellen Engines die nach oben stürmen. Junior ist noch drin und wird bald ersetzt. Hoffe auf ein neues Release von Nemo oder OctoChess. Die würden gut in diese Gruppe passen aber wurden länger nicht mehr upgedatet. An Nemo wird offenbar derzeit gearbeitet.

Gruß
Frank
Parent - - By Frank Qy. Date 2015-03-27 12:22
Hallo,

hier der Zwischenstand nach 600 von 1.000 Partien.
Nach meinen üblichen Stats je nach 100 Partien ... nichts auffälliges zu sehen.
Läuft alles normal durch.

Es folgt überigens Rodent 1.7 Build 1 POP x64.
Könnte EXchess und Disaster Area überflügeln.

Das Teilnehmerfeld ist interessant geworden.
Wirklich nur noch die aufstrebenden aktuellen Amateure drin.
Junior hole ich raus sobald die nächste Engine, die ohne Probleme läuft und aktuell ist Crafty überholt hat.
Dann folgt Hiarcs und Naum ... werden ersetzt.

Das spinne ich so lange bis 21 Programme über 2.900 sind und 21 Programme über 2.650.
Dann hätte ich innerhalb eines Feldes von 21 Programme nicht so starke Elo Differenzen und die Ergebnisse werden mit weniger Partien wesentlich besser.
OctoChess und Nemo sind echte Kandidaten. vielleicht wird auch mal Minko oder Booot upgedatet (die Fehler rausgeholt, dann können die bei mir auch spielen).

Hakkapeliitta und Godel auch Rhetoric stehen bei 2.600 Elo. Das finnische Programme stürmt beeindruckend nach oben. Warte hier auf das kommende Update bevor ich teste, könnte dann Junior ersetzen. Wie gesagt, Junior ist bald drei Jahre als und muss raus. Schade eigentlich Junior wie auch Spark sind meine absoluten Lieblinge, spielen so schönes beeindruckendes Angriffsschach nach den Eröffnungszügen wie kaum ein zweites Programm.

Vielleicht gibt es bald auch ein Hiarcs oder Shredder Update wobei ich hoffe das diese dann in die Klasse 2900+ gehen damit ich hier mal 21 voll bekomme. So meine Denke bei der Auswahl der Programme ... will immer mit wenigen Partien bestmögliche Ergebnisse herausholen und wer meine Liste beobachtet wird schnell feststellen, dass wenn 1.000 Partien vorliegen sich kaum noch etwas nennenswertes regt.

Code:
Calculated with EloStat 1.3
Stats after 100, 200 ... games!       Elo   Games  Score  Draws   White Black Points  w/ d/ l
--. Pedone 1.1 BMI2 x64               ----  1.000  --.-%  --.-%   --,-  --,-  --,-   --/--/--
--. Pedone 1.1 BMI2 x64               ----    900  --.-%  --.-%   --,-  --,-  --,-   --/--/--
--. Pedone 1.1 BMI2 x64               ----    800  --.-%  --.-%   --,-  --,-  --,-   --/--/--
--. Pedone 1.1 BMI2 x64               ----    700  --.-%  --.-%   --,-  --,-  --,-   --/--/--
19. Pedone 1.1 BMI2 x64               2675    600  37.5%  42.3%   20,0  14,0  34,0   09/50/41
18. Pedone 1.1 BMI2 x64               2680    500  38.2%  40.8%   24,5  16,0  40,5   22/37/41
19. Pedone 1.1 BMI2 x64               2677    400  37.6%  41.8%   20,5  17,0  37,5   17/41/42
19. Pedone 1.1 BMI2 x64               2677    300  37.7%  42.0%   21,0  19,0  40,0   22/36/42
20. Pedone 1.1 BMI2 x64               2668    200  36.5%  45.0%   18,5  18,5  37,0   14/46/40
20. Pedone 1.1 BMI2 x64               2665    100  36.0%  44.0%   25,0  11,0  36,0   14/44/42

                                      Points  Score  EloS  Ordo  +   -  Draws
01. Naum 4.6 x64                  672.5/0980  68.6%  2890  2893  17 17  38.7%
02. Chiron 2.0 x64                663.0/0980  67.7%  2883  2885  17 17  40.4%
03. Senpai 1.0 SSE42 x64          610.5/0980  62.3%  2844  2844  16 16  43.6%
04. Nirvanachess 2.0a x64         597.5/0980  61.0%  2834  2835  16 16  46.4%
05. Hiarcs 14 WCSC w32            584.5/0980  59.6%  2825  2825  17 17  40.5%
06. Andscacs 0.72 POP x64         573.5/0980  58.5%  2818  2817  16 16  45.6%
07. Junior 13.3.00 x64            532.5/0980  54.3%  2789  2787  17 17  40.7%
08. Deuterium 14.3.34.130 POP x64 502.0/0980  51.2%  2769  2765  16 16  44.9%
09. iCE 2.0 v2240 POP x64         492.0/0980  50.2%  2762  2758  16 16  45.7%
10. Cheng4 0.38 x64               476.5/0980  48.6%  2752  2747  16 16  44.4%
11. Fizbo 1.3.1 x64               475.5/0980  48.5%  2751  2746  16 16  43.6%
12. SmarThink 1.70 SSE3 x64       473.5/0980  48.3%  2750  2745  17 17  41.5%
13. Vajolet2 1.45 POP x64         447.5/0980  45.7%  2732  2726  17 17  42.1%
14. Atlas 3.80 x64                446.0/0980  45.5%  2731  2725  16 16  45.5%
15. Gaviota 1.0 AVX x64           435.5/0980  44.4%  2724  2718  17 17  41.3%
16. Arasan 17.5 POP x64           431.5/0980  44.0%  2721  2715  16 16  44.2%
17. DisasterArea 1.54 x64         386.0/0980  39.4%  2690  2682  17 17  42.7%
18. EXchess 7.51b x64             372.5/0980  38.0%  2680  2671  17 17  42.1%
19. Pedone 1.1 BMI2 x64           225.0/0600  37.5%  2675  2666  21 21  42.3%
20. Rodent 1.6 Build 6 POP x64    365.5/0980  37.3%  2675  2666  17 17  38.9%
21. Crafty 24.1 SSE42 x64         337.0/0980  34.4%  2654  2644  18 18  37.1%
Parent - By Frank Qy. Date 2015-03-27 13:26
Hi,

hier mal ein paar Beispiele für Abweichungen in meiner eigenen Liste.
Diese erkläre ich zunächst natürlich nie mit ErrorBar Schmarn, sondern versuche eher durch das Spielverhalten der Engines Rückschlüsse zu schließen.

Schönes Beispiel derzeit: Senpai
14. Senpai 1.0 SSE42 x64             2830   10   10  3200    53.7%   2805   41.6%
Also nach 3.200 Partien eine Leistung von 2.830 Elo.

Im aktuellen FCT1 Turnier ...
03. Senpai 1.0 SSE42 x64          610.5/0980  62.3%  2844  2844  16 16  43.6%

Wir haben 14 Elo Differenzen innerhalb der eigenen Liste.
Und die Gründe sind so klar ...

Senpai ist taktisch anfällig. Heißt, gegen deutlich stärkere Programme gibt es deutlich schlechtere Ergebnisse.
Schön zu sehen bei der FCT1 Statistik ... 4 Partien gewonnen unter 50 Züge und 10 verloren. Und das wird immer krasser je stärker die Gegner werden. Sind in einem Feld weniger taktisch starke Gegner geht die Senpai Elo nach oben weil die Senpai Stärke mehr und mehr zum Tragen kommt.

Anderes Beispiel:
Vajolet2 1.45 ... lässt keine Chance aus Remis zu machen. Eine der höchsten Remisquoten direkt nach den Eröffnungszügen. In einem Feld mit vielen aggressiven Programmen geht die Vajolet Elo nach unten. Selbst nach 3.000 Partien ging die Elo um 10 nach unten, nach 4.000 Partien dann wieder um 5 nach oben. Testete zuletzt weniger taktische Engines und Vajolet legte zu.

Nächstes Beispiel:
Hannibal spielt sehr stark im Endspiel. Gegen schwächere Gegner, die oftmals auch genau diese Stärke haben geht die Elo nach unten. Gegen stärkere Gegner nach oben. Schrieb zu Andreas Stangmüller noch (er meldete 50 Elo) ... niemals in meiner Liste, maximal vielleicht 30 Elo. Und genau so war es dann ... das war mit Ansage aber auch so was von klar weil Hannibal eine perfekte Engine ist, aus deren Spielverhalten Rückschlüsse zu schließen sind.

Nächstes Beispiel:
Stockfish wird in einem Feld mit weniger schwächeren Gegner ca. 10-15 Elo bessere Resultate erzielen. Die vielen schnellen Remispartien gegen deutlich schwächere (über 7% Quote, Remispartien unter 50 Züge, Komodo 8 hat z. B. knappe 3%) lässt die beeindruckende Dominanz im späten Mittelspiel / Übergang Endspiel nicht so deutlich auftrumpfen in den Listen.

Nur in wenigen Fällen schlägt dann wirklich mal die ErrorBar aus durch zu wenige Partien und zu starke Veränderungen.
Die Gründe sind meist immer ein wenig tiefer zu suchen und finden sich durch einfache logische Erklärungen.

Aber sehr krass verhält sich SmarThink.
Die Engine spielt derart anders als die anderen, dass die Elo laufend um 10 am schwanken ist. Muss mit der Remisquote zu tun haben. Extrem niedrig bis Zug Nummer 50 und noch extrem niedriger bis Zug Nummer 100 und dann geht es rasant nach oben. Ein solches Verhalten hat keine andere Engine. Bedeutet gegen die Stärkeren gibt es deutlichere Packungen und gegen die schwächeren deutlichere Siege. Keine andere Engine hat ein spätes Mittelspiel was so menschenänlich ist wie es SmarThink an den Tag legt. Die Engine simuliert meines Erachtens perfekt den Super-GM in heutiger Zeit.

Schauen wir aber nur auf die ErrorBar Statistik sind und bleiben wir einfach blind und deuten viel zu viel in diese Zahlen rein.

Kennen wir alle diese Umstände können wir gar wild beeinflussen ...

Beispiel:
Fizbo oder IcE Spielstärke geht im Endspiel stark zurück. Beide sind Taktiker bzw. ICE mehr als die aktuelle Fizbo Version (die älteren Fizbo Versionen waren schwächer aber taktisch stärker). Nun kreiere ich ein Turnier mit 10 Engines. Ich nehme 9 die im Endpiel stark sind und ICE. Kann schön mit der FCP Datenbank simuliert werden.

Ergebnis:
ICE ist ca. um 30 Elo schwächer als in meiner Liste nach fast 4.000 Partien.

Und genau das ist das Problem wenn die starken Engines gegen zu ähnlich gleiche Engines gestetet werden (Thema IPP Clones). Es kommt einfach nichts genaues dabei heraus, egal wie viele Partien vorliegen.

Also, mit Spielstilen und mehr Wissen zu den Engines ist vieles nicht nur zu erklären sondern erscheint dann eher total logisch. Große Fragezeichen bei den Abweichungen zwischen den Listen können eher mit einem Ausrufezeichen und der Erklärung deklariert werden. Und wenn wir die Stärken und Schwächen der Engines kennen, ist jede Betrachtung auf eine Liste gar viel spannender.

Gruß
Frank

So, genug jetzt ...
Up Topic Hauptforen / CSS-Forum / FCP Rating List, v. 2.05.s6 & Live-Book

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill