Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Die stärksten klassischen Nicht-NNUE Engines?
- - By Thomas Zipproth Date 2024-02-11 16:05
Kürzlich hatte ich mich gefragt, was denn zur Zeit (oder evtl. für immer) die 3 stärksten Nicht-NNUE Engines sind.
Mir sind nur Stockfish, Komodo und Ethereal eingefallen, also jeweils Engines deren Handcrafted-Evaluation Entwicklung eingestellt wurde.
Also schnell mal ein Round-Robin Turnier zusammen mit der aktuellen NNUE Stockfish Version gespielt, 60+1 auf einem schnellen Rechner.
100 Positionen, 50 balancierte Eröffnungen + 50 UHO.

Code:
  # PLAYER             :  RATING  POINTS  PLAYED   (%)  CFS(%)    W    D    L  D(%)
  1 SF_09.02.24 (NNUE) :   269.0   523.0     600    87     ---  447  152    1    25
  2 SF_31.07.20        :     0.0   323.5     600    54     ---  193  261  146    44
  3 Komodo_14.1        :  -151.0   197.0     600    33     ---   74  246  280    41
  4 Ethereal_12.75     :  -202.0   156.5     600    26     ---   40  233  327    39


Was mich wundert ist der große Abstand der letzten klassischen Stockfish Version zu Komodo 14.1, das 3 Monate später released wurde (02.11.2020)
Ich hatte diese beiden Engines eigentlich näher zusammen in Erinnerung.
Laut CEGT könnte es aber ungefähr passen: Stockfish 11.0 (15.01.2020) : 3457, Komodo 14.1 (02.11.2020) : 3357
Oder gibt es noch Versionen / Engines die mir entgangen sind?
Parent - - By Frank Quisinsky Date 2024-02-11 17:43 Edited 2024-02-11 17:53
Laufzeit: 26.06.2020 - 27.11.2020

Hier ein kleines Turnier ... der TOP-41 bevor es so langsam los ging mit Neural-Network!
Gespielt wurde mit 20+5 Fischer auf 4.9Ghz ... 4.9Ghz war zu dem Zeitpunkt das NON-PLUS-Ultra an Prozesorleistung!
Zeitkontrolle lag deutlich höher als bei CEGT und CCRL.

Code:

  FCP Tourney-2020
  ----------------

  Date           : November 27th, 2020 (08:27)
  Games          : 41.000
  Version        : 50.0, after R50 (final results)
  Elo            : GullChess 3.0 BMI2 x64 = 3035
  Conditions     : http://www.amateurschach.de/main/_fcp-tourney-2020.htm

  Generated with : Ordo 1.2.6 x64 (Ratings for chess and other games)
  https://sites.google.com/site/gaviotachessengine/ordo
  by Miguel A. Ballicora (Argentina)

   # Player                           :      Elo  Games  Score%   won  draw  lost  Points  Draw%   Error   OppAvg   OppE  MoveAvg
  -------------------------------------------------------------------------------------------------------------------------------
  01. Stockfish 11 BMI2 x64           :  3341.82  2.000    83.7  1353   643     4  1674.5   32.1   13.71  3029.12  10.38     81.1
  02. Komodo 14.0 BMI2 x64            :  3271.29  2.000    77.7  1150   809    41  1554,5   40.5   12.57  3030.88  10.41     78.7
  03. Houdini 6.03 Pro x64            :  3261.82  2.000    76.8  1104   865    31  1536,5   43.3   11.55  3031.12  10.44     81.0
  04. Ethereal 12.25 PEXT x64         :  3202.24  2.000    70.7   909  1009    82  1413,5   50.5   10.71  3032.61  10.46     93.0
  05. SlowChess BC 2.2 x64            :  3171.54  2.000    67.2   843  1002   155  1344,0   50.1   10.06  3033.37  10.48     84.0
  06. Fire 7.1 POP x64                :  3169.39  2.000    67.0   818  1042   140  1339,0   52.1   11.17  3033.43  10.45     86.2
  07. Xiphos 0.6 BMI2 x64             :  3147.47  2.000    64.3   755  1064   181  1287,0   53.2   10.57  3033.98  10.46     84.0
  08. Booot 6.4 POP x64               :  3147.06  2.000    64.3   733  1106   161  1286,0   55.3   10.41  3033.99  10.47     77.5
  09. rofChade 2.3 BMI x64            :  3144.36  2.000    64.0   764  1031   205  1279,5   51.5   10.37  3034.05  10.47     89.6
  10. Laser 1.7 BMI2 x64              :  3120.35  2.000    61.0   672  1097   231  1220,5   54.9   10.05  3034.65  10.48     85.8
  -------------------------------------------------------------------------------------------------------------------------------
  11. Shredder 13 x64                 :  3105.01  2.000    59.1   656  1052   292  1182,0   52.6   10.69  3035.04  10.46     85.8
  12. Fritz 17 (Ginkgo) x64           :  3104.82  2.000    59.1   635  1093   272  1181,5   54.6    9.75  3035.04  10.48     85.6
  13. Schooner 2.2 SSE x64            :  3102.45  2.000    58.8   606  1139   255  1175,5   57.0   10.41  3035.10  10.47     86.0
  14. Defenchess 2.2 POP x64          :  3095.96  2.000    58.0   586  1146   268  1159,0   57.3    9.91  3035.26  10.48     91.5
  15. RubiChess 1.7.3 x64             :  3092.23  2.000    57.5   611  1077   312  1149,5   53.9   10.19  3035.36  10.47     88.2
  16. Andscacs 0.95 BMI2 x64          :  3084.43  2.000    56.5   589  1081   330  1129,5   54.0   10.10  3035.55  10.48     84.4
  17. Fizbo 2.0 BMI2 x64              :  3068.55  2.000    54.4   582  1013   405  1088,5   50.6    9.98  3035.95  10.48     88.5
  18. Arasan 22.0 BMI2 x64            :  3038.06  2.000    50.5   490  1038   472  1009,0   51.9   10.25  3036.71  10.47     86.4
  19. GullChess 3.0 BMI2 x64          :  3035.00  2.000    50.0   451  1100   449  1001,0   55.0    9.87  3036.79  10.48     89.6
  20. Fritz 16 (Rybka) x64            :  2998.27  2.000    45.3   397  1016   587   905,0   50.8    9.78  3037.71  10.48     87.7
  -------------------------------------------------------------------------------------------------------------------------------
  21. Pedone 2.0 BMI2 x64             :  2990.00  2.000    44.2   362  1043   595   883,5   52.1    9.91  3037.91  10.48     88.1
  22. Chiron 4 x64                    :  2987.88  2.000    43.9   358  1040   602   878,0   52.0    9.93  3037.97  10.48     88.9
  23. Vajolet2 2.8 BMI2 x64           :  2986.15  2.000    43.7   345  1057   598   873,5   52.9    9.79  3038.01  10.48     88.5
  24. Winter 0.8 x64                  :  2985.57  2.000    43.6   391   962   647   872,0   48.1   10.34  3038.02  10.47     85.0
  25. Wasp 4.00 Modern x64            :  2984.99  2.000    43.5   342  1057   601   870,5   52.9    9.69  3038.04  10.49     88.6
  26. Critter 1.6a x64                :  2974.14  2.000    42.1   353   979   668   842,5   49.0   10.35  3038.31  10.47     89.8
  27. Igel 2.5.0 BMI2 x64             :  2971.80  2.000    41.8   314  1045   641   836,5   52.3    9.99  3038.37  10.48     83.1
  28. Equinox 3.30 x64                :  2971.61  2.000    41.8   305  1062   633   836,0   53.1   10.03  3038.37  10.48     90.4
  29. Nirvanachess 2.4 POP x64        :  2967.71  2.000    41.3   300  1052   648   826,0   52.6   10.03  3038.47  10.48     85.8
  30. Nemorino 5.00 BMI2 x64          :  2954.56  2.000    39.6   323   939   738   792,5   47.0   10.44  3038.80  10.47     89.9
  -------------------------------------------------------------------------------------------------------------------------------
  31. iCE 4.0 v853 Modern x64         :  2945.84  2.000    38.5   292   957   751   770,5   47.9   10.05  3039.02  10.48     85.4
  32. Demolito 2020-05-14 PEXT x64    :  2945.44  2.000    38.5   311   917   772   769,5   45.9   10.53  3039.03  10.46     96.4
  33. Protector 1.9.0 x64             :  2938.85  2.000    37.6   264   978   758   753,0   48.9   10.41  3039.19  10.47     88.0
  34. Hannibal 1.7 x64                :  2934.63  2.000    37.1   260   965   775   742,5   48.3   10.46  3039.30  10.47     91.1
  35. Texel 1.07 BMI2 x64             :  2931.60  2.000    36.8   263   944   793   735,0   47.2   10.27  3039.37  10.47     89.5
  36. Minic 2.33 x64                  :  2929.38  2.000    36.5   269   921   810   729,5   46.0   10.56  3039.43  10.46     84.5
  37. Senpai 2.0 BMI2 x64             :  2910.10  2.000    34.1   220   925   855   682,5   46.3   10.62  3039.91  10.46     88.9
  38. Combusken 1.2.0 x64             :  2896.88  2.000    32.5   204   894   902   651,0   44.7   10.25  3040.24  10.47     86.1
  39. SmarThink 1.98 AVX2 x64         :  2886.62  2.000    31.4   230   794   976   627,0   39.7   10.80  3040.50  10.46     86.9
  40. Monolith 2 PEXT x64             :  2858.99  2.000    28.2   122   885   993   564,5   44.3   11.01  3041.19  10.45     83.0
  -------------------------------------------------------------------------------------------------------------------------------
  41. Rodent IV 0.22 POP x64          :  2851.68  2.000    27.4   129   839  1032   548,5   42.0   11.53  3041.37  10.44     86.9
  -------------------------------------------------------------------------------------------------------------------------------

  MoveAvg (average)           : 174.60 / 87.300
  White advantage             : 48.86  +/- 1.20
  Draw rate (equal opponents) : 62.06% +/- 0.30

  Games        :  41.000 (finished)
  White Wins   :  12.717 (31.0%)
  Black Wins   :   7.944 (19.4%)
  Draws        :  20.339 (49.6%)
  Unfinished   :       0

  White Perf.  : 55.8%
  Black Perf.  : 44.2%

  ECO A00-A99  :   7.427 Games (18.1%)
  ECO B00-B99  :  10.649 Games (26.0%)
  ECO C00-C99  :   7.965 Games (19.4%)
  ECO D00-D99  :   7.910 Games (19.3%)
  ECO E00-E99  :   7.049 Games (17.2%)


Code:
Operating system : Windows 10 Professional x64, - 10 cores -
GUI              : Deep Shredder 12 by  Stefan Meyer-Kahlen
Processor        : Intel® Core™ i9-10900K
                   4.9Ghz, DDR4 32Gb 3200Mhz RAM
Bench            : Intel: Total time= 41.38 seconds, nodes= 087615604, nps= 2117336
                   AMD:
                   Bench results by Wasp 4.00 Modern x64 with 1 core
TalkChess        : U.S. Forum  Thread

Time of tourney  : ~280 games per day = ~146 days
Updates          : Current results will be updated 1-2 times daily
Replay           : Short draws below 20 moves, games over 300 moves
Elo              : 3035 (avg. of 41 participate eng.) set for Shredder 12 GUI
                 : 3035 GullChess 3.0 BMI2 x64 set for Bayes, EloStat, Ordo
Tournament type  : Each one against each other, 50 games per match,
                   820 games per round, 50 x 820 = 41.000 games total
Time control     : 20+5, 20 minutes game + 5 seconds move, "Fischer"
Endgame 4-man    : Syzygy, Nalimov, Gaviota, egbb & Shredderbases
Opening book     : FEOBOS 20.2 Contempt 3 Fix-4, *.bkt for Shredder 12 GUI
Cores            : 1 core, Hyperthreading = off, Large-Pages = off
Settings         : Hashtables = 768Mb, contempt = 0
                   resign = off, ponder = off, learning = off


Viele Grüße
Frank
Parent - - By Frank Quisinsky Date 2024-02-11 17:52 Edited 2024-02-11 18:01
Laufzeit: 04.01.2021 - 10.06.2021

Hier ein weiteres kleines Turnier der TOP-41 ... da waren aber schon ein paar NN Engines (13) am Start!
Dieses Turnier dann mit 40 Züge in 12 Minuten wiederholend auch bei 4.9Ghz.

Zwischen den beiden Turnier lagen nur 35 Tage.
Während also das FCP-Tourney-2020 lief überschlugen sich die Ereignisse.
Daher lies ich dann die die Horde nochmals aufeinander los.
Änderte hierbei nur wenige Turnier-Parameter.

Viele Grüße
Frank

Code:

  FCP Tourney-2021
  ----------------

  Date           : June 19th, 2021 (15:15)
  Games          : 41.000
  Version        : 50.0, after R50 (final results)
  Elo            : Shredder 13 POPCNT x64 = 3125
  Conditions     : http://www.amateurschach.de/main/_fcp-tourney-2021.htm

  Generated with : Ordo 1.2.6 x64 (Ratings for chess and other games)
  https://sites.google.com/site/gaviotachessengine/ordo
  by Miguel A. Ballicora (Argentina)

   # Player                           :      Elo  Games  Score%   won  draw  lost  Points  Draw%   Error   OppAvg   OppE  MoveAvg
  -------------------------------------------------------------------------------------------------------------------------------
  01. Stockfish 110121 NN BMI2 x64    :  3462.29  2.000    88.0  1519   480     1  1759,0   24.0   16.46  3081.84  10.52     79.0
  02. Dragon by Komodo NN AVX2 x64    :  3416.32  2.000    85.0  1404   590     6  1699,0   29.5   14.86  3082.99  10.56     83.2
  03. SlowChess 2.5 NN AVX2 x64       :  3268.86  2.000    71.9  1014   849   137  1438,5   42.5   11.53  3086.68  10.64     87.7
  04. Ethereal 12.75 PEXT x64         :  3266.03  2.000    71.6   969   927   104  1432,5   46.4   11.30  3086.75  10.65     94.3
  05. Nemorino 6.04 NN PEXT x64       :  3206.29  2.000    64.9   808   980   212  1298,0   49.0   10.68  3088.24  10.67     82.9
  06. Igel 2.9.0 NN BMI2 x64          :  3199.97  2.000    64.2   767  1032   201  1283,0   51.6   10.25  3088.40  10.68     80.9
  07. RubiChess 1.9 NN BMI2 x64       :  3193.50  2.000    63.4   764  1007   229  1267,5   50.4   10.73  3088.56  10.66     85.1
  08. Xiphos 0.6 BMI2 x64             :  3185.24  2.000    62.4   719  1057   224  1247,5   52.9   10.50  3088.77  10.67     85.8
  09. Pedone 3.0 NN BMI2 x64          :  3175.43  2.000    61.2   705  1037   258  1223,5   51.9   10.21  3089.02  10.68     84.5
  10. Booot 6.4 POPCNT x64            :  3163.91  2.000    59.8   642  1106   252  1195,0   55.3   10.68  3089.30  10.67     78.0
  -------------------------------------------------------------------------------------------------------------------------------
  11. rofChade 2.3 BMI2 x64           :  3162.71  2.000    59.6   677  1030   293  1192,0   51.5   10.45  3089.33  10.67     89.2
  12. Lc0 0.26.3 NN CPU x64           :  3157.31  2.000    58.9   665  1027   308  1178,5   51.4    9.65  3089.47  10.69     90.1
  13. Defenchess 2.3 dev BMI2 x64     :  3144.81  2.000    57.4   618  1058   324  1147,0   52.9   10.61  3089.78  10.67     89.1
  14. Schooner 2.2 XB SSE x64         :  3132.42  2.000    55.8   571  1089   340  1115,5   54.5    9.95  3090.09  10.68     85.9
  15. Laser 1.7 BMI2 x64              :  3132.03  2.000    55.7   564  1101   335  1114,5   55.0   10.54  3090.10  10.67     86.6
  16. Shredder 13 POPCNT x64          :  3125.00  2.000    54.8   565  1063   372  1096,5   53.1   10.21  3090.28  10.68     85.4
  17. Fritz 17 (Ginkgo) x64           :  3119.74  2.000    54.1   523  1120   357  1083,0   56.0   10.04  3090.41  10.68     85.6
  18. Fizbo 2.0 BMI2 x64              :  3100.57  2.000    51.7   533  1001   466  1033,5   50.0   10.03  3090.89  10.68     85.5
  19. Andscacs 0.95.123 x64           :  3094.79  2.000    50.9   474  1089   437  1018,5   54.5   10.17  3091.03  10.68     88.2
  20. GullChess 3.0 Sy BMI2 x64       :  3072.64  2.000    48.0   439  1044   517   961,0   52.2    9.92  3091.59  10.69     89.3
  -------------------------------------------------------------------------------------------------------------------------------
  21. Wasp 4.50 Modern x64            :  3069.75  2.000    47.7   409  1089   502   953,5   54.5   10.06  3091.66  10.68     84.7
  22. Arasan 22.2 BMI2 x64            :  3052.58  2.000    45.5   370  1078   552   909,0   53.9    9.93  3092.09  10.68     90.0
  23. Winter 0.9 NN BMI2 x64          :  3047.35  2.000    44.8   412   967   621   895,5   48.4   10.10  3092.22  10.68     84.9
  24. Koivisto 4.19 AVX x64           :  3038.23  2.000    43.6   339  1066   595   872,0   53.3   10.28  3092.45  10.68     87.4
  25. Orion 0.8 NN FMA x64            :  3032.97  2.000    42.9   338  1041   621   858,5   52.0   10.34  3092.58  10.67     85.0
  26. Combusken 1.4.0 AMD x64         :  3029.85  2.000    42.5   354   993   653   850,5   49.6   10.03  3092.66  10.68     85.5
  27. Nirvanachess 2.5 POPCNT x64     :  3027.31  2.000    42.2   319  1050   631   844,0   52.5   10.10  3092.72  10.68     85.3
  28. Marvin 5.0.0 NN AVX2 x64        :  3020.84  2.000    41.4   326  1003   671   827,5   50.1   10.50  3092.88  10.67     84.8
  29. Chiron 4 x64                    :  3015.13  2.000    40.6   295  1036   669   813,0   51.8    9.93  3093.02  10.68     85.2
  30. Vajolet2 2.8 BMI2 x64           :  3012.56  2.000    40.3   308   997   695   806,5   49.9   10.38  3093.09  10.67     88.3
  -------------------------------------------------------------------------------------------------------------------------------
  31. Halogen 9 NN PEXT x64           :  3000.43  2.000    38.8   284   984   732   776,0   49.2   10.05  3093.39  10.68     84.4
  32. Seer 1.2.1 NN Skylake x64       :  3000.23  2.000    38.8   282   987   731   775,5   49.4   10.11  3093.40  10.68     82.0
  33. Critter 1.6a x64                :  2994.62  2.000    38.1   295   933   772   761,5   46.6   10.62  3093.54  10.67     88.9
  34. Demolito 2020-12-24 PEXT x64    :  2987.76  2.000    37.2   272   945   783   744,5   47.3   10.35  3093.71  10.67     98.2
  35. chess22k 1.14 JAVA x64          :  2974.91  2.000    35.6   224   978   798   713,0   48.9   10.45  3094.03  10.67     86.6
  36. Texel 1.08a13 BMI2 x64          :  2969.13  2.000    35.0   246   906   848   699,0   45.3   10.70  3094.17  10.67     88.0
  37. Hannibal 1.7 x64                :  2966.85  2.000    34.7   225   937   838   693,5   46.9   10.77  3094.23  10.66     89.0
  38. Protector 1.9.0 x64             :  2954.91  2.000    33.3   200   930   870   665,0   46.5   10.47  3094.53  10.67     89.0
  39. iCE 4.0 v853 Modern x64         :  2949.39  2.000    32.6   212   880   908   652,0   44.0   10.56  3094.67  10.67     83.0
  40. pirarucu 3.3.5 JAVA x64         :  2908.58  2.000    28.0   150   819  1031   559,5   41.0   11.28  3095.69  10.65     81.0
  -------------------------------------------------------------------------------------------------------------------------------
  41. Topple 0.8.0 Modern x64         :  2902.81  2.000    27.4   147   800  1053   547,0   40.0   11.54  3095.83  10.64     83.4
  -------------------------------------------------------------------------------------------------------------------------------

  MoveAvg (average)           : 174.06 / 87.030
  White advantage             : 59.25  +/- 1.27
  Draw rate (equal opponents) : 61.66% +/- 0.31

  Games        :  41.000 (finished)
  White Wins   :  13.352 (32.6%)
  Black Wins   :   7.595 (18.5%)
  Draws        :  20.053 (48.9%)
  Unfinished   :       0

  White Perf.  : 57.0%
  Black Perf.  : 43.0%

  ECO A00-A99  :   7.883 Games (19.2%)
  ECO B00-B99  :   9.153 Games (22.3%)
  ECO C00-C99  :   9.111 Games (22.2%)
  ECO D00-D99  :   7.046 Games (17.2%)
  ECO E00-E99  :   7.807 Games (19.0%)


Code:

Operating system : Windows 10 Professional x64, - 10 cores -
GUI              : Deep Shredder 13 by  Stefan Meyer-Kahlen
Processor        : Intel® Core™ i9-10900K
                   4.9Ghz, DDR4 32Gb 3200Mhz RAM
Bench            : Intel: total time= 65.38 seconds, nodes= 138240203, nps= 2114406
                   AMD:
                   Bench results by Wasp 4.50 Modern x64 with 1 core
TalkChess        : U.S. Forum  Thread

Time of tourney  : ~260 games per day = ~158 days
Updates          : Current results will be updated each 30 minutes (Fling FTP)
Replay           : Draws below 20 moves, games over 300 moves, time loses
Elo              : 3091 (avg. of 41 participate eng.) set for Shredder 13 GUI
                 : 3125 Shredder 13 POPCNT x64 set for Bayes, EloStat, Ordo
Tournament type  : Each one against each other, 50 games per match,
                   820 games per round, 50 x 820 = 41.000 games total
Time control     : 40/12, 40 moves in 12 minutes "repeatedly"
Endgame 5-man    : Syzygy, Nalimov, Gaviota, egbb & Shredderbases
Opening book     : FEOBOS v20.1 Contempt 3-5 tuned v2, *.bkt for Shredder 13 GUI
Cores            : 1 core, Hyperthreading = off, Large-Pages = off
Settings         : Hashtables = 768Mb, contempt = x (default eng. settings)
                   resign = off, ponder = off, learning = off
Parent - - By Frank Quisinsky Date 2024-02-11 18:04
Short-Game Statistik vom FCP-Tourney-2020

Code:

Statistics to short won / draw games:
After round 50 out of 50 (final results) = 2.000 games per engine

++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

2.242 of 41.000 = 5,469% : Fast won/lost games below 60 moves (with mate ended)
1.488 of 41.000 = 3,630% : Fast draw games below 40 moves

                                  won59 lost59 draw39        won59w won59b lost59w lost59b
01. Stockfish 11 BMI2 x64           243      0     71           172     71       0       0
02. Komodo 14.0 BMI2 x64            172      0     83           125     47       0       0
03. Houdini 6.03 Pro x64            164      0     56           110     54       0       0
04. SlowChess BC 2.2 x64            121      3     98            85     36       0       3
05. Booot 6.4 POP x64               115      0    105            88     27       0       0
06. Ethereal 12.25 PEXT x64         115      1     71            79     36       1       0
07. Xiphos 0.6 BMI2 x64             103      3     84            75     28       0       3
08. Fizbo 2.0 BMI2 x64               96     31     66            62     34      10      21
09. Andscacs 0.95 BMI2 x64           90      9     81            54     36       3       6
10. Schooner 2.2 SSE x64             80      5     84            55     25       4       1
11. Defenchess 2.2 POP x64           76      6     85            50     26       0       6
12. Laser 1.7 BMI2 x64               71      2     89            45     26       1       1
13. Fire 7.1 POP x64                 69      5     96            48     21       1       4
14. rofChade 2.3 BMI x64             67     13     70            44     23       3      10
15. Fritz 17 (Ginkgo) x64            65     19     78            38     27       6      13
16. Arasan 22.0 BMI2 x64             44     31     77            31     13      13      18
17. Shredder 13 x64                  43     20     71            29     14       1      19
18. Chiron 4 x64                     43     33     69            29     14       9      24
19. Pedone 2.0 BMI2 x64              43     39     57            26     17      12      27
20. RubiChess 1.7.3 x64              40     19     83            23     17       6      13
21. Wasp 4.00 Modern x64             34     12     81            23     11       3       9
22. Vajolet2 2.8 BMI2 x64            31     26     82            24      7       7      19
23. Critter 1.6a x64                 26     70     64            17      9      28      42
24. Nemorino 5.00 BMI2 x64           25     77     55            21      4      28      49
25. Winter 0.8 x64                   25    129     57            13     12      35      94
26. Texel 1.07 BMI2 x64              24     70     63            19      5      21      49
27. Igel 2.5.0 BMI2 x64              24     80     94            16      8      24      56
28. Demolito 2020-05-14 PEXT x64     22     52     35            17      5      11      41
29. GullChess 3.0 BMI2 x64           21     52     76            19      2      15      37
30. iCE 4.0 v853 Modern x64          19     84     72            15      4      26      58
31. Fritz 16 (Rybka) x64             18    118     68            11      7      33      85
32. Protector 1.9.0 x64              17     70     77            11      6      22      48
33. Nirvanachess 2.4 POP x64         16     65     87             9      7      20      45
34. Equinox 3.30 x64                 15     93     59            10      5      27      66
35. Rodent IV 0.22 POP x64           11     85     70            10      1      28      57
36. Senpai 2.0 BMI2 x64              11    144     63             6      5      54      90
37. Minic 2.33 x64                   11    155     65             7      4      42     113
38. SmarThink 1.98 AVX2 x64          11    211     49             5      6      65     146
39. Hannibal 1.7 x64                 10     86     59             6      4      29      57
40. Combusken 1.2.0 x64               8    193     54             4      4      60     133
41. Monolith 2 PEXT x64               4    130     72             3      1      56      74

++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

  654 of 41.000 = 1,596% : Fast won/lost games below 50 moves (with mate ended)
  525 of 41.000 = 1,281% : Fast draw games below 30 moves

                                  won49 lost49 draw29        won49w won49b lost49w lost49b
01. Stockfish 11 BMI2 x64            64      0     30            46     18       0       0
02. Houdini 6.03 Pro x64             52      0     13            37     15       0       0
03. Komodo 14.0 BMI2 x64             50      0     31            35     15       0       0
04. Booot 6.4 POP x64                38      0     26            31      7       0       0
05. SlowChess BC 2.2 x64             32      0     28            23      9       0       0
06. Ethereal 12.25 PEXT x64          32      0     33            25      7       0       0
07. Xiphos 0.6 BMI2 x64              31      0     29            20     11       0       0
08. Fizbo 2.0 BMI2 x64               30      6     14            15     15       1       5
09. Schooner 2.2 SSE x64             25      1     29            17      8       1       0
10. Andscacs 0.95 BMI2 x64           25      3     25            17      8       1       2
11. Defenchess 2.2 POP x64           21      0     33            15      6       0       0
12. Fritz 17 (Ginkgo) x64            21      1     24            14      7       0       1
13. Fire 7.1 POP x64                 20      2     35            14      6       1       1
14. Laser 1.7 BMI2 x64               19      0     41            10      9       0       0
15. rofChade 2.3 BMI x64             19      4     27             9     10       1       3
16. Chiron 4 x64                     15      4     20            12      3       1       3
17. Wasp 4.00 Modern x64             13      4     25            11      2       1       3
18. Critter 1.6a x64                 12     17     22             8      4       6      11
19. Winter 0.8 x64                   12     31     23             6      6       4      25
20. RubiChess 1.7.3 x64              11      0     27            10      1       0       0
21. Pedone 2.0 BMI2 x64              11      7     18             4      7       2       5
22. Shredder 13 x64                   9      5     26             7      2       0       5
23. Arasan 22.0 BMI2 x64              9      6     26             6      3       2       4
24. Nemorino 5.00 BMI2 x64            9     18     18             8      1       8      10
25. Vajolet2 2.8 BMI2 x64             8     10     33             8      0       2       8
26. Texel 1.07 BMI2 x64               7     18     23             6      1       5      13
27. Igel 2.5.0 BMI2 x64               7     30     28             5      2       8      22
28. Protector 1.9.0 x64               6     19     36             4      2       4      15
29. Demolito 2020-05-14 PEXT x64      5     11      8             3      2       3       8
30. Nirvanachess 2.4 POP x64          5     13     29             3      2       1      12
31. GullChess 3.0 BMI2 x64            5     15     19             5      0       5      10
32. iCE 4.0 v853 Modern x64           5     20     35             4      1       9      11
33. Equinox 3.30 x64                  4     26     27             4      0       9      17
34. SmarThink 1.98 AVX2 x64           4     43     20             1      3      14      29
35. Senpai 2.0 BMI2 x64               4     49     19             3      1      17      32
36. Fritz 16 (Rybka) x64              4     52     21             2      2      15      37
37. Hannibal 1.7 x64                  3     26     22             3      0       7      19
38. Minic 2.33 x64                    3     52     21             2      1      12      40
39. Rodent IV 0.22 POP x64            2     21     29             2      0       4      17
40. Monolith 2 PEXT x64               2     28     34             2      0      10      18
41. Combusken 1.2.0 x64               0    112     23             0      0      39      73
Parent - - By Frank Quisinsky Date 2024-02-11 18:05
Short-Game Statistik vom FCP-Tourney-2021

Code:

Statistics to short won / draw games:
After round 50 out of 50 (final results) = 2.000 games per engine

++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

2.549 of 41.000 = 6,217% : Fast won/lost games below 60 moves (with mate ended)
1.318 of 41.000 = 3,215% : Fast draw games below 40 moves

                                  won59 lost59 draw39        won59w won59b lost59w lost59b
01. Stockfish 110121 NN BMI2 x64    333      0     31           219    114       0       0
02. Dragon by Komodo NN AVX2 x64    257      0     28           178     79       0       0
03. SlowChess 2.5 NN AVX2 x64       162      7     39            80     32       2       5
04. Pedone 3.0 NN BMI2 x64          127     16     66            97     30       9       7
05. Ethereal 12.75 PEXT x64         102      4     55            64     38       0       4
06. Booot 6.4 POPCNT x64             99      7     88            71     28       3       4
07. Xiphos 0.6 BMI2 x64              92     10     79            62     30       1       9
08. Fizbo 2.0 BMI2 x64               87     24     69            69     18       8      16
09. Defenchess 2.3 dev BMI2 x64      86     22     84            66     20       6      16
10. Wasp 4.50 Modern x64             81     15     92            62     19       2      13
11. RubiChess 1.9 NN BMI2 x64        79      9     79            53     26       2       7
12. Nemorino 6.04 NN PEXT x64        76     27     70            55     21       4      23
13. Schooner 2.2 XB SSE x64          75      8     59            53     22       2       6
14. Igel 2.9.0 NN BMI2 x64           69     36     97            50     19      11      25
15. Laser 1.7 BMI2 x64               67     19     56            48     19      10       9
16. Andscacs 0.95.123 x64            62     25     64            45     17       8      17
17. Seer 1.2.1 NN Skylake x64        55     70     94            38     17      20      50
18. Fritz 17 (Ginkgo) x64            54     31     74            43     11       2      29
19. Chiron 4 x64                     51     40     56            38     13      17      23
20. rofChade 2.3 BMI2 x64            49     42     69            30     19      10      32
21. Marvin 5.0.0 NN AVX2 x64         39     28     83            23      7      13      15
22. Vajolet2 2.8 BMI2 x64            39     42     50            33      6      10      32
23. Shredder 13 POPCNT x64           37     30     76            26     11      10      20
24. Arasan 22.2 BMI2 x64             37     49     77            30      7      14      35
25. Lc0 0.26.3 NN CPU x64            31     97     68            21     10      22      75
26. Critter 1.6a x64                 29     96     44            25      4      23      73
27. Winter 0.9 NN BMI2 x64           29    117     64            20      9      27      90
28. GullChess 3.0 Sy BMI2 x64        28     77     44            24      4      27      50
29. Combusken 1.4.0 AMD x64          25    108     66            18      7      31      77
30. iCE 4.0 v853 Modern x64          24    110     64            18      6      36      74
31. Orion 0.8 NN FMA x64             24    121     69            22      2      38      83
32. Nirvanachess 2.5 POPCNT x64      23     73     66            12     11      21      52
33. Demolito 2020-12-24 PEXT x64     22     60     27            17      5      17      43
34. chess22k 1.14 JAVA x64           22     82     56            14      8      23      59
35. Koivisto 4.19 AVX x64            22    101     61            14      8      24      77
36. Halogen 9 NN PEXT x64            21    120     70            17      4      40      80
37. Protector 1.9.0 x64              18     80     70            12      6      23      57
38. Texel 1.08a13 BMI2 x64           17     93     49            13      4      40      53
39. pirarucu 3.3.5 JAVA x64          11    248     67            10      1      76     172
40. Hannibal 1.7 x64                  7    128     63             5      2      37      91
41. Topple 0.8.0 Modern x64           6    246     53             4      2      75     171

++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

  769 of 41.000 = 1,876% : Fast won/lost games below 50 moves (with mate ended)
  452 of 41.000 = 1,103% : Fast draw games below 30 moves

                                  won49 lost49 draw29        won49w won49b lost49w lost49b
01. Stockfish 110121 NN BMI2 x64    118      0     10            79     39       0       0
02. Dragon by Komodo NN AVX2 x64     87      0     10            54     33       0       0
03. SlowChess 2.5 NN AVX2 x64        45      0     14            30     15       0       0
04. Pedone 3.0 NN BMI2 x64           39      1     22            32      7       1       0
05. Xiphos 0.6 BMI2 x64              29      1     22            21      8       0       1
06. Booot 6.4 POPCNT x64             29      1     33            21      8       0       1
07. Defenchess 2.3 dev BMI2 x64      29      5     29            21      8       2       3
08. Ethereal 12.75 PEXT x64          27      1     22            19      8       0       1
09. Wasp 4.50 Modern x64             25      1     27            21      4       1       0
10. Fizbo 2.0 BMI2 x64               24      1     26            21      3       1       0
11. Andscacs 0.95.123 x64            23      2     25            16      7       0       2
12. Laser 1.7 BMI2 x64               23      4     20            16      7       3       1
13. Schooner 2.2 XB SSE x64          21      2     23            12      9       1       1
14. Igel 2.9.0 NN BMI2 x64           20     14     35            16      5       4      10
15. Seer 1.2.1 NN Skylake x64        20     20     29            14      6       9      11
16. RubiChess 1.9 NN BMI2 x64        18      2     21            10      8       1       1
17. Nemorino 6.04 NN PEXT x64        14     10     21            12      3       2       7
18. Marvin 5.0.0 NN AVX2 x64         12      9     25            10      2       1       8
19. Fritz 17 (Ginkgo) x64            12     10     26            10      2       1       9
20. Arasan 22.2 BMI2 x64             11     11     24             9      2       2       9
21. rofChade 2.3 BMI2 x64            11     11     25             6      5       3       8
22. Critter 1.6a x64                 11     28     21             9      2       8      20
23. Shredder 13 POPCNT x64           10      4     23             8      2       2       2
24. Vajolet2 2.8 BMI2 x64            10      8     17             9      1       2       6
25. GullChess 3.0 Sy BMI2 x64        10     21     20             9      1       9      12
26. Chiron 4 x64                      9     12     16             7      2       4       8
27. iCE 4.0 v853 Modern x64           9     29     24             8      1       8      21
28. Nirvanachess 2.5 POPCNT x64       8     20     27             3      5       5      15
29. Koivisto 4.19 AVX x64             8     25     22             5      3       5      20
30. Orion 0.8 NN FMA x64              8     40     24             8      0      13      27
31. Winter 0.9 NN BMI2 x64            7     35     21             5      2       7      28
32. Combusken 1.4.0 AMD x64           7     38     29             4      3      11      27
33. Halogen 9 NN PEXT x64             7     42     19             5      2      11      31
34. Lc0 0.26.3 NN CPU x64             7     54     11             4      3      11      43
35. Demolito 2020-12-24 PEXT x64      5     25      9             5      0       6      19
36. chess22k 1.14 JAVA x64            4     22     18             3      1       6      16
37. Protector 1.9.0 x64               3     11     32             2      1       3       8
38. Texel 1.08a13 BMI2 x64            3     23     16             3      0       9      14
39. Topple 0.8.0 Modern x64           2     93     19             2      0      29      64
40. Hannibal 1.7 x64                  1     27     21             1      0       7      20
41. pirarucu 3.3.5 JAVA x64           1    117     26             0      1      29      78
Parent - - By Frank Quisinsky Date 2024-02-11 18:11 Edited 2024-02-11 18:28
Ich finde Turnier deutlich besser als pure Ratinglisten, bei denen über verschiedene Engine Generationen zusammengemixt wird.
Das spiegelt besser die Entwicklung wieder.
Ferner ist es immer gut wenn möglichst viele Engines gegeneinander die gleiche Anzahl an Partien haben.

Mache ich im Grunde schon seit der Schachcomputer-Ära so.
So kann ich mir auch jede Frage in der History des Computerschachs selbst beantworten.

Nur gab es früher natürlich nicht die Hardware von heute.
Daher habe ich früher dann immer nur für einen begrenzten Zeitraum Ratinglisten erstellt.

Könnte die Daten mal alle zusammenkramen ...
Müssten insgesamt, also alles was produziert wurde ...
Ca. so viele Partien sein wie die CEGT und CCRL zusammen bei 40/40 CCRL oder 40/20 CEGT.
Mache das ja auch schon deutlich länger als die beiden Listen existieren.

Ca. seit 2010 sind es 1.7 Millionen Partien.
Davor müssten nochmals ca. 1.2 Millionen Partien zusammenkommen.
Und das waren alles keine Blitzpartien.
Das Problem ist das viele der 1.2 Millionen Partien in Winboard Zeiten zusammengekommen sind.
Und da spielten auch nicht freie Engines mit, sehr viele private Versionen, teils auch völlig unbekannt.
Daher habe ich nie veröffentlicht.

Das war in MS-DOS Zeiten nicht anders.
Da testeten wird mit 8 Personen und sendeten uns die Daten per Post zuerst auf Disketten zu, später auf CD-Rom.

Nicht anders war es in der Schachcomputer-Ära.
Wir testeten mit 18 Personen, meist interessierte aus Neuss / Düsseldorf.
Es ist traurig, zwei sind noch am Leben und ich hoffe einer von denen übersteht eine derzeit schwere Krankheit.
Seinerzeit war ich mit Abstand der Jüngste!

Das sind alles so Geschichten, wie z. B. auch die Arena Zeit.
Ich schaue nicht so gern in meine Aufzeichnungen bzw. gesammelten Daten!
Parent - - By Thomas Zipproth Date 2024-02-11 19:04
Danke für die Tabellen und diese Erzählung.
So ungefähr scheinen die Reihenfolge und Abstände bei meinem Turnier zu stimmen.
Houdini hatte ich ausgenommen, aber es spielt wohl auch keine große Rolle mehr.

Ja, früher hatte man oft unglaublich viel Zeit und Arbeit investiert, aber es ist halt ein Hobby.
Und vieles was man gemacht hat ist nicht bekannt oder verschwindet selbst aus der eigenen Erinnerung.
Parent - By Frank Quisinsky Date 2024-02-11 19:16
Genau so ist es.
Vieles habe ich wirklich schon längst vergessen.

Das ist ein kleines Problem, nicht das vergessen ...
Eher, das so viele schöne Kontakte nicht mehr vorhanden sind.
Auch wenn es reichlich schöne Kontakte gibt, so vermisse ich viele Personen aus dem Computerschachbereich.

Noch krasser ist es bei meinem anderen Hobby, der Verkehrsluftfahrt.
Da war ich auch einst einer der Jüngsten und ich glaube der Kreis der Spotter war schon früher gefühlt deutlich älter als der Kreis der Computerschächler.

Der Lauf der Zeit ...

Zuletzt, also vor der NN-Ära haben mich selbst folgende Engines beeindruckt:
Booot, Xiphos, Laser, Fizbo, Andscacs, Chiron ...
Auch Pedone aber da Revenge spielt ...
Insbesondere dann Booot und Pedone (neben Wasp).

Die spielen heute wieder und sind einfach nicht klein zu kriegen ... diese verflixten Engines, diese!
https://www.amateurschach.de/fling/index.html
Parent - - By Peter Martan Date 2024-02-11 17:53 Upvotes 1
Du meinst natürlich Engines, die noch ganz ohne NNUE ausgekommen sind, zu denen fiele mir höchstens noch Hiarcs 15.2 ein und eventuell noch Shredder 13, aber die werden natürlich beide mit denen, die du getestet hast, nicht ganz mithalten können.
Wenn du Engines meinst, bei denen man die NNUE- Unterstützung auch noch abdrehen kann, dann wäre Dragon auch in der letzten Version ein Anwärter und bei den SF- Branches ist ShashChess immer noch mit der UCI- Option NNUE off versehen, von dem ist übrigens gerade wieder ein neues Update 34.6 herausgekommen.
Parent - - By Thomas Zipproth Date 2024-02-11 18:50 Upvotes 1
Danke für den Hinweis, Engines mit abschaltbarem NNUE wären natürlich auch relevant.

Die Frage ist ob nach NNUE dort noch viel in die Handcrafted Evaluation investiert wurde, wahrscheinlich nicht.
Eine Verbesserung der Baumsuche kann sich positiv auswirken,
aber bei Stockfish hat soweit ich weiß die Anpassung der Baumsuche an NNUE zu einer Verschlechterung des Spiels ohne NNUE geführt.
Aber ausprobieren könnte ich die erwähnten Engines bei Gelegenheit mal.
Parent - - By Peter Martan Date 2024-02-11 19:07 Edited 2024-02-11 19:11
Thomas Zipproth schrieb:

Die Frage ist ob nach NNUE dort noch viel in die Handcrafted Evaluation investiert wurde, wahrscheinlich nicht.

Bei Dragon sowohl als auch bei ShashChess gab's und gibt's ja schon lange alle möglichen Parameter, die Eval und Suche für den User veränderbar zu machen und bei beiden auch eine alternativ wählbare MCTS.
Bei beiden legen (legten, Kaufman hat ja mit Dragon aufgehört) die Autoren Wert auf adaptierbare Personalities und eine an menschliche Anforderungen anpassbare Spielstärke- Skalierbarkeit. Bei bestimmten Stellungen war ja hingegen auch SF selbst bis zuletzt, bevor die HCE dann ganz abgeschafft wurde, mit besserem zeitlichem Output- Verlauf mit NNUE off als mit NNUE- Nutzung unterwegs, oft auch was die Mattsuche anging z.B., ansonsten auch hauptsächlich bei Stellungen mit schon starkem einseitigem Vorteil (in Zeiten der Hybrid- Eval wurde in diesen Stellungen ja automatisch hard coded evaluiert) und eher weniger praxisnahen komponierte anti- engine- puzzles. Derlei "Stärken" wirken sich im Eng-Eng-Match aus der Eröffnung heraus kaum messbar aus und wenn, dann eher als Nachteil, drum hat man SF die HCE ja auch völlig gestrichen. Was keine Elo im gängigen game playing bringt, verliert mehr und mehr an Interesse.
Parent - - By Frank Quisinsky Date 2024-02-11 19:23 Edited 2024-02-11 19:27
Hi Peter,

eher nicht!
Die "Nicht-NN" Engines sind reizvoller für stärkere Schachspieler, weil auf einem Niveau das deutlich über Super Großmeister liegt.

Daran messen sich auch Vereinsspieler heute noch mit einem viel größeren Eifer (das geht dann bei der Spielstärke runter auf DOS-Ebene oder auch hin- zur CB-Emu Simulation).
Mich erreichen oft Anfragen zu Engines mit klassischer Eval. Eher sehr selten mal zu einer aktuellen NN Engine.

Für Analysen der Vereinspartien nehmen sicherlich die Meisten heute auch einfach nur ein Stockfish auf einem Handy.
Glaube das machen mehr, als sich die NN-Engines herunter zu laden.
Schaue Dich mal in den Vereinen um, denen reicht das.

Also, ich kann das nicht bestätigen.
Ganz sicher ist es aber so bei den wenigen Mohikanern der "Computerschächler", die derzeit die NN-Szene beobachten.

Und vergesse nicht die Hype auf Schachcomputer, die seit einigen Jahren wieder ausgebrochen ist und wild um sich schlägt.
Ein paar ältere Schachcomputer zu besitzen ist für viele Computerschächler der vergangenen Zeit das Maß aller Dinge und gar Vereinsspieler sind auf der Suche nach 1600-2000 Elo bei etwas in die Hand nehmen und auf dem Spielfeld bewegen.

Viele Grüße
Frank
Parent - - By Peter Martan Date 2024-02-11 19:41
Hast schon recht, mit "verlieren an Interesse" meinte ich mehr das (Interesse) der Entwickler, aber bei denen gibt's natürlich auch nicht nur die im SF- und im Lc0- Framework Beteiligten. Sie geben aber halt mit ihren Fortschritten den Ton an, und das ist auch gut so. Nischen gab's und gibt's daneben immer und je mehr ein Mainstream dominiert, umso wichtiger werden auch die weniger im Rampenlicht stehenden Sachen. Und profitieren können im Zeitalter von open sources natürlich auch die Anderen von dem, was an der Spitze stattfindet. ich weiß, dass du das nicht so positiv siehst wie ich, schaden kann's aber meiner Meinung eigentlich nach wie vor nicht, weil ja niemand auf denselben Zug aufspringen muss, wenn er in eine andere Richtung fahren oder gehen will. Der Druck zur Anpassung nimmt ja auch wieder ab, je weniger leicht nachweisbar die Fortschritte ganz oben noch sind mit den 0815- Testmethoden, sowohl in die Höhe als auch in die Breite. Je mehr Engines es werden, die ganz oben ähnlich stark abschneiden, umso weniger Grund haben Programmierer, immer weiter ausschließlich in dieselbe Richtung zu marschieren.
Parent - - By Frank Quisinsky Date 2024-02-11 20:03
Ich finde Open-Source ja überwiegend auch gut. Aber was früher in unzähligen Diskussionen zu beobachten war, dass jede stärkere neue Engine als Clone verschrien wurde. Danach dann die Igorit-Ära, die ja für viele heute noch Bestand hat (Stockfish Clones). Dann kamen die GitHub Seiten und mehr und mehr Open Source Programme. Was früher also verpönt war ist heute Gang und gebe. Heute bedient man sich offiziell der vielen Ideen aus freien Sourcen. Man bedient sich und gibt wieder frei (in der Regel). Das hilft der Entwicklung ungemein aber sorgt auch dafür, dass für viele Personen der Reiz verschwunden ist. Das war schon in Winboard Zeiten zu beobachten als die starken Sourcen von Pepito, Fruit und Glaurung verfügbar waren. Die wurden auch rege genutzt und nicht alle gaben es zu. Mehr und mehr starke Programme, die dann nicht Ähnlichkeiten zu Crafty oder GnuChess hatten, wurden verfügbar. Im Grunde zog sich genau das, also mit oder ohne GitHub, so durch. Und zwischen den ganzen Entwicklungsschritten sind viele Programmierer und Anwender auf der Strecke geblieben, die das eine oder andere nicht gut gefunden haben. Man kann nicht alles schönreden, weil es zu jedem erdenklichen Thema immer ein Pro und Contra gibt.

Früher wurde mehr entwickelt. Programmierer sahen darin auch eine wirkliche Herausforderung genau dabei dann nicht auf freie Sourcen zu schauen.
So viele neue Ideen entstanden dabei.

Auch Stockfish hat beigetragen.
Mehr Spielstärke durch neue Parameter oder ausprobieren von möglichen Parametern auf vielen Systemen.
Das war schon immer so eine Art KI, auch vor Neural-Network.
Stockfish optimierte sich im Grunde von selbst, auch wenn Menschen noch Hand anlegten und für die Vorgaben verantwortlich waren.

Persönlich denke ich das Programmierer, die wirklich in eine Richtung marschieren und Ihrem Entwicklungsgedanken treu bleiben nicht unbedeutend sind oder deren Programme uninteressant sind. Meist sind es Personen, die schon sehr lange dabei sind und lieber selbst entwickeln als sich überwiegend die GitHub Seiten anzusehen. Neural-Network war dann wirklich ein großer Sprung, aber ich vermute ja eher, dass Neural-Network auch ein wenig Illusion ist. Die immensen Steigerungen von Spielstärke verlaufen sich mit immer mehr Bedenkzeit. Würden wir also 20 Jahre später auf Computerschach lauschen, würden wir bei der Hardware, die es dann wahrscheinlich gibt bei klassischer Eval im Vergleich nur noch sehr geringe Zuwächse an Elo beobachten. Für mich ist diese Annahme zu ca. 60% beweisen, bzw. deuten meine Ergebnisse bei immer längeren Bedenkzeiten oder auch Analysen darauf hin. Die Frage ist also, wie es mit Neural-Network weiter geht, vermutlich stehen wir hier wirklich noch ziemlich am Anfang. Computerschach ist also noch lange nicht ausgereizt aber für die zukünftigen Steigerungen gibt es kaum noch Vorstellungsvermögen. Daher glauben auch viele Computerschach wäre ausgereizt oder große Spielstärkesteigerungen sind kaum noch möglich. Das halte ich für einen Trugschluss!
Parent - By Frank Quisinsky Date 2024-02-11 20:11
Also, ich finde Computerschach nach wie vor spannend.
OK, nicht mehr so dramatisch spannend wie noch vor vielen Jahren aber nach wie vor spannend!

Auch zu sehen wie dann neue Generationen an Entwicklern mit den vorhandenen Daten / Informationen / Wissen umgehen und welche neue Ideen hinzukommen.
Das ist der eingeleitete Weg, der aber schon mit freien Protokollen vor vielen Jahren begonnen hat.
Das war der Auslöser für alles was wir heute haben.
Parent - - By Peter Martan Date 2024-02-11 20:43 Edited 2024-02-11 21:11
Frank Quisinsky schrieb:

Daher glauben auch viele Computerschach wäre ausgereizt oder große Spielstärkesteigerungen sind kaum noch möglich. Das halte ich für einen Trugschluss!

Nein, nein, dass keine Spielstärkesteigerungen mehr möglich sind, ist absolut nicht gesagt, kann sein, sie beginnen erst so richtig, das Problem ist die Nachweisbarkeit. Wenn du nicht mehr sagen kannst, ob ein Programm stärker geworden ist, weil's jetzt schon nur mehr Remis oder 1:1 gegen ähnlich starke spielt aus der frühen Eröffnung, kannst du mit dieser Testmethode allein einfach keinen Fortschritt mehr nachweisen, egal, wie groß er noch sein mag.
Computerschach hat noch Hoffnungsgebiete genug, schau dir nur die nach wie vor zahllosen anti-engine-puzzles an (die Art und Anforderung hat sich ein bisschen geändert, man kann einfach immer längere DsTM verlangen und immer längere cyclic zugzwang- positions und muss immer mehr in die Festungen hinein komponieren, aber auf solche Anforderungen können Menschen mit Engine- Unterstützung ja immer besser reagieren, je besser die Engine- Unterstützung und die tbs werden) und wie die besten Engines in Endspielen, von denen man als Mensch meint, die müssten doch klar beurteilbar sein, auch mit guter Hardware- Zeit immer noch Evals abgeben, nach denen man nur vermuten kann, ob sie Remis oder gewonnen bedeuten, und wenn man von diesen zunächst noch von den Engines als unklar evaluierten Stellungen ausspielen lässt, schaut's gleich nach ein paar Zügen viel klarer aus.

Computerschach ist nicht remistod, Eng-Eng-Matches aus frühen Eröffnungsstellungen sind es hingegen schon, weil entweder nimmst du ausgeglichene Stellungen, dann gibt's nur Remis, oder unausgeglichene, und bei denen gibt's jetzt noch ein paar Jahre lang im bunten Mix mit verschieden starken Teilnehmern nachweisbare Performance- Unterschiede, aber schon allein mit der immer größer werdenden Zahl an Engines, die solche unausgeglichenen frühen Eröffnungsstellungen (der Vorteil einer Seite zählt ja umso mehr, je früher in der Eröffnung er vorhanden ist) gegen ähnlich starke nur mehr 1:1 ausspielen, wird das Evalfenster, von dem noch Partiepaare mit einseitigem Gewinn erreicht werden, immer kleiner, bis es schließlich ganz zu geht, dann kannst du aus der Eval der Eröffnungsstellung schon bei einer bestimmten Engine- Paarung sagen, wie das Ergebnis des Partiepaares beim Farbwechsel sein wird.

Eng-Eng-Match aus frühen Eröffnungsstellungen ist remistod, da beißt die Maus jetzt schon keinen Faden mehr ab, und das vor allem wird bald noch deutlich deutlicher, weil selbst wenn die Spitze nicht mehr (auf diese Art messbar) viel stärker wird, je größer die Breite des (in dieser Hinsicht) starken Pools wird, umso deutlicher wird's auch allein dadurch schon, dass mit dieser Art des Testens allein sich die Energie, die man in die weitere Entwicklung und die Fortschrittskontrolle Test stecken muss, für die zu erzielenden Ergebnisse nicht mehr lohnt. Woher soll denn auch eine Rentabilität kommen, wenn man keine Benchmarks als Werbung für die Hardware mehr verkaufen kann und bei noch so großer Gläubigkeit an allgemeine KI für die realistisch auch nichts mehr beitragen kann mit neuronalen Netzen, die für etwas anderes als Schach einfach just gar nix gut sind. Als "Influencer" und YouTuber wird man mit Schach auch keine besseren Geschäfte machen können, wenn man dazu noch bessere Engine- Unterstützung hat. Auch eher im Gegenteil, je mehr Leute zu Hause oder am Handy bei jedem live Spiel schon die Engine mitlaufen lassen können.

Inwieweit sie es (lohnend) dann noch für den menschlichen Schachspieler ist (die weitere Engine- Entwicklung), der nicht primär am Problemschach interessiert ist, wenn die Datenbanken zur Eröffnungstheorie allein schon ausreichen, um sagen zu können, das lohnt bei halbwegs fehlerfreiem Spiel das Ausspielen nicht mehr, und man für diese Erkenntnis also auch gar keine spielenden Engines mehr braucht, das wird sich weisen, aber das betrifft ja beim menschlichen auch nur das Fernschach unmittelbar, und bei dem wird man sich sowieso auch Regeländerungen überlegen müssen und macht's ja auch schon lang genug.
Parent - - By Frank Quisinsky Date 2024-02-11 21:14 Edited 2024-02-11 21:23
Also, diesen Ausführungen kann ich überwiegend zustimmen.

Bis auf eine Kleinigkeit, die ich ein wenig anders sehe (wobei ich natürlich auch falsch liegen kann):
Das bei Eng-Eng so viel Remis endet liegt sicherlich auch an remislichen Eröffnungen aus dem ECO-Code kommend. Und wenn genauer geschaut wird, sind es Systeme, die vieles abtauschen und dann gemächlich und "komplikationslos" in Endspiele münden. Diese werden von so vielen Engines Nahe an der Perfektion beherrscht.

Wo Spielraum ist, ist bei den komplizierten, schärferen Varianten. Auch Eröffnungen, die in der GM-Ära mal mehr oder weniger beliebt waren (hat Gründe), wie z. B. Holländisch oder Skandinavisch sind in vielen Fällen keinesfalls immer gleich Remis. Kann man im Grunde auch schön sehen wenn bei einem Engine-Match ca. 100 Elo Differenz liegen. Auffällig ist, dass auch ruhigere Eröffnungen oder sichere Eröffnungen bei den viele Figuren auf dem Brett verbleiben im Computerschach zu 1:0 und 0:1 Ergebnisse auf höchstem Niveau führen.

Auch ist es so, dass wahrscheinlich bei den aktuell spielstärksten Engines fast alle guten Ideen integriert wurden und auch das zu hohen Remis Quoten führt. Gleiches sorgt für gleiche Resultate auch wenn verschiedentlich durch eigene Ideen untermauert umgesetzt. Das Mittelspiel und das späte Mittelspiel sind voller schöpferischer Ideen und noch lange nicht ausgereizt. Und genau das ist auch nicht so ohne, wie z. B. gerade die Statistiken zu schnellen Gewinnen / Verlusten auf sehr hohem Niveau darlegen. Das sind nicht nur taktische Fehler, die begangen werden. Und wenn taktische Fehler müssen Programme auch in der Lage sein diese auszunutzen. Grundsätzlich kann man sagen, jede Kurzpartie basiert auf einen taktischen Fehler. Finde das ist nicht richtig, weil das ist ja die Stärke einer Engine wenn ein solch taktischer Fehler entlarvt wird. Gerade das ist eine Kunst, die in dieser Entwicklungsphase im Computerschach immer wichtiger wird, um Spielstärke voranzutreiben. Das passiert heute überwiegend noch im Mittelspiel und späten Mittelspiel.

Insofern muss man Statistik oder auch die vielen Remisen heutiger Engines etwas differenzierter betrachten.

Fest steht, es sind bessere Tools notwendig.
Menschen können das nicht mehr im Detail auswerten.
Mutmaßungen und oder Wahrscheinlichkeiten deuten auf etwas hin.
Beweise auf den Tisch ... wenn das mal so einfach wäre!

So langsam lässt mein Forscherdrang nach.
Schwelle erreicht und ehrlich gesagt gehe ich derzeit auch Dingen nach, die mich mehr beschäftigen.
Aber Computerschach generell lenkt ab und ist stets interessant und daher nach wie vor Willkommen!
Parent - - By Peter Martan Date 2024-02-11 21:43 Edited 2024-02-11 21:46
Frank Quisinsky schrieb:

Also, diesen Ausführungen kann ich überwiegend zustimmen.

Bis auf eine Kleinigkeit:
Das bei Eng-Eng so viel Remis endet liegt sicherlich auch an remislichen Eröffnungen aus dem ECO-Code kommend. Und wenn genauer geschaut wird, sind es Systeme, die vieles abtauschen und dann gemächlich und "komplikationslos" in Endspiele münden. Diese werden von so vielen Engines Nahe an der Perfektion beherrscht.

Wo Spielraum ist, ist bei den komplizierten, schärferen Varianten.

Nein, im Gegenteil. Remis aus ausgeglichen ist nur die eine Seite der Medaille. Ganzer Punkt aus "komplizierten", "schärferen" Varianten ist dieselbe oder noch größere Flut.
1 Bauer Vorteil aus früher Eröffnung geht jetzt noch bei SF- Eval, bei Lc0- Eval auch schon nur mehr hin und wieder (weil Lc0 niedriger evaluiert), und er (der eine Bauer) geht, wenn du nicht nur SF- Lc0 spielen lässt.
Wenn du mit kompliziert wirklich die wenigen meinst mit ebenso breitem Spielbaum wie bei ausgeglichenen Stellungen, aber zusätzlich noch dynamisch und am Kippen für eine Seite, ok, aber die musst du in der frühen Eröffnung erst einmal finden.  Kleine aber bereits echt nachweisbare Fehler ganz früh sind für die Spitzenengines mit guter Hardware- Zeit schon klar vorgezeichnete Wege ins Verderben, weil sie meistens die Zahl der Varianten vermindern, forcierter sind, leichter zum gewinnbringenden Vorteil durchzurechnen sind. Man müsste über einzelne Beispiele reden, aber mit einzelnen Beispielen bekommst du keine großen Partiezahlen zusammen, wenn du noch dazu auch nicht noch und noch thematische Dubletten haben willst.

Du kannst größere Vorteile, wenn sie nicht allzu forcierte Abspiele haben, aus späten Eröffnungsstellungen, aus Mittelspielstellungen und aus Endspielstellungen nehmen, im Endspiel ist ein Bauer Eval nix, in der frühen Eröffnung ist er heutzutage schon oft zu viel oder halt doch noch zu wenig, dann wird's Remis. Und beides bei den "schärferen" Stellungen noch mehr als bei den "ruhigen". Weil natürlich können scharfe komplizierte Varianten auch ungefähr gleich schnell durch Vereinfachung ins Remis führen wie in den ganzen Punkt, du hast deine geliebten kurzen Partien, aber sonst hast du von "komplizierten", "schärferen" Varianten just gar nix als alleiniges Kriterium, wie gesagt, man müsste es halt auch an einzelnen Stellungen definieren und nicht mit solchen plakativen Ausdrücken allein, die ja für Engines noch weniger bedeuten als für Menschen.

Es ist wie gesagt in der frühen Eröffnung jetzt schon ein kleines Fenster und es wird schon allein durch die Zahl der Engines, für die es so klein ist, schnell noch kleiner. Auch schon deshalb, weil die Evals von immer mehr Engines schon (oder gerade) in der frühen Eröffnung immer genauer vorhersagen, wie sie sich mit diesen Stellungen beim Ausspielen ins Mittelspiel tun. Sind sie am Anfang richtig, ist's im Mittelspiel schon aus, entweder in die eine oder andere Richtung, gewonnen oder Remis. Im Mittel- und Endspiel sind die falschen Evals noch eher als solche nachweisbar und erkenntlich. Drum würde ich halt mehr mit Mittel- und Endspielstellungen testen, würde genauer und schneller machbar sein, blinde Flecke aufzudecken, und jedenfalls würde es Partiezahlen und Energie sparen. Du hättest endlich wieder mehr von deinen kurzen Partien, die dir so wichtig sind
Parent - - By Frank Quisinsky Date 2024-02-11 21:57 Edited 2024-02-11 22:02
Gut, die Meinung kann man ja vertreten.

Ich bin da eher pragmatisch und bewerte 1:0 / 0:1 anhand von einfacher Statistik.
Wie viele Figuren waren bei Zugzahl X auf dem Feld, die zu 1:0 / 0:1 führen.
Und da sehen die Stats recht eindeutig aus.
Je weniger es sind, desto weniger 1:0 / 0:1 Ergebnisse.
Interessant ist der Umkehrschluss seit Schach-Computer-Zeiten.
Da war es umgekehrt und je stärker die Engines werden, desto mehr 1:0 / 0:1 Ergebnisse gibt es je länger die Leichtfiguren / Schwerfiguren auf dem Feld sind.

Logischer Weise kommen dann die Ergebnisse aus Eröffnungen bei denen möglich lange die Leicht- und Schwerfiguren auf dem Feld verbleiben.
Hinsichtlich der Zugzahl ist entscheidend, wie schnell in der Eröffnung durch Bauernvorstösste geöffnet wird.

Generell hinterlassen späte Figurenabtäusche noch krassere verlustbringende Bauernstrukturen.
Für mich das der Kernpunkt!

Das alles mache ich nicht anhand irgend welcher Einzelstatistiken zu einzelnen Engines aus, sondern bewerte immer möglichst viele Engines die auf einem hohen Niveau liegen.
Das bewerte ich nicht mit 2 oder 3 Engines die dazu tendieren, vieles gleich zu spielen.

---

Zurück zu NN.
Ich glaube noch nicht mal das viele Vereinsspieler Wissen was das genau ist.
Die denken eher wir sprechen über anonyme Personen.

Wie gesagt, die analysieren schnell mit Handy und einem Stockfish, gerade die Schachspieler der jüngeren Generation.

Ich glaube noch weniger wissen was HCE ist.
Wahrscheinlich denken die Meisten an einen Keks- oder Schoko-Riegel aus dem Energiebereich.
Worüber wir hier reden ist also für die meisten Schachspieler eher ein böhmisches Dorf.

Und wenn die unsere Diskussion hier lesen bekommen die Hunger!
Das wird die Wirtschaft ankurbeln, Sonntag Abend sich was zu essen zu besorgen ist teuer.

Kein Bock jetzt auch noch dafür verantwortlich zu sein.
Parent - - By Peter Martan Date 2024-02-11 22:12 Edited 2024-02-11 22:24
Frank Quisinsky schrieb:

Gut, die Meinung kann man ja vertreten.

Ich bin da eher pragmatisch und bewerte 1:0 / 0:1 anhand von einfacher Statistik.
Wie viele Figuren waren bei Zugzahl X auf dem Feld, die zu 1:0 / 0:1 führen.

Meinst du mit 1:0/0:1 wirklich, dass ein- und dieselbe Engine damit einmal gewinnt und einmal verliert? Oder heißt es, die Stellung führt im gesamten Turnier gleich oft zu Gewinn wie Verlust, so eine Stellung würde ich dann erst recht gern als konkretes Beispiel sehen.
Ich tu' mir mit deinen "Stats" immer ein bisschen schwer, weil du ja sowas wie Partiepaare gar nicht spielen lässt oder höchstens, wenn zufällig dieselben beiden Engines mit vertauschten Farben dieselbe  Stellung vom Buch noch einmal vorgesetzt bekommen.
Zitat:

Und da sehen die Stats recht eindeutig aus.
Je weniger es sind, desto weniger 1:0 / 0:1 Ergebnisse.

Soll heißen, je weniger Figuren bei einer Stellung am Brett sind, deso seltener kommt es vor, dass die eine Engine gewinnt und die andere verliert?
Das mag ja sein, aber was hilft dir das jetzt bei der Auswahl der Stellungen, außer, dass du lieber Stellungen nehmen könntest, bei denen weniger Figuren am Brett sind. Dann würde ich halt überhaupt gleich spätere Stellungen nehmen.
Zitat:

Interessant ist der Umkehrschluss seit Schach-Computer-Zeiten.
Da war es umgekehrt und je stärker die Engines werden, desto mehr 1:0 / 0:1 Ergebnisse gibt es je länger die Leichtfiguren / Schwerfiguren auf dem Feld sind.

Das bringt mich wieder zu der Frage, was wohl mit 1:0/0:1 Ergebnissen gemeint sein könnte, in dem Zusammenhang versteh' ich's jetzt noch weniger.
Zitat:

Logischer Weise kommen dann die Ergebnisse aus Eröffnungen bei denen möglich lange die Leicht- und Schwerfiguren auf dem Feld verbleiben.
Hinsichtlich der Zugzahl ist entscheidend, wie schnell in der Eröffnung durch Bauernvorstösste geöffnet wird.

Generell hinterlassen späte Figurenabtäusche noch krassere verlustbringende Bauernstrukturen.
Für mich das der Kernpunkt!

Das alles mache ich nicht anhand irgend welcher Einzelstatistiken zu einzelnen Engines aus, sondern bewerte immer möglichst viele Engines die auf einem hohen Niveau liegen.
Das bewerte ich nicht mit 2 oder 3 Engines die dazu tendieren, vieles gleich zu spielen.

Ohne Beispiele von bestimmten Stellungen wird das nix, Frank. Bitte bring "Stats" zu einer bestimmten Eröffnungsstellung, schön wär' halt anhand von Partiepaaren, wie man das allgemein meint heutzutage, mit Farbwechsel zwischen 2 bestimmten Engines.
Und nicht Paare von verschiedenen Engines zu einer bestimmten Stellung und nicht Paare von Partien zwischen 2 Engines mit verschiedenen Eröffnungen.
Sonst wird's schwer, über die Auswirkung von einer bestimmten Stellung auf eine bestimmte Engine- Paarung bei einer bestimmten Hardware- TC zu reden.
Parent - - By Frank Quisinsky Date 2024-02-11 22:31 Edited 2024-02-11 22:39
Hallo Peter,

halte von Vorgabeeröffnung mit Farbwechsel nicht sonderlich viel.
Hatte ich auch mal ne Zeit gemacht aber es brachte noch weniger als gar nichts!

Damit ich mehr auswerten kann benötigte ich möglich viel zu allen erdenklichen Systemen und nicht wenig mit Farbwechsel zu ein paar auserwählten Systemen.
Finde das dann aber gut wenn ein perfekter Test-Set existiert der ultimativ für viele Engines anwendbar ist.

Man kann heute mit sehr einfachen Mitteln viel sehen, aber geht es tiefer ins Detail wie z. B. zu wichtigen Bauernstrukturen, die fast immer verbleiben bevor es zu Vorteilen auf höchstem Niveau kommt, wird es kompliziert und mithin sehr aufwendig.

Nein, ich meine z. B.:

Bei Zugnummer 30, 35 und 40 (das werte ich aus).
Sind jeweils noch wie viele Figuren auf dem Feld.
Wie viele Spiele enden dann bei wie vielen Figuren auf dem Feld mit 1:0 / 0:1 auf höchstem Niveau.

Das Ergebnis ist immer gleich:
Die Anzahl der 1:0 / 0:1 Partien ist höher wenn bei bei 30 / 35 / 40 Zügen mehr Figuren auf dem Feld sind.

Die 30 / 35 / 40 Kombination ist ausgetüfelt und sorgte für die besten Anhaltspunkte aufgrund meiner wirklich riesigen Datenbanken mit Partien ohne Aufgabefaktor.

Nun kannst Du die Ergebnisse auf die A00-E99 Systeme aufteilen und siehst sofort bei welchen ECO-Codes die Wahrscheinlichkeit zu einem 1:0 / 0:1 höher ist.
Nimmst Du alle hierzu erzeugten Stats fällt sofort auf, dass im Grunde alle Systeme die möglichst lange die Figuren halten für mehr 1:0 / 0:1 Ergebnisse sorgen.

Es fällt auch auf, dass Systeme mit zurückhängenden Bauern dabei sehr schlecht abschneiden (z. B. Benoni).

Das sind jetzt aber Computerschach-Stats die nichts mit menschliches Schach zu tun haben, weil einige Hundert Elo drüber.

Interessant dabei ist zunächst nicht ob es sich um geschlossene oder offene Systeme handelt, Hauptsache viele Figuren auf dem Feld.
Bei den geschlossenen gibt es seltener Kurzpartien aber die Anzahl der 1:0, 0:1 Ergebnisse ist gar höher!!!

---

Nein, je mehr Figuren auf dem Brett möglichst lange verbleiben, desto höher die Wahrscheinlichkeit auf ein 1:0 / 0:1
Verbleiben z. B. sehr lange viele Leicht- und Schwerfiguren sind dann bei den später erfolgten Abtäuschen die Bauernstrukturen teils so schwach das es zu 1:0 / 0:1 Ergebnissen kommt.
Allerdings hängt das oft mit Engine Fehlern zusammen.

Eine Engine ist im Vorteil und sieht ein Remis bei hoher Zugzahl und vielen Figuren auf dem Brett durch 50-Zug Regel.
Die Engine gibt Material vom erreichten Plus und verliert das dann noch oft.

Alles nicht so einfach, wirklich gute Auswertungen anzufertigen.

Fener sind so nur ca. 60% der Partien auswertbar.
Weil es gibt Engine-Fehler, Partien die zu schnell entschieden werden oder durch Unnötiges verzögern (Swindle Mode, unnötige Contempt Faktoren).
Alles Dinge die guten Stats im Weg stehen.

Daher meide ich diese Engines, weil die mir im Grunde gute Stats ruinieren durch untypsiche Verhaltensmuster.

---

Du schreibst:
Das mag ja sein, aber was hilft dir das jetzt bei der Auswahl der Stellungen, außer, ...

Das verstehe ich nicht!

---

Ach so, je stärker die Engines werden, desto weniger 1:0, 0:1 Ergebnisse bei wenigen Figuren auf dem Feld.
Der Umkehrschluss ... durch die Endspielschwäche bei den Schachcomputer war das natürlich früher sehr krass.
Da konntest Du selbst mit großen Nachteil in ein Endspiel als Mensch gehen und konntest locker gewinnen.

Dafür braucht man keine Beispiele!
Das ist einfach erklärt ...

Wenn ich beginne hier sämtliche Stats ins Forum zu posten ...
Damit könnte ich 100 1.000 Seiten Bücher füllen, beschäftige mich ja nicht erst seit gestern mit dem Thema.

Gruß
Frank
Parent - - By Peter Martan Date 2024-02-11 22:55 Edited 2024-02-11 23:03
Frank Quisinsky schrieb:

halte von Vorgabeeröffnung mit Farbwechsel nicht sonderlich viel.

Das Prinzip ist aber halt der way to go, um Partiepaare auswerten zu können, bei denen dieselbe Stellung einmal von der einen Farbe und einmal von der anderen zwischen den jeweils selben Gegnern gespielt wird. So ein Partiepaar geht heutzutage meistens Remis aus, wenn's aus einer ausgeglichenen Stellung zwischen starken Engines auf nicht zu kurzer Hardware- TC ausgespielt wird. Andere als solche ausgeglichene Stellungen sind es wohl, von denen wir reden. Bei denen gehen mittlerweile mehr und mehr 1:1 aus, heißt beide Engines gewinnen für dieselbe Seite, was gegen die "Remisquote" nur dann hilft, wenn du die 1:1- Paare nicht auch als paarweise Remis siehst, was sie aber natürlich de facto sind.
Zitat:

Damit ich mehr auswerten kann benötigte ich möglich viel zu allen erdenklichen Systemen und nicht wenig mit Farbwechsel zu ein paar auserwählten Systemen.
Finde das dann aber gut wenn ein perfekter Test-Set existiert der ultimativ für viele Engines anwendbar ist.

Damit du mehr statistisch belastbares Material zur einzelnen Stellung bekommst, musst du die einzelne Stellung alle Engines mit Farbwechsel spielen lassen, mit mehr Stellungen brauchst du einfach mehr Partien insgesamt, um über die einzelne Stellung gleich gute Daten zu haben.

Zitat:

Nein, ich meine z. B.:

Bei Zugnummer 30, 35 und 40 (das werte ich aus).
Sind jeweils noch wie viele Figuren auf dem Feld.
Wie viele Spiele enden dann bei wie vielen Figuren auf dem Feld mit 1:0 / 0:1 auf höchstem Niveau.

Das Ergebnis ist immer gleich:
Die Anzahl der 1:0 / 0:1 Partien ist höher wenn bei bei 30 / 35 / 40 Zügen mehr Figuren auf dem Feld sind.

Verstehe, du meinst mit 1:0/0:1 Partien offenbar einfach solche, die mit ganzen Punkten enden zum Unterschied von Remis- Partien. Da solltest du dann aber halt bei den ganzen Punkten unterscheiden, wie oft sie für ein- und dieselbe Seite vorkommen, wie oft gleichermaßen von je 2 Engines, die diese Eröffnung einmal mit Weiß spielen und einmal mit Schwarz. Ob es sich um Stellungen handelt, die öfter zu gleichseitigem Gewinn führen, oder um solche, die öfter mit Gewinn für die eine Seite und mit Remis für die andere enden. Das wäre die Frage an die Remis- bzw.- Gewinnstatistik der bestimmten einzelnen Eröffnung.
Und entweder du hast solche Statistiken, dann bring sie bitte für eine bestimmte Stellung, oder du hast sie nicht, dann werden mir deine Stats zu allen möglichen "Stellungstypen" erst recht nichts sagen, wenn du sie nicht wenigstens anhand einer einzelnen bestimmten Stellung erklärst.
Sorry, entweder wir reden über einzelne Stellungen weiter, oder wir lassen's.
Nämlich ich lass' es dann wieder. Mit dem, was Thomas wissen wollte, hat es ohnehin schon wieder länger nichts mehr zu tun.
Parent - - By Frank Quisinsky Date 2024-02-11 23:11 Edited 2024-02-11 23:18
Hallo Peter,

also Partiepaare auswerten ist deswegen schwierig weil die Datenbasis muss abgestimmt sein.
Engines haben Stärken und Schwächen, gerade nach den Eröffnungszügen.

Hast Du also eine Datenbasis an Vorgabestellungen, die nicht auf alle möglichen Stärken / Schwächen Konstellationen abgestimmt ist verwischt jedes Ergebnis, egal wie viele Partien Du erzeugen lässt. Die Methode die ich verfolge, möglich viel aus dem ECO-Bereich bei Eng-Eng abzubilden hat genauso Stärken und Schwächen aber verwischt die Auswertung nicht so stark. Auf Kosten einer höheren Remisquote. Die Frage bei den Remisen ist eher wie werte ich die besser aus. Wie oft versuchte ein Angreifer den schnellen Sieg und die Partie endete dann doch in einer dreifachen. Dazu habe ich z. B. vor einiger Zeit ein paar Auswertungen gemacht, um festzustellen welche Engines sind spekulativ nach den Eröffnungszügen unterwegs.

Selbst 100 oder 500 Vorgabestellungen reichen nach den Möglichkeiten der Eröffnugnstheorie nicht aus.
Insofern sind kleine Vorgaben an Stellungen, die mit weiß oder schwarz abgespielt werden, meines Erachtens nicht sinnvoll.
Es sei denn, ein Test-Set ist gut ausgewogen. Um einen solchen zu erstellen, bei dieser rasanten Entwicklung an Engines, ist das fast nicht möglich.
Versuche das ja aber oftmals stehe ich kurz vor der Aufgabe.

---

Klar, das stimmt natürlich was Du zu belastbaren Material zu einer einzelnen Stellung schreibst aber bevor das wirklich gemacht wird musst Du die wirklich guten Stellungen herausselktieren. Das alleine ist ein Arbeit an der ich seit mehr als 10 Jahren dran bin. Mit dem Ergebnis, dass mir laufend Zweifel kommen wenn ich mir die Ergenisse ansehen. Vieles wird laufend über Board geworfen, dank Neural-Network. Aber Du hast ja die Datenbank mit den 4000 auf 6-Züge gekürzten Positionen. Da steckt alles drin, was durch die Filter gekommen ist, allerdings gekürzt auf 6 Züge.

Wie gesagt, ich kann unmöglich sämtliche Stats ins Forum posten.
Das würden auch sicherlich nur wenige verstehen oder mir ja bestens bekannt ...

Sofort angreifen anstatt drüber nachzudenken!

Und insofern mache ich das derzeit noch für mich bzw. mache ich derzeit nur sehr einfache Dinge die nicht kompliziert sind und habe mal wieder 90% meiner Aktivitäten auf Eis gelegt.
Im Grunde sind meine wesentlichen Fragen auch beantwortet, ob falsch oder richtig ist dabei nicht wichtig.
Nobody is perfect und es machte Spaß ... ist die Hauptsache!

Gruß
Frank
Parent - By Frank Quisinsky Date 2024-02-11 23:22
Doch das hat eine Menge damit zu tun was Thomas wissen wollte.
Neural-Network und HCE ist das Thema!

Glaube mir, dass wird zu einem ganz großen Thema, vielleicht nicht in den nächsten 2-5 Jahren.
Alleine mit KI ist nicht alles lösbar und leider ist vieles was gut war durch Neural-Network über Board geschmissen worden.

Das Geheimnis ist wahrscheinlich wie immer ...
Der gute und gezielte MIX.

Und die Frage von Thomas, konnte ich wie ich denke ... in Perfektion beantworten!
Parent - - By Stefan Pohl Date 2024-02-12 08:56 Edited 2024-02-12 09:04
Peter Martan schrieb:

Computerschach ist nicht remistod, Eng-Eng-Matches aus frühen Eröffnungsstellungen sind es hingegen schon, weil entweder nimmst du ausgeglichene Stellungen, dann gibt's nur Remis, oder unausgeglichene, und bei denen gibt's jetzt noch ein paar Jahre lang im bunten Mix mit verschieden starken Teilnehmern nachweisbare Performance- Unterschiede, aber schon allein mit der immer größer werdenden Zahl an Engines, die solche unausgeglichenen frühen Eröffnungsstellungen (der Vorteil einer Seite zählt ja umso mehr, je früher in der Eröffnung er vorhanden ist) gegen ähnlich starke nur mehr 1:1 ausspielen, wird das Evalfenster, von dem noch Partiepaare mit einseitigem Gewinn erreicht werden, immer kleiner, bis es schließlich ganz zu geht, dann kannst du aus der Eval der Eröffnungsstellung schon bei einer bestimmten Engine- Paarung sagen, wie das Ergebnis des Partiepaares beim Farbwechsel sein wird.


Das stimmt zwar prinzipiell, ist aber trotzdem nicht relevant. Zumindest nicht für uns. Auf Fishtest gibt es mittlerweile ein "UHO-Konzept" Eröffnungsvorgabefile mit Lichess Partien in einem nur 0.05-breiten Bereich mit der Wahrscheinlichkeit für einen Weißsieg von nur 48%-52%. Und das sind noch über 2.6 Millionen verschiedene Endstellungen nach 7-9 Zügen. Ergo: Bis das "UHO Evalfenster zu geht", sind wir alle hier mit Sicherheit schon tot. Insofern ist das für niemanden hier von Relevanz. Ich habe das Computerschach mit meinem UHO-Konzeot in dieser Generation vor dem Remistod gerettet, aber ich bin zuversichtlich, daß es auch in der nächsten Generation einen solchen Remistod-Retter geben wird.

Zudem kommt hinzu, daß ich es für nicht so unwahrscheinlich halte, daß das Computerschach in der baldigen Zukunft komplett umsteuert und nicht mehr Richtung noch mehr Spielstärke, sondern Richtung mehr Aggressivität (=Attraktivität für menschliche Nutzer/Zuschauer) geht. Erst seit es mein EAS-Tool gibt, ist es ja überhaupt möglich, die Aggressivität von Engines statistisch (halbwegs) seriös (und auch schnell!) zu messen und (sehr wichtig!) einen numerischen Wert zuzuweisen. Letzteres macht es dann überhaupt erst möglich, automatisiert das DeepLearning der nnue-Netze (über das numerische "Feedback" des EAS-Tools) an die Aggressivität der Engine zu koppeln, nicht mehr nur an Elo-Erfolg. Ed Schröder, der ja unbestritten ein Genie ist, hat mit seinem Rebel EAS genau das schon mal vorgemacht. Und zwar mit Erfolg: Rebel EAS ist in meiner EAS-Liste in den Einzelstats jeweils die Nummer 3 (nur hinter den beiden Stockfishen), was Opfer und hohe Opfer (3+ Bauerneinheiten) angeht. Und in Ed Schröders Messungen siehts ja bekanntermaßen so aus:

(von Eds Website)
"REBEL-EAS is an in between version based on the same, but more, neural net data as REBEL-16.2  but  heavily modified during the last 5 months in order to make REBEL to play more aggressive and runs as a module under Chess System Tal 2.0  

REBEL 16.2 gains an EAS score of : 80.258
REBEL-EAS gets an EAS score of : 160.569

As a cherish on the cake the playing strength of the neural net has increased with 20-25 elo using balanced positions. Using the TCEC positions composed by Jeroen Noomen and GM Matthew Sadler adds another 26 elo points while the draw rate dropped with almost 20%."

Und Ed hat das nn-Tool, das er dafür geschrieben hat, auch zum Download bereitgestellt. Das heißt nun nichts anderes, als daß auch andere Engine-Entwickler sich Eds und auch mein EAS-Tool einfach runterladen können und dann können auch sie versuchen, ihre nnue-Netze so generieren, daß mehr Aggressivität/Attraktivität herauskommt, ohne die Spielstärke zu zerschießen (hoffentlich).

Da das Computerschach seit den Anfängen in den 1950er Jahre bis heute immer nur das Ziel hatte, die Spielstärke zu erhöhen, ist ein solches Umsteuern nach so vielen Jahren natürlich eine radikale Änderung, die nicht über Nacht stattfinden wird. Es wird eben Leute geben, die voran gehen (Ed Schröder z.B.) und andere, die das als Irrweg, Verrat an der Sache oder ähnliches verdammen werden. So, wie es momentan noch bei den UHO-Eröffnungen der Fall ist. Aber mit der Zeit wird die erste Gruppe immer größer und die zweite immer kleiner. Bei meinen UHO-Eröffnungen ist es bislang zumindest so, insofern hoffe ich mal, daß das auch beim Umsteuern in der Zielsetzung des Computerschachs der Fall sein wird.

Aber daß wir heute (meiner Meinung nach) am Anfang dieses Paradigmenwechsels im Computerschach stehen, ist doch super aufregend für uns alle und unsere Generation.
Parent - By Peter Martan Date 2024-02-12 09:57 Edited 2024-02-12 10:29 Upvotes 1
Und so sehr auch das sehr bewundernswert ist, wie du da methodisch konsequent vorgehst, kann ich dabei nicht umhin zu bemerken, dass auf diese und ähnliche Art die Selektion der als mit mehr oder weniger Fortschritt beurteilten Engines auf genauer und genauer mit dieser Methode gemessen beschränkt wird.
Was ich dennoch oder gerade deshalb nicht glaube: dass es dadurch gelingen wird, die Explosion auch "nur" in dieser Hinsicht ähnlich bis gleich stark gemessenen Engines in ihrer Anzahl überschaubar zu halten, noch, dass sie eine Spitze, wie es sie früher mal gab, noch weiter wird formieren können. Die Spitze wird auch in genau dem einen Test immer breiter und irgendwann werden selbst die so zu einer bestimmten Art von Celo erhobenen Centielo das Ranking nicht mehr zweifelsfrei definieren, wenn du genug Engines mit genug unterschiedlicher Hardware- TC mitspielen lässt, werden die Partiezahlen nicht mehr stemmbar, eine bestimme einzelne Entwicklungsversion von einer besimmten anderen zweifelsfrei zu unterscheiden. Dann musst du irgendwo einsparen, einfachster Weise beim Engine- Pool, den zu zum Vergleich heranziehst.

Man wird weiter Ranglisten haben, aber die Abstände, die man zwischen ihnen misst, sind mehr und mehr auf genau ihre eine Methode beschränkt, nicht nur in ihrer absoluten Höhe, sondern auch in ihren Relationen, die Übertragbarkeit auf andere Tests, andere Engine- Pools (bei denen man einfach einen Teil des im anderen mitspielenden Samples weglässt und dafür andere dazu nimmt), andere Hardware- TCs und andere Eröffnungen immer kleiner wird, das ist ist ja jetzt schon so, die Transitivität sinkt, aber das natürlich umso mehr, je weniger Diskrimination mit dem Ausspielen früher Eröffnungsstellungen an und für sich da ist.

Du züchtest auf deine Art UHO- Engines und EAS- Engines, man kann letztere dann besonders "aggressiv" nennen, mir persönlich ist der Ausdruck für ein rein statistisch sehr umschrieben mit bestimmten Teststellungen und deren Auswertung herauskristallisiertes Performance- Kriterium zu vielsagend. Genau genommen ist es einfach ein bestimmtes Erfolgsergebnis eines bestimmten Tests, der in EAS- Elo gemessen wird zum Unterschied von nicht-EAS- Elo.

Das mag alles sehr sophisticated sein, aber die Beobachtung, dass auch mit noch so genau für den bestimmten Testzweck, für die bestimmten vorhandenen Engines und die praktikable (erschwingliche aber dennoch moderne) Hardware- TC zugeschnittene Methodik, das, was man immer so gern als alte Elosion der overall playing strength bezeichnet hat, mehr und mehr von dieser Übertragbarkeit eines Tests auf einen anderen abtriftet.

Im Endergebnis läuft's auf den selben Remistod hinaus: es gibt noch Messergebnisse, aber wenn man sie untereinander vergleicht, sind nicht einmal die Rankings, geschweige denn die Ratings mit dem vergleichbar, was unter irgendwie auch nur ein bisschen anderen Bedingungen herauskommt.
Es läuft für mich halt auch auf Remis hinaus, weil letztlich ist ja das Prinzip, denjenigen Engines (die sich dahingehend natürlich anhand dieses Tests auch immer mehr nahekommen in ihren Evals der frühen Eröffnungsstellungen) dafür, dass sie das dann quantitativ noch irgendwie unterschiedlich gegeneinander ausspielen, genau die Eröffnungen vorsetzt, die in genau ihr Evalfenster passen, hat man ja zum Schluss auch nur eine Selffulfilling Prophecy untermauert.

Man könnte auch gleich die Eröffnungsstellungen, die sich beim Ausspielen für die engines of interest bewähren, als Teststellungen für sich allein nehmen und die Evals der Engines, die man an ihnen testet, untereinander vergleichen. Die Eval, die dem erwarteten Ausspiel- Ergebnis am nächsten kommt, gewinnt, je nachdem wieviele Engines teilnehmen, mehr oder weniger Punkte, aber ohne sie dann auch tatsächlich in Unmengen von Partien statistisch genau so bis zum Matt oder Remis ausspielen zu müssen.
Tatsächlich mach' ich das ja mit MEA und Eröffnungsstellungen auch so (übrigens auch mit UHO- Stellungen, die eignen sich da sehr gut dazu und man hat sie, dank deiner schönen Dokumentation und Veröffentlichung schon mit Quellen und Eval- Vorsortierung, muss mich gleich mal wieder dafür bedanken) meine Erfahrung ist halt damit die, dass das zwar im Ergebnis dem Ausspielen derselben Engines auch nahe kommt, aber ich würde nicht auf die Idee kommen, dass das je nach Sammlung der Stellungen und Hardware- TC eine ganz bestimmte Art des game playings ersetzt. Falsch, eine einzelne ganz bestimmte sehr umschrieben definierte Art des Ausspielens unter denselben Engines mit ganz bestimmter Hardware- TC schon, aber die ist dann eben auch nur eine einzelne.

Wollte man das, was man früher mal unter overall playing strength im Eng-Eng-Match zu definieren versucht hat (von der ich immer schon gesagt habe, dass es sie nicht als messbare Größe gibt, nicht zwischen Menschen und nicht zwischen Maschinen), mit einer gewissen Vielfalt and Testmethoden in eine Zusammenschau bringen, käme man wohl dennoch zu dem Schluss, dass das Eng-Eng-Match von der frühen Eröffnungsstellung aus remistod ist. Das Pinzip, den Engines entgegen ihrer eigenen Zugwahl (entgegen dem, was sie anhand ihrer eigenen Evals spielen würden) Züge der frühen Eröffnung aufzuzwingen, von denen man schon anhand der Evals relativ sicher weiß, wie sich die Ergebnisse statistisch verhalten werden, das ist im allgemeinen statistischen Sprachgebrauch schon einfach Selection Bias zur Methode erhoben. Wählen sie ab einer gewissen Spielstärke, die mittlerweile schon eine ziemlich breite Basis an Engineanzahl hat, ihre Eröffungen aus der Grundstellung selbst, sieht man den Unterschied sofort als simplen Remistod von der Grundstellung aus. Jetzt die Abweichungen von dieser Nulllinie in der Größenordnung der Abweichung der Evals der in diesem Test besonders erfolgreichen Engines durch das Ausspielen von dazu gerade ausreichend großen Partiezahlen zu bestätigen, ist eigentlich schon einfach eine ziemlich aufwändige Methode eines ausgespielten Stellungstests, vor allem aber wieder nur eines einzelnen solchen Stellungstests. Nehme ich andere Stellungen, für einen von meinen, bekomme ich andere Ergebnisse, nimmst man andere zum Ausspielen, auch. Ebenso sind die Ergebnisse vom Pool an Engines und der Hardware- TC abhängig. Das alles sind halt irgendwie doch mehr oder weniger (aber im Erfolgsfall mehr und mehr) willkürlich getroffene sehr umschriebene Definitionen von "noch nicht ganz tot" bis hin zu "na also, die Hoffnung lebt ja doch noch", auch im Engine- Engine- Match von der frühen Eröffnungsstellung aus. Was man genau so gut sagen könnte: von der Grundstellung aus ist Computerschach remistod, je nachdem, was für Stellungen man für welchen ausgespielten oder nicht ausgespielten Stellungstest verwendet, lebt es weiter, aber es sind halt viele verschiedene Lebensformen

Im Ernst, auch mit den besten UHO- Eröffnungen kriegst du ein Verhältnis von Diskrimination zu error bar nur mit Partiezahlen zusammen, die dir in einem Framework zur Kontrolle einer einzelnen Engineversion mit wirklich großen Mengen irgendwann reichen und für eine Liste von 16 Engines brauchst du nicht ganz so große Mengen für die innerhalb dieser einen Liste unumstrittene Sortierung von Engines, die mitspielen. Aber daraus, dass es überhaupt noch irgendwie für einzelne Listen geht, die sich halt auch im Ranking, nicht nur im Rating nicht mehr aufeinander übertragen lassen, allein schon deshalb nicht, weil in der einen die Ranglistenplätze zwischen mehr oder weniger und anderen Engines verteilt werden, abzuleiten, der Remistod hätte in dieser einen bestimmten Disziplin noch nicht ganz stattgefunden und werde für die nächste Generation auch noch nicht zur Kenntnis genommen werden müssen, naja...
Hardware- Zeit und Stromaufwand wird irgendwann für das, was an Ergebnis herauskommt, halt schon auch ein bisschen hinterfragt werden müssen.
Just my two cents...
Parent - - By Frank Quisinsky Date 2024-02-12 22:50 Edited 2024-02-12 23:22
Hallo Stefan,

nur ist es leider nicht erst so seit es Deine Tool gibt.

Viele Programmierer aus der Vergangenheit versuchten Ihren Engines immer wieder taktische Fähigkeiten zu geben. Bei Phalanx war es lt. Dusan Dobes doch eher ein Zufall. Bei ETChess eher nicht mehr und auch bei Aristarch eher nicht. Allard Siemelink (Spark) hatte dann wie z. B. auch Steen Suurballe (Gandalf) ganz spezielle Ideen, die auch umgesetzt wurden. John Stanback arbeitet auch schon länger daran, im Grunde schon bei Zarkov.

Gut und richtig ist, dass es mit Deinem Tool besser messbar wird und das mit weniger Aufwand als händisch in Kombination mit vorhanden Datenbanksystsemen bzw. anderen Tools. Einige Ideen kamen von Dir auch dazu. Bei den FCP-Tounreys gab es sehr schöne Auswertungen von Klaus Wlotzka und sofern ich mich erinnere, animierte Dich das ein solches Tool zu erstellen. Wie auch UHU. Als wir von den 41.641 alle Positionen mit FEOBOS Contempt 1 herausnahmen, schriebst Du dazu mal, dass doch diese Stellungen mit höherer EVAL auch interessant wären. Sprich, die schlechtesten der 41.614 Positionen. FEOBOS hat ein Bewertungsprogram, welches Klaus Wlotzka entwickelt hat. Jede Stellung wird bewertet und Ferdinand Mosca schrieb ein Tool um die Bewertungen aus Excel heraus für PGN zu sortieren. Kurze Zeit später gab es die UHU-Idee von Dir. Die finde ich persönlich auch gut, aber ehrlich gesagt langweilig beim Zusehen. Interessant hinsichtlich der Messung, ob Engines aus einer schlechteren Position heraus noch ein Remis erzielen können oder gar gewinnen können. Natürlich lässt die Remis Quote nach oder auch der Züge Durchschnitt wird niedriger, wenn mit positiver Vorgabe die Partie startet.

Persönlich bin ich froh, dass es Deine Tools gibt, auch wenn ich die eher seltener einsetze. Ferdinand arbeitete gar mal eine Zeit an einer Statistik GUI, die er aber nach meinem Wissen nicht fertig stellte. Das Thema ist nicht so ohne, gerade wenn komplizierte Ideen einfließen. So erstellte er ja auch bekanntlich viele kleiner Helfer für jenes und dieses.

Maßgeblich für die Aussagen um taktische Stärke ist, der einfache Züge Durchschnitt der Gewinne oder auch die Anzahl der schnellen Gewinne bei denen dann Engines auch die Fehler bei vielen Figuren auf dem Brett ausnutzen. Das messe ich im Grunde seit Winboard Zeiten bei allen meiner Turniere und das der Spielstil immer im Vordergrund stand war genau das eine wichtige Aussage.

Letztendlich stammt die Idee nicht von mir!!

Die Frage, die sich franz. Programmierer in Winboard Zeiten stellten, war allerdings zu interessant. So bin ich nur zu gern auf den Zug aufgesprungen. Insbesondere resultierte alles aus einer Idee von Bruno Lucas (Dragon ... das franz. Programm Dragon). Er war befreundet mit Christian Barreteau (AnMon) und AnMon erspielte erstaunlich viele Kurzpartien und war daher früher bei den Winboard Engines die beliebteste überhaupt (konnte ich an den Download Zahlen auf meiner Winboard Seite schön messen).

Was richtig genial bei dem EAS-Tool ist, das es die starken EVAL-Schwankungen auch bewertet, sofern ich das richtig nachvollziehe. Das ist im Grunde auch nicht neu. Bei der Arena GUI gab es die Idee der Blundersuche. So war Arena in der Lage, ab einer festgesetzten Eval in den Partien Markierungen zu setzen. Auch das war eine Idee in Verbindung mit der Idee von Burno Lucas. Die schnellen Gewinne über die Datenbank selbst einfach zu selektieren anhand von ... wann kam es zu einem gewinnbringenden Vorteil. Deine Tools fassen vieles zusammen, wie z. B. die Ausgabe der schnellen Gewinne nach Zug Nummer x bzw. die Partien werden dann auch in gesonderte Datenbanken gespeichert. Das geht zwar mit ChessBase auch sehr schnell aber Dein Tools ist einfacher und funktionieren, ChessBase ist nicht erforderlich ... hat auch nicht jeder!!

Also, die ganzen Ideen sind alt Stefan, sehr alt.
Allerdings ist noch nie jemand auf die Idee gekommen Engines zu testen mit Vorgabestellungen, die auf klaren Vorteilen beruhen. Das macht im Grunde auch keinen Sinn aber wird in Anbetracht der hohen Remis Quote interessant aus den oben beschriebenen Gründen. Das gleiche Resultat kann auch erzielt werden, wenn deutlich schwächere Engines gegen deutlich stärkere Engines spielen. Das hat den Vorteil, dass die Partien nicht mit schon für eine Seite fast verlorenen Stellungen starten und mithin auch interessanter zu verfolgen sind. Meine persönliche Meinung, ich würde UHU nie und nimmer einsetzen weil ich hätte gar kein Spaß beim Zusehen. Für statistische Zwecke von ultra schnellen Blitzpartien aber ganz sicher ein gutes Mittel zur Zweckerfüllung von Entwicklern.

Möchte Deine Arbeit nicht herunter reden. Viele Programmierer und auch Anwender finden die Ideen ja großartig und nutzen das gerne. Und in Anbetracht dessen das Du Dir selbst eine wahnsinnige Mühe gibst mehr darzustellen als eine bloße und nicht viel aussagende Elo ehrt Dich genau das. Wir haben bzw. hatten immer schon viele Ratinglisten-Systeme aber aus den blanken Zahlen war nie etwas ablesbar. Der Grund warum es ellenlange Spielstilbeschreibungen gab um die User Informationen zu den Engines mit auf dem Weg zu geben. Die Seite der Spielstilbeschreibungen auf den alten Winboard Seiten von mir oder auch in Anfangszeiten übernommen auf der Arena Seite von mir hatte über 2 Millionen Zugriffe.

Selbst versuchte ich auf meinen Webseiten immer Stats hierzu anzubieten, oder für die Leser der Schach-Welt (die alten Spielstilbeschreibungen liegen dort noch). Es gab seit der Zeit als Bruno damit um die Ecke kam also auch immer Spielstilbeschreibungen zu den Engines. In Winboard Zeiten hatte jede Engines gar eine Detailseite und wenn besondere Stärken ersichtlich wurden, wurde gar auf den Detailseiten darauf hingewiesen. Die beruhten auf sehr einfache Züge Statistiken, Anzahl der Figuren auf dem Brett Statistiken etc.. Das war auch gut so, denn es waren wirklich sehr viele Leser der Schachwelt die endlich etwas gefunden haben über Engines und deren Stärken und Schwächen. Gerade die Fernschachspieler nagelten uns und fragten und fragten und gar andere Großmeister die Jörg Hickl gut kannte schrieben und fragten neugierig nach.

Also, so neu sind die ganzen Ideen nicht.
Neu ist ein schönes Tool auf das Du wie ich finde auch zu Recht stolz sein kannst, weil mit Deinen eigenen Ideen gefüttert.
Aber wie gesagt verkaufe es nicht als neue Idee, weil die ist wirklich schon sehr alt.

Das Programmierer immer schon auf solche Statistiken schauten ist auch nicht neu. Neu ist eher das vielleicht mehr Programmierer ein Interesse daran zeigen und froh sind damit vielleicht auch Ihre Programme ein wenig zu optimieren. Ich hoffe und wünsche es mir natürlich, Ed Schröder ist ein gutes Beispiel. Auch hat Ferdinand Mosca eine Reihe von Tools geschrieben, die auch sehr viel selektieren. Diese wurden mit Ferdinand über TalkChess aufgrund Tool-Anfragen entwickelt. Das sind im Grunde auch die Tools, die ich z. B. bevorzugt einsetzen für die Optimierung bei Eröffnungen.

Ferner haben gar schon die Schach-Computer Freaks darauf geschaut welche Schachcomputer aggressiv spielten. Es hatte Gründe warum die Programme von Johan de Koning so beliebt waren oder auch die Spracklen Programme immer mal verblüffendes an den Tag legten. Auch einige Kittinger Programme waren nicht ohne und genau das liebten wir früher. Wir sammelten die Partien gar für die eigenen Vereinszeitschriften.

Auch ChessBase wies schon zu Zeiten von Fritz 1 darauf hin. Fritz 1 war taktisch wie später auch Fritz 5.32 sehr stark. Im Endspiel schwach aber für taktische Analysen bei vollem Brett wurde die Engines immer zu Recht sehr gelobt.  Auch Hegener und Glaser bediente sich der Wünsche Der User und rief Wettbewerbe aus. Wer schlängt einen MM5 am schnellsten in einer Kurzpartie. Ein Event vom Kaufhof im Düsseldorf bei dem es hochwertige Preise gab. Etc. etc., könnte hundert von den Beispielen nennen.

Taktische Stärke messen ist also eine alte Geschichte.
Programmierer arbeiten gar mit vielen Tricks und einige sind mir bekannt.

Dein Tool dafür ist sehr speziell, gut umgesetzt und "Nice to have", für alle Anwender und Programmierer.
Erneut, die ganzen Ideen sind keinesfalls neu und kamen so richtig zum Ausbruch als es darum ging wie kann die Stärke von AnMon ins Licht gerückt werden. Zumindest dachte ich mir dann ... OK, ich starte ganz einfach eine Spielstilbeschreibung für die stärksten der WinBoard Engines. Und hierfür bediente ich mich sehr einfacher Mittel die dann auch später immer mehr ins Detail gingen. Wie z. B. heute bevorzugt an ... wie kann ich mehr über die Bauernstrukturen in Erfahrung bringen. Auch das ist keine Idee von mir. Jörg Hickl schrieb ein Buch darüber und meinte mal zu mir, ihr braucht irgend etwas im Computerschach um das besser auszuwerten, denn genau diese Frage ist der Schlüssel für alles was danach kommt.

Du kannst das ja mal versuchen aber wenn Du Dich damit beschäftigst und alles erdenkliche was wirklich eine wesentliche Rolle einfließen lässt vergehen Monate, wenn nicht Jahre um ein schlüssiges Konzept zu erstellen. Zumindest denke ich mir das wenn ich das Thema wieder anpacke. Ich würde mal sagen sehr komplex und nur in einem Team umsetzbar. Ein Team welches viele gute Schachspieler benötigt und auch Programmierer für die Umsetzung.

Viele Grüße
Frank
Parent - By Frank Quisinsky Date 2024-02-12 23:38 Edited 2024-02-12 23:53 Upvotes 1
Das zog in Frankreich wirklich Kreise.
Ständiges Thema bei den franz. Programmierer, die ja bekanntlich ihre eigene Turniere in Massy oder den franz. Meisterschaften organisierten.

So war auch Franck ZIBI stets interssiert an den Stats zu taktischen Fehlern!!
Wie können taktische Fehler mit UCI festgestellt werden und wie wird es umgesetzt, rein mittels dem UCI-Protokoll?

Franck ZIBI hatte dann einen franz. Studenten an der Hand, der es umbedingt umsetzen wollte für eine wichtige Arbeit während des Studiums.
Er gab ihm die Chance Pharaon dafür zu nutzen und der Student entwickele wirklich einen Schachtrainer / Lehrer als UCI Feature.

Für solche Projekte schrieben auch Martin oder auch ich Bescheinigungen für Lehrkräfte.
Mitgewirkt an folgender Idee ...

Es gab so viele schöne Ideen in dieser Zeit und jeder der wollte konnte sich einbringen und mitarbeiten.
Auch versuchte ich ja lange die Kids vom Computerschach über Schach AGs in den Schulen zu überzeugen.

Kurt Lellinger hat ja das Bundesverdienstkreuz für die Gründung der deutschen Schulschachstiftung erhalten.
Er ist hier aus Trier und brauchte Schach verstärkt in die Schulen. Eine Zeit unterstütze ich sein Vorhaben und half auch die Kinder zum Schach zu bringen.

Reizen konnte ich die immer mit schönen Kurzpartien.
Es gibt hierzu ein schönes Interview bei dem auch der Schach-Tutor von Stefan Meyer-Kahlen abgearbeitet wurde.

Sehr lesenswert, liegt auf den Schach-Welt Seiten.

Kurzpartien, Messung von taktischer Stärke war also immer ein großes Thema.
Oben findest Du ja die Stats vom FCP-Tourney-2020 und FCP-Tourney-2021 ... da gab es Deine Tools z. B. noch nicht.
Und was Klaus Wlotzka umgesetzt hat in Excel war fantastisch, genau auch wie seine Arbeit zum Eröffnugnsprojekt FEOBOS, was Dich seinerzeit ja auch begeisterte,
sofern ich Deine seinerzeitigen Kommentare richtig verstanden habe.

Aber, die beste und schlüssigste Aussage zum Thema kam von Allard Siemelink (Spark).
Er schrieb mir mal ... Frank, wenn eine Engine für sich sieht, sieht die Engine auch gegen sich ... erkennt also den potentiellen Angriff und wehrt ab.
Du musst bei der Bewertung immer die Anzahl der schnellen Verluste mit aufführen.
Wer schnell gewinnen kann wird in der Regel nicht oft schnell verlieren, so Allard.
Wie Recht er hatte und wie deutlich es wird wenn wir mehr Partien produzieren können (im Vergleich zu früher).

Leider misst das Dein Tool z. B. nicht, obwohl es wirklich wichtig wäre genau das festzustellen und auch zu bewerten.
Allard hatte seinerzeit selbst Tools entwickelt, um zu prüfen ob seine Programmierung Früchte trägt.
Spark war seinerzeit der Angreifer bei vollem Brett schlechthin und verlor kaum bis äußerst selten gegen deutlich stärker sehr schnell eine Partie.

Er hat es meines Erachtens hinsichtlich Programmierung dann richtig auf die Spitze getrieben.
Auch Jonathan Kreuzer war stets an diesen Themen interessiert und setze um was geht mit SlowChess (schon früher in Winboard Zeiten).

SlowChess ist nicht ohne Grund das Lieblingsprogramm von John Stanback oder war auch lange Zeit meine bevorzugte Analyse-Engine.
Weil John begeistert war von den Fähigkeiten die Jonathan erarbeite!

Etc, etc. ...
Parent - - By Stefan Pohl Date 2024-02-13 07:17 Edited 2024-02-13 07:44 Upvotes 1
Frank Quisinsky schrieb:


Was richtig genial bei dem EAS-Tool ist, das es die starken EVAL-Schwankungen auch bewertet, sofern ich das richtig nachvollziehe. Das ist im Grunde auch nicht neu. Bei der Arena GUI gab es die Idee der Blundersuche. So war Arena in der Lage, ab einer festgesetzten Eval in den Partien Markierungen zu setzen. Auch das war eine Idee in Verbindung mit der Idee von Burno Lucas. Die schnellen Gewinne über die Datenbank selbst einfach zu selektieren anhand von ... wann kam es zu einem gewinnbringenden Vorteil. Deine Tools fassen vieles zusammen, wie z. B. die Ausgabe der schnellen Gewinne nach Zug Nummer x bzw. die Partien werden dann auch in gesonderte Datenbanken gespeichert. Das geht zwar mit ChessBase auch sehr schnell aber Dein Tools ist einfacher und funktionieren, ChessBase ist nicht erforderlich ... hat auch nicht jeder!!
Also, die ganzen Ideen sind alt Stefan, sehr alt.


Die Idee, sich Eval-Schwankungen anzusehen, um Opfer zu finden ist nicht neu. Das stimmt. Das Problem ist nur, daß meine Tools so leider nicht arbeiten...
Du verstehst überhaupt nicht, wie das EAS-Tool funktioniert. Das erste, was alle meine Tools machen, die auf meiner bahnbrechenden schnellen Opfersuche basieren, also auch das EAS-Tool, ist, alle Kommentare aus den Partien zu löschen, also auch alle Evals, Suchtiefen etc. Meine Tools kommen ohne jede Engine-Eval aus, das macht sie gerade so schnell. Und unabhängig von jeder Engine-Meinung.

Also beurteile gefälligst nicht, welche meiner Ideen neu sind und welche nicht, bevor du die Ideen überhaupt verstehst. Und davon bist du weit entfernt. Was es besonders peinlich macht, ist, daß das EAS-Tool sogar beim Start anzeigt, daß es alle Kommentare aus der pgn-Datei löscht:

@echo *** Check games, fix result-tags and delete all comments for faster computing

Und das ist die erste Befehlszeile dazu. Wer sich mit pgn-extract auskennt, weiß, daß "-C -N -V" alle Kommentare komplett löscht, womit logischerweise alle Evals verschwunden sind:
pgn-extract --quiet --fixresulttags -C -N -V --plycount ../%gamebase% --output newsource.pgn > NUL

Alle Operationen erfolgen danach heraus aus der neu erstellten newsource.pgn Datenbank, die nur noch die Tags und die "nackte" Notation enthält. Tja. Und bei keinem meiner Tools ist eine Schachengine dabei, die irgendwie neue Evals reinrechnet (was sowieso auch viel zu langsam wäre, bei Auswertungen großer Datenbanken). Auch das sieht jeder, der sich die Tools und die dazugehörigen bin-Unterordner mal ansieht.

Alle meine Tools sind ja batch-Dateien, daß heißt der Sourcecode ist ja mit jedem Texteditor einsehbar. Liegt alles offen. Die Opfersuche beginnt im EAS-Tool momentan ab Zeile 303 und umfaßt nur knappe 2 Bildschirmseiten und benötigt nur pgn-extract.
Aber wer nicht reinschaut und/oder nichts versteht, sollte sich an Dieter Nuhr halten: "Wenn man keine Ahnung hat, einfach mal Klappe halten." Oder du redest weiter mit dir selber, das machst du ja in diversen Foren am liebsten. Das Schöne ist, wenn man mit sich selber redet, hat man immer Recht. Also genau dein Ding. Während ich mich weiter aufs "Machen" konzentriere, nicht aufs sinnfreie Foren zutexten. Damit bin ich dann an dieser Stelle auch raus. Dafür ist meine Zeit zu schade.
Parent - - By Frank Quisinsky Date 2024-02-13 07:44
Stefan, etwas weniger aggressiv auftreten wirkt Wunder!
Was man mit PGN-Extract so alles anstellen kann ist in der Tat bekannt. Da gebe Dir absolut Recht!
An diesem Tool arbeitete jemand einige Jahre und dachte sich bei den vielfältigen Möglichkeiten etwas!

Ich beurteile sehr wohl was ich nutzen möchte, sehe bei Deinem Tool einige Dinge die schnell funktionieren
und gut sind. Das schrieb ich Dir ja schon als Du mich gefragt hast ob ich mir Deine Tools ansehen
möchte, einige Ideen von mir hast Du ja dabei umgesetzt.

Schrieb ja, ich nutze es nicht so gern weil Wesentliches für Beurteilungen zur taktische Schlagkraft fehlt
bzw. bei den Ausgaben nicht dargestellt wird.
Parent - - By Stefan Pohl Date 2024-02-13 07:51 Upvotes 2
Frank Quisinsky schrieb:

Stefan, etwas weniger aggressiv auftreten wirkt Wunder!



Ich erklär dir mal, was aggressiv ist: Meine Ideen als "alt, sehr alt" zu verunglimpfen, ohne auch nur die geringste Ahnung zu haben, was meine Ideen überhaupt sind bzw. waren.
Parent - By Frank Quisinsky Date 2024-02-13 07:57
Stefan, dafür bist Du mir aber heute zu sehr "Stiermäßig" unterwegs.
Später vielleicht!
Up Topic Hauptforen / CSS-Forum / Die stärksten klassischen Nicht-NNUE Engines?

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill