Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / CCC Blitz 3/2
- By Peter Martan Date 2024-01-02 13:11 Upvotes 1
Main event:

# PLAYER   : RATING POINTS PLAYED (%)
1 Stockfish: 3622.6 74.5   110    68
2 Torch    : 3592.8 70.0   110    64
3 Dragon   : 3573.6 67.0   110    61
4 Lc0      : 3571.2 66.0   109    61
5 Berserk  : 3524.0 59.0   110    54
6 Ethereal : 3486.8 52.5   109    48
7 Rubi     : 3456.9 48.0   110    44
8 Obsidian : 3453.9 47.5   110    43
9 Caissa   : 3450.8 47.0   110    43
10 Seer    : 3438.4 45.0   110    41
11 Igel    : 3429.0 43.5   110    40
12 Rofchade: 3400.2 39.0   110    35
- By Peter Martan Date 2024-01-06 08:55 Edited 2024-01-06 09:05
Semifinale Halbzeit (478 von 900 Partien):

# PLAYER   : RATING POINTS PLAYED (%)
1 Stockfish: 3569.6 98.5   160    62
2 Torch    : 3543.6 90.5   158    57
3 Lc0      : 3494.4 78.5   160    49
4 Berserk  : 3483.3 75.5   160    47
5 Dragon   : 3482.6 74.5   158    47
6 Ethereal : 3426.6 60.5   160    38


443+444:

[Event "CCC22 Blitz: Semifinals (3|2)"]
[Site "?"]
[Date "2024.01.05"]
[Round "1"]
[White "Torch"]
[Black "Lc0"]
[Result "1-0"]
[ECO "B84"]
[PlyCount "117"]
[EventDate "2024.??.??"]
[EventType "blitz"]
[TimeControl "180+2"]

1. e4 c5 2. Nf3 d6 3. d4 cxd4 4. Nxd4 Nf6 5. Nc3 a6 6. Be3 e6 7. Be2 Qc7 8. Qd2 Nc6 {book} 9. g4 h5 10. Nxc6 (10. gxh5 Nxh5 11. Nxc6 bxc6 12. O-O-O e5 13. Bc4 Rb8 14. Rhg1 Qb7 15. Bb3 Be6 16. Kb1 Be7 17. Bg5 f6 18. Be3 c5 19. Nd5 c4 20. Ba4+ Kf7 21. c3 g5 22. Qe2 Ng7 23. f3 Nf5 24. Bc1 Nh4 25. Rgf1 Rbc8 26. Be3 Ng6 27. Rf2 Bd8 28. a3 a5 29. Ka1 Bh3 30. Qc2 Rb8 31. Rfd2 Be6 32. Rb1 Bh3 33. Rbd1 Nh4 34. Qc1 Be6 35. h3 Ng6 36. Ka2 Rh7 37. Rg1 Rh8 38. Rh1 Nh4 39. Rhd1 Rh7 40. Ka1 Rh8 41. Re2 Ng6 42. Rh2 Nh4 43. Rhd2 Ng6 44. Ka2 Rh7 45. Rh2 Nh4 46. Rf2 Ng6 47. Rfd2 Rh8 48. Rf1 Kg7 49. Rh1 f5 50. Qg1 Nh4 51. Bd1 Kf7 52. Bxg5 Bxg5 53. Qxg5 Bxd5 54. exd5 Rbg8 55. Qe3 Rg3 56. Qe1 f4 57. Qe4 Qc8 58. Bc2 Kf6 59. Bb1 Qc7 60. Rf1 Qc5 61. Rfd1 Kg5 62. Re2 Qc7 63. Ree1 Kh5 64. Rg1 Rhg8 65. Rxg3 Rxg3 66. Bc2 Kg5 67. Re1 Rg2 68. Re2 Rg1 69. Rd2 Rg3 70. Re2 Rg1 71. Rd2 Rg3 72. Rf2 Rg1 73. Re2 Rg3 74. Rd2 Kh5 75. Ba4 Kg5 76. Bc2 Rg1 77. Re2 Kh5 78. Ba4 Kg5 79. Re1 Rg2 80. Bb5 Rg3 81. Rf1 Kh6 82. Ba4 Kg5 83. Bc6 Kh6 84. Bb5 Kg5 85. Bxc4 Nxf3 86. Bd3 Nh4 87. Rd1 Qf7 88. c4 Qa7 89. c5 Qxc5 90. Qh7 Qxd5+ 91. Ka1 Rxd3 92. Rxd3 Qe6 93. Rd1 f3 94. Rg1+ Ng2 95. h4+ Kf4 96. h5 Ne3 97. Qg7 Ng4 98. h6 f2 99. Rf1 Qc4 100. Rxf2+ Nxf2 101. h7 Qf1+ 102. Ka2 Qc4+ 103. Kb1 Qf1+ 104. Ka2 Qc4+ 105. Kb1 Qf1+ 106. Ka2 {½-½ Lc0-Torch CCC22 Blitz: Semifinals (3|2) 2024 (1)}) 10... Qxc6 11. gxh5 Bd7 12. O-O-O Nxh5 13. f4 b5 14. a3 Rb8 15. f5 Nf6 16. fxe6 Bxe6 17. h4 Qb7 18. Qd3 Bc4 19. Qd4 Bxe2 20. Nxe2 Qxe4 21. Qd2 Qc4 22. Bg5 Ne4 23. Qe3 d5 24. Rd4 Qa2 25. Nc3 Qa1+ 26. Nb1 Bxa3 27. bxa3 O-O 28. Rxd5 b4 29. Qxe4 bxa3 30. Kd2 Rxb1 31. Rxb1 Qxb1 32. Qe7 Rb8 33. Rd8+ Rxd8+ 34. Qxd8+ Kh7 35. Qd3+ f5 36. Qxf5+ Kg8 37. Qd5+ Kh8 38. Qd8+ Kh7 39. Qd3+ Kh8 40. Qxa3 Qg1 41. Be3 Qg2+ 42. Kc3 Qf1 43. h5 Qf6+ 44. Bd4 Qf3+ 45. Kb2 Qb7+ 46. Qb3 Qd7 47. Qb6 Kg8 48. h6 Kh7 49. hxg7 Qc8 50. Qf6 Qb8+ 51. Kc1 Qg3 52. Qf5+ Kh6 53. Qf8 Qg5+ 54. Kb1 Kh5 55. g8=Q Qb5+ 56. Bb2 Qxb2+ 57. Kxb2 a5 58. Qf3+ Kh6 59. Qh1# 1-0
- - By Peter Martan Date 2024-01-10 01:00 Edited 2024-01-10 01:13
Semifinale Endstand:

# PLAYER   : RATING POINTS PLAYED (%)
1 Stockfish: 3571.3 185.5  300    62
2 Torch    : 3542.0 170.5  299    57
3 Lc0      : 3498.0 149.0  300    50
4 Dragon   : 3490.0 144.5  299    48
5 Berserk  : 3477.2 138.5  300    46
6 Ethereal : 3421.5 111.0  300    37


Mit dem Gamepairs Rescoring Tool:

   # PLAYER       :  RATING  ERROR  PLAYED    W    D    L   (%)  CFS(%)
   1 Stockfish    :    3500   ----     150   76   69    5  73.7      99
   2 Torch        :    3430     57     150   51   89   10  63.7     100
   3 Lc0          :    3336     55     150   26   95   29  49.0      70
   4 Dragon       :    3321     60     150   27   86   37  46.7      84
   5 Berserk      :    3293     58     150   19   89   42  42.3     100
   6 Ethereal     :    3172     63     150    6   62   82  24.7     ---

-------------------------------------------------------------------
--- Number of all Gamepairs          : 450
--- Number of drawn Gamepairs overall: 245 (= 54.44%)
--- Number of 1:1 drawn Gamepairs    :  68 (= 15.11%)
--- Number of 2-draws drawn Gamepairs: 177 (= 39.33%)
Parent - By Stefan Pohl Date 2024-01-11 14:00 Edited 2024-01-11 14:07 Upvotes 2
Peter Martan schrieb:

Semifinale Endstand:

<code># PLAYER   : RATING POINTS PLAYED (%)
1 Stockfish: 3571.3 185.5  300    62
2 Torch    : 3542.0 170.5  299    57
3 Lc0      : 3498.0 149.0  300    50
4 Dragon   : 3490.0 144.5  299    48
5 Berserk  : 3477.2 138.5  300    46
6 Ethereal : 3421.5 111.0  300    37</code>

Mit dem Gamepairs Rescoring Tool:

<code>   # PLAYER       :  RATING  ERROR  PLAYED    W    D    L   (%)  CFS(%)
   1 Stockfish    :    3500   ----     150   76   69    5  73.7      99
   2 Torch        :    3430     57     150   51   89   10  63.7     100
   3 Lc0          :    3336     55     150   26   95   29  49.0      70
   4 Dragon       :    3321     60     150   27   86   37  46.7      84
   5 Berserk      :    3293     58     150   19   89   42  42.3     100
   6 Ethereal     :    3172     63     150    6   62   82  24.7     ---

-------------------------------------------------------------------
--- Number of all Gamepairs          : 450
--- Number of drawn Gamepairs overall: 245 (= 54.44%)
--- Number of 1:1 drawn Gamepairs    :  68 (= 15.11%)
--- Number of 2-draws drawn Gamepairs: 177 (= 39.33%)</code>


Hier sieht man schön, daß chesscom eine UHO-Stufe zu niedrig unterwegs ist (sie benutzen mein UHO_2022_8mvs_+110_+119): Denn die Zahl der 2-draws Gamepairs ist viel größer als die der 1:1 drawn Gamepairs. Auch war die Remisquote mit über 61% und 54.44% Remis-Gamepairs zu hoch. Das wäre also der klassische Fall, eine UHO Stufe hochzuschalten...
Genau deshalb benutze ich für meine Testruns eben die Stufe +120_+129.

PS: Für UHO 2024 plane ich die UHO-Stufen auf 0.05 Eval-Intervall zu verdoppeln, statt eben wie bisher +110_+119 und dann +120_+129 wird es dann auch noch +115_+124 geben. Damit lassen sich dann die Remisquote und die 1:1 Gamepairs noch genauer an die eigenen Spielbedingungen anpassen. Generell wird es aber so sein, das kann ich jetzt schon sagen, daß die Evalstufen insgesamt deutlich niedriger ausfallen werden, da KomodoDragon 3.3 (im Gegensatz zu KomodoDragon 2.6, was ich für UHO 2022 zur Evaluierung benutzt habe) jetzt auf Gewinnwahrscheinlichkeiten genormte Evals hat. Heißt also, daß +1.00 heißt, daß Weiß eine Gewinnwahrscheinlichkeit von 50% hat. Daher werden die UHO 2024 Stufen eher wieder denen der ganz alten UHO V3 ähneln, die so bei +0.80 oder +0.90 losgehen. Das finde ich aber durchaus positiv.
Die Evaluierung für UHO 2024 läuft seit gut 1.5 Monaten und sollte, falls alles glatt weiterläuft, noch ca. 3 Wochen dauern. Dann beginnt die Arbeit aber eigentlich erst richtig... Aber, wenn alles glattgeht, könnte der Release wie geplant im Frühjahr stattfinden.
- - By Peter Martan Date 2024-01-10 12:48 Edited 2024-01-10 13:18
Jetzt läuft ein Challenger Match Torch- Lc0, erst 72 von 500 Partien gespielt, Torch momentan mit 53% voran.

Daraus das Partiepaar 57+58 mit einzelnen SF- Kommentaren bei der Verzweigung und beim 24. Zug von Schwarz.

[Event "CCC22 Blitz: Challenger Match (3|2)"]
[Site "?"]
[Date "2024.01.10"]
[Round "1"]
[White "Torch"]
[Black "Lc0"]
[Result "1-0"]
[ECO "A43"]
[Annotator "57"]
[PlyCount "177"]
[EventDate "2024.??.??"]
[EventType "blitz"]
[TimeControl "180+2"]

1. d4 c5 2. d5 e6 3. c4 exd5 4. cxd5 d6 5. Nc3 a6 6. a4 g6 7. e4 Bg7 8. Be2 Nd7 {book} 9. Nf3 Ne5 10. Nxe5 Bxe5 11. O-O Qh4 $5 (11... Nf6 12. Kh1 Nd7 13. f4 Bg7 14. Bd3 O-O 15. Qf3 Qh4 16. h3 Re8 17. Be3 g5 18. a5 gxf4 19. Bxf4 Ne5 20. Bxe5 Rxe5 21. Na4 b5 22. Nb6 Rb8 23. Bxb5 axb5 24. a6 Bxa6 25. Nd7 Rc8 26. Nxe5 Bxe5 27. Rxa6 Rc7 28. Qe3 f6 29. g4 h5 30. Rg1 Rg7 31. Qf3 Kh7 32. Qf5+ Kh6 33. Qxh5+ Qxh5 34. gxh5 Rxg1+ 35. Kxg1 Kxh5 36. Rb6 b4 37. b3 Kg5 38. Rb7 Kf4 39. h4 Kxe4 40. h5 Bf4 41. Kf2 Kxd5 42. Kf3 Ke5 43. Re7+ Kf5 44. Rd7 Ke5 45. Re7+ Kf5 46. Rc7 Bg5 47. Rd7 Bf4 48. Rg7 Bg5 49. Rd7 Bf4 50. Ra7 Bg5 51. Ra8 Bh6 52. Rd8 Bf4 53. Rd7 Ke5 54. Rg7 Kf5 55. Ra7 Bg5 56. Ra1 Ke5 57. Rh1 Bh6 58. Ke2 d5 59. Kd3 Kf5 60. Rg1 Bg5 61. Rg2 Bh6 62. Rg6 Bg5 63. Rg8 Bf4 64. Rg6 Bg5 65. Rg8 Bf4 66. Rg1 Bg5 67. Rg2 Bh6 68. Kc2 c4 69. Rg8 Bf4 70. Kb2 Bh6 71. Ka2 Bf4 72. Kb2 Be5+ 73. Kc2 Bf4 74. Rg6 Bg5 75. Kb2 Be3 76. Rg8 Bh6 77. Ka2 Be3 78. Rg7 Bg5 79. Kb2 Be3 80. Ka2 cxb3+ 81. Kxb3 d4 82. Kc4 b3 83. Kxb3 d3 84. Kc3 d2 85. Kc2 Bh6 86. Rg6 Be3 87. Rg2 Bh6 88. Kd1 Be3 89. Ke2 Ke6 90. Rg3 Bg5 91. Rh3 Bh6 92. Rh2 Kf7 93. Rh1 Kg7 94. Kf3 Kh7 95. Rb1 Bg5 96. Kg4 Kh6 97. Ra1 f5+ 98. Kxf5 {½-½ Lc0-Torch CCC22 Blitz: Challenger Match (3|2) 2024 (1) unterminated}) 12. g3 Qe7 13. a5 Nf6 14. Bh6 Ng8 15. Be3 Nf6 16. Na4 Bh3 17. Re1 Nd7 18. Rb1 O-O 19. b4 c4 20. Bxc4 Bg7 21. Bd3 Ne5 22. f4 Nxd3 23. Qxd3 Rac8 24. Rb3 Qf6 $2 $18 (24... Rfe8 $16) 25. Nb6 Rc7 26. e5 dxe5 27. d6 e4 28. Qd2 Rc6 29. Bc5 Qe6 30. Nd5 Kh8 31. Rd3 Rd8 32. Ne7 Rxc5 33. bxc5 Qc4 34. Rd5 Be6 35. Rc1 Qb3 36. Re5 Bxe5 37. fxe5 Kg7 38. Qc3 Qa4 39. h4 h5 40. Rc2 Rf8 41. Rg2 Kh7 42. Kh2 Qd1 43. Qe3 Qa4 44. Rd2 Qxa5 45. Nd5 Bxd5 46. Rxd5 Qa4 47. Rd4 Qa2+ 48. Rd2 Qc4 49. Qd4 Qxd4 50. Rxd4 a5 51. Kg2 Ra8 52. Rxe4 Kg7 53. Ra4 Re8 54. Kf3 Rxe5 55. Rxa5 Kf6 56. Ra8 Rd5 57. Ke4 Re5+ 58. Kd4 Re1 59. Rb8 Rd1+ 60. Ke4 Re1+ 61. Kf3 Rd1 62. Rxb7 Ke6 63. Ke4 Rd2 64. Re7+ Kf6 65. Ke3 Rd1 66. Ke2 Rd5 67. Re8 Kf5 68. c6 Rxd6 69. c7 Rc6 70. c8=Q+ Rxc8 71. Rxc8 Ke5 72. g4 hxg4 73. Rc4 Kf5 74. Ke3 g3 75. Kf3 Kf6 76. Kxg3 Kf5 77. Rc7 Kf6 78. Kf4 Ke6 79. Kg5 Ke5 80. Rxf7 Ke6 81. Kxg6 Ke5 82. h5 Ke6 83. h6 Kd5 84. h7 Kd4 85. h8=Q+ Kc4 86. Rd7 Kb4 87. Qc8 Kb5 88. Rb7+ Ka4 89. Qa8# 1-0

Edit: Nach etwas weiterem Forward- Backward vom 24. Zug an, steigt die Eval von SF auch nach den Alternativzügen, das dürfte an der Stelle auch bei bester Gegenwehr für Schwarz schon verloren gewesen sein, restliches Backward zur Vorgabestellung läuft.
Parent - By Peter Martan Date 2024-01-10 13:50 Edited 2024-01-10 13:53
Je länger sich SF ins restliche Backward vertieft, umso mehr schaut's so aus, als ob die Verzweigung beim 11. Zug vielleicht schon spielentscheidend gewesen sein könnte.
Nach dem Lc0- Zug 11...Dh4 (?!):



12.g3 Dd8 13.a5 Sf6 14.Lh6 b5 15.axb6 Dxb6 16.Ta2 Tb8 17.Dd3 Sg8 18.Le3 Sf6 19.b4 c4 20.Dc2 Dxb4 21.Tb1 Db3 22.Lxc4 Dxc2 23.Txc2 Txb1+ 24.Sxb1 Ke7 25.f4 La1 26.Ta2 Sg4 27.Lb6 Lg7 28.Lxa6 Lxa6 29.Txa6 Tc8 30.Sa3 f5 31.exf5 gxf5 32.h3 Sf6 33.Ld4 Sh5 34.Lxg7 Tc1+ 35.Kf2 Sxg7 36.Ta7+ Kf8 37.Sb5 Td1 38.Sc7
  Weiß steht besser. 
  +/- (1.24)  Tiefe: 41/95   00:03:06  2998MN

Und nach dem 11...Sf6 von Torch aus der Gegenpartie:



Analysis by Stockfish dev-20240101-0fca5605:

12.Kh1 Sd7 13.Le3 0-0 14.f4 Lg7 15.e5 b6 16.Dd2 dxe5 17.f5 Sf6 18.fxg6 fxg6 19.Tad1 Lf5 20.d6 Dd7 21.h3 De6 22.a5 bxa5 23.Lxc5 Kh8 24.De3 Sd7 25.La3 Db3 26.Td5 a4 27.Ta5 Tfc8 28.Sd5 Tf8 29.Dxb3 axb3 30.Sc7 Tab8 31.Txa6 Lh6 32.Tc6 Le3 33.Lb5 h5 34.Td1
  Weiß steht besser. 
  +/- (0.92 --)  Tiefe: 43/56   00:05:41  5530MN

30 Threads der 16x3.5GHz CPU, 32G Hash.
- - By dkappe Date 2024-01-12 22:56
Wirklich ein überraschender Endspiel Sieg durch Zugzwang.

Event:
Ort:
Datum:

Weiss:
Schwarz:

Ergebnis
Board
Parent - - By Peter Martan Date 2024-01-13 00:19 Edited 2024-01-13 00:28 Upvotes 1
95...Kg7? vergibt das Remis.

Danach:



Analysis by Stockfish dev-20240101-0fca5605:

96.Kg4 Sb7 97.Kf5 Kf7 98.Lc4+ Ke7 99.Kg6 f5 100.Ld3 Sd6 101.Kxh6 Kf6 102.h5 Se8 103.Kh7 Sg7 104.h6 Sh5 105.Lc4 Kg5 106.d5 Sxg3 107.Kg7 Se4 108.h7 Sd6 109.Ld3 Kf4 110.h8D Ke3 111.Dh3+ Kd4 112.Lxf5 b5 113.Kg6 b4 114.Df3 Kc4
  Weiß steht klar auf Gewinn. 
  +- (10.19)  Tiefe: 34/55   00:04:11  6597MN, tb=4403977

Und davor:

6k1/8/1p1n1p1p/p7/P2P1K1P/3B2P1/1P6/8 b - - 0 1

Analysis by Stockfish dev-20240101-0fca5605:

95...Kf7 96.Lc2 Ke7 97.b3 Kf7 98.Kf3 Ke8 99.Kf2 Kf7 100.Ld3 Ke8 101.Lg6+ Kf8 102.Kg2 Kg7 103.Ld3 Kf8 104.Kf3 Kf7 105.Lc4+ Ke8 106.Lb5+ Kf7 107.Ld7 Ke7 108.Lg4 Ke8 109.Kf2 Kf8 110.Lf3 Sf5 111.Ld1 Sd6 112.Ke3 Ke8 113.Kd3 Kd8 114.Lf3 Ke8 115.g4 Kf8 116.Ke3 Ke7 117.Ke2 Kf8 118.Kf2 Ke8 119.Ld5 Kf8 120.Ke3 Ke8 121.Lc4 Kf8 122.Ld3 Kg7 123.Le2 Kf8 124.Kf3 Kf7 125.Lc4+ Ke7 126.Lb5 Kf7 127.Ke3 Ke7 128.Ld3 Ke8 129.Kf2 Ke7 130.Lc2 Kf7 131.Ld1 Ke8 132.Kf3 Ke7 133.Lc2 Kf7 134.Lh7 Ke8 135.Lg6+ Kd7
  Weiß steht besser. 
  +/- (0.94)  Tiefe: 86/86   00:03:48  5558MN, tb=20474673
Parent - By Peter Martan Date 2024-01-13 09:35 Edited 2024-01-13 10:18
Peter Martan schrieb:

95...Kg7? vergibt das Remis.

Das ist eigentlich eine ganz gute Teststellung.
Wie lange brauchen die Engines, um nach dem 95. Zug von Weiß (unmittelbar vor dem Diagramm oben und in der .pgn von der Partie) im MultiPV=3- Modus 2 gleich gute erste Züge von einem beliebigen anderen durch 2x Remis und einmal Weiß gewinnt- Eval zu unterscheiden?
Eine 0.00- nahe Eval für die beiden richtigen wäre natürlich schön, ist aber, was ich so gesehen habe bisher, nur mit viel Forward- Backward zu bekommen. Auch Crystal braucht einige Züge vorwärts, um gegen 0.00 zu gehen. (Hab' bisher nur die Version 7 CMB probiert.)
Eigentlich ist die Engine- Entwicklung, was Festungen angeht, immer noch nicht so weit, wie uns die Eng-Eng-Match- Ergebnisse allein immer wieder glauben machen wollen.

Edit: Hab' mal Torch selbst in der freien Analyse auf chesscom gestartet an der Stellung, das dauert (ich nehme an single thread?) eigentlich mit leerem Hash gestartet auch sehr lang (vermutlich, wie lange genau, weiß ich nicht, weil ich nach ca. 10 Minuten ohne positives Ergebnis ausgestiegen bin), bis das 95...Kg7? schlechter bewertet würde als die beiden Alternativen.
Das ist in Tiefe 46, leider lässt sich ohne Premium- Account kein Output ordentlich kopieren oder speichern, als Text fehlen die Figurenbezeichnungen, aber vor dem jeweiligen Kleinbuchstaben fürs Zielfeld im ersten Schwarzzug muss man sich halt überall ein K dazu denken oder das im Engine- Output online verwendete graphische Köngissymbol:

6k1/8/1p1n1p1p/p7/P2P1K1P/3B2P1/1P6/8 b - - 0 1

+1.01 1... f7 2. g4 e8 3. e3 f7 4. e2 e8 5. f3 f7 6. e2 e7 7. d2 f7 8. c3 e8 9. d5 e7 10. b3 e8 11. c4 e7 12. d5 e8 13. d3 e7 14. e3 e8 15. f4 e7 16. b3 e8 17. a2 e7 18. d5 e8 19. b3 f8 20. f3 e8 21. e2 d8 22. c2 e8 23. d1 f7 24. b3+

+1.01 1... f8 2. e2 e7 3. f3 f7 4. d5+ f8 5. g4 e8 6. b3 f8 7. f3 e8 8. c2 f7 9. f4 g7 10. e3 f7 11. b3+ e8 12. e6 e7 13. d5 e8 14. f4 f8 15. b3 e8 16. c2 e7 17. g6 f8 18. e3 c4+ 19. f3 d6 20. d3 f7 21. f4 e8 22. e3 f7 23. e2 e7

+1.01 1... g7 2. e3 f7 3. e2 g7 4. d3 f7 5. h5+ f8 6. g6 g7 7. e4 f8 8. g4 f7 9. c6 e7 10. b5 f7 11. c4+ e7 12. c3 e8 13. d5 e7 14. f3 e8 15. d2 e7 16. e3 c4+ 17. f4 d6 18. d5 e8 19. c6+ f8 20. e3 f7 21. d5+ f8 22. b3 e8 23.

Über diese Tiefe hinaus dauert es ziemlich lange, bis weitere Iterationen kommen, als nach ca. 5 Minuten insgesamt die 47. erreicht ist, hat sich die Reihenfolge ein bisschen geändert, 1...(95...) Kg7 ist jetzt an 2. Stelle, die Evals aller drei Königszüge sind bei 1.05, also eine Erkenntnis, dass 2 Züge Remis halten und ...Kg7? verliert, sehe ich nach wie vor keine, obwohl ...Kg7 immer noch im Output ist. An der Stelle dreh' ich's jetzt ab, weil sich in der Editierzeit wohl nichts mehr tun wird, Torch ist jetzt in Tiefe 49 ohne weitere Änderung von first move oder Eval.
- - By Peter Martan Date 2024-01-14 08:44
Challenger- Match Torch- Lc0 3'+2":

# PLAYER : RATING POINTS PLAYED (%)
1 Torch  : 3516.2 273.0  500    55
2 Lc0    : 3483.8 227.0  500    45


im Gamepairs Rescoring Tool:

   # PLAYER    :  RATING  ERROR  PLAYED    W    D    L   (%)  CFS(%)
   1 Torch     :    3500   ----     250   66  164   20  59.2     100
   2 Lc0       :    3435     31     250   20  164   66  40.8     ---

-------------------------------------------------------------------
--- Number of all Gamepairs          : 250
--- Number of drawn Gamepairs overall: 164 (= 65.60%)
--- Number of 1:1 drawn Gamepairs    : 55 (= 22.00%)
--- Number of 2-draws drawn Gamepairs: 109 (= 43.60%)


Das Partiepaar 449+450:

[Event "CCC22 Blitz: Challenger Match (3|2)"]
[Site "?"]
[Date "2024.01.13"]
[Round "1"]
[White "Torch"]
[Black "Lc0"]
[Result "1-0"]
[ECO "E11"]
[PlyCount "143"]
[EventDate "2024.??.??"]
[EventType "blitz"]
[TimeControl "180+2"]

1. d4 Nf6 2. Nf3 e6 3. c4 Bb4+ 4. Nbd2 d6 5. g3 O-O 6. Bg2 Bxd2+ 7. Qxd2 Ne4 8. Qc2 f5 {book} 9. Nd2 Nf6 (9... Nxd2 10. Bxd2 Nd7 11. e4 Nf6 12. exf5 exf5 13. O-O-O Qd7 14. Rhe1 Qf7 15. Bf4 Ne4 16. f3 Nf6 17. Bg5 Bd7 18. Bxf6 Qxf6 19. f4 Rab8 20. Bd5+ Kh8 21. c5 h6 22. Kb1 c6 23. Qa4 dxc5 24. dxc5 Rbe8 25. Bb3 Be6 26. Bxe6 Rxe6 27. Qxa7 Rxe1 28. Rxe1 Qf7 29. Qa4 Re8 30. Rxe8+ Qxe8 31. a3 Kh7 32. Qc2 Qe1+ 33. Ka2 Qe6+ 34. Qb3 Qe7 35. h4 Kg6 36. a4 Qe4 37. Ka3 Qe7 38. Kb4 Qe1+ 39. Qc3 Qe2 40. Qe5 Qd2+ 41. Ka3 Qd3+ 42. Qc3 Qe4 43. Kb3 Qe6+ 44. Ka3 Qe4 45. Kb3 Qe6+ 46. Kb4 Qe2 47. b3 Qd1 48. Ka3 Qe2 49. Qd4 Qe1 50. Qd3 Qa1+ 51. Kb4 Qe1+ 52. Qc3 Qe2 53. Qe5 Qd2+ 54. Qc3 Qe2 55. Ka3 Qf1 56. b4 Kh5 57. b5 cxb5 58. axb5 Qxb5 59. Qf3+ Kg6 60. h5+ Kh7 61. Qd5 Qa5+ 62. Kb3 Qb5+ 63. Kc3 Qa5+ 64. Kc2 Qa4+ 65. Kd2 Qb4+ 66. Kd3 Qb5+ 67. Ke3 Qb1 68. Kd4 Qa1+ 69. Kd3 Qd1+ 70. Kc4 Qa4+ 71. Kc3 Qa3+ 72. Kd4 Qa1+ 73. Kd3 Qd1+ 74. Kc4 Qa4+ 75. Kc3 Qa3+ 76. Kc2 Qa4+ 77. Kb2 Qb4+ 78. Ka2 Qa4+ 79. Kb1 Qb4+ 80. Ka2 Qa4+ 81. Kb1 Qb5+ 82. Kc1 Qf1+ 83. Kd2 Qf2+ 84. Kd1 Qg1+ 85. Kc2 Qf2+ 86. Kc1 Qg1+ 87. Kd2 Qh2+ 88. Kc1 Qxg3 89. Qxf5+ Kh8 90. Kb2 Qf2+ 91. Kb3 Qf3+ 92. Kb4 Qc6 93. Qf8+ Kh7 94. Qd6 Qf3 95. Qe5 Qc6 96. Qd6 Qf3 97. Qe5 Qc6 98. Qe3 Kg8 99. Qe7 Kh7 100. Ka5 Qa6+ 101. Kb4 Qc6 102. Qf7 Qe4+ 103. Ka5 Qe1+ 104. Kb5 Qe2+ 105. Kb6 Qa6+ 106. Kc7 Qc6+ 107. Kb8 Qxc5 108. Kxb7 Qb5+ 109. Ka7 Kh8 110. Qf8+ Kh7 111. Qf7 Kh8 112. Ka8 Qa5+ 113. Kb7 Qb4+ 114. Ka6 Qa4+ 115. Kb7 Qb4+ 116. Ka6 Qa3+ 117. Kb6 Qb2+ 118. Ka5 Qc3+ 119. Kb6 Qb4+ 120. Ka7 Qd4+ 121. Ka6 Qa4+ 122. Kb6 Kh7 123. Kb7 Kh8 124. Kb6 Qd4+ 125. Ka5 Qd8+ 126. Kb5 Qd3+ 127. Kb6 Qb1+ 128. Ka6 Qa1+ 129. Kb6 Qb1+ 130. Ka6 Qe4 131. Kb5 Qb1+ 132. Ka5 Kh7 133. Ka6 Qa1+ 134. Kb5 Qb1+ 135. Ka6 Kh8 136. Ka5 Qa1+ 137. Kb5 Qb2+ 138. Ka5 Kh7 139. Ka6 Qa3+ 140. Kb6 Qe3+ 141. Ka6 Qe2+ 142. Kb6 Kh8 143. Qf5 Qb2+ 144. Ka5 Qa2+ 145. Kb5 {½-½ Lc0-Torch CCC22 Blitz: Challenger Match (3|2) 2024 (1) adjudication}) 10. b4 Nc6 11. Qc3 a6 12. O-O Ne7 13. a4 Rb8 14. b5 b6 15. e4 Nxe4 16. Nxe4 fxe4 17. Bxe4 axb5 18. axb5 Bb7 19. d5 exd5 20. cxd5 Rf7 21. Qc2 Ng6 22. Ra7 Qe8 23. h4 Qxb5 24. Rd1 Nf8 25. Bb2 Qc5 26. Qd2 Qc4 27. f3 Ra8 28. Rxa8 Bxa8 29. Re1 h5 30. f4 c5 31. Bf3 Rf5 32. Re7 Rf7 33. Re8 Qb3 34. Re3 Qb5 35. Kh2 Qd7 36. Bxh5 Re7 37. Bg4 Qe8 38. Rxe7 Qxe7 39. h5 Qe4 40. Qc3 Qd4 41. Qxd4 cxd4 42. Be2 Bxd5 43. Kh3 Ne6 44. f5 d3 45. Bxd3 Nc5 46. Bb5 Be4 47. g4 Bd3 48. Bc6 b5 49. f6 gxf6 50. Bxf6 Ne4 51. Bd5+ Kh7 52. Be7 Nc3 53. Be6 Ne4 54. g5 Nd2 55. Kg3 b4 56. Kf4 b3 57. Bf7 b2 58. g6+ Bxg6 59. Bxg6+ Kg7 60. Bxd6 Kg8 61. h6 b1=Q 62. Bxb1 Nxb1 63. Kg5 Kf7 64. Bb4 Ke6 65. h7 Kd5 66. h8=Q Ke4 67. Qd8 Na3 68. Bxa3 Ke3 69. Bc5+ Ke2 70. Kg4 Kf1 71. Qd1+ Kg2 72. Qg1# 1-0
Parent - - By Reinhold Stibi Date 2024-01-14 09:09 Edited 2024-01-14 09:13
Da schneidet Lc0 ja überraschend schlecht ab.

Was sind die Gründe dafür ?

Torch gleich im Rating um 65 Elo besser; beim aktuellen Stockfish wären das ja noch mehr.

Wo sind die Schwachpunkte von Lc0 ?

Könntest du vielleicht ein paar Diagramme einstellen ?
Parent - - By Peter Martan Date 2024-01-14 09:12 Edited 2024-01-14 09:44
65 im der Gamepairs Auswertung, im "normalen" Rating 32.4.
Die Gründe liegen in der doch immer noch kurzen TC, denke ich, es gibt auch immer wieder Stimmen, die die Hardware der A-B-Engines relativ zur GPU- Hardware bei den chesscom- Turnieren stärker auf der A-B-Seite sehen als z.B. bei TCEC.
Just my two cents.
Diagramme hast du, wenn du dir die Partien kopierst und ins GUI einfügst, Reinhold, mehr als eine Partie auf einer Seite geht halt leider im Foren- Reader nach wie vor nicht.
Schau dir mal die Stellung in dem Diagramm an, besser gesagt vor dem Zug, der da im Diagramm schon passiert war, und der die Partie vergeben hat, also vor dem 95. von Schwarz, diese hier

,

aus der Partie , die Dietrich gepostet hat:

https://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=167941#pid167941

Das ist auch eine ganz gute Teststellung.
95...Kg7? (und ...Kh8?) verliert, 95...Kf7 und 95...Kf8 halten das Remis. Am besten schaut man sich die Lines und Evals im MultiPV=3 (oder4)- Modus an, wie lange es dauert, bis die beiden gleichwertigen Lösungszüge eine deutlich niedrigere Eval haben und den 0- Fortschritt in den Output- Lines relativ zu den avoid moves, die zum zwingenden Verlust führen.
Parent - - By Reinhold Stibi Date 2024-01-14 09:18
Also 3 Min. + 2 Sek. pro Zug ist doch keine  kurze Bedenkzeit.

Wie schaut es denn mit der Hardware von beiden Seiten aus; die ist doch
bestimmt nicht schlecht.

Da müsste die Zeit doch vollkommen ausreichen.
Parent - - By Peter Martan Date 2024-01-14 09:22 Edited 2024-01-14 09:26
Die Hardware ist saustark, aber von CPU- Seite halt vielleicht noch etwas stärker als von der der GPU.
Ich persönlich glaube eh auch nicht, dass es hauptsächlich daran liegt, man muss auch vielleicht bedenken, dass Torch gegen SF und Lc0 hauptsächlich getestet und entwickelt werden wird, im Blitz Main Event mit dem größeren Feld war der Abstand eine Spur kleiner, im Semifinale allerdings noch etwas größer.
Und wie er gegen SF sein wird, sehen wir im Anschluss, das Finale SF- Torch läuft schon.
Parent - - By Reinhold Stibi Date 2024-01-14 09:35
Ja, habe gerade CCC auf meinen Mini- Computer mit Ryzen 9 5900hx geladen.

Da läuft gerade das Blitz Finale 3/2 mit Stockfish gegen Torch.

Stockfish führt deutlich mit 24/40   zu  16/40   8 Punkte mehr ist schon sehr beachtlich.
Parent - By Max Siegfried Date 2024-01-14 13:32
Stockfisch hat 5 mal die 0 kassiert
und 17 mal eine 1.

17 zu 5 ist schon ein himmelweiter Unterschied.
Außerdem ist er gerade dabei Sieg Nr. 18 einzufahren.
Vielleicht schafft er danach noch 2 Siege, dann steht es 20 zu 5.
Parent - - By Stefan Pohl Date 2024-01-14 13:42 Upvotes 1
Reinhold Stibi schrieb:

Da schneidet Lc0 ja überraschend schlecht ab.



Das ist überhaupt nicht überraschend. Die TCEC Hardware ist CPU-seitig ca. nur halb so schnell wie bei chesscom aber GPU-seitig etwa genauso schnell. Daher hat Lc0 bei chesscom eine viel schlechtere Leela-Ratio als im TCEC, weil die CPU-Engines bei chesscom doppelt so schnell rechnen, wie im TCEC, Lc0 ist aber bei beiden Veranstaltungen etwa auf demselben Level.
Also ist es völlig logisch, daß Lc0 bei chesscom immer etwas schlechter wegkommt als im TCEC. Dazu kommt, daß die kürzeren Bedenkzeiten bei chesscom eher die CPU-Engines bevorteilen, die einfach ca. 1000 mal mehr nps haben und daher mit kürzeren Bedenkzeiten besser zurechtkommen.

Das habe ich jetzt gefühlt hier schon zum 10.Mal erklärt...
Parent - By Martin Steinwandter Date 2024-01-14 15:45 Edited 2024-01-14 15:52
Später in der CCC22 kommen die Rapid-Spiele. Und auch da sehe ich LC0 hinter Torch. Die Entwicklung von LC0 ist einfach viel langsamer wegen der GPU-Nutzung.
Außerdem wird das Rating im laufenden Spiel zwischen Torch und LC0 sicher noch etwas sinken.
- - By Peter Martan Date 2024-01-16 10:13 Edited 2024-01-16 10:15
Nach etwas mehr als der Hälfte des Finales (283 von 500 Partien):

# PLAYER   : RATING POINTS PLAYED (%)
1 Stockfish: 3529.4 165.0  283    58
2 Torch    : 3470.6 118.0  283    42


283+284:

[Event "CCC22 Blitz: Finals (3|2)"]
[Site "?"]
[Date "2024.01.16"]
[Round "1"]
[White "Stockfish"]
[Black "Torch"]
[Result "1-0"]
[ECO "A80"]
[PlyCount "159"]
[EventDate "2024.??.??"]
[EventType "blitz"]
[TimeControl "180+2"]

1. d4 f5 2. Nc3 d5 3. Bf4 c6 4. e3 Nd7 5. Bd3 e6 6. Nf3 Be7 7. O-O Ngf6 8. Ne2 O-O {book} 9. c4 Nh5 10. h3 Nxf4 11. exf4 Nf6 (11... c5 12. cxd5 exd5 13. Qc2 g6 14. Nc3 c4 15. Be2 Nf6 16. b3 cxb3 17. Qxb3 Qa5 18. Rfe1 Kh8 19. Ne5 Qb4 20. Rab1 Qxb3 21. Rxb3 Bd8 22. Bf3 Ne4 23. Bxe4 fxe4 24. g3 Ba5 25. Rc1 Bxh3 26. Nxd5 Rad8 27. Ne7 Rxd4 28. g4 Bxg4 29. Nxg4 Rd7 30. Rb5 Bd2 31. Rd1 Rxe7 32. Rxd2 Rxf4 33. Ne3 Kg7 34. Ra5 b6 35. Ra4 h5 36. Rc4 Re6 37. a4 Rf7 38. Kf1 Kh6 39. Kg1 Kg7 40. Kg2 Kh6 41. Rdd4 Ref6 42. Rc2 Re6 43. Rcc4 Ref6 44. Rd2 Re6 45. Rc8 Kg7 46. Rd4 Ref6 47. Rd2 Re6 48. Rd4 Ref6 49. Rc2 Re6 50. Rcc4 Ref6 51. Rc2 Re6 52. Rd5 Kh6 53. Rd8 Kg7 54. Rd4 Kh6 55. Rc8 Kg7 56. Rcd8 Rf8 57. R8d7+ Rf7 58. Rd8 Rf8 59. R8d5 Rf7 60. Rd2 Rfe7 61. Rc2 Rf7 62. Kg1 Kh6 63. Kf1 Kg7 64. Kg1 Kh6 65. Rc8 Kg7 66. Rcd8 Rf8 67. R5d7+ Rf7 68. Rd4 Rf8 69. R8d5 Rf7 70. Rc4 Ref6 71. Rc2 Re6 72. Rd4 Rf4 73. Rcc4 Re7 74. Rd8 Re6 75. Rcc8 Rf7 76. Rg8+ Kf6 77. Rcd8 Kg5 78. Rh8 Re5 79. Rd6 Rfe7 80. Ra8 Kh6 81. Kf1 Kg7 82. Rc8 Rg5 83. Rc1 Kf8 84. Rc4 Kf7 85. Rcc6 Kg7 86. Re6 Rxe6 87. Rxe6 Ra5 88. Rxe4 g5 89. Kg2 Kf7 90. Kg3 Kf6 91. Rb4 Rc5 92. Kg2 Ra5 93. Nf1 Rd5 94. Ne3 Ra5 95. Kf3 Ke6 96. Nd1 Rc5 97. Ne3 Ra5 98. Re4+ Kf6 99. Rd4 Ke6 100. Rb4 Rc5 101. Rb1 Kf6 102. Rd1 Ra5 103. Rd4 Ke6 104. Rb4 Rc5 105. Nf1 Rd5 106. Re4+ Kf6 107. Ne3 Ra5 108. Rc4 Ke5 109. Nf1 Rd5 110. Rc7 Ra5 111. Rc4 Rd5 112. Re4+ Kf6 113. Rb4 Rd3+ 114. Ne3 Ra3 115. Rc4 g4+ 116. Kf4 Ra2 117. Kg3 Kg5 118. Kg2 Kf6 119. Nd5+ Kg5 120. Nc3 Ra3 121. Ne4+ Kf5 122. Ng3+ Kg5 123. Ne4+ Kg6 124. Rb4 h4 125. Nd6 Kg5 126. Nf7+ Kf6 127. Nh6 g3 128. Ng4+ Kg5 129. f3 Ra2+ 130. Kh3 Re2 131. f4+ Kf5 132. Nh6+ Kg6 133. Ng4 Kf5 134. Nh6+ Kg6 135. Ng4 g2 136. Rb5 Kf7 137. Rb1 Ke6 138. Kxh4 Rb2 139. Rg1 Kf5 140. Kg3 Rb3+ 141. Kh4 Kxf4 142. Rxg2 Rb1 143. Rf2+ Ke4 144. Nf6+ Ke3 145. Ng4+ Ke4 146. a5 bxa5 147. Nf6+ Kd4 148. Rf4+ Kc3 149. Ne4+ Kb2 150. Nd2 Rh1+ 151. Kg3 a4 152. Rxa4 {1/2-1/2 Torch-Stockfish CCC22 Blitz: Finals (3|2) 2024 (1)}) 12. c5 Bd7 13. b4 a5 14. a3 Be8 15. Qc2 Qc7 16. Rfe1 Bh5 17. Ng5 Bf7 18. b5 Ne4 19. b6 Qd8 20. Nxf7 Rxf7 21. Rf1 Qf8 22. Rac1 g6 23. f3 Nf6 24. h4 Qg7 25. g3 Nd7 26. Qd2 a4 27. Qe3 Bf6 28. Kg2 Qh6 29. Qf2 Rff8 30. Rh1 Qg7 31. Rb1 h5 32. Rb4 Ra5 33. Rc1 Re8 34. Ng1 Nf8 35. Nh3 Rea8 36. Qe3 Qh8 37. Ng5 Re8 38. Rd1 Rb8 39. Bc2 Rba8 40. Rbb1 Qg7 41. Qc3 Qe7 42. Re1 Qg7 43. Rbd1 Qd7 44. Bd3 Kh8 45. Re3 Qg7 46. Bf1 Qe7 47. Qb4 Bxg5 48. fxg5 Qf7 49. Rde1 Kg8 50. Bd3 Qd7 51. R1e2 Kf7 52. Qe1 Rb5 53. Bxb5 cxb5 54. g4 Re8 55. Qg3 Kg8 56. Qc7 Qc6 57. Re1 f4 58. Qxf4 Qd7 59. Qc7 Qf7 60. Qxf7+ Kxf7 61. c6 bxc6 62. Rc3 hxg4 63. fxg4 b4 64. axb4 Rb8 65. Rxc6 Ke8 66. Rec1 Kd8 67. h5 a3 68. Ra1 e5 69. Rxa3 exd4 70. Ra7 Rc8 71. Rd6+ Ke8 72. hxg6 Rc2+ 73. Kf3 Rc3+ 74. Kf4 Rc1 75. g7 Rf1+ 76. Kg3 d3 77. g8=Q d2 78. Rd8+ Kxd8 79. Qxd5+ Nd7 80. Qxd7# 1-0
Parent - - By Martin Steinwandter Date 2024-01-16 11:15
Danach ein Stockfish vs LC0 über 500 Partien würde die Sache perfekt machen.
Parent - - By Peter Martan Date 2024-01-16 12:27
Naja, wäre ein bisschen gemein Lc0 gegenüber, wie Stefan Pohl hier mal wieder geschrieben hat,

https://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=167977#pid167977

wirkt sich bei den doch nicht gerade langen TCs die CPU- Hardware- Überlegenheit bei den chesscom- Turnieren relativ zu der bei TCEC doch ziemlich deutlich aus offenbar. Da kommen die GPUs nicht ganz mit, scheint's. Der Abstand zwischen Torch und Lc0 wäre bei TCEC- CPU vielleicht auch kleiner geworden als im chesscom- Challenger, vor allem aber vermutlich bei TCEC- Bedenkzeiten.
Parent - - By Martin Steinwandter Date 2024-01-16 16:25 Edited 2024-01-16 16:30
Es geht mir auch nicht darum, eine Engine schlecht zu reden. Ich hätte nur eine bessere Datenbasis unter genau diesen Bedingungen als eben "nur" Torch vs LC0 und Fish vs Torch.
Und Aussagen über die relative Stärke eines dieser Akteure können dann auch unter diesen Bedingungen gemacht werden.
Parent - By Peter Martan Date 2024-01-16 17:49
Dazu hast du ja das ganze übrige Turnier, ab dem Main Event, mit dem ich diesen Thread hier begonnen habe, spielen SF, Torch und Lc0 mit, davor haben sich dafür in einer Entry League und 2 Qualifiers noch mehr Engines um die Plätze im Hauptfeld qualifiziert, dass du dann trotzdem nur eine begrenzte Zahl von Partien jeder Engine hast, das kann man natürlich immer zu wenig finden, auf der anderen Seite bleibt's ja sowieso immer nur ein einzelnes Turnier mit einer einzelnen Hardware- TC, einem besimmten Teilnehmer- Pool und bestimmten Eröffnungen.
Parent - - By Stefan Pohl Date 2024-01-18 10:24 Upvotes 1
Peter Martan schrieb:

Naja, wäre ein bisschen gemein Lc0 gegenüber, wie Stefan Pohl hier mal wieder geschrieben hat,


Naja, gemein ist eigentlich das falsche Wort. Es gibt nun mal keine "richtige", "falsche", oder "gemeine" Leela-Ratio. Die Leela-Ratio ist bei chesscom einfach nur anders als im TCEC.

Für mich persönlich ist es halt so, daß ich die TCEC Leela-Ratio in meinen NN-Lc0-Testruns anpeile und als Maßstab nehme. Weil für mich das TCEC die Computerschach-WM ist.
Aber prinzipiell kann bzw. könnte man auch jede andere Leela-Ratio nehmen. Das bleibt jedem selbst überlassen.
Parent - By Peter Martan Date 2024-01-18 10:27
Stefan Pohl schrieb:

Naja, gemein ist eigentlich das falsche Wort.

Du hast recht, gemein war gemein
Parent - By Peter Martan Date 2024-01-18 14:31
Läuft schon
- - By dkappe Date 2024-01-18 05:24
Letztes mal 3|2 blitz final war +73 elo SF über Torch. Dieses mal +48. Mal sehen.
Parent - By Stefan Pohl Date 2024-01-18 06:34 Edited 2024-01-18 06:40
dkappe schrieb:

Letztes mal 3|2 blitz final war +73 elo SF über Torch. Dieses mal +48. Mal sehen.


Hier die komplette Auswertung (normal und Gamepairs)
Noch ein weiter Weg für Torch: 11 gewonnene Gamepairs von 250. Stockfish 79. Das ist schon heftig.
Zum Glück für Torch ist die von chesscom benutzte (unterste) Eval-Stufe meiner UHO-Eröffnungen für einen Wettkampf auf diesem absoluten Top-Niveau zu niedrig: 66.4% Remisen und 48% 2xRemis-Gamepairs sind natürlich viel zu viel. Hätte man (richtigerweise) eine Eval-Stufe höher gewählt, wäre die Remisquote bei ca. 53%-55% gewesen und dann wäre das Ergebnis noch deutlicher zugunsten von Stockfish ausgegangen.

Code:

     Program        Elo    +    -   Games   Score   Av.Op.  Draws

   1 Stockfish    : 3821   11   11   500    56.8 %   3773   66.4 % (+118,=332,- 50)
   2 Torch        : 3773   11   11   500    43.2 %   3821   66.4 % (+ 50,=332,-118)

Games        : 500 (finished)

White Wins   : 168 (33.6 %)
Black Wins   : 0 (0.0 %)
Draws        : 332 (66.4 %)


Gamepair Auswertung (250 Gamepairs)

Code:

   # PLAYER       :  RATING  ERROR  PLAYED    W    D    L   (%)  CFS(%)
   1 Stockfish    :       0   ----     250   79  160   11  63.6     100
   2 Torch        :     -98     34     250   11  160   79  36.4     ---

-------------------------------------------------------------------
--- Number of all Gamepairs          : 250
--- Number of drawn Gamepairs overall: 160 (= 64.00%)
--- Number of 1:1 drawn Gamepairs    : 39  (= 15.60%)
--- Number of 2-draws drawn Gamepairs: 121 (= 48.40%)
-------------------------------------------------------------------
- - By Peter Martan Date 2024-01-18 09:36 Edited 2024-01-18 09:38 Upvotes 1
Ich hab' mir hier mal den Spaß gemacht, alle Partien vom Main Event, Semifinal, Final und Challenger zu einer .pgn zusammenzuführen und dann die mit dem Gamepairs Rescoring Tool (Ausgangswert 3500) auswerten zu lassen:

   # PLAYER       :  RATING  ERROR  PLAYED    W    D    L   (%)  CFS(%)
   1 Stockfish    :    3500   ----     455  194  245   16  69.6     100
   2 Torch        :    3407     26     705  158  437  110  53.4     100
   3 Lc0          :    3337     34     455   70  289   96  47.1      76
   4 Dragon       :    3322     45     205   56  107   42  53.4      97
   5 Berserk      :    3273     44     205   40  110   55  46.3     100
   6 Ethereal     :    3158     50     205   18   89   98  30.5      97
   7 Rubi         :    3075     80      55   10   21   24  37.3      56
   8 Obsidian     :    3068     88      55    6   28   21  36.4      56
   9 Caissa       :    3060     88      55    6   27   22  35.5      71
  10 Seer         :    3030     88      55    5   25   25  31.8      61
  11 Igel         :    3014     86      55    7   19   29  30.0      93
  12 Rofchade     :    2929    100      55    2   19   34  20.9     ---

-------------------------------------------------------------------
--- Number of all Gamepairs          : 1280
--- Number of drawn Gamepairs overall: 708 (= 55.31%)
--- Number of 1:1 drawn Gamepairs    : 203 (= 15.86%)
--- Number of 2-draws drawn Gamepairs: 505 (= 39.45%)
-------------------------------------------------------------------
Parent - - By Stefan Pohl Date 2024-01-18 10:19
Dabei bitte immer bedenken, mein Gamepair Rescorer geht nur korrekt, wenn eine Eröffnungsvorgabe auch pro head-to-head nur einmal benutzt wird, also für 2 Partien = 1 Gamepair.

Wenn man also Datenbanken zusammenschmeißt, kann das auch schiefgehen. Ich weiß nicht so genau, wie chesscom die jeweils nächste Eröffnungsvorgabe aus meinem UHO-Set auswählt. Aber es könnte eben passieren, daß eine Eröffnungsstellung mehrfach vorkommt. Solange die head-to-head Engine-Konstellation dabei unterschiedlich ist, geht das gut (zum Glück, denn dieser Fall ist natürlich viel wahrscheinlicher). Aber eben nicht, wenn die beiden gleichen Engines die gleiche Eröffnung mehrfach vorgesetzt bekommen...
Parent - - By Peter Martan Date 2024-01-18 10:23
Alles klar, Stefan, danke, für den Fall, dass das dann mit dem Tool so doch nicht passt, hier noch ein EloStat- Auswertung zum Vergleich:

    Program                            Score     %    Av.Op.  Elo    +   -    Draws

  1 Stockfish                      : 544.0/910  59.8   3506   3575   14  14   62.4 %
  2 Torch                          : 730.0/1410 51.8   3521   3534   11  11   62.4 %
  3 Dragon                         : 212.0/410  51.7   3485   3497   21  21   61.5 %
  4 Lc0                            : 442.5/910  48.6   3512   3502   14  14   63.0 %
  5 Berserk                        : 197.5/410  48.2   3489   3476   21  21   61.7 %
  6 Rubi                           :  48.0/110  43.6   3447   3402   44  44   54.5 %
  7 Obsidian                       :  47.5/110  43.2   3447   3399   40  41   60.9 %
  8 Caissa                         :  47.0/110  42.7   3447   3396   40  41   61.8 %
  9 Seer                           :  45.0/110  40.9   3448   3385   41  42   58.2 %
10 Ethereal                        : 164.0/410  40.0   3497   3427   20  21   62.4 %
11 Igel                            :  43.5/110  39.5   3449   3376   43  44   55.5 %
12 Rofchade                        :  39.0/110  35.5   3452   3348   45  46   50.9 %
Parent - By Stefan Pohl Date 2024-01-18 10:26 Edited 2024-01-18 10:30 Upvotes 1
Dabei merke ich noch an, daß, wenn es zu so einer Kollision in einem head-to-head kommt, nur dieser head-to-head Vergleich dann falsch ist. Alle andere Engine-Konstellationen sind nicht betroffen. Und völlig falsch ist er dann auch nicht. Es geht dann ggf. ein oder zwei Gamepairs über den digitalen Jordan. Aber das Ergebnis ist nicht völliger Müll.

Übrigens gab es keine Kollision (ist eben auch recht selten). Ich habe mir die Elostat Auswertung angesehen und die Engines habe dort alle doppelt so viele Partien wie Gamepairs in der Gamepair Rescoring Auswertung. Also alles korrekt!

So kann man eben auch kontrollieren, ob das Gamepair Rescoring korrekt war: Man läßt die pgn klassisch durch ORDO oder Elostat etc. durchlaufen und schaut sich die Partiezahlen jeder Engine an, die dann natürlich immer doppelt so groß sein müssen, wie die Zahlen in Gamepairs - logisch.
- By Peter Martan Date 2024-01-22 13:24
Alt Final:

# PLAYER   : RATING POINTS PLAYED (%)
1 Stockfish: 3531.5 294.5  500    59
2 Lc0      : 3468.5 205.5  500    41
Up Topic Hauptforen / CSS-Forum / CCC Blitz 3/2

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill