Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Wahrscheinlich eine kleine "neue" Erkenntnis ...
- - By Frank Quisinsky Date 2024-01-06 16:54 Edited 2024-01-06 17:12
Hallo zusammen,

aus dem laufenden Turnier mit längeren Bedenkzeiten ...

Der Elo-Durchschnitt wurde mit 3282 recht genau berechnet aber stimmt nicht.
Es muss schon mit sehr viel Zufall verbunden sein, wenn auch nach nur ca. 70 Partien in so vielen Fällen alles falsch berechnet wird.
Man sieht ja z. B. auch das nach nur 70 Partei bei 44 Engines im Turnier die Reihenfolge der Engine bis auf wahrscheinlich wenige Ausnahmen stimmt.

Schaut danach aus das folgendes passiert:
Erhöht sich die Bedenkzeit werden die Schwächeren deutlich Stärker, so um 30 Elo in meinem Fall.

Ist interessant und erklärt auch die steigende Remis Quote der Stärkeren als auch der Schwächeren untereinander.
Denn genau dieses Turnier habe ich vorher simuliert mit 3+1 und im Vergleich zu den Elo zu 40 in 20 war das schon zu erkennen.

Erneuter Anstieg der Bedenkzeit von 40 in 20 zu 66 + 6 und Bingo.

Muss man abwarten, wie sich das entwickelt.
Ich lasse den Elo-Durchschnitt bei jetzt 3282 noch ein paar Runden so stehen.
Dragon wird sicherlich nicht dann 3485 erzielen, sondern jetzt bei höherer Bedenkzeit eher um 3450-3460.
Ich bin darauf sehr gespannt.

Aber feststeht, die ganze Riege der Schwächeren nimmt gemeinschaftlich ca. um 30 Elo zu.
Klar, sollte auch logisch sein.
Die sehen mehr und spielen daher auch öfters mal Remis gegen deutlich stärker.
Nur bei Fizbo noch nicht zu sehen.

Und mal wieder ein Indiz dafür das viele Ratinglisten keinesfalls vergleichbare Resultate produzieren können, wenn denn die Bedenkzeit eine andere ist.
Aber in der Regel stimmt es meist hinsichtlich der Rangfolge der Engines.
Wobei einzelne Kandidaten hier auch nach unten oder oben aus dem Profil fallen.
Wie z. B. Uralochka aufgrund der enormen taktischen Stärke.
Dann verlieren die vermeidlich Schwächeren dann doch in der Regel mehr Partien gegen taktisch stärkere Engines.

Viele Grüße
Frank

Und der Neural Network Vorteil schwindet so langsam dahin ...
Wenn ich sehe wie stark Stockfish im Turnier spielt.
Parent - - By Frank Quisinsky Date 2024-01-06 18:07
Was ich machen könnte ist ...

Einen Stockfish 17 (wenn verfügbar) mal gegen die 44 Engines 20 Runden spielen lassen mit 66+6
Dauert ca. 1 Woche ... dann wird es klarer!

Elo Unterschied zu dem 3 1/2 Jahre alten letzten Stockfish ohne NN (bevor NN kam, also vom 30.07.2020) wird vermutlich nicht höher sein als bis maximal 110-120 Elo, eher weniger.
Und wenn dann 4x mehr Zeit als 66+6 benutzt wird, wird es wahrscheinlich wieder zu -30 kommen und irgendwann gibt es keinen Vorteil mehr oder nur einen sehr kleinen.

Und was ich meine zur "kleinen neuen Erkenntnis".
Habe noch niemanden gesehen der behauptet, dass bei Stockfish der Unterschied nur noch um die 100 sind wenn mit längeren Bedenkzeiten gespielt wird.
Mein Kommentar der letzen Wochen: NN ist auch eine Illusion hinsichtlich Spielstärkesteigerungen ...

Rechne ich alle Zuwächse auf der Stockfish Seite mal zusammen:
Also, Versionen vom 30.07.2020 bis heute komme ich auf weit über 400 Elo.
Aber sicherlich ist das so, unter den Bedinungen mit denen dort getestet wird nur hebt sich das offenbar mit längeren Bedenkzeiten dann fast auf.
Parent - - By Lothar Jung Date 2024-01-06 18:32
In den Partien gegen LC0 sieht man, das Stockfish bei 3/2 sehr stark ist, da das NNUE Netz sehr schnell gute Bewertungen liefert. LC0 braucht wegen der rechenintensiven Algebra deutlich länger.
LC0 hat auch mit höheren Hardwarelatenzen (PCI-Bus) zu kämpfen.
Bei höheren TCs fällt das weniger ins Gewicht.
Parent - - By Frank Quisinsky Date 2024-01-06 18:46 Edited 2024-01-06 18:51
Hallo Lothar,

kann mir gar vorstellen das Lc0 bei wirklich langen Bedenkzeiten stärker ist als Stockfish.
Schaue ich auf Ergebnisse, die ich seinerzeit bei den FCP-Ratings produziert habe. Da spielte Lc0 auf 3070 Ti.

Im Grunde wäre das zu erkennen an der Anzahl der Gewinnpartien gegen Engines mit hoher Spielstärke, nicht an den vielen Remispartien die Beide produzieren.
Sagte ja schon Lc0 hat sehr gute Stats in allen Bereichen, Stockfish nicht gerade bei den Remispartien.

Auch war mein persönlicher Eindruck von Lc0, dass das Spiel gegen Angreifer besser ist.
Genau gegen diese Gegner werden mehr Gewinne eingefahren.

Sind nur kleine Anzeichen und bewiesen ist das alles nicht.

Hinzu kommen die von Dir beschriebenen Gründe, aber da kennst Du dich sicherlich 100x besser aus.
Beschäftige mich mit der Engine zu wenig.

Nur wenn Lc0 besser ist als Stockfish, sind die Unterschiede bei längeren Bedenkzeiten sicherlich auch wieder sehr gering (Vermutung).

Viele Grüße
Frank
Parent - - By Lothar Jung Date 2024-01-06 18:52
Hinzu kommt der Vorteil der CPU-Caches:

CPU-Caches sind ein wichtiger Bestandteil der Computerarchitektur, die dazu dienen, die Geschwindigkeit zu erhöhen, mit der ein Prozessor auf Daten zugreift. NNUE (Efficiently Updatable Neural Network) ist ein neuronales Netzwerk, das speziell für Schach-Engines wie Stockfish entwickelt wurde, um die Bewertung von Schachpositionen zu verbessern. Die Effizienz von NNUE beruht auf seiner Fähigkeit, schnell aktualisiert zu werden, während sich die Position auf dem Brett ändert.

Der Zugriff auf das NNUE kann durch CPU-Caches beschleunigt werden, da:

1. **Reduzierung der Zugriffszeit**: Caches sind viel schneller als der Hauptarbeitsspeicher. Wenn NNUE-Daten im Cache gespeichert werden, kann der Prozessor schneller darauf zugreifen.

2. **Lokalität der Daten**: NNUE-Bewertungen erfordern häufig den Zugriff auf die gleichen Daten. Caches nutzen das Prinzip der räumlichen und zeitlichen Lokalität, wodurch wiederholte Zugriffe auf diese Daten schneller werden.

3. **Effizienzsteigerung**: NNUE muss ständig aktualisiert werden. Caches helfen, die Übertragung kleiner Datenmengen zwischen den Updates zu beschleunigen, wodurch die Gesamtleistung der Schach-Engine verbessert wird.

Insgesamt verbessern CPU-Caches die Leistung von Schach-Engines, die NNUE verwenden, indem sie den schnellen Zugriff auf häufig verwendete Daten ermöglichen und die Verarbeitungszeit für das Aktualisieren und Bewerten von Positionen reduzieren.
Parent - - By Frank Quisinsky Date 2024-01-06 19:06 Edited 2024-01-06 19:16
Nehme ich gern zur Kenntnis und wird sicherlich auch so sein!!
Könnte ja mit meinen Bedingungen siumuliert werden bzw. auch Lc0 könnte gegen alle mal antreten.
Nur, dass dauert mindestens 6 Monate. Ich mache das nicht mehr.

Zurück zu den CPU-Engines:
Ich finde die Experimente die Ed mit Rebel EAS durchführt nicht uninteressant.
Das zu sehen mit den Tools von Stefan Pohl macht die Sache noch spannender!

z. B. der Tatbestand, dass ab Punkt x in einer Partie ein deutlicher Vorteil erzeugt wird ist definitiv SUPER!
Hatte ich bei allem was ich in den letzten Jahren machte nie auf dem Schirm.

Denke zwar, dass schnelle Siege höher zu bewerten sind als das aber ich streite gar nicht ab das ich da falsch liegen könnte und entscheidende Vorteile höher zu bewerten sind als schnelle Siege.

Genau der Punkt:
Engines, die schnelle Siege produzieren hinterlassen bei den Angriffen oft fragwürdige Bauernstrukturen wenn die abgewährt werden.
Dann stellt sich die Frage, ob schnelle Siege wirklich so hoch bewertet werden sollten.

Insofern, jede neue Idee ist und bleibt interessant und wir sind noch lange nicht am Ende der Fahnenstange angekommen.
Egal ob neue Ideen dann mal ins Nirwana laufen oder nicht.
Parent - - By Lothar Jung Date 2024-01-06 19:37
Testen von LC0 mit anderen Engines ist sehr zeitaufwendig.
Auf Discord wird fast nur gegen Stockfish getestet.
Was sehr schade ist!
SSDF ist da anderes und LC0 war an erster Stelle.

Bei der Relation zu Stockfish ist noch folgendes zu berücksichtigen:

1. Die High-End-Serverhardware für Stockfish hat sehr große Caches.
2. Die NNUE wird mit LC0-Trainingsmaterial gefüttert. Also NNUE weist schon bei LC0-Partien Bescheid.
3. Bei den UHU-Eröffnungen ist LC0 im Nachteil, da mit der Ausgangsstellung trainiert wird.
4. Nur bei Fischerchess wurde speziell trainiert und Leela konnte mindestens gleichziehen.
Parent - - By Frank Quisinsky Date 2024-01-06 20:03 Edited 2024-01-06 20:42
Hi Lothar,

bei den CPU-Engines untereinander ist dann interessant das keine an Stockfish vorbeizieht.
Irgendwann haben sich 30, 40, 50 Engines unter Stockfish einsortiert, alle nicht schwächer als 50 Elo.

UHU ist speziell!
Im Grunde wird hauptsächlich abgetestet, ob nach einer schlechten Eröffnungsvorgabe noch ein Remis erzielt werden kann.
Aber geanu das Material eignet sich, um mehr über so viele andere Sachen herauszufinden.

Schrieb ja:
Was UHU macht lässt sich auch anders simulieren und startete hierzu ja einen Thread.

Punkt 2 ist interessant und Dein Punkt 4:

Fischer Chess ist interessant für das Training. Damit werden abwegige Figurenkonstellationen getestet, auch was für Menschen nicht menschlich ist kann interessant für Computer-Programme sein, die auf menschliches Wissen beruhen.

Da gab es in den 80er Jahren mal ein nettes Experiment mit einem GM.
Dem wurden eine Reihe normaler Positionen präsentiert, er möge sich die ansehen und dann nach kurzer Zeit wieder aufbauen.
Glaube er schaffte 8 von 10.

Dann wurden eine Reihe unnormaler Positionen präsentiert, Stellungen die so komisch aussahen das diese nicht typisch genug waren.
Glaube er schaffte 1 von 10.

So Sachen kann man gut mit FRC trainieren.
Umso verblüffter sind wir dann, wenn es zu ungleichen Figuren auf dem Brett kommt und der höhere Materialwert nicht unbedingt in Vorteil ist.

Nach meinem Wissen trainieren einige Programmierer mit FRC-Positionen.

Zurück zu Stockfish:
Stockfish stagniert augenscheinlich!

Erinnere mich an die erste NN Version und der Meldung +80 Elo.
Und wie viel ist es 3.5 Jahre später bei längeren Bedenkzeiten ... echt krass!

Wie viel Hardware wurde verbraucht, welche Stromkosten sind entstanden und wie viele arbeiten daran.

Wenn wir mit irgend etwas an der Fahnenstange angekommen sind, ist es eher Neural-Network, zumindest dahingehend wie es heute eingesetzt wird.
Betrachte ich so die Ergebnisse, kann ich ja auch nicht zu irgend welchen anderen Schlussfolgerungen kommen.

Aber ich lasse mal auf mich zukommen was in diesem Jahr alles passiert und lasse mein laufendes Turnier sehr wahrscheinlich länger laufen.
So habe ich mehr Material aber wahrscheinlich wird es sich bestätigen was ich in den letzten Monaten herausgefunden habe bzw. vermute.

Und zu dem Punkt 1:
Kann das Stockfish Team auch die 10fache Hardwareleistung haben, spielt im Grunde keine Rolle wenn die Vorteile schwinden.
Dann stellen sich ganz andere Fragen!

Interessasnt finde ich so so eine Art Wabe aufzubauen.
Also, 64 Trainings-Dateien die alle spezielle Aufgaben haben ... wie z. B. jede einzelne syzygy Datenbank die abgerufen wird.

Dann greift eine Engine je nach Position auf die passenden NN Files zu.

Wenn das vorhanden ist geht es immer weiter:
Wie lassen sich z. B. 64 Trainings Dateien cachen oder in eine Art SMP-Mode versetzen.

Solche Geschichten könnten die Spielstärke weiter voran treiben.

Daher begeistert mich z. B. SlowChess.
Mit kleinen Neural-Network Dateien zu einem hervorragenden Ergebnis ...
Der Programmierer ist ein Genius denn die produzierte Leistung scheint unglaublich gut zu sein!

Gruß
Frank
Parent - - By Max Siegfried Date 2024-01-06 23:19
Kann man wirklich sagen das Stockfish stagniert?

1.Die Entwickler haben Stockfish stärker gemacht.
2.Die Netze werden besser trainiert und sind auch stärker geworden.
3.Die Hardware ist Leistungsfähiger geworden. Besonders die Apple Hardware.

= Die Remisquote ist deutlich angestiegen und das wird offensichtlich auch in Zukunft der Fall sein.

Mir macht weniger die zunehmende Remisquote Sorgen, sondern die steigende Anzahl der 0.00 Bewertungen, welche zusätzlich immer früher in der Eröffnung angezeigt werden, als auch immer früher im Endspiel.
Irgendwann zeigen die Engines nur noch 0.00 an. Wie soll man damit analysieren?
Parent - By Olaf Jenkner Date 2024-01-07 00:30
Willst du eine Remisstellung gewinnen?
Parent - - By Frank Quisinsky Date 2024-01-07 01:48 Edited 2024-01-07 02:13 Upvotes 1
Hallo Max,

schaut danach aus aber um absolut genaues festzustellen habe ich nicht viel.
Die Tendenzen weisen darauf hin, um es anders auszudrücken.

Gibt mehrere Varianten:

1. Stockfish stagniert.
2. Neural Network schwindelt uns einen Vorteil vor, der mit mehr Zeit mehr und mehr verschwindet.
3. Die Stockfish Test-Methoden sind nicht mehr zeitgemäß.
4. Gewisse Schwellen wurden erreicht.

zu 1:  Hört sich härter an als es ist. Wenn das Stockfish Team z. B. beim Test feststellt das eine Verbesserung 8 Elo gebracht hat muss man das nur realistisch sehen, bei längeren Bedenkzeiten könnte das dann auf 2 Elo heruntergehen. Und jede noch so kleine Verbesserung macht unsere Nummer 1 wieder stärker.
zu 2:  Eigentlich kaum zu glauben, aber darauf deutet vieles hin, wenn die letzte Stockfish Version, bevor NN kam, so derart stark spielt.
zu 3:  Ich vertraue auf die Power, die in einem solch großen Team steckt. Ferner war die Leistung, die mit bisherigen Testmethoden erbracht wurde, super. Dennoch stellt sich immer die Frage ob irgendwann der Punkt gekommen ist, wo bewährte Testmethoden nicht mehr zielführend sind.
zu 4:  Mag sein mit den Möglichkeiten, die wir haben, dem Wissen was vorhanden ist und dem Stand der programmiertechnischen derzeitigen Möglichkeiten. Heißt nicht wir mit Schach zu 99% durch sind. Du kannst auch mal folgendes Experiment machen. Lasse Stockfish gegen sich selbst spielen mit unterschiedlichen Bedenkzeiten. Stockfish 16 dann mit 3+1 gegen Stockfish 16 mit 120 +12 (nur ein Beispiel). Wenn Schwellen erreicht wurden, wird der Unterschied sehr niedrig sein. Ich kann Dir jetzt schon sagen, der Unterschied ist groß genug, um nicht davon auszugehen.

Und zu den 0,00 Bewertungen.
Das dachten wir auch schon vor Neural-Network bei Stockfish. In der ersten Runde bei 66+6 gab es so eine Partie. Stockfish verlor in der ersten Runde 4x und in einer Partie war die Engine länger auf 0,00 und verlor dann ziemlich krass. Glaube das war gegen Caissa in der Eröffnung (mehrere Züge in Folge mit 0,00). Gegen Igel gab es eine krasse Niederlage in der Eröffnung, unglaublich. Aber auch Igel gehört zu den Engines die eine Partie sehr schnell entscheiden können. Aber diese Partie ... beim FCP-Tourney-2020 wurden nach 2000 4 Partien verloren. Niemals habe ich Stockfish ohne NN-File in solch einen Angriff laufen sehen.

Suche die Partie mal raus ...

Event:
Ort:
Datum:

Weiss:
Schwarz:

Ergebnis
Board


Code:
[Event "66 Minutes/Game + 6 Seconds/Move"]
[Site "fcp-tourney-2024-ma, Gutweiler"]
[Date "2024.01.01"]
[Round "1.32"]
[White "Igel 3.5.0 NN"]
[Black "Stockfish 200731 dev"]
[Result "1-0"]

1. d4 {book 0s} Nf6 {book 0s} 2. c4 {book 0s} e6 {book 0s}
3. Nc3 {book 0s} Bb4 {book 0s} 4. e3 {book 0s} Bxc3+ {book
0s} 5. bxc3 {book 0s} b6 {book 0s} 6. Bd3 {book 0s} Bb7
{book 0s} 7. f3 {+1.04/34 5:10m} d6 {+0.44/36 4:59m} 8. Ne2
{+0.91/33 4:47m} Nc6 {+0.21/30 28s} 9. O-O {+0.96/33 4:25m
(e4)} Na5 {+0.20/37 1:27m} 10. e4 {+0.71/31 4:05m (Ng3)}
Ba6 {-0.01/36 45s} 11. f4 {+1.82/31 3:47m (Bg5)} O-O
{+0.48/38 3:20m} 12. Ng3 {+2.34/33 3:30m (f5)} Bxc4
{+0.40/34 40s} 13. Bxc4 {+2.86/33 3:14m} Nxc4 {+0.13/38
1:20m} 14. f5 {+2.76/36 3:00m} e5 {0.00/40 57s} 15. Bg5
{+2.63/36 2:46m (Qe2)} h6 {-0.60/35 42s} 16. Bh4 {+3.46/34
2:34m} Ne3 {+1.86/39 2:35m} 17. Qf3 {+3.32/36 2:22m} Nxf1
{+1.57/40 1:03m} 18. Rxf1 {+3.66/35 2:12m} Re8 {+1.86/47
7:24m (g5)} 19. Nh5 {+4.30/32 2:02m} Kf8 {+2.14/45 1:26m}
20. h3 {+5.05/33 1:53m (Nxf6)} exd4 {+2.94/41 3:28m}
21. cxd4 {+4.51/35 1:45m} c5 {+2.81/36 27s} 22. Bxf6
{+5.22/35 1:37m} gxf6 {+3.51/39 1:49m} 23. Qf4 {+5.01/35
1:30m (Qe3)} Ke7 {+3.66/37 55s} 24. Qxh6 {+5.42/34 1:24m}
Kd7 {+3.47/37 39s} 25. Nxf6+ {+4.29/32 1:18m} Kc7 {+3.70/37
1:06m} 26. Nxe8+ {+5.74/31 1:12m} Qxe8 {+3.47/37 58s}
27. dxc5 {+5.32/33 1:07m} bxc5 {+3.74/38 1:30m} 28. Qf6
{+5.37/32 1:02m} Rd8 {+3.77/35 45s} 29. Re1 {+5.59/30 58s}
Rd7 {+3.90/33 1:06m} 30. Kf2 {+6.04/27 54s} Qe5 {+3.82/34
1:58m} 31. Qxe5 {+7.15/28 50s} dxe5 {+4.83/34 1:07m} 32. h4
{+7.66/29 47s} Kd8 {+5.33/39 5:14m} 33. g4 {+8.63/28 44s
(h5)} c4 {+6.83/37 3:43m} 34. g5 {+9.26/27 33s (h5)} Rd2+
{+7.94/38 6:08m (Ke7)} 35. Re2 {+9.83/29 38s} Rd3 {+6.88/30
18s} 36. Re3 {+10.51/28 36s} Rd2+ {+8.71/37 4:42m} 37. Kf3
{+10.89/30 35s (Kg3)} Rc2 {+6.07/27 12s} 38. g6 {+13.89/29
31s (h5)} fxg6 {+9.95/29 37s} 39. fxg6 {+14.85/29 29s} Ke7
{+10.51/29 37s} 40. Ra3 {+16.20/30 28s} a6 {+13.25/31
2:19m} 41. Rxa6 {+17.19/33 38s (h5)} Rc3+ {+25.83/30 2:26m}
42. Kg4 {+17.66/31 12s} Rc2 {+29.94/29 34s (Rc1)} 43. h5
{+27.03/24 23s} c3 {+29.94/24 1s} 44. h6 {+219.82/23 21s
(Kf3)} Rg2+ {+57.33/29 12s} 45. Kf5 {+190.87/25 20s} c2
{+69.57/26 7s} 46. Rc6 {+225.11/24 19s} Rf2+ {+81.65/25 8s}
47. Kxe5 {+226.24/27 18s} Kd7 {+154.06/25 4s} 48. Rxc2
{+226.12/26 17s} Rxc2 {+154.07/27 0s} 49. g7 {+226.14/24
7s} Rg2 {+154.12/38 2s} 50. h7 {+226.16/24 6s} Rxg7
{+154.13/47 1s (Rg5+)} 51. h8=Q {book 0s} Rg5+ {+154.14/23
1s} 52. Kf4 {book 0s (Kd4)} Rb5 {+M15/34 7s} 53. a3 {book
0s (Qd4+)} Rb1 {+M19/29 10s} 54. a4 {book 0s (Qh3+)} Rf1+
{+154.14/26 2s} 55. Ke5 {book 0s} Kc7 {+M15/46 8s} 56. a5
{book 0s} Rb1 {+M14/51 1s} 57. a6 {book 0s (Qa8)} Rb5+
{+M12/49 2s} 58. Kf4 {book 0s (Kd4)} Kb6 {+M13/58 2s}
59. e5 {book 0s (Qa8)} Rb4+ {+M16/26 4s} 60. Kg5 {book 0s
(Kf3)} Rb5 {+M14/34 4s} 61. a7 {book 0s (Qa8)} Kxa7
{+M16/47 3s} 62. Kh6 {book 0s (Qh7+)} Rb6+ {+M15/26 3s}
63. e6 {book 0s (Qf6)} Rxe6+ {+154.14/30 6s} 64. Kg5 {book
0s} Rd6 {+154.14/33 10s} 65. Kf4 {book 0s (Qe5)} Ka6
{+154.14/36 10s} 66. Ke5 {book 0s (Qf8)} Rd3 {+M23/44 18s}
67. Ke4 {book 0s (Qh2)} Rb3 {+M26/38 1s} 68. Kd5 {book 0s
(Qg8)} Ka5 {+M24/45 4s} 69. Qa8+ {book 0s (Kc4)} Kb4
{+M24/44 1s} 70. Kd4 {book 0s} Rb2 {+M17/49 3s} 71. Qb7+
{book 0s} Ka3 {+M16/53 3s} 72. Qa6+ {book 0s} Kb3 {+M15/58
3s} 73. Kd3 {book 0s} Kb4 {+M14/61 3s} 74. Qa1 {book 0s
(Qf6)} Rb3+ {+M15/50 3s} 75. Kc2 {book 0s} Ra3 {+M14/55 3s}
76. Qb2+ {book 0s} Ka4 {+M12/61 3s} 77. Qb6 {book 0s} Rh3
{+M11/62 4s} 78. Qe6 {book 0s} Rh4 {+M10/68 4s} 79. Qd7+
{book 0s} Kb4 {+M9/74 4s} 80. Qe7+ {book 0s} Kb5 {+M8/81
5s} 81. Qxh4 {book 0s} Kb6 {+M7/71 4s} 82. Kd3 {book 0s
(Kc3)} Kc6 {+M6/135 4s} 83. Kd4 {book 0s (Qe7)} Kd7
{+M5/245 2s} 84. Kd5 {book 0s (Qf6)} Kc7 {+M4/245 0s}
85. Qb4 {book 0s} Kd8 {+M3/245 0s} 86. Kd6 {book 0s (Qb7)}
Ke8 {+M2/245 0s} 87. Ke6 {book 0s} Kd8 {+M1/58 0s} 88. Qb8#
{book 0s} 1-0


Igel schon krass mit der Bewertung der Eröffnung.
Ich habe vor dem Turnier alle Varianten mit SF16 prüfen lassen und SF16 gibt nicht eine solch hohe Bewertung aus.
Und Igel in der Regel auch nicht, wenn die Stellung nicht ausgeglichen ist.

+1,04 mit dem ersten errechneten Zug 7.
Wie SF am Damenflügel rumeiert mit Springer und Läufer ist grausam.
Rochade dann nicht gut und dann noch das Qualitätsopfer von Igel ... viele kleine Vorteile die zum Sieg führten.
Aber die Eröffnung war alles andere als gut gespielt.

Das ist z. B. eine herausragende Eigenschaft auch von Igel.
Klar, offene Stellung gibt Bonus, wenn leicht alles zügig entwickelt werden kann.

Die Bewertungen von Igel nach den Buchzügen ist nach allen, was ich bislang gesehen habe, erstklassig.
Auch eine besondere Engine, die vieles auch eigensinnig spielt und mithin eine Errungenschaft ist.

Gruß
Frank

Also sollten uns von den Bewertungen nach den Buchzügen (in den meisten Fällen) nicht irre machen lassen.
Parent - - By Peter Martan Date 2024-01-07 09:10 Edited 2024-01-07 10:00
Frank, die "neue kleine Erkenntnis", die uns diese Partie bringen könnte, wäre gar so neu (allerdings auch gar so klein) eigentlich nicht, SF 2020 (interpretiere ich 200731 richtig?) war insbesondere in der Eröffnung, und in der geht dies Partie halt bereits verloren, noch nicht das, was er seit NNUE- Unterstützung ist.

10...La6? nach 45" in Tiefe 36, das ist mit SF dev. in keiner Weise reproduzierbar auf moderner Hardware.

Mit leerem Hash (1G) single thread gestartet:



Analysis by Stockfish dev-20240101-0fca5605:

10...Sd7 11.Sf4 De7 12.De2
  Weiß hat minimalen Vorteil. 
  = (0.28)  Tiefe: 10/9   00:00:00
...
10...De7 11.Ld2 c5 12.Sg3 0-0-0 13.De2 Dc7 14.f4 h5 15.e5 h4 16.exf6 hxg3
  Weiß steht etwas besser. 
  +/= (0.50)  Tiefe: 19/27   00:00:01  1152kN
...
10...c5 11.Tb1 h6 12.Sg3 Dc7 13.De2 0-0-0 14.Le3 Thg8 15.Tfe1 Sd7 16.Sf1 g5 17.Sd2 Sc6 18.Sb3 Se7 19.a4 a5 20.Tb2
  Weiß steht etwas besser. 
  +/= (0.53)  Tiefe: 31/48   00:00:33  39809kN
...
10...De7 11.Te1 Sd7 12.Le3 La6 13.Da4 0-0 14.Sc1 c5 15.Sb3 Tfc8 16.Tac1 Sxb3 17.axb3 Lb7 18.Da2 e5 19.Df2 a5 20.Ta1 Kh8 21.Dd2 h6 22.d5 g5 23.b4 Kg7 24.Ta2
  Weiß steht etwas besser. 
  +/= (0.57)  Tiefe: 32/48   00:00:50  58086kN
...
10...De7 11.Te1 Sd7 12.Le3 La6 13.Da4 0-0 14.Sc1 c5 15.Sb3 Tfc8 16.Tac1 Sxb3 17.axb3 Lb7 18.Da2 e5 19.Df2 a5 20.Ta1 Sf8 21.d5 Te8 22.h4 Lc8 23.h5 Ld7 24.Dg3
  Weiß steht etwas besser. 
  +/= (0.57 ++)  Tiefe: 34/48   00:01:11  82974kN

Und wenn man dann den Zug aus der Partie eingibt, das 10...La6?:



Analysis by Stockfish dev-20240101-0fca5605:

11.Lg5 Dd7 12.d5 h6 13.Lxf6 gxf6 14.Sd4
  Weiß steht etwas besser. 
  +/= (0.60)  Tiefe: 10/15   00:00:00
...
11.f4 De7 12.e5 Sd7 13.La3 Lxc4 14.f5 0-0-0 15.Sg3 Sb8 16.exd6 cxd6 17.fxe6 fxe6 18.Se4
  Weiß steht besser. 
  +/- (1.20)  Tiefe: 18/25   00:00:00  253kN
...
11.f4 De7 12.Sg3 0-0-0 13.e5 Se8 14.c5 Lxd3 15.Dxd3 dxc5 16.Da6+ Kb8 17.La3 Dd7 18.Lxc5 f5 19.Tab1 Ka8 20.Lb4 Sc6 21.Se2 Tb8 22.Tbc1 g6 23.Dd3 Sxb4 24.cxb4 c6 25.d5 cxd5 26.Sd4
  Weiß steht deutlich besser. 
  +/- (1.32 ++)  Tiefe: 33/61   00:00:52  61615kN

Hier erkennt der single thread SF also sofort den Fehler und springt mit der Eval nach oben, wohlgemerkt, das ist unmittelbar nach dem Start mit leerem Hash. Von wann ist dein SF in dieser Partie, 200731 spricht für 2020, das wäre so ungefähr SF11, aber auch der spielt bei mir nicht 10...La6? single thread mit leerem Hash.

Das ist ein Backward, das ich dann mit 30 Threads und 8G und 30"/Zug vom 20. an (bei dem ja schon längst alles entschieden war, eigentlich war's das schon nach dem 10., spätestens nach dem 11. Zug) habe laufen lassen:

[Event "66 Minutes/Game + 6 Seconds/Move"]
[Site "fcp-tourney-2024-ma, Gutweiler"]
[Date "2024.01.01"]
[Round "1.32"]
[White "Igel 3.5.0 NN"]
[Black "Stockfish 200731 dev"]
[Result "1-0"]
[ECO "E43"]
[Annotator "Peter"]
[PlyCount "175"]
[EventDate "2024.??.??"]

1. d4 {book 0s} Nf6 {book 0s} 2. c4 {book 0s} e6 {book 0s} 3. Nc3 {book 0s} Bb4 {book 0s} 4. e3 {book 0s} Bxc3+ {book 0s} 5. bxc3 {book 0s} b6 {book 0s} 6. Bd3 {book 0s} Bb7 {book 0s} 7. f3 {1.04/34 310} d6 {0.44/36 299} 8. Ne2 {0.91/33 287} Nc6 {0.53/38 28 letzter Buchzug} 9. O-O {0.56/37 265 (e4)} Na5 {0.56/38 87} 10. e4 {0.55/35 245 (Ng3)} Ba6 {1.42/37 45} ({Stockfish dev-20240101-0fca5605:} 10... Qe7 {0.55/35}) 11. f4 {1.35/38 227 (Bg5)} O-O {1.95/38 200} ({Stockfish dev-20240101-0fca5605:} 11... Qe7 {1.35/38}) 12. Ng3 {1.79/40 210 (f5)} Bxc4 {1.95/34 40} 13. Bxc4 {1.79/36 194} Nxc4 {1.86/32 1:20m} 14. f5 {1.74/36 180} e5 {2.73/34 57} ({Stockfish dev-20240101-0fca5605:} 14... h6 {1.74/36}) 15. Bg5 {2.49/36 166 (Qe2)} h6 {2.62/32 42} 16. Bh4 {2.41/38 2:34m} Ne3 {2.86/35 155} 17. Qf3 {2.63/37 142} Nxf1 {2.78/34 63} 18. Rxf1 {2.56/38 132} Re8 {3.74/31 7:24m (g5)} ({Stockfish dev-20240101-0fca5605:} 18... g6 {2.56/38}) 19. Nh5 {3.46/36 122} Kf8 {3.72/36 86} 20. h3 {3.41/35 113 (Nxf6)} exd4 {2.94/41 208} (20... exd4 {3.75/35}) 21. cxd4 {4.51/35 105} c5 {2.81/36 27} 22. Bxf6 {5.22/35 97} gxf6 {3.51/39 109} 23. Qf4 {5.01/35 1:30m (Qe3)} Ke7 {3.66/37 55} 24. Qxh6 {5.42/34 84} Kd7 {3.47/37 39} 25. Nxf6+ {4.29/32 78} Kc7 {3.70/37 1:06m} 26. Nxe8+ {5.74/31 72} Qxe8 {3.47/37 58} 27. dxc5 {5.32/33 67} bxc5 {3.74/38 90} 28. Qf6 {5.37/32 62} Rd8 {3.77/35 45} 29. Re1 {5.59/30 58} Rd7 {3.90/33 66} 30. Kf2 {6.04/27 54} Qe5 {3.82/34 1:58m} 31. Qxe5 {7.15/28 50} dxe5 {4.83/34 67} 32. h4 {7.66/29 47} Kd8 {5.33/39 314} 33. g4 {8.63/28 44 (h5)} c4 {6.83/37 223} 34. g5 {9.26/27 33 (h5)} Rd2+ {7.94/38 368 (Ke7)} 35. Re2 {9.83/29 38} Rd3 {6.88/30 18s} 36. Re3 {10.51/28 36} Rd2+ {8.71/37 282} 37. Kf3 {10.89/30 35 (Kg3)} Rc2 {6.07/27 12} 38. g6 {13.89/29 31s (h5)} fxg6 {9.95/29 37} 39. fxg6 {14.85/29 29} Ke7 {10.51/29 37} 40. Ra3 {16.20/30 28} a6 {13.25/31 2:19m} 41. Rxa6 {17.19/33 38 (h5)} Rc3+ {25.83/30 146} 42. Kg4 {17.66/31 12} Rc2 {29.94/29 34 (Rc1)} 43. h5 {27.03/24 23} c3 {29.94/24 1} 44. h6 {219.82/23 21 (Kf3)} Rg2+ {57.33/29 12} 45. Kf5 {190.87/25 20} c2 {69.57/26 7} 46. Rc6 {225.11/24 19} Rf2+ {81.65/25 8} 47. Kxe5 {226.24/27 18} Kd7 {154.06/25 4} 48. Rxc2 {226.12/26 17} Rxc2 {154.07/27 0} 49. g7 {226.14/24 7s} Rg2 {154.12/38 2} 50. h7 {226.16/24 6} Rxg7 {154.13/47 1 (Rg5+)} 51. h8=Q {book 0s} Rg5+ {154.14/23 1s} 52. Kf4 {book 0s (Kd4)} Rb5 {#15/34 7} 53. a3 {book 0s (Qd4+)} Rb1 {#19/29 10} 54. a4 {book 0s (Qh3+)} Rf1+ {154.14/26 2} 55. Ke5 {book 0s} Kc7 {#15/46 8} 56. a5 {book 0s} Rb1 {#14/51 1} 57. a6 {book 0s (Qa8)} Rb5+ {#12/49 2} 58. Kf4 {book 0s (Kd4)} Kb6 {#13/58 2} 59. e5 {book 0s (Qa8)} Rb4+ {#16/26 4} 60. Kg5 {book 0s (Kf3)} Rb5 {#14/34 4} 61. a7 {book 0s (Qa8)} Kxa7 {#16/47 3} 62. Kh6 {book 0s (Qh7+)} Rb6+ {#15/26 3} 63. e6 {book 0s (Qf6)} Rxe6+ {154.14/30 6} 64. Kg5 {book 0s} Rd6 {154.14/33 10} 65. Kf4 {book 0s (Qe5)} Ka6 {154.14/36 10} 66. Ke5 {book 0s (Qf8)} Rd3 {#23/44 18} 67. Ke4 {book 0s (Qh2)} Rb3 {#26/38 1} 68. Kd5 {book 0s (Qg8)} Ka5 {#24/45 4} 69. Qa8+ {book 0s (Kc4)} Kb4 {#24/44 1} 70. Kd4 {book 0s} Rb2 {#17/49 3} 71. Qb7+ {book 0s} Ka3 {#16/53 3} 72. Qa6+ {book 0s} Kb3 {#15/58 3s} 73. Kd3 {book 0s} Kb4 {#14/61 3} 74. Qa1 {book 0s (Qf6)} Rb3+ {#15/50 3} 75. Kc2 {book 0s} Ra3 {#14/55 3} 76. Qb2+ {book 0s} Ka4 {#12/61 3} 77. Qb6 {book 0s} Rh3 {#11/62 4} 78. Qe6 {book 0s} Rh4 {#10/68 4} 79. Qd7+ {book 0s} Kb4 {#9/74 4} 80. Qe7+ {book 0s} Kb5 {#8/81 5s} 81. Qxh4 {book 0s} Kb6 {#7/71 4} 82. Kd3 {book 0s (Kc3)} Kc6 {#6/135 4} 83. Kd4 {book 0s (Qe7)} Kd7 {#5/245 2} 84. Kd5 {book 0s (Qf6)} Kc7 {#4/245 0} 85. Qb4 {book 0s} Kd8 {#3/245 0} 86. Kd6 {book 0s (Qb7)} Ke8 {#2/245 0} 87. Ke6 {book 0s} Kd8 {#1/58 0} 88. Qb8# {book 0s} 1-0

Dann hab' ich neu gestartet und noch einmal die 30 Threads mit leeren 8G Hash MultiPV=8 bis in Tiefe 31 rechnen lassen (so eine Minute lang ungefähr):

r2qk2r/pbp2ppp/1p1ppn2/n7/2PPP3/2PB1P2/P3N1PP/R1BQ1RK1 b kq - 0 1

Analysis by Stockfish dev-20240101-0fca5605:

1. +/= (0.52):  10...h6 11.Sg3 h5 12.Tf2 h4 13.Sf1 Dd7 14.De2 Sh5 15.Le3 e5 16.Sd2 Sf4 17.Lxf4 exf4 18.h3 0-0 19.Te1 Tfe8 20.Sb3 Sxb3 21.axb3 Dd8 22.Dd2 Dg5 23.Kh1 a5 24.Tfe2 Te7 25.b4 g6 26.Db2 c5 27.bxa5 bxa5

2. +/= (0.53):  10...Sd7 11.f4 De7 12.La3 c5 13.Sc1 0-0 14.Sb3 Sxb3 15.axb3 f6 16.Dh5 e5 17.Tae1 a5 18.Lc2 Tfe8 19.Dd1 Sf8 20.Lc1 cxd4 21.cxd4 exd4 22.Dd3 Dc7 23.La3 Tac8 24.Lb1 a4 25.bxa4 La6 26.Dxd4 Lxc4

3. +/= (0.59):  10...De7 11.Te1 Sd7 12.Le3 La6 13.Da4 0-0 14.Sc1 Tfc8 15.Sb3 c5 16.Tac1 Sxb3 17.axb3 Lb7 18.Da2 e5 19.Df2 a5 20.Ta1 Sf6 21.d5 Sh5 22.Dd2 Sf6 23.h4 Ta7 24.g4 Tca8 25.Df2 a4 26.b4 h6 27.Dg3 Lc8 28.Ta2 a3 29.Tea1 Ta4

4. +/= (0.60):  10...Dd7 11.d5 De7 12.Sd4 Sd7 13.Sb3 0-0 14.Sxa5 bxa5 15.La3 Se5 16.Le2 La6 17.c5 Lxe2 18.Dxe2 dxc5 19.Tad1 Tfe8 20.c4 Sd7 21.Dd2 Dd6 22.Dxa5 h6 23.Tfe1 exd5 24.Txd5 De6 25.Tc1 c6 26.Tdd1 f5

5. +/= (0.66):  10...c5 11.Sg3 h5 12.Tf2 h4 13.Sf1 h3 14.g3 Dc7 15.Sd2 La6 16.Df1 cxd4 17.cxd4 Tc8 18.a4 0-0 19.Dxh3 Sxc4 20.Sf1 Sh7 21.g4 Db7 22.e5 g6 23.Dh6 Dd5 24.exd6 Dxd6 25.Lxc4 Txc4 26.La3 Dd8 27.Lxf8 Sxf8 28.De3 Lb7 29.Taa2 g5

6. +/- (0.87):  10...Dc8 11.Te1 h6 12.Sg3 Dd7 13.f4 0-0-0 14.e5 Se8 15.De2 Kb8 16.Tb1 f6 17.exd6 Sxd6 18.c5 Sf5 19.Lb5 Lc6 20.Lxc6 Sxc6 21.Da6 The8 22.Se4 e5 23.dxe5 fxe5 24.a4 Dc8 25.Db5 Db7 26.cxb6 Dxb6+ 27.Le3 Dxb5 28.Txb5+ Ka8 29.Lf2 Sd6 30.Sxd6 cxd6

7. +/- (1.06):  10...Tf8 11.Sg3 Dd7 12.De2 0-0-0 13.Lg5 Kb8 14.Tae1 Tde8 15.h3 Th8 16.f4 h6 17.Lxf6 gxf6 18.Kh2 Dd8 19.Tf2 La6 20.Sh5 f5 21.e5 De7 22.exd6 Dxd6 23.c5 Lxd3 24.Dxd3 Dc6 25.Tb2 Td8 26.Te5 Thg8 27.cxb6 Sc4 28.bxc7+ Kxc7 29.De2 Sxb2 30.Tc5 Dxc5 31.dxc5 Sd3 32.c4 Sxc5 33.Sf6 Tg6 34.De1 Tc8 35.Da5+ Kb8

8. +/- (1.17):  10...La6 11.f4 De7 12.Sg3 0-0-0 13.e5 Se8 14.c5 Lxd3 15.Dxd3 dxc5 16.Da6+ Kb8 17.La3 Dd7 18.Lxc5 Dc8 19.De2 bxc5 20.Tab1+ Ka8 21.Tb5 cxd4 22.Txa5 d3 23.Db2 g6 24.Se4 Db7 25.Dxb7+ Kxb7 26.Tb1+ Ka8 27.Kf2 Sg7 28.Tc5 Tb8 29.Td1 Kb7 30.g4 Thd8 31.Sg5 h5 32.Sxf7 Td7

Wie deine SF- Installation in Tiefe 36 auf 10...La6? kommt, müsste man mit einem SF von 2020 zu reproduzieren versuchen, aber was im Spiel aus der move history im Hash ist, lässt sich in der post mortem Analyse halt überhaupt immer nur schwer nachvollziehen.

Edit: Noch der Versuch mit SF11 single thread mit leerem 1G-Hash gestartet:
Zitat:
Von wann ist dein SF in dieser Partie, 200731 spricht für 2020, das wäre so ungefähr SF11, aber auch der spielt bei mir nicht 10...La6? single thread mit leerem Hash.


r2qk2r/pbp2ppp/1p1ppn2/n7/2PPP3/2PB1P2/P3N1PP/R1BQ1RK1 b kq - 0 1

Analysis by Stockfish 11 64 POPCNT30:

10...0-0 11.Sg3 Tc8 12.f4 e5 13.Tb1 Te8 14.d5 c5 15.Sf5
  Weiß steht besser. 
  +/- (0.71)  Tiefe: 10/16   00:00:00
...
10...c5 11.Le3 Tc8 12.Tc1 Sc6 13.Sg3 h5 14.h3 0-0 15.d5 Se5 16.Lg5 La6 17.De2 Sxd3
  Weiß steht besser. 
  +/- (1.16)  Tiefe: 15/24   00:00:00  724kN
...
10...Sd7 11.f4 Dh4 12.Sg3 0-0-0 13.e5 h5 14.Tb1 Kb8 15.De1 Ka8 16.De3 dxe5 17.fxe5 f6 18.exf6 Sxf6 19.Dg5 Dxg5 20.Lxg5 h4 21.Se2 h3 22.g3 The8 23.Lxf6 gxf6 24.Txf6 e5
  Weiß steht etwas besser. 
  +/= (0.59 ++)  Tiefe: 27/39   00:00:30  73431kN
10...Sd7 11.f4 Dh4 12.Sg3 0-0-0 13.e5 h5 14.Tb1 Kb8 15.De1 Ka8 16.De3 dxe5 17.fxe5 f6 18.exf6 Sxf6 19.Dg5 Dxg5 20.Lxg5 h4 21.Se2 h3 22.g3 The8 23.Lxf6 gxf6 24.Txf6 e5
  Weiß steht etwas besser. 
  +/= (0.49 ++)  Tiefe: 27/39   00:00:31  73985kN
1...
10...Sd7 11.Sf4 0-0 12.Le3 c5 13.Tc1 De7 14.De2 Dh4 15.Sh3 Tae8 16.f4 f5 17.e5 De7 18.Lf2 h6 19.Tfd1 Tc8 20.Lg3 Le4 21.Sf2 Lxd3 22.Dxd3 d5 23.cxd5 exd5 24.Tb1 Sc4 25.dxc5 Txc5
  Weiß steht etwas besser. 
  +/= (0.31 ++)  Tiefe: 30/45   00:01:18  189MN

Und wieder nach Ausspielen von 10...La6?:

r2qk2r/p1p2ppp/bp1ppn2/n7/2PPP3/2PB1P2/P3N1PP/R1BQ1RK1 w kq - 0 1

Analysis by Stockfish 11 64 POPCNT30:

11.Lg5 0-0 12.f4 De8 13.Lxf6 gxf6 14.e5 fxe5 15.fxe5 Lxc4
  Weiß steht besser. 
  +/- (1.14)  Tiefe: 10/16   00:00:00
11.Lg5 0-0 12.f4 De8 13.c5 Lc4 14.cxd6 cxd6 15.Sg3 Lxd3 16.Dxd3 Dc6 17.Lxf6
  Weiß steht besser. 
  +/- (1.03)  Tiefe: 11/16   00:00:00
11.Lg5 0-0 12.f4 h6 13.Lh4 Lxc4 14.e5 g5 15.fxg5 Sg4 16.Sf4 Lxd3 17.Sxd3 Se3 18.Dh5 Sxf1 19.Txf1
  Weiß steht besser. 
  +/- (0.78)  Tiefe: 12/20   00:00:00
11.Lg5 0-0 12.f4 h6 13.Lh4 Lxc4 14.e5 g5 15.fxg5 Sg4 16.Sf4 Lxd3 17.Sxd3 Se3 18.Dh5 Sxf1 19.Txf1
  Weiß steht besser. 
  +/- (1.29)  Tiefe: 13/21   00:00:00  100kN
11.Lg5 h6 12.Lxf6 Dxf6 13.Da4+ Kf8 14.f4 De7 15.Sg3 De8 16.Dd1 Sxc4 17.De2 d5 18.f5
  Weiß steht etwas besser. 
  +/= (0.50)  Tiefe: 14/21   00:00:00  200kN
So weit so gut, dann beginnt sich der Fisch aber wieder mehr und mehr zu irren:
...
11.Sf4 0-0 12.De2 c5 13.e5 dxe5 14.dxe5 Sd7 15.Te1 Lb7 16.Sh5 Dh4 17.Sg3 Tad8 18.Td1 g6 19.Tb1 f5 20.exf6 Sxf6 21.Sf1 Tfe8 22.Se3
  Die Stellung ist ausgeglichen. 
  = (0.06)  Tiefe: 20/32   00:00:02  6374kN
...
11.Lg5 h6 12.Lxf6 Dxf6 13.Da4+ Kf8 14.Sc1 Df4 15.Kh1 De3 16.Td1 Ke7 17.Sb3 Sxb3 18.Dxb3 Thd8 19.a4 Kf8 20.Dc2 Lb7 21.a5 e5 22.Tf1 Df4 23.Df2 Df6 24.Kg1 Kg8 25.Tfb1 Dg5 26.Ta2 De7 27.Kh1 Lc6 28.d5 Lb7 29.g3 Kh8 30.Kg2 Lc8 31.f4 exf4 32.gxf4 Df6 33.Dg3 bxa5
  Die Stellung ist ausgeglichen. 
  = (0.15 --)  Tiefe: 39/51   00:02:42  433MN

Scheint also tatsächlich so, dass hier der Unterschied zwischen vor- und nach- NNUE- Ära so richtig deutlich wird.
Parent - - By Frank Quisinsky Date 2024-01-07 10:22 Edited 2024-01-07 10:26
Code:

[ENGINE]
Name=Stockfish 200731 dev
Author=the Stockfish developers
Filename=C:\Chess\Shredder_12\Engines\Stockfish\Stockfish_20073110.exe
[OPTIONS]
Contempt=0
Move Overhead=100
SyzygyPath=d:\Chess\_syzygybases-6
SyzygyProbeLimit=6


Glaube Dir Peter, aber ich wüsste nicht was.
Im Process Explorer schaut bei Stockfish auch alles normal aus.

Ba6 {-0.01/36 45s}

Kam also bei Zugtiefe 36!

Denke Du musst die gleiche SF Version nehmen.
Die kannst Du alle runterladen auf der dev Seite!
Parent - - By Peter Martan Date 2024-01-07 10:42 Edited 2024-01-07 10:48
Ja, die Zweifel, die ich an deiner Installation in der ersten Version meines Postings geäußert hatte ("da stimmt was nicht" oder so ähnlich war wohl meine Formulierung) hab' ich im Lauf der zahlreichen Edits wieder gelöscht. Ich lade mir sicher nicht die Version 200731 runter, es genügt mir schon, gesehen zu haben (kam dann im letzten Edit dazu), dass SF11 (ungefähr des Alters von deiner Version) zwar single thread auch nicht 10...La6? spielt, aber nach Eingabe des Zuges in den Evals schwankt. Es ist gerade, was die Beurteilung solcher Eröffnungszüge angeht, NNUE offensichtlich schon ein Quantensprung gewesen, ja nicht nur für SF, aber der hat's halt (wenn auch zuerst mit dem Shogi- SF) aufgebracht, z.B. Igel hat ja auch stark davon profitiert.
Der Witz ist ja der, wieviel Fortschritt in der jüngeren Vergangenheit wirklich noch passiert sein mag, vor allem aber in der ferneren Zukunft  vielleicht noch passieren wird, spielt dann überhaupt keine Rolle mehr und lässt sich auch durch keine übliche und praktisch relevante Art der "Fortschrittskontrolle" mehr sagen, je weniger sie sich in Eng-Eng-Games noch auswirkt.
Parent - - By Frank Quisinsky Date 2024-01-07 11:35 Edited 2024-01-07 11:51
Ja offenbar auch ein Fortschritt im Mittelspiel der größer ist als ich dachte.

Beispiel:
Wasp vor Neural-Network verlor kaum schnell eine Partie und gewann sehr viele. Das Mittelspiel ist die Stärke der Wasp Versionen mit klassischer Eval gewesen. Insofern schrieb ich John, er möge das Mittelspiel mit der klassischen Eval spielen lassen und dann ca. ab x-Figuren auf dem Brett Neural-Network nutzen um das eher schwächere Endspiel von Wasp (im Vergleich zu den anderen) zu stärken. Er testete das dann auch aber das Ergebnis waren ernüchternd. Wasp wurde auch im Mittelspiel schwächer und das Ergebnis war mithin negativ. Shit, dachte ich mir ... das kann nicht sein aber dem ist so. Nun hat Wasp seine Stärke ja auch mit Neural-Network halten können und Frank ist zufriedengestellt.

Tatsächlich ist es so, das Neural-Network entgegen meiner ehemaligen Ansicht sich auch im Mittelspiel deutlich auswirkt. Dachte eher das der Fortschritt stark überwiegend sich im Übergang zum Endspiel auswirkt.
Die Frage steht dennoch im Raum, ob irgendwann, mit deutlich höherer Bedenkzeit, der Neural-Network Vorteil sich in Luft auflöst.
Wenn im Vergleich von Blitz zu Schnellschach bis hin zu sehr langen Bedenkezeiten der Vorteil mehr und mehr, offenbar gar ziemlich deutlich dahinschmilzt.
Parent - - By Peter Martan Date 2024-01-07 12:24 Edited 2024-01-07 12:26
Frank Quisinsky schrieb:

Die Frage steht dennoch im Raum, ob irgendwann, mit deutlich höherer Bedenkzeit, der Neural-Network Vorteil sich in Luft auflöst.
Wenn im Vergleich von Blitz zu Schnellschach bis hin zu sehr langen Bedenkezeiten der Vorteil mehr und mehr, offenbar gar ziemlich deutlich dahinschmilzt.

Du schreibst von demjenigen Vorteil, der sich mit Eng-Eng-Matches, ausschließlich von Eröffnungsstellungen ausgespielt, nachweisen lässt.
Inwieweit der noch irgendetwas mit einem "wahren" schachlichen Vorteil und Fortschritt zu tun hat, so groß der vielleicht auch immer noch und vielleicht sogar jetzt erst recht sein mag, läßt sich dann halt so (jetzt schon und eigentlich schon länger) nicht mehr sagen.
So what, wir haben ja noch die (vielen anderen ausgespielten und nicht ausgespielten) Stellungstests
Parent - By Frank Quisinsky Date 2024-01-07 13:54 Edited 2024-01-07 13:58 Upvotes 1
Hallo Peter,

ich bin echt am überlegen ob ich nach dem Turnier auch einen Stellungstest kreiere und zwar aus Partien von diesem Turnier.
Habe zwar deutlich mehr Spaß jetzt mit den neuen Turnier-Parametern und Änderungen aber das Hauptproblem bleibt.

Die TOP-Engines untereinander spielen weiterhin zu oft Remis, ändert auch das Buch offenbar nichts dran.
Wobei ich mir hier wirklich etwas habe einfallen lassen.

Auch die Remisquote der ganzen Engines untereinander, die um 3100 Elo liegen, steigt deutlich an, wenn ich das mit älteren
FCP-Turnieren vergleiche wo die drin waren.

Insofern ist die Remisquote von 61,5% total gekünzelt wegen der Elo Spreitzung der Teilnehmer.
Dennoch, macht Spaß zu sehen wie die HCE Engines kämpfen und hier und da auch überraschend Remis spielen.

Werde mal so nach und nach auf die Suche gehen und mir schöne Stellungen für einen Test herauspicken.

Wie dem auch ist ...
Es muss irgend einen Weg geben auch mit Eng-Eng interessant zu testen und die Remisquote zu drücken.

Lese gerade ein wenig was für Ideen Wit hatte (ChessAcademy).
Der entwickelte mal ein Mittelspielbuch.
Er hat mir ein paar seiner Ideen damals gemailt.

Weg von der Eröffnungstheorie und mit einer Vorgabe starten bei einem vollen Brett im Mittelspiel.
Shit auf schnelle Gewinne und Theorie!

Denke nach wie vor das sich im Mittelspiel noch viel bewegen wird.
Also warum eigentlich nicht etwas aufbauen speziell zu diesem Thema und dann die Engines drauf ansetzen.

Keine Ahnung ... suche und suche nach etwas was neu und interessant sein könnte.

Gruß
Frank
Parent - - By Daniel Reist Date 2024-01-07 01:37
Hallo Frank

Du kannst ja die Version vom Stockfish vom Ende 2023
nehmen.
Die entspricht in etwa einem Stockfish 17.

Und ja das habe ich schon des öfteren erwähnt,
dass die Engines mit längeren Zeiten viel besser
spielen als mit wenigen Sekunden pro Zug.

Parent - By Frank Quisinsky Date 2024-01-07 02:07
Hallo Daniel,

ich mache das später mal.
Warte auf SF17 und lasse jetzt beim laufenden Turnier erstmal viele Partie produzieren.

Und ja, ist nicht so das ich der einzige mit diesen Vermutungen bin.
Auch in meinem Bekanntenkreis sind einige der Meinung und nutzen für Analysen auch immer andere Engines, nicht nur SF allein.

Nur dieses ewige glotzen auf Unterschiede in Ratinglisten die im Grunde auch fast alle mit Blitz spielen lassen.
Und dann Ergebnisse von alt und neu mixen, wobei die älteren Engines nicht mehr gegen neuere viele Partien spielen.
Das verzerrt die Ratings ein wenig.

Aber egal, alle geben sich Mühe und nichts ist perfekt.
War es noch nie!

Viele Grüße
Frank
Parent - - By Martin Steinwandter Date 2024-01-07 09:01 Edited 2024-01-07 09:08
Daniel Reist schrieb:

Hallo Frank

Du kannst ja die Version vom Stockfish vom Ende 2023
nehmen.
Die entspricht in etwa einem Stockfish 17.

Und ja das habe ich schon des öfteren erwähnt,
dass die Engines mit längeren Zeiten viel besser
spielen als mit wenigen Sekunden pro Zug.



Mann kann natürlich eine sehr alte Stockfisch Version ("Stockfish 200731 dev" dieser ist doch drei Jahre alt oder täusche ich mit) nehmen und gegen Gegner der neuesten Generation (Igel 3.5.0 NN) spielen lassen. Mir entzieht sich aber der Sinn des ganzen
Parent - - By Frank Quisinsky Date 2024-01-07 10:43 Edited 2024-01-07 11:02
Hallo Martin,

schnell erklärt!

1. Die letzte Version bevor die erste NN Version verfügbar war.
2. Hinweis auf der dev Seite vom SF Team selbst zu Contempt
Contempt wurde herausgenommen weil es mit Neural-Network nicht funktioniert. Der Hinweis kam irgendwann zwischen SF 11 und SF 12. Wenn man Contempt nutzen möchte wird exakt auf diese Version verwiesen.

SF 16 hatte in meinem letzten Turnier einen Zügedurchschnitt bei den Remispartien von sage und schreibe 111 Zügen und insgesamt von 100 Zügen. Das ist schon über der Grenze zu "unbrauchbar" im Eng-Eng Spiel. 99% aller Engines produzieren einen niedrigeren Zügedurchschnitt.

Nur ist der Zügedurchschnitt dieser Version auch nicht so viel besser. Der liegt bei 95 Züge.
Unter Beachtung, das die ganzen Produzenten des hohen Zügedurchschnitts vom letzten Turnier gar nicht mehr im Feld sind, sind diese 95 Züge im Grunde wie 100. Wenn das so bleibt ist der Hinweis auf der SF dev Seite auch nicht korrekt und Contempt funktionierte schon früher nicht mehr oder der hohe Zügedurchschnitt bei den Remispartien liegt nicht an Contempt.

Schrieb dazu ja, 14 Programme produzierten untereinander einen Zügedurchschnitt von 107 Zügen.
Diese Programme spielen bei dem derzeitigen Turnier alle nicht mehr mit.

Bei der im Sommer geschlossenen KI-Ratingliste gab es nur 4 Programme mit einem Zügedurchschnitt der ca. bei 95 oder höher lag (Ethereal, Koivisto, Berserk und Demolito). Bei den aktuellen TOP-41 waren es 14 auf einen Schlag.
Insofern reagierte ich und der Zügedurchschnitt aller 44 Engines schaut derzeit auch wieder absolut normal aus.

Die Spielstärke ist ja super!
Stockfish ohne Neural-Network liegt derzeit nur 84 Elo hinter Dragon 3.3 NN. Stockfish 16 NN lag 4 Elo vor Dragon 3.3 NN.
Also ist der Unterschied derzeit zwischen Stockfish 200730 ohne Neural Network zu Stockfish 16 NN ca. 88 Elo bei viel zu wenigen Partien.
Ich lese ja immer der Unterschied soll schon über 300 Elo liegen ...

Also müsste Dragon 3.3 NN noch deutlich steigen im Turnier und Stockfish ohne Neural-Network müsste noch deutlich fallen.
Wahrscheinlicher ist aber eher das bei längeren Bedenkzeiten die Unterschiede von den Neural-Network Engines immer mehr dahinschmelzen.

Gruß
Frank
Parent - - By Frank Quisinsky Date 2024-01-07 11:19 Edited 2024-01-07 11:54
Mal weg von Stockfish ...

Echt krass ist es bei Wasp.
Wasp 6.63 NN dev ist im Blitz 30-40 Elo stärker als Wasp 6.50.
Und was John mitteilte stimmte immer zu 100%.

Wie auch schon bei 40 Züge in 20 Minuten (da war Wasp 6.61 ca. 30 Elo stärker im Blitz) landete die dev Version hinter Wasp 6.50.

Wenn 30-40 Elo im Blitz bedeutet das wahrscheinlich 10-15 Elo besser bei wirklich langen Bedenkzeiten (wenn überhaupt).
Um 10-15 Fortschritt wirklich darzustellen benötigt es mindestens bei über 40 Gegnern ca. 1.200 Partien.

...

die Turnier Elo aller Engines wurde exakt berechnet für 90 Minuten Partien. Nun produziere ich 150 Minuten Partien und die Elo ist für die schwächeren Engines exakt 30 Punkte gemeinschaftlich höher und für viele der besten Engines offenbar 30 Elo niedriger.
z. B. bei SlowChess ... SlowChess müsste auf 3380 kommen und ist derzeit weit davon entfernt.

Bei der Rangfolge der Engines im Turnier stimmt schon nach wenigen Partien augenscheinlich grob alles.
Aber bei der produzierten Elo schaut im Turnier alles mehr als komisch aus, wenn nicht davon ausgeangen wird das alle Engines mit immer mehr Zeit sich auch deutlich immer mehr annähern.

Wie gesagt ...
Ich lasse das Turnier ja laufen und es dauert ein wenig bis alles klarer wird.
Parent - - By Martin Steinwandter Date 2024-01-07 11:32 Upvotes 2
Diese Version ohne NN wird einfach mehr verlieren und daher einen niedrigeren Zügedurchschnitt produzieren.
Bei Komodo ist es die Version 14.1, die letzte vor NN. Bei dir spielt Dragon 3.3NN. Und das zieht sich durch das ganze Turnier.
Du siehst schon, dass Stockfisch gegen Versionen spielt, die doch stärker sind und deshalb halt auch der Zügedurchschnitt runter gehen muss. Für mich logisch und deshalb ist dieses Turnier auch nicht so interessant.
Wenn schon ohne NN dann aber das gleiche für alle. Was solls, dann ist der Durchschnitt halt höher, aber die Daten sind dann eben auch valider.
Parent - By Frank Quisinsky Date 2024-01-07 11:45 Edited 2024-01-07 11:49
Hallo Martin,

das kann sein!

Komodo 14.1 habe ich schon öfters getestet (bei 40 in 8, bei 40 in 12). Das Ergebnis lag konstant ca. 80 Elo unter SlowChess. Stockfish war seinerzeit 60 Elo stärker als Komodo 14.1.
Insofern sollte ein Ergebnis von ca. 20 Elo schwächer als SlowChess im Turnier erreicht werden. Nur wenn alles näher zusammenrückt werden die Karten ein wenig neu gemischt.
Immerhin laufen hier Partien von durchschnittlich 2,5 Stunden.

Werde später mal SF 17 in einem Spießroutenlauf gegen die 44 antreten lassen.
Wahrscheinlich wird SF 17 dann nur 80-120 höher liegen als die verwendete Stockfish Version.

Insofern wäre der Fortschritt der letzten 3,5 Jahre bei der verwendeten Bedenkzeit eher ernüchternd und deutlich niedriger als ich selbst vermutete.
Ich hätte eher so auf 160 Elo getippt.
Mal schauen ...

Gruß
Frank
Parent - By Frank Quisinsky Date 2024-01-07 11:59
Übrigens, in Runde 2 hat Stockfish noch keine einzige Partie verloren!
Aber auch nicht so sehr viele gewonnen!
Up Topic Hauptforen / CSS-Forum / Wahrscheinlich eine kleine "neue" Erkenntnis ...

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill