Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Schach-Engine-Duell: TripleBrain vs. Stockfish16
1 2 Previous Next  
- - By Dieter Brandhorst Date 2024-02-26 23:19 Edited 2024-02-26 23:23 Upvotes 1
In meinem letzten Post habe ich über die Leistungsfähigkeit von Shredder-Triple-Brain(Lc0_BT3+Leptir) gegenüber den renomierten solo-Engines Leptir, Stockfish16 und Lc0_BT3 mithilfe der TCET2024 Testsuite, berichtet.  Die Konfiguration meiner Tests umfasste eine Threadripper 1950X CPU mit 3.4 GHz und eine RTX 4070 GPU, wobei jeder Engine exakt 3 Sekunden Bedenkzeit pro Zug hatte.
Die Ergebnisse waren aufschlussreich: Während Stockfish16 unter diesen Bedingungen 56 von 234 Problemen löste und Leptir 91 Aufgaben meisterte, erreichte Lc0_BT3 eine Lösungsrate von 85 Problemen. TripleBrain, als Kombination aus Lc0_BT3 und Leptir, der auf 28 Threads lief, übertraf jedoch alle mit einer beeindruckenden Lösungsrate von 120 von 234, was mehr als der doppelten Menge an gelösten Aufgaben im Vergleich zu Stockfish16 entspricht.
Angeregt durch diese Ergebnisse, organisierte ich einen direkten Vergleichskampf zwischen TripleBrain und Stockfish16, um zu sehen, ob diese überlegene Problemlösungsfähigkeit auch in einem direkten Duell Bestand hat. Beide Engines traten in 100 Partien gegeneinander an, wobei das UHO2024 Eröffnungsbuch von Stefan Pohl bis zum 6. Zug verwendet wurde. Die Ergebnisse waren eng, aber aufschlussreich:

-Triple Brain : Elo 3809, mit einer Gewinnrate von 52,5% (28 Siege, 49 Remis, 23 Niederlagen)
-Stockfish16: Elo 3791, mit einer Gewinnrate von 47,5% (23 Siege, 49 Remis, 28 Niederlagen)

Wer Interesse an den Partien hat, kann sie sich als PGN downloaden. https://drive.google.com/file/d/1CfSE8IgxvAEQlvr1WkqVOKgqvhYkfgqv/view
Interessant fand ich u.a. Partie Nr.27.

Es ist das erste Mal seit Langem, dass ich auf meinem Rechner ein Turnierergebnis sehe, bei dem Stockfish nicht an der Spitze steht. Die Differenz von 18 Elo-Punkten, besonders in Kombination mit einem UHO-Eröffnungsbuch, erscheint auf den ersten Blick nicht weltbewegend. Auch  die Fehlermarge (+-49) verdeutlicht, dass zur Signifikanz mehr als 100 Partien erforderlich wären. Trotzdem unterstreicht das Ergebnis nicht nur die Fähigkeit von TripleBrain, traditionelle Grenzen zu überschreiten sondern zeigt, was passiert, wenn man die unterschiedlichen Ansätze von Lc0 und Stockfish in der Schach-Engine-Entwicklung kombiniert.

VG Dieter Brandhorst
Parent - - By Max Siegfried Date 2024-02-27 00:35
Stockfish 56
Leptir 91
LC0 BT3 85
Triple Brain 120

Es ist schon extrem beeindruckend das Triple Brain so ein tolles Ergebnis in nur 3 Sekunden pro Stellung erreichet, während andere Leute mit Stockfish 16 anscheinend 60 Sekunden pro Stellung brauchen, für ein identisches Ergebnis. Somit das 20-fache der Zeit.

Was mich noch überrascht ist das Leptir, wenn er nur ein bisschen besser wäre, doppelt so viele Punkte hätte wie Stockfish, obwohl Leptir doch oft als ... abgestempelt wird.
Von Zufall kann man bei so einem Ergebnis nicht mehr reden.
Was sagt Eduard zu dem Ergebnis mir der Top Chess Engines Testsuite 2024?

Ich bin mir übrigens relativ sicher das du mit Triple Brain (Leptir 91 + LC0 BT4) bessere Ergebnisse erzielen würdest.
Lass es mich so sagen: BT4 unterscheidet sich noch mehr von Stockfish als BT3, somit eine bessere Ergänzung und spielt im Vergleich zu BT3 intuitiver.

Lassen wir das Remis mal außen vor, da Schach Remis ist, aber +5 Siege mehr / -5 Niederlagen weniger, dass ist schon eine Hausnummer auf diesem Niveau.

Es wäre ziemlich blöd wenn man Triple Brain dauerhaft nur mit der Shredder GUI verwenden darf.
Nur gut das es bei der normalen Engine Analyse und der WDL Analyse nicht der Fall ist.

Wenn ich Leptir und LC0 BT3 nebeneinander laufen lasse, anstatt Triple Brain, dann müsste ich doch auch genauso viele Stellungen gelöst bekommen, sehe ja immer welche Engine ungefähr 0.00 und welche + oder - anzeigt.
Müsste ich dann nicht sogar mehr Lösungen bekommen als mit Triple Brain?
Leptir 91 + LC0 BT3 45 (die restlichen 40 sind die gleichen Züge wie zuvor von Leptir gelöst. "somit doppelt") = 136 anstatt 120.
Parent - - By Dieter Brandhorst Date 2024-02-27 08:34 Upvotes 1
Zitat:
ch bin mir übrigens relativ sicher das du mit Triple Brain (Leptir 91 + LC0 BT4) bessere Ergebnisse erzielen würdest.


Das steht noch aus, ich werde es dann aber auch fairer Weise mit dem neuen Stockfish 16.1 vergleichen.

Zitat:
Wenn ich Leptir und LC0 BT3 nebeneinander laufen lasse, anstatt Triple Brain, dann müsste ich doch auch genauso viele Stellungen gelöst bekommen, sehe ja immer welche Engine ungefähr 0.00 und welche + oder - anzeigt.
Müsste ich dann nicht sogar mehr Lösungen bekommen als mit Triple Brain?


Wenn immer der bessere Zugvorschlag der beiden Engines gewählt würde, wären theoretisch sogar 134 Lösungen möglich gewesen, statt 120. Das ist aber über einen einfachen Score-Vergleich nicht möglich, wie du leicht mit der BanksiaGUI in derselben Engine-Konstellation feststellen kannst. Die Herausforderung bei einer multi-Engine ist die hohe Kunst, den besten Zug aus den Vorschlägen der Engines auszuwählen. Nach meinen Erfahrungen macht das TripleBrain von Stefan Meyer-Kahlen noch am Besten.

VG Dieter Brandhorst
Parent - - By Max Siegfried Date 2024-02-28 17:51
Es gibt eine neue Version:

Big Leptir 260224 differences to Stockfish 16.1:
* Network Dimension 3072 implemented
* Simple Eval changed for small network (less impact)
* Corchess search code implemented
* LMR (last move reduction) changed for better analysis
* Eval Hash implemented for better ultra-long analysis
* Slow Mover implemented
* Minimum Thinking Time implemented
* Random Op. MultiPV implemented

https://solistachess.jimdosite.com/engines/
Parent - - By Max Siegfried Date 2024-02-28 18:48
Es gibt auch einen Leptir Ultra.
Vielleicht ist dieser sogar besser für längere Analysen.
Parent - - By Dieter Brandhorst Date 2024-02-28 20:02 Upvotes 1
Wie kann ich die neuen Versionen bekommen? Auf der verlinkten Website steht etwas von einigen Wochen Erholungspause.

VG Dieter Brandhorst
Parent - - By Max Siegfried Date 2024-02-28 20:18
Dieter Brandhorst schrieb:

Wie kann ich die neuen Versionen bekommen? Auf der verlinkten Website steht etwas von einigen Wochen Erholungspause.

VG Dieter Brandhorst


File name          : Top Chess Engines Testsuite 2024 v2.pgn
Total test items   : 115
Test for           : best moves
Total engines      : 1
Timer              : movetime: 60
Expand ply         : 1
Elapsed            : 50:48
Laps               : 1
Total tests        : 115
Total corrects     : 80 (69%)
Ave correct elapse : 00:10
Status             : completed

Correct/Total:
Leptir Ultra: 80/115

Failed tests (hit *):
1. Leptir Ultra:
12, 17, 20, 21, 22, 30, 31, 32, 35, 36, 38, 42, 43, 44, 47, 48, 51, 52, 54, 55, 56, 57, 60, 66, 72, 76, 85, 89, 90, 93, 95, 98, 100, 105, 107

Successful tests:
1. Leptir Ultra:
0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 13, 14, 15, 16, 18, 19, 23, 24, 25, 26, 27, 28, 29, 33, 34, 37, 39, 40, 41, 45, 46, 49, 50, 53, 58, 59, 61, 62, 63, 64, 65, 67, 68, 69, 70, 71, 73, 74, 75, 77, 78, 79, 80, 81, 82, 83, 84, 86, 87, 88, 91, 92, 94, 96, 97, 99, 101, 102, 103, 104, 106, 108, 109, 110, 111, 112, 113, 114

Leptir Ultra habe ich mir hier heruntergeladen: https://pixeldrain.com/u/rjxd5DLq
Dieser soll besonders gut für lange Analysen sein.
Das Ergebnis spricht für sich selbst.

Vergleichbar mit dem Test von Peter Martan:
CrystalMZ 040823 Iccf=2 Depth=21
Bisher gelöst: 77 von 115  ;  26:19m

Ich würde zu gerne wissen was der Unterschied zu Big Leptir ist und wo man diesen herbekommt.
Ist der einzige Unterschied die Größe vom Netz?
Parent - - By Peter Martan Date 2024-02-28 20:29 Edited 2024-02-28 20:42 Upvotes 1
Max Siegfried schrieb:

Vergleichbar mit dem Test von Peter Martan:
CrystalMZ 040823 Iccf=2 Depth=21
Bisher gelöst: 77 von 115  ;  26:19m

Nicht wirklich vergleichbar, weil's bei mir 30"/Stellung waren und nur 8 der 32 möglichen threads um gleichzeitig 2 weitere SF- Versionen laufen zu lassen. Und die Hardware- TC wird gerade bei den Branches und ihren Settings und diesen Stellungen eine relativ große Rolle spielen.
Und nein, ich werde nicht versuchen herauszufinden, welcher der Branches und welches der Settings mit diesen Stellungen und bei welcher Hardware- TC die Nase vorn haben mag. Da würde sich nämlich die Schwäche der "Suite" erst recht zeigen, dass Engines ähnlich zu den Ausnahmsstellungen passender Ausrichtung und Einstellung über die User- Parameter, was MultiPV, Fortress- Detection, Pruning, Reductions und spezialisierte Mate Search angeht, eben keine großen Unterschiedszahlen an Lösungen untereinander haben. Sie hängen die game playing engines ab, aber auch die sind schon eine Nummer besser, wenn man sie auch MultiPV laufen lässt. Das ist für die anti engine puzzles typisch, drum hab' ich da schon immer single primary und MultiPV derselben Engines sowohl als auch laufen lassen.
Und da spielen dann zwar auch die relativ zu den wenigen Stellungen wenigen Lösungen gleich anscheinend umso mehr Rolle im rein zahlenmäßigen Vergleich, in Wirklichkeit tun sie's aber halt nicht einmal innerhalb des einzelnen Tests von Run zu Run, wenn man sie irgendwie im Vergleich zu den Zufallsschwankungen betrachtet. Es ist wie gesagt "Spreizung" auf Kosten von statistischer Relevanz, Reproduzierbarkeit und Transitivität.
Und ja natürlich kann man auf derlei Relativierungen bei Stellungstests auch völlig verzichten, aber wozu dann überhaupt Suiten, wenn sie nicht zusäztlich zur interaktiven Analyse einzelner Stellungen wenigstens statistisch auch irgendwas aussagen? Und wenn sie das sollen, ist's halt einfach nicht egal, wie groß das Verhältnis von Unterschiedlichkeit der Messwerte zur Standardabweichung ist.
Zitat:

Ich würde zu gerne wissen was der Unterschied zu Big Leptir ist und wo man diesen herbekommt.
Ist der einzige Unterschied die Größe vom Netz?

Reinhold Stibi wird vielleicht mehr wissen, der stand mit Eduard über dessen Engines und Bücher vor Kurzem noch in Kontakt, glaube ich. Manche der Engines bekam man wohl nur dann dazu, wenn man Bücher kaufte, andere Versionen waren frei.
Schreib' doch einfach ein Mail an Eduard oder warte, ob sich jemand meldet, der mehr weiß.
Parent - - By Max Siegfried Date 2024-02-29 08:59
Die 2-fache Bedenkzeit macht kaum einen Unterschied.
30 Sekunden = 77
60 Sekunden = 80

Thema 20-fache Bedenkzeit, siehe weiter unten.
= 25 Punkte

= 2-fache Bedenkzeit müsste ungefähr 2,5 Punkte erreichen = 79,5.
Das sieht grob vergleichbar aus.
Parent - By Peter Martan Date 2024-02-29 09:18 Edited 2024-02-29 09:21 Upvotes 2
Wenn das so funktionierte, bräuchte man keine Suiten, es würde eine einzelne Stellung genügen, und von der könntest du alles ableiten. Eine einzelne time to solution würde genügen und alles Andere für andere Stellungen und andere Engines könntest du daraus ableiten.
Hingegen ist  weder time to solution von Stellung zu Stellung, noch von Engine zu Engine übertragbar, infolgedessen erst recht nicht linear umrechenbar.

Merke: Time to solution ist auch nicht aus Vergleichen ein- und derselben Engine anhand ihrer Knotenzahlen/Zeit, nicht aus time to depth und nicht aus anderen benchmarks umrechenbar.
Time to solution ist ein völlig für sich allein stehender Wert, der für jede einzelne Stellung und für jede einzelne Engine ermittelt werden muss.
Period.

Ich sag's auch gern zum wiederholten Mal auf diese Art: wenn dem nicht so wäre, könntest du auch mit beliebig kleiner Hardware- Zeit Eng-Eng-Matches spielen lassen, um "overall playing strength" zu ermitteln, Remistod wäre kein Problem mehr, wenn Spiele mit weniger als 1"/game dieselben Performances erbrächten wie solche mit LTC. Man könnte beliebig viele Partien in beliebig kurzer Zeit spielen lassen, die Unterschiede in Milli-Elo statt in Elo messen und gut wär's, Grundstellung allein würde reichen, in Nullkommanix wären 100.000 Partien gespielt und bei noch so vielen Remis würden sich ausreichend große Performance- Unterschiede zwischen noch so ähnlichen Engines und Versionen herausstellen. Klappt's so? Nein. Warum nicht? Weil schachliche Performances, welcher Art auch immer, keinen linearen Verlauf über verschiedene zeitliche Vorgaben haben.

Die Änderungen von time to solution verlaufen bei ein- und derselben Engine bei 2 verschiedenen Stellungen schon nicht linear, geschweige denn bei mehr als 2 Stellungen und mehr als einer Engine.
Drum hat man so komplizierte Ranking- und Ratingsysteme erdacht wie Arpad Elo seinerzeit.
Parent - - By Max Siegfried Date 2024-02-28 20:50
Schwächen bei Leptir Ultra sind Stellungen die:

-eine Mindesttiefe erfordern um zu erkennen das Zug B besser ist als Zug A. (wenn beide Züge zuvor mit ungefähr +1.00 oder niedriger bewertet wurden).
-eine Mindesttiefe erfordern um zu erkennen das Zug B besser ist als Zug A. (wenn beide Züge zuvor mit ungefähr einem +1.00 Unterschied und einer hohen Bewertung bewertet wurden).
-ein Matt enthalten (da könnte sich Eduard ggf. etwas vom Matefish abschauen.)
-einen Desperadoturm/Dame enthalten.
-geschlossene Festungen sind.
-fast geschlossene Festungen sind.
-Figuren wie Dame, Turm.. einsperren.

Wobei ich ganz klar sagen muss dass die mit Abstand größte Schwäche der Mattangriff ist.
Das macht gefühlt 50% der nicht gelösten Aufgaben aus.

Gefolgt von fast geschlossenen Festungen und geschlossenen Festungen. 25%

Gefolgt von eingesperrten Schwerfiguren. 10%

Gefolgt von Desperadoturm/Dame. 10%.

Gefolgt von Mindesttiefe. 5%.
Parent - By Max Siegfried Date 2024-02-29 12:33
Hier nochmal die ungelösten Stellungen nach Test mit den 10 Minuten Bedenkzeit pro Stellung:
20, 22, 30, 32, 42, 47, 48, 52, 56, 57, 60, 93, 98, 99, 100 bzw. +1 da BanksiaGUI immer mit 0 anfängt zu zählen, aber die Stellungen in der Testsuite mit 1 beginnen.
21, 23, 31, 33, 43, 48, 49, 53, 57, 58, 61, 94, 99, 100, 101

15 Stellungen:

21, Na8 (kein Schlagzug) Matt in 28
23, Kc8 (kein Schlagzug) Matt in 14
31, Rxb7 fast geschlossene Festung
33, Bxh6 Mattangriff +199.03/60 bzw. Matt in ungefähr 45 Zügen.
43, Bc6 (kein Schlagzug) Matt in 19 (bzw. Matt in ungefähr 40 falls Schwarz mit Nb5 antwortet, was nie passiert).
48, Rg4 (kein Schlagzug) Matt in 21
49, Nd6 (kein Schlagzug) endet mit Patt
53, La7+ (kein Schlagzug) fast geschlossene Festung
57, Qxc7 eingesperrte Dame und eingesperrter König (Matt in ungefähr 30 Zügen)
58, Kb7 / Bc6 (keine Schlagzüge) Matt in 16 (Kxb8 war materialistisch)
61, a6 (kein Schlagzug) Matt in 22
94, Re5 (kein Schlagzug) Kf1 +3.00 was die Engines nie spielen wollen (falls Re5 Re6 Rxe6 fxe6 was die Engines sehr oft spielen wollen, Matt in 14)
99, Bce5 (kein Schlagzug) Matt in 9
100, Qg1 (kein Schlagzug) Matt in 38
101 Nf8 (kein Schlagzug) Matt in 20

Ergebnis:
(kein Schlagzug) und Matt: 21, 23, 43, 48, 58, 61, 99, 100, 101 = 9 Stellungen

gewonnene Stellung mit Mattangriff: 33 = 1 Stellung
(kein Schlagzug) gewonnene Stellung: 94 = 1 Stellung
eingesperrte Figuren: 57 = 1 Stellung

fast geschlossene Festung: 31, 53 = 2 Stellungen
(kein Schlagzug) endet mit Patt: 49 = 1 Stellung

Fazit:
Leptir Ultra hat ein großes Matt Problem.
Die Engine wird gefühlt deutlich besser werden, wenn Eduard es schafft das Problem zu lösen.
Parent - - By Max Siegfried Date 2024-02-28 22:19
Leptir Ultra mit MultiPV = 2

File name          : Top Chess Engines Testsuite 2024 v2.pgn
Total test items   : 115
Test for           : best moves
Total engines      : 1
Timer              : movetime: 60
Expand ply         : 1
Elapsed            : 1:15:01
Laps               : 1
Total tests        : 115
Total corrects     : 80 (69%)
Ave correct elapse : 00:28
Status             : completed

Correct/Total:
Leptir Ultra: 80/115

Failed tests (hit *):
1. Leptir Ultra:
12, 13, 17, 20, 21, 22, 29, 30, 31, 32, 36, 38, 42, 47, 48, 51, 52, 56, 60, 66, 70, 75, 78, 82, 90, 94, 95, 97, 98, 99, 100, 101, 105, 106, 108

Successful tests:
1. Leptir Ultra:
0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 14, 15, 16, 18, 19, 23, 24, 25, 26, 27, 28, 33, 34, 35, 37, 39, 40, 41, 43, 44, 45, 46, 49, 50, 53, 54, 55, 57, 58, 59, 61, 62, 63, 64, 65, 67, 68, 69, 71, 72, 73, 74, 76, 77, 79, 80, 81, 83, 84, 85, 86, 87, 88, 89, 91, 92, 93, 96, 102, 103, 104, 107, 109, 110, 111, 112, 113, 114
Parent - - By Dieter Brandhorst Date 2024-02-29 00:08 Upvotes 1
Bei meiner beliebten TC=3 Sekunden lieferte ShashChess34.5 mit den Einstellungen high_Tal und MultiPV=4, bei 256MB Hash und 31 Threads, ganz klar und mit Abstand das beste Ergebnis von 55/115.

CPU: Threadripper 1950X, 3,4 GHZ.

Bisher gelöst: 55 von 115  ;  4:20m

         1   2   3   4   5   6   7   8   9  10  11  12  13  14  15  16  17  18  19  20
-------------------------------------------------------------------------------------
   0 |   2   3   -   0   1   0   2   -   1   0   0   1   -   -   -   -   0   2   0   2
  20 |   -   -   -   2   3   0   -   0   -   0   -   -   -   -   0   -   -   -   -   -
  40 |   1   -   -   -   -   -   -   -   2   -   0   -   -   1   1   2   -   -   2   0
  60 |   -   0   0   -   1   -   -   -   -   0   0   1   0   -   -   2   0   0   1   0
  80 |   0   0   3   -   0   -   3   -   0   -   -   -   -   -   3   -   -   0   -   0
  100|   -   0   -   -   -   -   0   0   -   -   0   0   -   3   -


Danach folgten Leptir (MultiPV=6) mit 35/115, Cool Iris11.80 mit 32/115, SF16.1 und Lc0_BT4_6147500 mit jeweils 13/115. Klar zeigt sich hier das die Suite wohl sehr stark Taktik orientiert ist. Für ein gutes Triple Brain fehlte mir hier ein adäquater Partner für ShashChess, um die Ergebnisse für diese spezielle Suite noch verbessern zu können.

VG Dieter Brandhorst
Parent - - By Max Siegfried Date 2024-02-29 08:18
Leptir Ultra löst mit 10 Minuten Bedenkzeit pro Stellung 100/115!!
Bei 1 Minute waren es "nur" 80/115.
Die 10-fache Bedenkzeit bringt hier 20 zusätzlich gelöste Aufgaben.

File name          : Top Chess Engines Testsuite 2024 v2.pgn
Total test items   : 115
Test for           : best moves
Total engines      : 1
Timer              : movetime: 600
Expand ply         : 1
Elapsed            : 3:36:21
Laps               : 1
Total tests        : 115
Total corrects     : 100 (86%)
Ave correct elapse : 00:38
Status             : completed

Correct/Total:
Leptir Ultra: 100/115

Failed tests (hit *):
1. Leptir Ultra:
20, 22, 30, 32, 42, 47, 48, 52, 56, 57, 60, 93, 98, 99, 100

Successful tests:
1. Leptir Ultra:
0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 21, 23, 24, 25, 26, 27, 28, 29, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 43, 44, 45, 46, 49, 50, 51, 53, 54, 55, 58, 59, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 94, 95, 96, 97, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114
Parent - - By Max Siegfried Date 2024-03-01 11:49
ShashChess 34.6 High Tal MultiPV=4

File name          : Top Chess Engines Testsuite 2024 v2.pgn
Total test items   : 115
Test for           : best moves
Total engines      : 1
Timer              : movetime: 600
Expand ply         : 1
Elapsed            : 15:27:22
Laps               : 1
Total tests        : 115
Total corrects     : 103 (89%)
Ave correct elapse : 07:49
Status             : completed

Correct/Total:
ShashChess 34.6 High Tal MultiPV=4: 103/115

Failed tests (hit *):
1. ShashChess 34.6 High Tal MultiPV=4:
13, 30, 32, 35, 47, 51, 56, 75, 93, 98, 100, 106

Successful tests:
1. ShashChess 34.6 High Tal MultiPV=4:
0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 31, 33, 34, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 48, 49, 50, 52, 53, 54, 55, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 94, 95, 96, 97, 99, 101, 102, 103, 104, 105, 107, 108, 109, 110, 111, 112, 113, 114

Damit hat ShashChess 34.6 High Tal MultiPV=4 3 Lösungen mehr als Leptir Ultra!!
Parent - - By Tommy Tulpe Date 2024-03-02 15:19 Upvotes 1
Max Siegfried schrieb:


Damit hat ShashChess 34.6 High Tal MultiPV=4 3 Lösungen mehr als Leptir Ultra!!


Das ist interessant.
Ich werde ShashChess 34.6 mal für ein par Fernschachanalysen einsetzen und berichten, wenn sich diese Engine anders verhält als Stockfish 16.1  .
Parent - - By Max Siegfried Date 2024-03-02 16:11
Tommy Tulpe schrieb:

Max Siegfried schrieb:


Damit hat ShashChess 34.6 High Tal MultiPV=4 3 Lösungen mehr als Leptir Ultra!!


Das ist interessant.
Ich werde ShashChess 34.6 mal für ein par Fernschachanalysen einsetzen und berichten, wenn sich diese Engine anders verhält als Stockfish 16.1  .


Das wird sehr interessant.
Ich behaupte das Stockfish 16.1 in den meisten Zügen die bessere feinere Bewertung liefern wird im Vergleich zu ShashChess 34.6.
ShashChess 34.6 wird nur da einen Vorteil haben, wo es Stellungen gibt, welche so schwer sind, wie die Stellungen aus der Top Chess Engines Testsuite 2024 v2.
Bei leichteren Testsuites/Stellungen ist Stockfish mittlerweile genauso gut.

Wie lange analysierst du eine Stellung?
1 Minute oder 10 Minuten?
Mit der 10-fachen Bedenkzeit (10 Minuten anstatt 1 Minute) löst ShashChess 34.6 ungefähr 10% mehr. 103/115 anstatt 93/115.
Ob sich das lohnt??
Und das betrifft nur diese super schweren Aufgaben.

Der Vorteil dürfte bei Engine Partien, sehr schweren Studien, sowie Anti-Engine-Puzzles vorhanden sein.
Für normales Menschenschach dürfte Stockfish 16.1 besser geeignet sein, da hier das Elo Niveau zu niedrig ist, damit ShashChess 34.6 etwas entdecken kann was Stockfish 16.1 nicht entdecken kann.
Parent - By Tommy Tulpe Date 2024-03-02 16:25 Upvotes 1
Max Siegfried schrieb:


Wie lange analysierst du eine Stellung?
1 Minute oder 10 Minuten?



Tja, geschätzter Max, damit hätte man absolut keine Chance, heutzutage mal einen vollen Punkt in einer Fernpartie einzufahren. Das meiste geht sowieso Remis aus.

6-12 Stunden pro Zug, davon einen gewissen Anteil interaktiv. Außer natürlich bei ganz offensichtlichen Zügen.

Nochmal schöne Grüße von Ulrich
Parent - - By Max Siegfried Date 2024-02-29 08:27 Edited 2024-02-29 08:50
Dieter Brandhorst schrieb:

Bei meiner beliebten TC=3 Sekunden lieferte ShashChess34.5 mit den Einstellungen high_Tal und MultiPV=4, bei 256MB Hash und 31 Threads, ganz klar und mit Abstand das beste Ergebnis von 55/115.

Danach folgten Leptir (MultiPV=6) mit 35/115

Klar zeigt sich hier das die Suite wohl sehr stark Taktik orientiert ist. Für ein gutes Triple Brain fehlte mir hier ein adäquater Partner für ShashChess, um die Ergebnisse für diese spezielle Suite noch verbessern zu können.


3 Sekunden
ShashChess34.5 55/115
Leptir 35/155

60 Sekunden
Leptir Ultra 80/155

Im Bereich von 3 Sekunden bis 60 Sekunden bringt die 20-fache Bedenkzeit hier 25 zusätzlich gelöste Aufgaben.

Ob man hier von "sehr stark Taktik orientiert" sprechen kann weiß ich nicht.
Es gibt sehr sehr viele Stellungen in denen nichts geschlagen wird und das Stockfish auf hoher Tiefe erkennt, dass die Stellung XY dann gewonnen ist, weil dann irgendwann die Taktik reinhaut und Material getauscht wird, ist selbstverständlich.
Gilt z.B. Matt setzen ohne das eine Figur geschlagen wird als Taktik?
Um genau zu sein muss die Engine den richtigen Zug in 115 Stellungen finden und in 25 dieser Stellungen ist es ein Schlagzug.
Klar hätte ich gerne mehr strategische und positionelle Teststellungen und auch taktische.
Aber die Testsuite ist eine Mischung aus allen anderen Testsuites (die ich finden konnte) ohne die für Stockfish+LC0 zu leichten Teststellungen.
Parent - - By Peter Martan Date 2024-02-29 10:00 Upvotes 3
Max Siegfried schrieb:

Ob man hier von "sehr stark Taktik orientiert" sprechen kann weiß ich nicht.

Doch, natürlich kann man, es sagt nur nichts, weil alles oder nichts, was Engines spielen, "Taktik" ist.

Das Besondere an diesen Stellungen ist, dass sie einzelne Lösungszüge haben, die erst mit Durchrechnung der nächsten paar Folgezüge mit wenig oder nur genau dem passenden Pruning eine gewissen Breite im Spielbaum haben müssen, die fürs game playing meistens nicht notwendig ist.
Die Pointen werden von win or save draw Algorithmen häufig zu früh aus der Berechnung ausgeklammert, es wird an ihnen zunächst vorbei gerechnet und drum dauert's dann oft viele Iterationen länger, bis sie doch noch gefunden werden.
Oft sind es gerade Stellungen, bei denen der Mensch sich sogar leichter tut als die Maschine, wenn er weiß, dass es eine solche Ausnahmsstellung ist, weiß er das nicht, rechnet er das bisschen, was ein Mensch überhaupt rechnet im Schach, auch hoffnungslos vorbei an den Lösungen. Drum find' ich's bei solchen Stellungen auch immer wieder nur fair, auch die Engine wissen zu lassen, Achtung, Falle. Indem man den Nullzug abdreht oder die nullmove verification höher, im MultiPV- Modus haben viele Engines schon prinzipiell andere Suchparameter als in den non primaries, MultiPV ist deshalb für solche Stellunge durchaus auch ein legitimes Mittel, so sehr er im game playing bremst. Indem man eigene Fortress Detection einbaut, die auch in 0815- Stellungen bremst, indem man weniger LMRs einstellt, heutzutage könnte man durchaus auch eigene Netze für solche Stellungen trainieren, Andreas Matthies hat's z.B. auch gemacht.

Eigentlich sind es insofern nicht die wirklich "schweren" Stellungen, weil sie haben ja wenigstens forcierte Abspiele und eindeutige best moves, die wirklich schweren Stellungen sind die ohne das alles, mit einem wirklich von Anfang an breiten Suchbaum, bei dem sich trotzdem erst in einer großen Tiefe die kleinen Eval- Unterschiede in den Endstellungen zur Zugsortierung bewähren.

Es sind einfach anti engine puzzles, das ist alles, was sie wirklich charakterisiert in ihrer Gemeinsamkeit, dass es immer schon davon abhing, welchen gerade modernen Engines man welche Stellungen vorsetzen musste, um sie aus ihrer game playing- Komfortzone zu schmeißen, und ab welcher Hardware- Zeit welche Stellungen zu leicht wurden und welche immer noch zu schwer waren, das hat gewechselt. Oft genug findet man sogar heute noch Stellungen, bei denen Oldies unter den Engines besser abschneiden an time to solution als die modernen und das noch dazu mit weniger Hardware- Zeit- Abhängigkeit als bei anderen (Stellungen und Engines). Aber je besser die Engines in der Hardware- Nutzung werden und je besser die Hardware wird, umso mehr muss man gezielt auf die win or save draw Algorithmen, die sich fürs eng-eng-game playing als am besten herausstellen hin komponieren, es bleiben praktisch nur mehr die Studien übrig, die der Mensch eigens gegen die Engines baut. Auch das Problemschach hat sich daran anpassen müssen, dass immer mehr mit Engine- Unterstützung komponiert werden muss, weil mit den Engines kontrolliert wird, ob die Stücke dicht sind, und weil eine Studie, die für Engines keinerlei Schwierigkeiten bietet, zumindest beim nicht ganz so fachkundigen Publikum nicht mehr soviel Applaus bekommt.
Zitat:

Aber die Testsuite ist eine Mischung aus allen anderen Testsuites (die ich finden konnte) ohne die für Stockfish+LC0 zu leichten Teststellungen.

Es sind anti engine puzzles, die du gezielt noch eigens gegen SF und LC0 gerichtet seleketiert hast, nicht mehr und nicht weniger als das. In anderen Zusammenhängen nennt man so etwas selection- bias
Parent - - By Dieter Brandhorst Date 2024-02-29 11:39 Upvotes 1
Zitat:
Es sind anti engine puzzles, die du gezielt noch eigens gegen SF und LC0 gerichtet seleketiert hast, nicht mehr und nicht weniger als das. In anderen Zusammenhängen nennt man so etwas selection- bias


Dem stimme ich zu, meine o.a. Ergebnisse deuten ja ebenfalls darauf hin. 

Zitat:
Doch, natürlich kann man, es sagt nur nichts, weil alles oder nichts, was Engines spielen, "Taktik" ist.


Sagt es wirklich nichts?

Alexander Shashin präsentiert in seinem Buch "Best Play" einen präzisen und quantifizierbaren Algorithmus zur Definition einer taktischen Stellung, die er als "Tal-Stellung" bezeichnet. Dies geschieht durch die Berechnung der Mobilität der Figuren beider Farben, wobei die Anzahl aller erreichbaren Felder für Weiß und Schwarz addiert wird. Anschließend wird der Faktor t ermittelt, indem die Gesamtmobilität von Schwarz durch die von Weiß geteilt wird. Laut Shashin erreicht man bei einem Verhältnis von t > 1,25 den Bereich der taktischen (Tal-)Stellungen. Dieser präzise Ansatz ermöglicht es ShashChess, mit der Einstellung "high-Tal" eine herausragende Leistung bei der Lösung taktischer Aufgaben zu erzielen. Aufgrund der beeindruckenden Leistung von ShashChess in dieser spezifischen Einstellung, welche die Ergebnisse anderer Schachengines deutlich übertraf, gelangte ich zu dem Schluss, dass es sich um eine außerordentlich taktisch orientierte Testsuite handelt. Zumindest deutet es darauf hin, dass es eine im Sinne Shashins taktische Testsuite ist.

VG Dieter Brandhorst
Parent - - By Jörg Oster Date 2024-02-29 12:04 Upvotes 1
Dieter Brandhorst schrieb:

Zitat:
Es sind anti engine puzzles, die du gezielt noch eigens gegen SF und LC0 gerichtet seleketiert hast, nicht mehr und nicht weniger als das. In anderen Zusammenhängen nennt man so etwas selection- bias


Dem stimme ich zu, meine o.a. Ergebnisse deuten ja ebenfalls darauf hin. 

Zitat:
Doch, natürlich kann man, es sagt nur nichts, weil alles oder nichts, was Engines spielen, "Taktik" ist.


Sagt es wirklich nichts?

Alexander Shashin präsentiert in seinem Buch "Best Play" einen präzisen und quantifizierbaren Algorithmus zur Definition einer taktischen Stellung, die er als "Tal-Stellung" bezeichnet. Dies geschieht durch die Berechnung der Mobilität der Figuren beider Farben, wobei die Anzahl aller erreichbaren Felder für Weiß und Schwarz addiert wird. Anschließend wird der Faktor t ermittelt, indem die Gesamtmobilität von Schwarz durch die von Weiß geteilt wird. Laut Shashin erreicht man bei einem Verhältnis von t > 1,25 den Bereich der taktischen (Tal-)Stellungen. Dieser präzise Ansatz ermöglicht es ShashChess, mit der Einstellung "high-Tal" eine herausragende Leistung bei der Lösung taktischer Aufgaben zu erzielen. Aufgrund der beeindruckenden Leistung von ShashChess in dieser spezifischen Einstellung, welche die Ergebnisse anderer Schachengines deutlich übertraf, gelangte ich zu dem Schluss, dass es sich um eine außerordentlich taktisch orientierte Testsuite handelt. Zumindest deutet es darauf hin, dass es eine im Sinne Shashins taktische Testsuite ist.

VG Dieter Brandhorst

Das macht ShashChess so aber nicht.
Parent - By Dieter Brandhorst Date 2024-02-29 13:30 Upvotes 1
Dann sollte es sich nicht unbedingt ShashChess nennen.
Parent - - By Peter Martan Date 2024-02-29 12:17 Edited 2024-02-29 12:52 Upvotes 1
Dieter Brandhorst schrieb:

Zitat:
Es sind anti engine puzzles, die du gezielt noch eigens gegen SF und LC0 gerichtet seleketiert hast, nicht mehr und nicht weniger als das. In anderen Zusammenhängen nennt man so etwas selection- bias


Dem stimme ich zu, meine o.a. Ergebnisse deuten ja ebenfalls darauf hin. 

Zitat:
Doch, natürlich kann man, es sagt nur nichts, weil alles oder nichts, was Engines spielen, "Taktik" ist.


Sagt es wirklich nichts?

Alexander Shashin präsentiert in seinem Buch "Best Play" einen präzisen und quantifizierbaren Algorithmus zur Definition einer taktischen Stellung, die er als "Tal-Stellung" bezeichnet. Dies geschieht durch die Berechnung der Mobilität der Figuren beider Farben, wobei die Anzahl aller erreichbaren Felder für Weiß und Schwarz addiert wird. Anschließend wird der Faktor t ermittelt, indem die Gesamtmobilität von Schwarz durch die von Weiß geteilt wird. Laut Shashin erreicht man bei einem Verhältnis von t > 1,25 den Bereich der taktischen (Tal-)Stellungen. Dieser präzise Ansatz ermöglicht es ShashChess, mit der Einstellung "high-Tal" eine herausragende Leistung bei der Lösung taktischer Aufgaben zu erzielen. Aufgrund der beeindruckenden Leistung von ShashChess in dieser spezifischen Einstellung, welche die Ergebnisse anderer Schachengines deutlich übertraf, gelangte ich zu dem Schluss, dass es sich um eine außerordentlich taktisch orientierte Testsuite handelt. Zumindest deutet es darauf hin, dass es eine im Sinne Shashins taktische Testsuite ist.

Doch natürlich sagt "Taktik" was, aber etwas ganz anderes für Menschen (da übrigens auch jedem solchen etwas anderes) als für Maschinen.
Wenn jetzt Andrea Manzo das, was Shashin auch primär für Menschen als "Tal-Stellung" bezeichnet,  mit einer eigenen Parameter- Einstellung besser berechnen  lassen kann, dann magst du das als deine persönliche (an Shashin und Manzo) angelehnte Definition von "Taktik" sehen, man könnte auch einfach sagen, was in dieses Rechenschema passt (und das andere Engines vielleicht auch so ähnlich als quantifizierbare Parameter im Code haben, bei vielen auch automatisch mehr oder weniger in den primary variants zum Unterschied von den non primaries anlegen) ist für dich eine "taktische" Stellung, dann musst du aber bei jeder Stellung erst wieder dazu sagen (oder es anhand von time to solution und output zeigen) ob und wie sehr sie in diese deine Definition passt.

Ansonsten ist wie gesagt für Engines alles Taktik, weil sie alles (nach mehr oder weniger anpassbaren verschiedenen) Algorithmen mehr oder weniger tief und mehr oder weniger breit "berechnen". Natürlich spielt dabei die Eval auch eine entscheidende, die Suche steuernde Rolle, man könnte bei den Stellungen auch sagen, über die wir hier mehr oder weniger verallgemeinernd reden, es sind solche mit einem entscheidenden Vorteil der Seite, die am Zug ist, der aber erst bei etwas tieferer Berechnung richtig bewertet wird, gehen die Engines in ihrerer Suche schon von vornherein mit mehr "Optimismus" heran, was die Evals angeht, steuert das die Suche bei solchen Stellungen auch schneller in die richtige Richtung. Das Gegenstück der Petrosian- Stellung wäre dann eine, bei der der zu findende Zug aus einer Reihe von stark nachteiligen als der am wenigsten nachteilige gefunden werde muss. Wieder ist die Engine, die von so einer Stellung mit anderen Parameter- Einstellungen und oder einer anderen Eval ausgeht, eventuell auch dadurch besser bei der time to solution. ShashChess ist ja auch einer der letzten SF- Branches, der die hand crafted evaluation auch noch verwendet, nicht nur die aus dem NNUE- Netz.

Andrea hat mir immer wieder mal Kassifikationstabellen geschickt nach Eval- Ranges geordnet, welchen Performance- Zahlen welche Kategorien von Teststellungen von High Petrosian bis High Tal entsprechen. Er testet selbst sehr wohl auch anhand von Stellungen in diesen verschiedenen Kategorien extra.
Das entspricht aber auch sehr ungefähr dem, was ich als Pendant für Menschen als "Achtung, Falle", oder "Achtung, Puzzle" gemeint habe vorhin. An so eine Stellung geht man auch als Mensch gleich ganz anders heran, man sucht eher in die entgegengesetzte Richtung als normaler Weise, im Sinne von, welcher Zug ist hier beim ersten Anschauen der unwahrscheinlichste und mit dem probiert man extra tiefer als man das sonst täte.

Einfachste Vorstellung, das auf der Engine- Seite so zu machen: man sagt der Engine, das scheint nur ausgeglichen, ist in Wirklichkeit für die Seite am Zug zu gewinnen, oder umgekehrt: leg' weniger Selektivität an Züge an, die so wie die meisten anderen Kandidaten hier im Anzug zunächst verloren scheinen, aber bei tieferer Suche die Eval ins = bringen könnten, und sei's "nur", dass solche Züge eher zu primaries erhoben werden in den Parametern und weniger als die meisten anderen als non primaries behandelt werden, oder dass sie "einfach" früher etwas weiter verfolgt werden in größere Tiefen, als die meisten anderen Alternativen in derselben Zeit.
Das eine im (nicht gleich offenkundig so großen) Vorteil wären dann "Tal"- Stellungen, die anderen im (nur scheinbar verlorenen) Nachteil "Petrosian"- Stellungen nach der einfachsten Shashin- Definition, die mir einfällt.
Parent - - By Dieter Brandhorst Date 2024-02-29 13:19 Upvotes 2
Zitat:
Er testet selbst sehr wohl auch anhand von Stellungen in diesen verschiedenen Kategorien extra.
Das entspricht aber auch sehr ungefähr dem, was ich als Pendant für Menschen als "Achtung, Falle", oder "Achtung, Puzzle" gemeint habe vorhin. An so eine Stellung geht man auch als Mensch gleich ganz anders heran, man sucht eher in die entgegengesetzte Richtung als normaler Weise, im Sinne von, welcher Zug ist hier beim ersten Anschauen der unwahrscheinlichste und mit dem probiert man extra tiefer als man das sonst täte.


Shashins Theorie ist ja so aufgebaut ,dass aufgrund objektiv leicht berechenbarer Kriterien (primär Mobilität und Königssicherheit), Schachstellungen in eher taktisch, strategisch oder defensiv eingeteilt werden und entsprechend nach dem stärksten Angriffszug, stärksten strategischen Zug, oder stärksten Verteidigungszug gesucht wird. Eine klare logische und selektive Vorgehensweise, die wenig mit persönlicher Einschätzung zu tun hat.

Ich halte als Schachspieler (Elo 2103), Shashins Theorie, insbesondere für die Stellungskategorisierung für sehr gut. Interessant fände ich auch, wenn man die Stellungen von Testsuites alle einmal nach Shashin kategorisieren und ihre Ausgewogenheit beurteilen könnte.

VG Dieter
Parent - - By Peter Martan Date 2024-02-29 14:04 Edited 2024-02-29 14:22 Upvotes 1
Ja, Dieter, aber wie dir Jörg schon in weniger Worten als ich gesagt hat, so macht's ShashChess nicht

Shashins Theorie soll menschlichen Sachspielern bei der Zugwahl helfen, was Andrea Manzo an Code daraus gemacht hat, weiß er und sonst vermutlich niemand so wirklich ganz genau, vielleicht nicht einmal Jörg, der den SF- Code als solchen sehr genau kennt.

Persönliche Einschätzung hat mit dem, was der menschliche Spieler (der ja keine Rechenmaschine wie eine Schachengine ist) aus der Shashin- Theorie macht, vielleicht ebenso wenig oder ebenso viel zu tun, wie die Kategorisierung von Schachstellungen, wie sie z.B. Andrea Manzo vornimmt, wenn er sie nach den objektivierbaren (interaktiv mit entsprechend tiefer Suche ermittelten) Evals seiner Engine´(mittlerweile geht er nach den WDL- probabilities, nicht mehr nach cp) den Shashin- Klassifikationen seiner Engine entsprechend vornimmt, in HT-, MT-, LT-, C-, LP-, MP-, und HP- Stellungen, was die UCI- Parameter angeht und weiteren Zwischenstufen, wie man sie sieht auf der allgemeinen ShashChess- site

https://github.com/amchess/ShashChess/

, daraus unter der Überschrift Shashin section:

Win probability range Shashin position’s type Informator symbols
[0, 4]                 High Petrosian                  -+
[5, 9]                 Middle-High Petrosian     -+ \ -/+
[10,12]                Middle Petrosian               -/+
[13,19]                Middle-Low Petrosian     -/+ \ =/+
[20,24]                Low Petrosian                  =/+
[25,49]                Caos: Capablanca-Low Petrosian=/+ \ =
[50]                   Capablanca                       =
[51,75]                Caos: Capablanca-Low Tal     = \ +/=
[76,80]                Low Tal                          +/=
[81,87]                Low-Middle Tal                   +/=
[88,90]                Middle Tal                       +/-
[91,95]                Middle-High Tal             +/- \ +-
[96,100]               High Tal                          +-


und auf den wiki- Unterseiten über die Stellungstests wie hier

https://github.com/amchess/ShashChess/wiki/Battery

und hier

https://github.com/amchess/ShashChess/wiki/Test-suite-results

Ich kann deshalb ein bisschen mitreden, weil ich beim ShashChess- Testen schon auch immer wieder mal etwas mitgearbeitet habe, was mir sogar mal die eine und die andere lobende namentliche Erwähnung eingetragen hat

https://talkchess.com/forum3/viewtopic.php?f=2&t=78738&p=955185&hilit=shashchess#p955185

https://github.com/amchess/ShashChess/releases/tag/34.5
Parent - By Dieter Brandhorst Date 2024-02-29 17:23 Upvotes 1
Dann danke  für die vielen Infos zu ShashChess, was sich allerdings m.E. etwas von der ursprünglichen Idee Alexander Shashins entfernt zu haben scheint.

VG Dieter
Parent - - By Dieter Brandhorst Date 2024-02-29 20:11 Upvotes 1
Ich habe mir die von dir verlinkte Seite ( https://github.com/amchess/ShashChess/blob/master/tests/HardPositions/258HardPositions.csv ) einmal angesehen.
Die hier zu den geprüften Stellungen angegebenen Shashin-Faktoren wie Material, Mobilität, Dichte und Expansion entsprechen exakt den Werten die man auch mit den von Shashin angegebenen Formeln dafür erhält. Das habe ich an 10 Stellungen von Hand überprüft. Nur für die Königssicherheit  gibt Shashin keine direkte Formel, sondern lediglich verbale Beschreibungen an, hier muss der Autor selbst einen Algorhitmus entwickelt haben um einen Zahlenwert zu erhalten. Insgesamt hält er sich aber bei diesen Daten doch sehr an die von Shashin vorgegebenen Formeln und Klassifizierungen. Könntest du ihn mal fragen, wie stark er selbst einschätzt von Shashins Theorie abzuweichen?

VG Dieter Brandhorst
Parent - By Peter Martan Date 2024-02-29 20:38 Edited 2024-02-29 20:52 Upvotes 1
Dieter Brandhorst schrieb:

Könntest du ihn mal fragen, wie stark er selbst einschätzt von Shashins Theorie abzuweichen?

Das ist keine Frage, die man leicht verbal anders als auf Code- Ebene beantworten kann, Dieter, schau' dir mal den (Code) an, dazu fehlen mir selbst die Kenntnisse, sodass du das besser mit ihm direkt besprichst. Was ich von anderen Programmierern lese, ist der allerdings teilweise wirklich nicht einfach zu verstehen, wo's nicht "nur" Stockfish selbst ist. Schreib' ihm doch ein Mail, sein Englisch ist gut und leicht verständlich und er antwortet im Allgemeinen auf freundliche Anfragen, soviel ich von ihm weiß. Wenn du keine Antwort bekommst, bitte ich ihn, in den Spamfilter zu schauen und dass es dir hier im Forum um Detailfragen gegangen ist. Ich glaube nicht, dass Andrea hier regelmäßig mitliest, in der Liste der registrierten User ist er allerdings immer noch, wie ich gerade sicherheitshalber nachgeschaut habe. Im Talkchess liest er sicher häufiger mit.
Parent - By Dieter Brandhorst Date 2024-02-29 14:08 Upvotes 1
Zitat:
Einfachste Vorstellung, das auf der Engine- Seite so zu machen: man sagt der Engine, das scheint nur ausgeglichen, ist in Wirklichkeit für die Seite am Zug zu gewinnen, oder umgekehrt: leg' weniger Selektivität an Züge an, die so wie die meisten anderen Kandidaten hier im Anzug zunächst verloren scheinen, aber bei tieferer Suche die Eval ins = bringen könnten, und sei's "nur", dass solche Züge eher zu primaries erhoben werden in den Parametern und weniger als die meisten anderen als non primaries behandelt werden, oder dass sie "einfach" früher etwas weiter verfolgt werden in größere Tiefen, als die meisten anderen Alternativen in derselben Zeit.
Das eine im (nicht gleich offenkundig so großen) Vorteil wären dann "Tal"- Stellungen, die anderen im (nur scheinbar verlorenen) Nachteil "Petrosian"- Stellungen nach der einfachsten Shashin- Definition, die mir einfällt.


So ähnlich sehe ich es auch. Man sollte zunächst die Kriterien streng nach den von Shashin vorgegebenen Algorhitmen  anwenden und entsprechend der Stellungskategorisierung die Suche der Engine anpassen. Der Erfolg oder Misserfolg einer solchen Engine würde zumindest Hinweise für den Stellenwert der Shashin-Theorie im Computerschach geben.

VG Dieter Brandhorst
Parent - - By Dieter Brandhorst Date 2024-02-29 12:20 Upvotes 1
Auch bei TC=1Minute, liegt bei mir noch ShashChess mit 93/115 vs. 78/115 von Leptir vorn.

ShashChess 34.5 _31thr_hTal
Bisher gelöst: 93 von 115  ;  35:08m

         1   2   3   4   5   6   7   8   9  10  11  12  13  14  15  16  17  18  19  20
-------------------------------------------------------------------------------------
   0 |   0   5   -   0   0   1  13   2   1   5   0   9   9   0   0   9   0   2   0   1
  20 |   7  35  10   1  10   0   -   0   9   1   -   -   -   -   7   -  33   9  14   8
  40 |   0   7   -   -  11   2   -   -   2  35  18   -   -   6   2   2   -  60   3   0
  60 |   3   2   0   -   0   -   9   1   -   0   0   1   4  11   -   0   0   0   2   0
  80 |   0   0   6   -   0  11   1  11   0   9  45   3  11   -   3  24   3   0   -   0
  100|   -   0  60  52  22  16   1   0  60   2   0   0   2   4   7


Leptir 230124_31thr_MPV6
  Bisher gelöst: 78 von 115  ;  54:44m

         1   2   3   4   5   6   7   8   9  10  11  12  13  14  15  16  17  18  19  20
-------------------------------------------------------------------------------------
   0 |   1   -  11   0  18   1   0   0   4   -  14   0   -   -   0   5   0   -   -  22
  20 |   -  51   -   0  14   0   3   0   9   -   -   -   -  56  16   -   -  26   -  28
  40 |   -  13   -   -  32   6   -   -   -   1   0   -  27   -  53   -   -   -  16   0
  60 |   -  31   0   5   0  25   -   0  60   2  22   5   6   0  22   4   1   3   5   0
  80 |   3   0   -  22   0   2   1  40   2   -   -  15  12   -   1  44  16   0   -   -
  100|   -  26   7  43  33   -  60   5   -   0  54   6   0   3   5
Parent - - By Max Siegfried Date 2024-02-29 12:48
Parent - By Dieter Brandhorst Date 2024-02-29 13:28 Upvotes 1
Danke
Parent - By Max Siegfried Date 2024-02-29 14:18
ShashChess 34.6

File name          : Top Chess Engines Testsuite 2024 v2.pgn
Total test items   : 115
Test for           : best moves
Total engines      : 1
Timer              : movetime: 60
Expand ply         : 1
Elapsed            : 1:22:09
Laps               : 1
Total tests        : 115
Total corrects     : 48 (41%)
Ave correct elapse : 00:17
Status             : completed

Correct/Total:
ShashChess 34.6: 48/115

Failed tests (hit *):
1. ShashChess 34.6:
0, 1, 2, 10, 12, 13, 17, 19, 20, 21, 22, 25, 26, 30, 31, 32, 33, 34, 36, 37, 38, 39, 42, 43, 44, 45, 47, 48, 51, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 69, 72, 73, 74, 75, 80, 83, 85, 87, 92, 93, 95, 96, 98, 99, 100, 101, 104, 105, 106, 107, 109, 111

Successful tests:
1. ShashChess 34.6:
3, 4, 5, 6, 7, 8, 9, 11, 14, 15, 16, 18, 23, 24, 27, 28, 29, 35, 40, 41, 46, 49, 50, 52, 64, 70, 71, 76, 77, 78, 79, 81, 82, 84, 86, 88, 89, 90, 91, 94, 97, 102, 103, 108, 110, 112, 113, 114
Parent - - By Max Siegfried Date 2024-02-29 15:39
ShashChess 34.6 High Tal

File name          : Top Chess Engines Testsuite 2024 v2.pgn
Total test items   : 115
Test for           : best moves
Total engines      : 1
Timer              : movetime: 60
Expand ply         : 1
Elapsed            : 1:10:02
Laps               : 1
Total tests        : 115
Total corrects     : 69 (60%)
Ave correct elapse : 00:19
Status             : completed

Correct/Total:
ShashChess 34.6 High Tal: 69/115

Failed tests (hit *):
1. ShashChess 34.6:
2, 8, 10, 12, 13, 14, 20, 21, 22, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 42, 43, 44, 45, 47, 48, 51, 55, 56, 57, 66, 67, 68, 69, 72, 73, 74, 83, 85, 96, 98, 99, 100, 101, 106, 109, 110

Successful tests:
1. ShashChess 34.6 High Tal:
0, 1, 3, 4, 5, 6, 7, 9, 11, 15, 16, 17, 18, 19, 23, 24, 25, 26, 27, 28, 29, 40, 41, 46, 49, 50, 52, 53, 54, 58, 59, 60, 61, 62, 63, 64, 65, 70, 71, 75, 76, 77, 78, 79, 80, 81, 82, 84, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 97, 102, 103, 104, 105, 107, 108, 111, 112, 113, 114
Parent - - By Max Siegfried Date 2024-02-29 15:43 Edited 2024-02-29 15:58
ShashChess 34.6 (41%) 48/115
ShashChess 34.6 High Tal (60%) 69/115
=High Tal hat 19% bzw. 21 Stellungen mehr gelöst.

Dieter du hast ShashChess 34.5 High Tal 93/115.
Das sind +24 Stellungen mehr die gelöst wurden.

ShashChess 34.6 High Tal (60%) 69/115 bei mir, finde ich für diese Testsuite gut aber:
Leptir Ultra hat bei mir (69%) 80/115 erreicht bei 1 Minute.
Das sind +9% und +11 Stellungen mehr die gelöst wurden.

Dieter kannst du den Leptir Ultra bei dir testen?
https://pixeldrain.com/u/rjxd5DLq
Ich habe da nichts eingestellt außer: Die Anzahl der Kerne + Syzygy Pfad + Hacken bei Ponder On und UCI_ShowWDL.
Wenn du schon mit ShashChess 34.5 High Tal 93/115 erreicht hast, dann müsstest du mit Leptir Ultra auf 104/115 kommen.
Parent - - By Dieter Brandhorst Date 2024-02-29 17:11 Upvotes 1
Ich hatte ShashChess 34.5 mit high Tal und MultiPV=4 getestet. Werde Leptir Ultra auch gerne testen.

VG Dieter Brandhorst
Parent - - By Max Siegfried Date 2024-02-29 19:55
ShashChess 34.6 High Tal MultiPV=4

File name          : Top Chess Engines Testsuite 2024 v2.pgn
Total test items   : 115
Test for           : best moves
Total engines      : 1
Timer              : movetime: 60
Expand ply         : 1
Elapsed            : 1:38:56
Laps               : 1
Total tests        : 115
Total corrects     : 93 (80%)
Ave correct elapse : 00:48
Status             : completed

Correct/Total:
ShashChess 34.6 High Tal MultiPV=4: 93/115

Failed tests (hit *):
1. ShashChess 34.6 High Tal MultiPV=4:
2, 9, 13, 21, 30, 31, 32, 35, 46, 47, 51, 52, 56, 63, 72, 74, 75, 83, 85, 93, 98, 99

Successful tests:
1. ShashChess 34.6 High Tal MultiPV=4:
0, 1, 3, 4, 5, 6, 7, 8, 10, 11, 12, 14, 15, 16, 17, 18, 19, 20, 22, 23, 24, 25, 26, 27, 28, 29, 33, 34, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 48, 49, 50, 53, 54, 55, 57, 58, 59, 60, 61, 62, 64, 65, 66, 67, 68, 69, 70, 71, 73, 76, 77, 78, 79, 80, 81, 82, 84, 86, 87, 88, 89, 90, 91, 92, 94, 95, 96, 97, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114
Parent - By Dieter Brandhorst Date 2024-02-29 20:20 Upvotes 1
Da haben wir ja doch sehr ähnliche Ergebnisse. Mit Leptir Ultra habe ich  81/115 bei TC=1 Minute.

VG Dieter
Parent - By Max Siegfried Date 2024-02-29 22:33 Edited 2024-02-29 22:37
Dieter Brandhorst schrieb:

Ich hatte ShashChess 34.5 mit high Tal und MultiPV=4 getestet. Werde Leptir Ultra auch gerne testen.

VG Dieter Brandhorst


Wie bist du eigentlich auf MultiPV=4 gekommen? Warum nicht 3 oder 5?
Müsste man die Einstellungen nicht jedes Mal neu anpassen, da ShashChess auf einem immer neueren Stockfish basiert?

Glaubst du, dass es möglich ist, die Engine so einzustellen, dass 110 oder 115 Aufgaben gelöst werden? Z.B. bei 10 Minuten pro Stellung?

Wann verwendet man High Petrosian/Capablanca?
Parent - - By Max Siegfried Date 2024-02-29 11:02
Die beiden 60 Sekunden Tests im Vergleich:

Die schwarz markierten Stellungen sind in beiden Tests gescheitert.
Failed tests (hit *):
MultiPV = 1 (Standard Einstellung)
Failed tests (hit *):
1. Leptir Ultra:
12, 17, 20, 21, 22, 30, 31, 32, 35, 36, 38, 42, 43, 44, 47, 48, 51, 52, 54, 55, 56, 57, 60, 66, 72, 76, 85, 89, 90, 93, 95, 98, 100, 105, 107

MultiPV = 2
Failed tests (hit *):
1. Leptir Ultra:
12, 13, 17, 20, 21, 22, 29, 30, 31, 32, 36, 38, 42, 47, 48, 51, 52, 56, 60, 66, 70, 75, 78, 82, 90, 94, 95, 97, 98, 99, 100, 101, 105, 106, 108

Daraus ergibt sich:
Nur im oberen Test: 35, 43, 44, 54, 55, 57, 72, 76, 85, 89, 93, 107 = 12
Nur im unteren Test: 13, 29, 70, 75, 78, 82, 94, 97, 99, 101, 106, 108 = 12

Das bedeutet das Leptir Ultra mit MultiPV = 1 bzw. 2 jeweils 12 Stellungen gelöst hat, welche die andere MultiPV = 1 bzw. 2 Einstellung nicht gelöst hat.
Das sind ungefähr 10% bei MultiPV = 1 bzw. andere 10% bei MultiPV = 2.
Das heißt Leptir Ultra löst 1/10 aller Aufgaben nicht aufgrund von MultiPV 1 vs 2.

Muss man jetzt Partien zweimal von Leptir Ultra mit jeweils MultiPV = 1 und = 2 analysieren lassen oder verzichtet man auf die mindestens 10%?

Warum gibt es nicht MultiPV 1.5?
Die Engine rechnet eine Zeit lange an beiden Varianten und beschränkt sich danach nur noch auf eine Variante.
Parent - By Peter Martan Date 2024-02-29 14:44 Edited 2024-02-29 15:00 Upvotes 1
Max Siegfried schrieb:

Warum gibt es nicht MultiPV 1.5?
Die Engine rechnet eine Zeit lange an beiden Varianten und beschränkt sich danach nur noch auf eine Variante.

Du musst dir mal die Engines, die du testest, etwas genauer anschauen.

Zumindest bei der Version 230124, die ich habe, stellt man den internen MultiPV- Modus einerseits an Zahl der primaries ein (Random Op MultiPV), andererseits durch Random Op Plies, auf die diese MultiPV- Anzahl angewendet wird, da gibst du eine Zahl an Halbzügen ein, bis zu der MultiPV gesucht wird, danach geht's single primary weiter, und dann wird auch bis zu dieser Tiefe an Plies nur innerhalb einer Eval- Range im MultiPV- mode gesucht, die du unter Random Op Score angibst in cp, die Voreinstellung 20 dort bedeutet also z.B., nur was nicht weiter als 20cp in der Eval vom bis dahin am besten evaluierten Zug abweicht, kommt in die Zahl der primaries hinein. Voreinstellung Op. Plies 16, Op. MultipV 2, Op. Sore 20 bedeutet: 16 Halbzüge tief werden 2 Varianten als primaries behandelt, wenn sie innerhalb einer Eval- Range von 20cp liegen.

Ein raffiniertes System, finde ich, aufgebracht hat's übrigens auch wieder mal Marco Zerbinati, damals mit einer SugaR- Version. Bei dem CrystalMZ z.B. gibt's das auch so, da hatte ich eben MultiPV=4 (heißt bei diesem Zerbinati- Crystal Iccf MultiPV und wird in Schritten der 2er Potenzen eingestellt, Iccf1=MultiPV=2, Iccf2=MultiPV=4, das stammt noch aus der Zeit, als Michael Byrne mit seinen Black Diamond- und Honey- Branches diese Art der Zählung aufbrachte, vor Black Diamond gab's auch schon andere Fische von ihm mit internem MultiPV- Mode, deren Namen mir jetzt nicht mehr einfallen, dann hat das System Michael Novak mit seinem HekaStockfish weiter verfeinert, bei ihm hieß der Parameter FluidMultiPV und den konnte man dann auch noch weiter eingrenzen und einstellen). Die "Kunst" besteht jetzt darin, für die entsprechende einzelne Stellung und dann die Summe der Stellungen in der Suite die besten MultiPV- Einstellungen zu finden, sie richten sich je nach Suite hauptsächlich nach der Hardware- TC
Parent - - By Max Siegfried Date 2024-02-29 17:34
Leptir Ultra mit MultiPV = 10

File name          : Top Chess Engines Testsuite 2024 v2.pgn
Total test items   : 115
Test for           : best moves
Total engines      : 1
Timer              : movetime: 60
Expand ply         : 1
Elapsed            : 48:23
Laps               : 1
Total tests        : 115
Total corrects     : 81 (70%)
Ave correct elapse : 9583 ms
Status             : completed

Correct/Total:
Leptir Ultra: 81/115

Failed tests (hit *):
1. Leptir Ultra:
2, 9, 15, 17, 21, 22, 30, 31, 36, 38, 39, 40, 42, 43, 47, 48, 52, 54, 55, 56, 60, 66, 68, 74, 82, 83, 90, 93, 98, 99, 103, 104, 106, 108

Successful tests:
1. Leptir Ultra:
0, 1, 3, 4, 5, 6, 7, 8, 10, 11, 12, 13, 14, 16, 18, 19, 20, 23, 24, 25, 26, 27, 28, 29, 32, 33, 34, 35, 37, 41, 44, 45, 46, 49, 50, 51, 53, 57, 58, 59, 61, 62, 63, 64, 65, 67, 69, 70, 71, 72, 73, 75, 76, 77, 78, 79, 80, 81, 84, 85, 86, 87, 88, 89, 91, 92, 94, 95, 96, 97, 100, 101, 102, 105, 107, 109, 110, 111, 112, 113, 114
Parent - - By Max Siegfried Date 2024-02-29 20:13
Wer bietet mehr?

1 Minute Bedenkzeit pro Stellung:
ShashChess 34.6 High Tal MultiPV=4 (80%) 93/115

10 Minuten Bedenkzeit pro Stellung:
Leptir Ultra (86%) 100/115
Parent - - By Max Siegfried Date 2024-03-01 11:55 Edited 2024-03-01 12:01
Wer bietet mehr?

1 Minute Bedenkzeit pro Stellung:
Leptir Ultra (69%) 80/115
ShashChess 34.6 High Tal MultiPV=4 (80%) 93/115

10 Minuten Bedenkzeit pro Stellung:
Leptir Ultra (86%) 100/115
ShashChess 34.6 High Tal MultiPV=4 (89%) 103/115

Sehr interessant ist das Leptir Ultra pro Minute 2 Stellungen mehr löst, während ShashChess 34.6 nur 1 Stellung mehr löst.
Es könnte also sein das Leptir Ultra stärker profitieren wird, je länger die Bedenkzeit pro Zug wird.
Parent - - By Max Siegfried Date 2024-03-01 12:19
Leptir Ultra
15 Stellungen nicht gelöst
21, 23, 31, 33, 43, 48, 49, 53, 57, 58, 61, 94, 99, 100, 101

ShashChess 34.6 High Tal MultiPV=4
12 Stellungen nicht gelöst
14, 31, 33, 36, 48, 52, 57, 76, 94, 99, 101, 107

Von beiden nicht gelöst:
31, 33, 48, 57, 94, 99, 101

Nur von Leptir Ultra nicht gelöst:
21, 23, 43, 49, 53, 58, 61, 100

Nur von ShashChess 34.6 High Tal MultiPV=4 nicht gelöst:
14, 36, 52, 76, 107

Das bedeutet Leptir Ultra löst 5 Stellungen die ShashChess 34.6 nicht gelöst hat.
Somit sollte ShashChess 34.6 theoretisch mindestens 108 Stellungen lösen können und nicht nur 103.
Damit bleiben 7 Stellungen übrig die beide Engines (nicht) lösen können.
Parent - - By Max Siegfried Date 2024-03-01 13:11
ShashChess 34.6 High Tal MultiPV=4

14
Der-Brillante-Schachzug
(#18) / axb8N
1-0
[FEN "1n6/Pp1p1p1p/1P1P1P1P/4K3/2p5/p7/rpp1P3/qkb1R3 w - - 0 1"]
Stattdessen kam axb8Q +0.00/57

31
The Engines Crackers 2
018 M. Illescas 2018
Rxb7
1/2-1/2
[FEN "1r6/1n1R1b2/8/1p1p3k/pPpPp1p1/2P1P3/P2K1PP1/8 w - - 0 1"]
Stattdessen kam Rxf7 -5.74/39

33
The Engines Crackers 3
W.Eigenmann 2022
Bxh6
1-0
[FEN "7k/p1p3p1/1p1p3p/6B1/2P5/q1PP4/7R/5RK1 w - - 0 1"]
Stattdessen kam Rh3 +0.65/42

36
The Engines Crackers 4
I.Bondar 1995
(#71) Bxb2
1-0
[FEN "2b1k3/8/6R1/2n5/8/B1r1N3/1pB5/6K1 w - - 0 1"]
Stattdessen kam Rg8 +0.00/53

48
ACT3
(#21) Rg4+
1-0
[FEN "5N1r/5n1n/ppp3R1/5K2/7k/6p1/6PN/8 w - - 0 1"]
Stattdessen kam Ne6 -4.58/36

52
ACT3
(#40) f5
1-0
[FEN "8/kP2Rp2/6pB/p6p/P4PPP/5P2/6K1/2q5 w - - 0 1"]
Stattdessen kam gxh5 +0.00/65

57
ACT4
ACT4.035
Qxc7+
1-0
[FEN "2k5/Q1np1N2/2p2Bpp/1p1P4/pPP1p2P/P5q1/8/1K6 w - - 0 1"]
Stattdessen kam Be5 +0.00/59

76
Hard-2020-final-213-positions
Hard-Talkchess-2020.087
(#45) c8N
1-0
[FEN "5nr1/2Pp2pk/3Pp1p1/4P1P1/6P1/5K2/8/7n w - - 0 1"]
Stattdessen kam c8Q +0.00/67

94
Computer Chess Test Suite
Krug, P._CCC
Re5
1-0
[FEN "8/5p2/1p1r2p1/1p1p1R2/1P3KN1/8/7p/3N2kr w - - 0 1"]
Stattdessen kam Rxf7 -72.78/32

99
Computer Chess Test Suite
Troitzky, A._Study_IQ 57
(#9) Bce5
1-0
[FEN "1B3B1B/2B5/p6B/8/8/8/8/1k1K4 w - - 0 1"]
Stattdessen kam Bh8-g7 +11.86/45

101
Computer Chess Test Suite
Neghina, Mihai_Rusz
(#20) Nf8
1-0
[FEN "8/4Pr1N/8/6PN/8/3K1ppp/4prkb/4Bbnn w - - 0 1"]
Stattdessen kam Kc2 +0.00/56

107
Computer Chess Test Suite
Korolkov, V._Study
(#23) g8=B
1-0
[FEN "8/6Pp/7p/7k/5Pp1/P5P1/1pK5/qB6 w - - 0 1"]
Stattdessen kam g8Q +0.00/72
Parent - - By Max Siegfried Date 2024-03-01 13:22 Edited 2024-03-01 13:24
Ich persönlich halte folgende Stellungen definitiv für machbar:

14
33
48
76
94
107

ggf. wenn auch schwieriger:
31
52
57
99

Somit bleiben 36 und 101 übrig.

Falls jemand Vorschläge hat, wie man ShashChess 34.6 High Tal MultiPV=4 besser einstellen könnte, werde ich dies gerne testen.
Parent - - By Max Siegfried Date 2024-03-01 15:27
Ein gigantisches Problem was ich bei ShashChess 34.6 sehe ist die fehlerhafte Bewertung:
Ist dies bei Leptir auch so?
Stockfish löst zwar deutlich weniger aber immerhin ist die Bewertung meistens korrekt.

Nur die gelösten Stellungen, an welchen 10 Minuten lang gerechnet wurde:

3 Qf3 +0.00/42 richtig wäre +2.00/40
6 Ng6 +0.00/54 richtig wäre +5.00/25
7 d4 M+8/56 richtig wäre M+7
8 d5 M+8/57 richtig wäre M+7
12 Rxg7 +0.69/37 richtig wäre +5.00/24

13 Kf2 +0.14/36 richtig wäre +2.50/27
17 Ne4+ -199.68/42 richtig wäre M-31/61 oder wenigstens +199.68
18 Nf6+ +0.00/68 richtig wäre M-15/57
19 Rc8 +0.00/56 richtig wäre +199.67/50 bzw. ungefähr M-40
20 Ng3 +0.00/63 richtig wäre M-23

23 Kc8 -2.52/40 richtig wäre M14/46
24 Bxh2 +0.01/41 richtig wäre -4.00/26
25 Rc2 +0.00/63 richtig wäre -5.00/45
26 Bd4 -5.31/39 richtig wäre +1.50/25
27 Ng6 -0.89/37 richtig wäre +2.00 bzw. M-12

28 R1f5+ +0.00/43 richtig wäre +5.00/30
29 Nf3+ +0.00/50 richtig wäre M-45 bzw. wenigstens -199.53/70
30 Ne3 -7.08/41 richtig wäre 0.00/43
35 Na5 +0.82/40 richtig wäre M-31/55
40 Rc3 +0.00/49 richtig wäre M-15/63

41 f5 -1.11/45 richtig wäre M-5/245
42 bxa5 +0.00/59 richtig wäre M-34/33
46 d6+ -0.55/61 richtig wäre +199.72/45 bzw. wenigstens +199.72/45
47 Kc7 +0.00/41 richtig wäre +2.00
50 h7 -3.53/42 richtig wäre +4.50/30

51 Kf7 -31.06/32 richtig wäre M-30/70 oder wenigstens +199.99
54 Qa1+ +0.00/63 richtig wäre M-10/54
55 Qf3 -11.13/38 richtig wäre M-6/63 oder wenigstens +199.99
56 Bxf4 -4.14/46 richtig wäre +4.70/31 bzw. M-12
61 a6 -7.01/37 richtig wäre M-22

62 Rxg2 -0.35/39 richtig wäre -2.50/31
63 Ra1 -8.29/33 richtig wäre +4.00/25
65 Qxf6 -0.10/39 richtig wäre +5.00/26
66 Nc6 -7.24/36 richtig wäre +0.00/78
68 Rd6+ -5.77/36 richtig wäre +4.00/24

70 Ng6+ +0.16/39 richtig wäre +3.00/27
72 Nexg6 +0.00/40 richtig wäre +1.55/25
74 Kd4 M-16/45 richtig wäre +0.00 oder wenigstens -4.00/28
75 Rxh4 -199.70/35 richtig wäre +0.00/78
77 Bf8+ +0.00/77 richtig wäre M-37/66

78 Bxc5+ +0.00/46 richtig wäre +2.00/46
81 Bh5+ -6.47/38 richtig wäre +3.50/23
82 Nab3+ -199.83/38 richtig wäre M-26/70
84 Rc3+ -2.94/51 richtig wäre M-17/70
87 Bf6 +0.03/44 richtig wäre +2.50/27

93 Nh7+ -6.84/37 richtig wäre +2.50/23
96 Bh2 +0.00/70 richtig wäre M-27/67
98 Rd3 +0.00/96 richtig wäre M-16/86
100 Qg1 +0.00/58 richtig wäre M-38/78
102 Ra3 -20.65/34 richtig wäre +0.00/22

104 Bxa6 +0.00/54 richtig wäre +6.00/20
106 Bf2+ +0.00/78 richtig wäre M-11/56
108 Qg3+ +0.00/94 richtig wäre M-11/79
110 Kd7 +0.00/77 richtig wäre M-25
111 Rxa4 +0.00/68 richtig wäre M-30/65

113 Bxb7 -0.35/40 richtig wäre +2.00/38
114 a4 +0.00/38 richtig wäre +6.50/31
115 Bh1 -28.93/32 richtig wäre +0.00/63

58/115

Hmm wenn ich damit eine Partie analysiere, dann findet ShashChess 34.6 gefühlt alle "besonderen" Züge, aber wenn ich dahinter eine 0.00 Bewertung habe, dann werde ich bestimmt nicht nach einer +50.00 oder Matt in X Variante suchen.
Das ist doch Mist und genauso gut hätte man alle Bewertungen würfeln können.
Up Topic Hauptforen / CSS-Forum / Schach-Engine-Duell: TripleBrain vs. Stockfish16
1 2 Previous Next  

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill