Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Crystal 9
- By Peter Martan Date 2025-05-11 09:53 Upvotes 2
https://github.com/jhellis3/Stockfish/releases/tag/v9

https://talkchess.com/viewtopic.php?p=979216#p979216
- - By Tommy Tulpe Date 2025-05-11 10:13
Gönnst du uns ein paar zusätzliche Informationen Peter?
* Crystal 9 basiert offenbar auf der aktuellen Stockfish-Version. Welche Veränderungen gegenüber dem Original wurden vorgenommen?
* Auf der Talkchess Seite sehe ich das Resultat eines 500 Partien Matches gegen die Vorgängerversion Crystal 8. Doch wie ist Crystal 9 im Spielstärkevergleich zu anderen Engines einzuordnen.
* Gibt es auffällige Schwächen und Stärken?
* ...

Freundliche Grüße von deinem ehemaligen Fernschachgegner Ulrich
Parent - - By Peter Martan Date 2025-05-11 11:20 Edited 2025-05-11 12:11 Upvotes 1
Ulrich, ich hab' in dem Posting mit dem Match auch ein paar Stellungstest- Resultate gezeigt, die Stellungen dazu, sofern nicht ohnehin hinlänglich bekannt, gab's in mehr oder weniger neuen oder neu zusammengestellten Sammlungen in Postings wie z.B. in einem Parallel- Thread im Talkchess, zuletzt noch hier:

https://talkchess.com/viewtopic.php?p=979228#p979228

Die Stärken von Crystal sind ja auch gerade dir ohnehin in groben Zügen schon länger bekannt, denke ich, anti engine puzzles im weiteren Sinn, insbesondere Festungen, weil Crystal einen spezialisiserten Code zur Fortress- Detection hat.
Im Detail muss man einzelne Stellungen anschauen, in denen Crystal seine besonderen Stärken zeigt, da sind ja auch gerade hier immer wieder Beispiele gebracht worden, z.B. jüngstens im Thread über Barrikadenbau, für mich ist eine der besonderen Stärken von Crystal halt, dass er durchaus auch im game playing mit längeren TCs einsetzbar ist, gegen SF dev. mit STC wird er halt nicht wirklich ganz mithalten können, außer auch wieder von ganz bestimmten Stellungen ausgehend, weil er mehr in die Breite sucht und dadurch deutlich mehr time to depth braucht als SF dev.

Edit: vielleicht noch eine Partie aus dem Match gegen die Vorversion, dessen Ergebnis im Talkchess- Thread steht, die erste von denen, die das IWS- Tool als very interesting filtert: (Die Gegenpartie war auch ein 1-0.)

Event:
Ort:
Datum:

Weiss:
Schwarz:

Ergebnis
Board
Parent - - By Reinhold Stibi Date 2025-05-11 13:40 Edited 2025-05-11 13:42
Crystal 9 enttäuscht taktisch. Frühere Versionen waren besser.
Mit meinem mittelstarken PC ,  8 Kerne/16 Threads  je 15 Sek.
HTC 114  nur 73 gelöste Stellungen; Vergleich: Rems M 091224  97 gelöste Stellungen.
ERET             96    "                                            "                  103     "

Spiele mit Rems M 091224 auch mit Einst. MultiPV 4  im Internet auf Playchess
und habe damit nach über 1000 Partien mit meinem mittelstarken PC keine Partie
verloren und einige gewonnen.
Parent - - By Max Siegfried Date 2025-05-11 14:22
Reinhold Stibi schrieb:

Crystal 9 enttäuscht taktisch. Frühere Versionen waren besser.
Mit meinem mittelstarken PC ,  8 Kerne/16 Threads  je 15 Sek.
HTC 114  nur 73 gelöste Stellungen; Vergleich: Rems M 091224  97 gelöste Stellungen.
ERET             96    "                                            "                  103     "

Spiele mit Rems M 091224 auch mit Einst. MultiPV 4  im Internet auf Playchess
und habe damit nach über 1000 Partien mit meinem mittelstarken PC keine Partie
verloren und einige gewonnen.


Wie gut schneidet Rems gegen Stockfish ab, wenn beide ohne Eröffnungsbücher spielen?
Da müssen die Engines dann schon von Anfang an mitdenken und nicht erst im Mittelspiel oder im späten Mittelspiel oder erst im Endspiel.
Stockfish hat dann für gewöhnlich deutlich mehr Züge Zeit, sich die ganzen Mikrovorteile pro Zug zu erarbeiten, welche sich dann summieren und zu Siegen führen.
Das ist nun mal das was 99,99 % aller Schachspieler interessiert.
Parent - By Reinhold Stibi Date 2025-05-11 15:07
Rems M 091224 spielt auch ohne Buch sehr gut
und kann sich auch damit  gegen Stockfish behaupten.
Schon viele  Partien auch ohne Buch gespielt; das Buch spielt
keine sehr große Rolle mehr; damit kann man aber bestimmte
Eröffnungsfallen, die aber nicht häufig vorkommen, umgehen
und das Spiel wird mit Eröffnungsbuch abwechslungsreicher.
Parent - - By Kurt Utzinger Date 2025-05-11 17:58
Max Siegfried schrieb:


Wie gut schneidet Rems gegen Stockfish ab, wenn beide ohne Eröffnungsbücher spielen?
Da müssen die Engines dann schon von Anfang an mitdenken und nicht erst im Mittelspiel oder im späten Mittelspiel oder erst im Endspiel.
Stockfish hat dann für gewöhnlich deutlich mehr Züge Zeit, sich die ganzen Mikrovorteile pro Zug zu erarbeiten, welche sich dann summieren und zu Siegen führen.
Das ist nun mal das was 99,99 % aller Schachspieler interessiert.


Es hat sich noch nichts verändert. In allen Tests schneidet Stockfish gegenüber
Rems & Co. deutlich schlechter ab. Sobald es um Partien geht, mit/ohne
Eröffnungsbücher(vorgaben), ist von diesem Nachteil nichts mehr zu sehen.
Schon etwas irritierend und schwer begründbar, weshalb das so ist. Ich kann
mir eigentlich nur vorstellen, dass Stockfish bei Partien mit den Informationen
aus den Hashtables besser umgeht.
Gruss
Kurt
Parent - - By Jörg Oster Date 2025-05-11 19:17 Upvotes 1
Kurt Utzinger schrieb:

Max Siegfried schrieb:


Wie gut schneidet Rems gegen Stockfish ab, wenn beide ohne Eröffnungsbücher spielen?
Da müssen die Engines dann schon von Anfang an mitdenken und nicht erst im Mittelspiel oder im späten Mittelspiel oder erst im Endspiel.
Stockfish hat dann für gewöhnlich deutlich mehr Züge Zeit, sich die ganzen Mikrovorteile pro Zug zu erarbeiten, welche sich dann summieren und zu Siegen führen.
Das ist nun mal das was 99,99 % aller Schachspieler interessiert.


<code>Es hat sich noch nichts verändert. In allen Tests schneidet Stockfish gegenüber
Rems & Co. deutlich schlechter ab. Sobald es um Partien geht, mit/ohne
Eröffnungsbücher(vorgaben), ist von diesem Nachteil nichts mehr zu sehen.
Schon etwas irritierend und schwer begründbar, weshalb das so ist. Ich kann
mir eigentlich nur vorstellen, dass Stockfish bei Partien mit den Informationen
aus den Hashtables besser umgeht.
Gruss
Kurt
</code>

Nein, Kurt. In der Beziehung sind ja alle gleich, nämlich immer noch Stockfish.

Es gibt eine plausiblere Erklärung: im Spiel ist diese (vermeintlich?) bessere Taktik- oder Lösefähigkeit einfach nicht von Nutzen.
Parent - - By Kurt Utzinger Date 2025-05-11 20:33 Edited 2025-05-11 20:37
Jörg Oster schrieb:

Kurt Utzinger schrieb:

Max Siegfried schrieb:


Wie gut schneidet Rems gegen Stockfish ab, wenn beide ohne Eröffnungsbücher spielen?
Da müssen die Engines dann schon von Anfang an mitdenken und nicht erst im Mittelspiel oder im späten Mittelspiel oder erst im Endspiel.
Stockfish hat dann für gewöhnlich deutlich mehr Züge Zeit, sich die ganzen Mikrovorteile pro Zug zu erarbeiten, welche sich dann summieren und zu Siegen führen.
Das ist nun mal das was 99,99 % aller Schachspieler interessiert.


<code>Es hat sich noch nichts verändert. In allen Tests schneidet Stockfish gegenüber
Rems & Co. deutlich schlechter ab. Sobald es um Partien geht, mit/ohne
Eröffnungsbücher(vorgaben), ist von diesem Nachteil nichts mehr zu sehen.
Schon etwas irritierend und schwer begründbar, weshalb das so ist. Ich kann
mir eigentlich nur vorstellen, dass Stockfish bei Partien mit den Informationen
aus den Hashtables besser umgeht.
Gruss
Kurt
</code>

Nein, Kurt. In der Beziehung sind ja alle gleich, nämlich immer noch Stockfish.

Es gibt eine plausiblere Erklärung: im Spiel ist diese (vermeintlich?) bessere Taktik- oder Lösefähigkeit einfach nicht von Nutzen.


Hallo Jörg
Ein interessante Bemerkung, auf die ich nicht gekommen wäre. Impliziert dann deine Antwort nicht den Schluss, dass
alle bislang bekannten Testverfahren mit Stockfish und seinen Derivaten die reale Spielstärke zwischen Programmen in
echten Partien nicht abzubilden vermögen? Wie dem auch sei: Immerhin bleibt dann noch die Tatsache, dass gewisse
Stockfish Derivate in der Analyse (viel) schneller zu den besten Zügen gelangen.
Gruss
Kurt
Parent - - By Max Siegfried Date 2025-05-11 23:16
Kurt Utzinger schrieb:

Jörg Oster schrieb:

Kurt Utzinger schrieb:

Max Siegfried schrieb:


Wie gut schneidet Rems gegen Stockfish ab, wenn beide ohne Eröffnungsbücher spielen?
Da müssen die Engines dann schon von Anfang an mitdenken und nicht erst im Mittelspiel oder im späten Mittelspiel oder erst im Endspiel.
Stockfish hat dann für gewöhnlich deutlich mehr Züge Zeit, sich die ganzen Mikrovorteile pro Zug zu erarbeiten, welche sich dann summieren und zu Siegen führen.
Das ist nun mal das was 99,99 % aller Schachspieler interessiert.


<code>Es hat sich noch nichts verändert. In allen Tests schneidet Stockfish gegenüber
Rems & Co. deutlich schlechter ab. Sobald es um Partien geht, mit/ohne
Eröffnungsbücher(vorgaben), ist von diesem Nachteil nichts mehr zu sehen.
Schon etwas irritierend und schwer begründbar, weshalb das so ist. Ich kann
mir eigentlich nur vorstellen, dass Stockfish bei Partien mit den Informationen
aus den Hashtables besser umgeht.
Gruss
Kurt
</code>

Nein, Kurt. In der Beziehung sind ja alle gleich, nämlich immer noch Stockfish.

Es gibt eine plausiblere Erklärung: im Spiel ist diese (vermeintlich?) bessere Taktik- oder Lösefähigkeit einfach nicht von Nutzen.


<code>Hallo Jörg
Ein interessante Bemerkung, auf die ich nicht gekommen wäre. Impliziert dann deine Antwort nicht den Schluss, dass
alle bislang bekannten Testverfahren mit Stockfish und seinen Derivaten die reale Spielstärke zwischen Programmen in
echten Partien nicht abzubilden vermögen? Wie dem auch sei: Immerhin bleibt dann noch die Tatsache, dass gewisse
Stockfish Derivate in der Analyse (viel) schneller zu den besten Zügen gelangen.
Gruss
Kurt
</code>


Bei welcher Engine könnte man den jeweiligen Nachteil durch stärkere Hardware oder mehr Bedenkzeit ausgleichen, während die andere Engine von diesen Vorteilen nicht wirklich profitiert?
Reicht es nicht einfach aus Stockfish stärkere Hardware zu geben, damit dieser die Lösung gleich schnell findet, dann sind hier alle zufrieden und gleichzeitig behält Stockfish seine Genauigkeit beim Mikrovorteil pro Zug bei.
Ich denke das ist viel einfacher als von einer Problemlöser Engine zu erwarten mit stärkerer Hardware genauer beim Mikrovorteil pro Zug zu werden.
Parent - By Roland Riener Date 2025-05-12 09:22 Upvotes 4
Hallo Max, würdest du bitte diesen Unfug des xfachen Ineinanderschachteln von Vorpostings in voller Länge beenden.
Parent - - By Olaf Jenkner Date 2025-05-11 21:23 Upvotes 1
Jörg Oster schrieb:

Es gibt eine plausiblere Erklärung: im Spiel ist diese (vermeintlich?) bessere Taktik- oder Lösefähigkeit einfach nicht von Nutzen.

Kann es sein, daß die Derivate einfach nach den Tests getuned wurde, während sich die Stockfish-Entwickler um sowas nicht kümmern?
Parent - By Jörg Oster Date 2025-05-11 21:48
Olaf Jenkner schrieb:

Jörg Oster schrieb:

Es gibt eine plausiblere Erklärung: im Spiel ist diese (vermeintlich?) bessere Taktik- oder Lösefähigkeit einfach nicht von Nutzen.

Kann es sein, daß die Derivate einfach nach den Tests getuned wurde, während sich die Stockfish-Entwickler um sowas nicht kümmern?

Ja, das vermutlich auch.
Parent - - By Kurt Utzinger Date 2025-05-11 21:52
Olaf Jenkner schrieb:

Jörg Oster schrieb:

Es gibt eine plausiblere Erklärung: im Spiel ist diese (vermeintlich?) bessere Taktik- oder Lösefähigkeit einfach nicht von Nutzen.

Kann es sein, daß die Derivate einfach nach den Tests getuned wurde, während sich die Stockfish-Entwickler um sowas nicht kümmern?


Das kann ich mir nicht vorstellen und würde auch nicht erklären, weshalb die
fraglichen Derivate in der Analyse von Partien spürbar besser als Stockfish sind.
Kurt
Parent - By Max Siegfried Date 2025-05-11 23:06
Kurt Utzinger schrieb:

Olaf Jenkner schrieb:

Jörg Oster schrieb:

Es gibt eine plausiblere Erklärung: im Spiel ist diese (vermeintlich?) bessere Taktik- oder Lösefähigkeit einfach nicht von Nutzen.

Kann es sein, daß die Derivate einfach nach den Tests getuned wurde, während sich die Stockfish-Entwickler um sowas nicht kümmern?


<code>Das kann ich mir nicht vorstellen und würde auch nicht erklären, weshalb die
fraglichen Derivate in der Analyse von Partien spürbar besser als Stockfish sind.
Kurt
</code>


Meinst du damit das finden schwieriger Züge?
Wenn die Engine darin besser ist als Stockfish, dann müsste sie gleichzeitig bei der genauen Bewertung des Mikrovorteils schlechter sein. Ansonsten wäre sie auch insgesamt von der Elo stärker als Stockfish.

Es ist doch gar nicht nötig, nach Tests zu tunen, da die Menschen in der Regel Tests verwenden, welche einen klaren Gewinnzug haben. Somit gewinnt immer die Engine, welche öfters und schneller den klaren Gewinnzug findet und nicht Stockfish, welcher den genaueren Mikrovorteil anzeigt.
Parent - - By Peter Martan Date 2025-05-12 08:31 Edited 2025-05-12 08:53
Olaf Jenkner schrieb:

Kann es sein, daß die Derivate einfach nach den Tests getuned wurde, während sich die Stockfish-Entwickler um sowas nicht kümmern?

Lustig finde ich ja, dass sich hier ausgerechnet mal 2 Schachprogrammierer über diese uralte Thema unterhalten, die sich selbst mehr dem Problemschach als dem game playing widmen, du mit Gustav überhaupt "nur" dem Kunstschach, Jörg mit Huntsman, einem SF- Derivat, das, wenn man ihm die entsprechenden Parameter aktiviert, auch einfach im game playing viel weniger gut abschneidet, als bei der spezialisierten Mattsuche. Natürlich sind genau diese blind spots der Suche der einen Engines, die damit in den Stellungen, die sie selbst aufs Brett bringen und zulassen, dass sie von ähnlich tickenden Maschinen ausgespielt werden, die effektivste Mischung aus time to depth und time to solution haben, sind genau diese blind spots der anti engine puzzles im weitesten Sinn die Glanzlichter der anderen (Derivate, Branches, Klone), die auf diese blind spots hin programmiert und parametrisiert werden, sofern das nämlich halt für diese bestimmten Stellungen erfolgreich so funktioniert.
Von wievielen verschiedenen Seiten man über die bange Frage "diskutieren" kann, wie wichtig wem welche Stellungen beim "Schachspielen" sind, das ist immer wieder erstaunlich

Wie sinnvoll ist es denn auf der anderen Seite aus dem eng-eng-game playing die einzig relevante Anwendung von Computerschach zu machen? Dafür die Eröffnungsstellungen mit mittlerweile wirklich auch schon viel Spitzfindigkeit (aber auch nach den Evals der spielenden Engines selbst) möglichst genau so auszusuchen, dass überhaupt noch Unterschiede in der Performance messbar sind mit halbwegs machbaren Partiezahlen und einer noch halbwegs irgendwie plausiblen Hardware- TC, und andererseits, weil das allein einfach auch schon so remistod ist, dass es überhaupt nur mehr darauf ankommt, welche Engines mitspielen dürfen, misst man z.B. EAS zusätzlich zu den "normalen" Celo und führt damit ein (auch rein statistischen) Maß der "Aggressivität" der Engines in genau diesem eng-eng-eng-match ein. Bräuchte man so etwas wie das, wenn die einzig relevante Frage wäre, wie Engine X gegen Engine Y in einem bestimmten head to head match von der Grundstellung in ganzen und halben Punkten abschneidet?
Parent - - By Kurt Utzinger Date 2025-05-12 12:06
Peter Martan schrieb:

[...] Natürlich sind genau diese blind spots der Suche der einen Engines, die damit in den Stellungen, die sie selbst aufs Brett bringen und zulassen, dass sie von ähnlich tickenden Maschinen ausgespielt werden, die effektivste Mischung aus time to depth und time to solution haben, sind genau diese blind spots der anti engine puzzles im weitesten Sinn die Glanzlichter der anderen (Derivate, Branches, Klone), die auf diese blind spots hin programmiert und parametrisiert werden, sofern das nämlich halt für diese bestimmten Stellungen erfolgreich so funktioniert.
[...]


Lieber Peter
Diese "Stilblüte" habe ich 3x gelesen ... und verstehe nur Bahnhof.
Könntest du das für mich in eine für mich verständliche Form bringen?
Vielen Dank.
Gruss
Kurt
Parent - By Peter Martan Date 2025-05-12 12:31 Edited 2025-05-12 12:35 Upvotes 1
Aber gern, Kurt, hier mal wieder Kurts Fassung :
Zitat:
Von wievielen verschiedenen Seiten man über die bange Frage "diskutieren" kann, wie wichtig wem welche Stellungen beim "Schachspielen" sind, das ist immer wieder erstaunlich
Parent - By Peter Weise Date 2025-05-12 08:42 Upvotes 2
Kurt Utzinger schrieb:

Es hat sich noch nichts verändert. In allen Tests schneidet Stockfish gegenüber
Rems & Co. deutlich schlechter ab. Sobald es um Partien geht, mit/ohne
Eröffnungsbücher(vorgaben), ist von diesem Nachteil nichts mehr zu sehen.
Schon etwas irritierend und schwer begründbar, weshalb das so ist. Ich kann
mir eigentlich nur vorstellen, dass Stockfish bei Partien mit den Informationen
aus den Hashtables besser umgeht.
Gruss
Kurt


Wie bereits seit zig Jahrzehnten bekannt: die "Resultate" solcher Stellungstests (Stellungssammlungen) haben mit der reellen Spielstärke (Einstufung) einer Engine nun mal absolut nichts tun.
Parent - - By Klaus S. Date 2025-05-11 22:47
Hallo Reinhold,
hattest du auch Crystal 8 diesen Tests unterzogen?

Wieviel besser waren die Ergebnisse?
Parent - - By Reinhold Stibi Date 2025-05-12 04:29 Edited 2025-05-12 04:50
Hallo Klaus,
Crystal 8 war deutlich besser. HTC 114 Test  88,   ERET beachtliche 102.
Crystal 7  HTC 114  87   ERET 104 !     Crystal 6 PMT  HTC 114  88   ERET 102.
Sehr Schade dass sich Crystal 9 so verschlechtert hat.
Aber da Rems M 091224 im schwierigen HTC 114 Test noch deutlich besser ist; auch in der
Analyse schwieriger Stellungen
und sich auch praktisch im Internetschach auf Playchess bestens bewährt hat bleibe
ich bei dieser Engine.
Im Spiel ist Stockfish gleichwertig mit Rems (Stockfishabkömmling) vielleicht
bei Eröffnungsvorgabestellungen geringfügig besser.

Viele Grüße
Reinhold

Viele Grüße
Reinhold
Parent - By Klaus S. Date 2025-05-12 22:44
Danke Reinhold
Parent - By Max Siegfried Date 2025-05-11 14:10
Peter Martan schrieb:

Ulrich, ich hab' in dem Posting mit dem Match auch ein paar Stellungstest- Resultate gezeigt, die Stellungen dazu, sofern nicht ohnehin hinlänglich bekannt, gab's in mehr oder weniger neuen oder neu zusammengestellten Sammlungen in Postings wie z.B. in einem Parallel- Thread im Talkchess, zuletzt noch hier:

<a class='ura' href='https://talkchess.com/viewtopic.php?p=979228#p979228'>https://talkchess.com/viewtopic.php?p=979228#p979228</a>

Die Stärken von Crystal sind ja auch gerade dir ohnehin in groben Zügen schon länger bekannt, denke ich, anti engine puzzles im weiteren Sinn, insbesondere Festungen, weil Crystal einen spezialisiserten Code zur Fortress- Detection hat.
Im Detail muss man einzelne Stellungen anschauen, in denen Crystal seine besonderen Stärken zeigt, da sind ja auch gerade hier immer wieder Beispiele gebracht worden, z.B. jüngstens im Thread über Barrikadenbau, für mich ist eine der besonderen Stärken von Crystal halt, dass er durchaus auch im game playing mit längeren TCs einsetzbar ist, gegen SF dev. mit STC wird er halt nicht wirklich ganz mithalten können, außer auch wieder von ganz bestimmten Stellungen ausgehend, weil er mehr in die Breite sucht und dadurch deutlich mehr time to depth braucht als SF dev.


Also haben wir einen Stockfish Klon mit Fortress-Detection Code.

Anti Engine Puzzles kann ShashChess auch. Ist jetzt Crystal 9 besser als ShashChess?
Wer von beiden ist besser bei Festungen?

Stockfish ist nur etwas schlechter bei anti Engine Puzzles, aber dafür besser in normalen Stellungen / Partien und somit besonders nützlich für die Analyse menschlicher Partien, außer in Festungsstellungen, da kein Fortress-Detection Code vorhanden ist. Interessanterweise sagen mehrere Stockfish Entwickler selbst, dass so etwas wie Festungserkennung nicht möglich ist zu programmieren.

Somit wäre nur zu klären welche Tiefe pro Zug Crystal 9 braucht um mit Stockfish gleichzuziehen oder diesen dank Fortress-Detection Code zu überholen.
Denn 99,999% aller Menschen wollen die beste Engine für die Analyse haben und wenn Crystal 9 nicht gut genug ist, warum sollte man diesen dann überhaupt verwenden? Man könnte ihn bei Bedarf bei einer Festung einschalten und dann wieder ausschalten. Aber die ganze Arbeit bzw. fast die ganze Arbeit wird Stockfish machen.
Up Topic Hauptforen / CSS-Forum / Crystal 9

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill