Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Test starker/aggressiver Engines gegen eine im Vergleich sehr schwache Engine.
- - By Thomas Zipproth Date 2025-01-02 17:51 Edited 2025-01-02 17:54 Upvotes 2
Angesichts des Releases der auf Aggressivität (anhand der Metrik EAS von Stefan Pohl) getrimmten Engines Patricia und Cerberus
hatte ich die Idee, diese und andere mal gegen eine im Vergleich sehr schwache Engine (fruit 2.1) zu testen.

Die Idee dahinter ist, dass eine aggressiv spielende Engine gegen eine im Vergleich sehr schwache Engine hinsichtlich der Resultate
eigentlich zwei Unterschiede im Vergleich zu einer "normal" spielenden Engine aufweisen müsste, auch wenn diese noch etwas stärker ist:

1. Sie gewinnt mehr Partien
2. Sie braucht weniger Züge bis zum Matt

Die Aggressivität sollte sich eigentlich bei einem Spielstärkeunterschied von > 800 Elo nicht negativ auf das Ergebnis auswirken.
Aus eigener Erfahrung als Vereinsspieler kann ich Punkt 1 und Punkt 2 zumindest bei Menschen (beim Spiel gegen viel stärkere Gegner, die offensiv spielen) bestätigen.

Hier das Ergebnis des Turniers, 16s+0.4s auf einem sehr schnellen Computer.
500 Stellungen (Hert) mit vertauschten Farben.
Stockfish_HCE = Stockfish Handcrafted Evaluation letzte Version, d.h. kein NNue.
Spiel bis zum Matt oder Remis nach Fide Regeln.

Code:

   # PLAYER          :  RATING    Win  Draw  Lost   Durchschnittliche Züge bis zum Matt
   1 Stockfish       :  1106.1    996     4     0   55.3
   2 Stockfish_HCE   :   944.9    990    10     0   53.0
   3 Komodo14        :   873.4    986    13     1   54.3
   4 Cerberus        :   851.2    985    13     2   58.2
   5 Patricia        :   782.8    980    15     5   55.5

   6 Fruit_2.1       :     0.0      8    55  4937  


Es zeigt sich, dass zumindest bei diesem Turnier weder Punkt 1 noch Punkt 2 zutreffen.
Im Gegenteil, die aggressiveren Engines gewinnen gegen die schwache Engine weniger Partien und brauchen länger zum Matt.
Überraschend ist auch der allgemein geringe Unterschied bei der Anzahl der Züge zum Matt.

Über die Gründe kann ich nur spekulieren.

1.) Vielleicht hilft aggressives/offensives Spiel nur gegen Menschen, die dabei "nervös werden" und anfangen, gröbere Fehler zu machen.
2.) Vielleicht ist die Anzahl der Züge zum Matt relativ unabhängig vom Spielstil, solange der Gegner nicht ständig grobe Fehler macht.
3.) Die Engines sind nicht / nicht mehr auf das Spiel gegen eine so (im Vergleich) schwache Engine hin optimiert.
Parent - - By Max Siegfried Date 2025-01-02 21:40 Upvotes 1
Das wundert mich nicht.

Aggressiv und Offensiv sind zwei unterschiedliche Parameter.

Menschen mit 1600 vs 2400 Elo ist etwas anderes als Engines 3200 vs 4000 Elo.
Ein Mensch mit 1600 Elo bekommt Angst, wenn er von einem Menschen mit 2400 Elo auf einmal angegriffen wird.
Eine Engine mit 3200 Elo interessiert es nicht die Bohne, wenn sie von einer 4000 Elo Engine angegriffen wird.
(Wobei Angriff und Aggressivität auch nicht das gleiche sind und somit ein weiterer Parameter.)

Die letzten Gegner die gegen mich aggressiv/offensiv gespielt haben, haben einfach in diesen Momenten schlechte Züge gemacht, welche nicht der jeweils aktuellen Brettstellung entsprachen.
Mit anderen Worten: Diese wurden dann von mir nach allen Regeln der Kunst demontiert.

Eine Engine merkt in der Regel, wenn ein aggressiver Zug gegen diese gemacht wird und merkt dann recht schnell: Matt in 15, während der beste Zug aber ein Matt in 5 gewesen wäre.

https://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=171268;hl=aggressiv
Von Max Siegfried Datum 2024-10-09 10:24

https://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=171155;hl=aggressiv
Von Max Siegfried Datum 2024-10-04 11:16 Gut 1

https://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=168829;hl=aggressiv
Von Max Siegfried Datum 2024-03-02 08:45
Parent - By Kurt Utzinger Date 2025-01-02 23:36 Upvotes 1
Max Siegfried schrieb:


Die letzten Gegner die gegen mich aggressiv/offensiv gespielt haben, haben einfach in diesen Momenten schlechte Züge gemacht, welche nicht der jeweils aktuellen Brettstellung entsprachen.
Mit anderen Worten: Diese wurden dann von mir nach allen Regeln der Kunst demontiert.


Eine solche Partie würde mich interessieren.
Gruss
Kurt
Parent - - By Stefan Pohl Date 2025-01-03 09:23
Thomas Zipproth schrieb:

Angesichts des Releases der auf Aggressivität (anhand der Metrik EAS von Stefan Pohl) getrimmten Engines Patricia und Cerberus
hatte ich die Idee, diese und andere mal gegen eine im Vergleich sehr schwache Engine (fruit 2.1) zu testen.

Die Idee dahinter ist, dass eine aggressiv spielende Engine gegen eine im Vergleich sehr schwache Engine hinsichtlich der Resultate
eigentlich zwei Unterschiede im Vergleich zu einer "normal" spielenden Engine aufweisen müsste, auch wenn diese noch etwas stärker ist:

1. Sie gewinnt mehr Partien
2. Sie braucht weniger Züge bis zum Matt

Die Aggressivität sollte sich eigentlich bei einem Spielstärkeunterschied von > 800 Elo nicht negativ auf das Ergebnis auswirken.


Das sehe ich anders. Bei so großen Spielstärkeunterschieden ist eine große Aggressivität, die ja u.a. auch Opferfreudigkeit (und somit Risikofreudigkeit!) bedeutet, ein Nachteil für eine Engine, kein Vorteil. Daher gilt hier m.E. weder Punkt 1 noch Punkt 2. Im Gegenteil. Die Risiko- und Opferfreudigkeit wird gegen sehr viel schwächere Gegner Punkte kosten und auch keine schnelleren Matts nach sich ziehen (im Einzelfall natürlich schon mal, klar, aber in der Gesamtmenge der Partien nicht).

Das gilt aber eben auch nur, wenn die Gegner viel schwächer sind. Sind sie das nicht (oder sind sie gar deutlich stärker), dann ist die Situation genau umgekehrt. Dann wird die aggressive Engine weniger Züge zum Matt (bzw. Sieg) benötigen als eine "Normalo-Engine". Genau das sehen wir ja in meiner EAS-Rangliste:

Code:

                                 bad  avg.win
Rank  EAS-Score  sacs   shorts  draws  moves  Engine/player
-------------------------------------------------------------------
   1    432481  51.61%  38.03%  05.49%   66   Patricia 3.1 avx2 
   2    340432  46.96%  29.39%  03.46%   70   Patricia 4.0 avx2 
   3    315346  43.56%  27.63%  04.21%   68   Cerberus 21124081r81 (NEW)
   4    253682  37.88%  23.88%  08.79%   75   Rebel Extreme avx2 
   5    221083  32.46%  23.04%  09.25%   71   Velvet 8.1.0 risky 
   6    204351  34.75%  22.22%  10.27%   73   Velvet 8.0.0 risky 
   7    200919  31.18%  29.46%  17.09%   71   Revenge 1.0 avx2 
   8    196748  21.29%  26.40%  09.17%   70   Stockfish 16 230630 
   9    193732  22.08%  24.73%  08.71%   70   Stockfish 16.1 240224 


Cerberus und Patricia haben nicht nur mehr Opfer als Stockfish 16/16.1 gespielt, sondern auch weniger Züge für die Siege benötigt (66/68 Züge im Schnitt bzw. eben 70/70 (Stockfishe)).
Parent - - By Kurt Utzinger Date 2025-01-04 15:23 Upvotes 1
Stefan Pohl schrieb:


Das sehe ich anders. Bei so großen Spielstärkeunterschieden ist eine große Aggressivität, die ja u.a. auch Opferfreudigkeit (und somit Risikofreudigkeit!) bedeutet, ein Nachteil für eine Engine, kein Vorteil. Daher gilt hier m.E. weder Punkt 1 noch Punkt 2. Im Gegenteil. Die Risiko- und Opferfreudigkeit wird gegen sehr viel schwächere Gegner Punkte kosten und auch keine schnelleren Matts nach sich ziehen (im Einzelfall natürlich schon mal, klar, aber in der Gesamtmenge der Partien nicht).

Das gilt aber eben auch nur, wenn die Gegner viel schwächer sind. Sind sie das nicht (oder sind sie gar deutlich stärker), dann ist die Situation genau umgekehrt. Dann wird die aggressive Engine weniger Züge zum Matt (bzw. Sieg) benötigen als eine "Normalo-Engine". Genau das sehen wir ja in meiner EAS-Rangliste:


Hallo Stefan

Mach ich einen Denkfehler, wenn ich meine, dass deine Argumentation unlogisch ist?
Natürlich kann eine äusserst aggressive Engine gegen eine viel schwächere Engine
auch mal Punkte verlieren, weil eben das Opfer nicht aufgeht. Aber die viel stärkere,
aber aggressive Engine sollte das fast immer wettmachen können durch ihre viel
höhere Spielstärke. Lässt man Mephisto Phoenix Vancouver mit Turnierstufe
gegen Stockfish mit 2 Sek/Zug ohne PB laufen, verliert der Vancouver trotzdem
haushoch. Deshalb sollte die aggressive Engine gegen gleichwertige oder gar
stärkere Gegner nicht im Vorteil, sondern im Nachteil sein, weil die stärkere
Engine die unnötigen Aggressivität und "dubiosen" Opfer widerlegen müsste.

Gruss
Kurt
Parent - - By Max Siegfried Date 2025-01-04 16:00
Der Mephisto Phoenix Vancouver hat aber keine 3200 Elo keine 3300 Elo und schon gar keine 4000 Elo.
Das was für 1600 vs 2400 gilt (800 Elo Unterschied), gilt nicht zwangsläufig für 3200 vs 4000 Elo (800 Elo Unterschied).
Parent - By Kurt Utzinger Date 2025-01-04 16:33
Max Siegfried schrieb:

Der Mephisto Phoenix Vancouver hat aber keine 3200 Elo keine 3300 Elo und schon gar keine 4000 Elo.
Das was für 1600 vs 2400 gilt (800 Elo Unterschied), gilt nicht zwangsläufig für 3200 vs 4000 Elo (800 Elo Unterschied).


Das mag sein.
Parent - By Thomas Zipproth Date 2025-01-04 17:08
Max Siegfried schrieb:

Der Mephisto Phoenix Vancouver hat aber keine 3200 Elo keine 3300 Elo und schon gar keine 4000 Elo.
Das was für 1600 vs 2400 gilt (800 Elo Unterschied), gilt nicht zwangsläufig für 3200 vs 4000 Elo (800 Elo Unterschied).


Nichts gegen die prinzipielle Aussage, nur woher die Elo 2400 kommem, ist mir nicht klar.
Magnus Carlsen hätte gegen Stockfish mit 2s/Zug keine Chance, hier liegt Stockfish sicherlich bei > 3000 Elo.
Ist jetzt nicht nur meine Meinung, generell habe ich schon öfters gelesen, das Carlsen auch bei 1s/Zug chancenlos wäre.
Parent - By Andreas Mader Date 2025-01-05 16:55
Max Siegfried schrieb:

Das was für 1600 vs 2400 gilt (800 Elo Unterschied), gilt nicht zwangsläufig für 3200 vs 4000 Elo (800 Elo Unterschied).


Wenn man sich die Formel zur Berechnung der ELO-Zahl ansieht, dann muss das zumindest was die Gewinnwahrscheinlichkeit betrifft sehr wohl der Fall sein.
Parent - - By Stefan Pohl Date 2025-01-05 08:43 Edited 2025-01-05 08:54
Kurt Utzinger schrieb:

Stefan Pohl schrieb:


Das sehe ich anders. Bei so großen Spielstärkeunterschieden ist eine große Aggressivität, die ja u.a. auch Opferfreudigkeit (und somit Risikofreudigkeit!) bedeutet, ein Nachteil für eine Engine, kein Vorteil. Daher gilt hier m.E. weder Punkt 1 noch Punkt 2. Im Gegenteil. <code>Die Risiko- und Opferfreudigkeit wird gegen sehr viel schwächere Gegner Punkte kosten und auch keine schnelleren Matts nach sich ziehen</code> (im Einzelfall natürlich schon mal, klar, aber in der Gesamtmenge der Partien nicht).

<code>Das gilt aber eben auch nur, wenn die Gegner viel schwächer sind. Sind sie das nicht (oder sind sie gar deutlich stärker), dann ist die Situation genau umgekehrt.</code> Dann wird die aggressive Engine weniger Züge zum Matt (bzw. Sieg) benötigen als eine "Normalo-Engine". Genau das sehen wir ja in meiner EAS-Rangliste:


<code>Hallo Stefan

Mach ich einen Denkfehler, wenn ich meine, dass deine Argumentation unlogisch ist?
Natürlich kann eine äusserst aggressive Engine gegen eine viel schwächere Engine
auch mal Punkte verlieren, weil eben das Opfer nicht aufgeht. Aber die viel stärkere,
aber aggressive Engine sollte das fast immer wettmachen können durch ihre viel
höhere Spielstärke. Lässt man Mephisto Phoenix Vancouver mit Turnierstufe
gegen Stockfish mit 2 Sek/Zug ohne PB laufen, verliert der Vancouver trotzdem
haushoch. Deshalb sollte die aggressive Engine gegen gleichwertige oder gar
stärkere Gegner nicht im Vorteil, sondern im Nachteil sein, weil die stärkere
Engine die unnötigen Aggressivität und "dubiosen" Opfer widerlegen müsste.

Gruss
Kurt
</code>



Ich habe mich wohl auch unglücklich ausgedrückt. Gegen stärkere Gegner kostet aggressive Spielweise üblicherweise auch Punkte. Aber die Länge der Gewinnpartien sollte eben schon besser (also kleiner) sein, als bei einer normalen Engine, die gegen stärkere Gegner spielt.
Aber selbst das gilt nicht unbedingt immer: Schauen wir auf Velvet normal und Velvet risky, so hat es M.Hohnert geschafft, in meiner full Ratinglist nur -12 Celo bei risky zu verlieren (auf Velvet 8.1.1 normal) (also fast nichts), dennoch hat Velvet 8.1.1 risky mit 221k EAS fast doppelt so viele EAS-Punkte wie Velvet 8.1.1 normal mit 121k EAS. Das sollte eigentlich gar nicht möglich sein... Ed Schröder hat bei Rebel (Extreme/EAS 2.0) satte -166 Celo verloren, nur um den EAS Score von 187k (EAS 2.0) auf 253k (Extreme) anzuheben.

Ergo: Bezüglich EAS bzw. eben Messung der Aggressivität überhaupt, gibt es noch viel zu lernen. Wir alle sind hier auf Neuland unterwegs, weil vor meinem EAS-Tool ja eine Messung der Aggressivität gar nicht machbar war. Und verschiedene aggressive Engines zeigen auch sehr unterschiedliches Verhalten bzgl. Celo-Loss und EAS-Zuwachs, wenn man sich eben Rebel (EAS 2.0/Extreme) und Velvet 8.1.1 (normal/risky) im Vergleich anschaut.
Und aggressives Spiel (wie Velvet risky mit 221k EAS) ist auch nochmal etwas anderes als hyper-aggressives Spiel (Patricia/Cerberus).

Sehr schwierig, allgemeingültige Gesetzmäßigkeiten zu erkennen. Wegen der hier skizzierten, komplizierten Sachlage. Erschwerend kommt hinzu, daß EAS-Scores leider auch stark von der Gegnerauswahl abhängen. Nicht nur was die Stärke der Gegner angeht. Sondern leider auch, was deren EAS-Score angeht: Hat man mehrere aggressive Engines in einer solchen EAS-Auswertung, bei der aggressive Engines auch gegenenander spielen, so sinken die EAS-Scores, weil sich die aggressiven Engines gegenseitig Punkte "stehlen" (es kann immer nur 1 Engine mit einem Opfer eine Partie gewinnen, auch wenn der Gegner ebenfalls sehr aggressiv spielt, denn das EAS-Tool erkennt konstruktionsbedingt ja nur Opfer, die die Farbe spielt, welche die Partie dann auch schlußendlich gewinnt).
Parent - - By Walter Eigenmann Date 2025-01-05 12:09 Upvotes 5
Das Grundproblem deines EAS ist halt, Stefan, dass "Opferfreudigkeit" mit "Risikofreudigkeit" gleichgesetzt wird.
Das ist schachlich zu simpel gesehen. Das Spiel der starken Engines ist fast immer sehr "aggressiv", sprich extrem nach vorne gerichtet -
dafür braucht's keinerlei Opfer. Diese sind heutzutage meist erst zum Schluss der Partie ein schöne Wirkung, aber nicht die Ursache.

"Patricia" & Co. erinnern irgendwie an's gute alte Kaffeehaus-Schach: Sexy anzuschauen - aber schachlich schlecht
(dies jetzt durch die Stockfish-Lupe gesagt). Der Erkenntnisgewinn aus solchen Partien ist meist minimal.
Aber hey, Spass ist auch ein legitimer Zustand, insofern ist EAS ja durchaus a nice goody

Gruss: Walter
Parent - - By Stefan Pohl Date 2025-01-05 15:00
Walter Eigenmann schrieb:

Das Grundproblem deines EAS ist halt, Stefan, dass "Opferfreudigkeit" mit "Risikofreudigkeit" gleichgesetzt wird.


Das stimmt so nicht. Das EAS-Tool berücksichtigt ja aus genau diesem Grund auch andere Kriterien, nicht nur Opferfreudigkeit, damit eben gerade nicht die Opferfreudigkeit alleine EAS-Punkte gibt. Sehr kurze Gewinnpartien geben ebenfalls viele EAS-Punkte und auch die durchschnittliche Länge aller Gewinnpartien gibt EAS-Punkte, wenn sie geringer ist, als die der Konkurrenz. Sowie Strafabzüge von EAS-Punkten für schlechte Remisen, also Remisen vor dem Endspiel oder nach einem zumindest temporären Materialvorteil in einer Partie.

Beispiel: Die EAS-Ranglisten Tabellennachbarn Arasan 24.2.1 und Stockfish Final HCE:

Code:

                                 bad  avg.win
Rank  EAS-Score  sacs   shorts  draws  moves  Engine/player
-------------------------------------------------------------------
  23    122378  10.97%  35.63%  27.98%   68   Stockfish final HCE 
  24    121762  23.48%  13.75%  14.59%   80   Arasan 24.2.1 avx2 


Diese Engines liegen im EAS Score quasi gleichauf, obwohl Arasan eine sac-Quote von 23.48% und Stockfish final HCE von nur 10.97% hat (!!!). Würde das EAS-Tool nur die Opferfreudigkeit berücksichtigen, lägen diese Engines Lichtjahre in der EAS-Liste auseinander. Stattdessen sind sie quasi gleichauf.
Parent - By Walter Eigenmann Date 2025-01-06 09:25 Upvotes 4
Ja, aber das Opfern ist bei der EAS-Aggressivitäts-Suche das statistisch prominenteste Kriterium. Ein Turmopfer in einer Gewinnpartie ergibt z.B. 200 Punkte, eine Gewinnpartie unter 40 Zügen nur 45 Punkte.
Beides ist aber im modernen Engine-Schach eigentlich nahezu unmöglich - es sei denn, die Gegnerschaft ist mässig stark oder schlecht oder sehr schlecht.
EAS misst also eigentlich nicht die "Aggressivität" einer Engine, sondern die Mangelhaftigkeit ihrer Gegner.
Und dann: Im modernen Engine-Schach bestimmt die Wahl der Eröffnungen wesentlich die Statistik (bei den Menschen ist die Eröffnungswahl ja eher unwichtig, dort wechseln bekanntlich die Vorteile pro Partie x-mal die Seite...)

Anders formuliert: Je ausgeglichener die gewählten Eröffnungen, und je grösser/breiter das Teilnehmerfeld, desto stärker die Annäherung der EAS-Rangliste an die übliche Turnierperformance (z.B. CEGT).
Irgendwann wären die beiden Ranglisten wohl praktisch identisch, womit wieder kein Erkenntnisgewinn möglich ist

Das tiefere "Übel" des EAS-Tools (und solcher Kastrationsversuche wie z.B. "Unbalanced Human Openings" UHO) ist ja eigentlich, dass wir alle so geil auf's 1:0 / 0:1 sind.
Remisen sind uns - im Youtube-Zeitalter der Sensations-Influenzer -  langweilig geworden. Wobei wir vergessen, welches fantastische Schach sich oft abspielt vor einem 1/2-Resultat.
Schach ist nun mal remis, der aktuelle Engine-Zirkus beweist es - und daran ändern auch die Millionen Klicks bei den Sensations-Schach-Youtubern nichts.
Wer das Computerschach verstehen will, muss in die Partien bzw. Stellungen selbst hinein - und zwar ausgiebig...

Gruss: Walter

.
Parent - - By Thomas Zipproth Date 2025-01-04 17:00
Hallo Stefan,

das Ergebnis des zweiten Tests mit einer deutlich stärkeren (aber immer noch schwachen) Engine:

Code:
   # PLAYER          :  RATING    Win Draw  Lost   Average moves to mate
   1 Stockfish       :   752.6    973   27     0   56.1
   2 StockfishHCE    :   603.7    938   62     0   54.8 
   3 Cerberus        :   546.4    922   71     7   57.6 
   4 Komodo14        :   520.2    904   94     2   58.4 
   5 Patricia        :   514.6    907   85     8   55.7 

   6 4ku51           :     0.0     17  339  4644    


Es scheint komplizierter zu sein als gedacht, Cerberus hat sich um einen Platz nach vorne geschoben
Ich hatte den ersten Test überhaupt nur gemacht, weil ich dachte, dass Cerberus und Patrica dabei glänzen würden / könnten.
Meine menschliche Intuition sagt:
Wenn Magnus Carlsen gegen mich offensiv und aggressiv spielt, gewinnt er sicherlich etwas schneller, als wenn er präzise und positionell spielt.
Ich wäre niemals in  der Lage, einen Fehler in seinen Angriffen zu finden.
Ich habe so etwas schon gegen Vlastimil Hort in einem Simultan vor ca. 25 Jahren erlebt, nach 18 Zügen musste ich aufgeben.
Aber wie gesagt, diese Annahme galt auch nur für extreme Spielstärkeunterschiede.

Für Engines gilt sie offenbar nicht oder eingeschränkt, der Grund ist mir nicht vollkommen klar.
Vielleicht finden auch sehr schwache Engines Lücken in den Angriffen der risikofreudigen Engines.
Da sie nicht wie Menschen unter Druck geraten oder erratisch reagieren.
Aber wenn solche Lücken da sind, müsste eine stärkere Engine sie eigentlich noch viel öfter aufdecken.
Das einzige, was Aggressivität im Engine Schach bringen sollte, sind "Zufallssiege" gegen stärkere Engines,
aufgrund der Erhöhung der Zufallsfaktors, und gelegentliche Kurzsiege.
Das könnte sich mit dem von dir beobachteten Verhalten (kürzere Siege, wenn die Engine denn gewinnt), aber generell schlechtere Ergebnisse (?) decken.
Aber dann sollten es auch bei sehr schlechten Engines kürzere Siege im Gewinnfall sein, das ist mir nach wie vor unklar.

Ich wiederhole jetzt den Test ein letztes Mal mit einer gleich starken Engine.
Vielleicht bringt das etwas Klarheit.
Parent - - By Stefan Pohl Date 2025-01-05 08:18 Edited 2025-01-05 08:22
Thomas Zipproth schrieb:

Hallo Stefan,

das Ergebnis des zweiten Tests mit einer deutlich stärkeren (aber immer noch schwachen) Engine:

Code:
   # PLAYER          :  RATING    Win Draw  Lost   Average moves to mate
   1 Stockfish       :   752.6    973   27     0   56.1
   2 StockfishHCE    :   603.7    938   62     0   54.8 
   3 Cerberus        :   546.4    922   71     7   57.6 
   4 Komodo14        :   520.2    904   94     2   58.4 
   5 Patricia        :   514.6    907   85     8   55.7 

   6 4ku51           :     0.0     17  339  4644    


Es scheint komplizierter zu sein als gedacht, Cerberus hat sich um einen Platz nach vorne geschoben
Ich hatte den ersten Test überhaupt nur gemacht, weil ich dachte, dass Cerberus und Patrica dabei glänzen würden / könnten.
Meine menschliche Intuition sagt:
Wenn Magnus Carlsen gegen mich offensiv und aggressiv spielt, gewinnt er sicherlich etwas schneller, als wenn er präzise und positionell spielt.
Ich wäre niemals in  der Lage, einen Fehler in seinen Angriffen zu finden.
Ich habe so etwas schon gegen Vlastimil Hort in einem Simultan vor ca. 25 Jahren erlebt, nach 18 Zügen musste ich aufgeben.
Aber wie gesagt, diese Annahme galt auch nur für extreme Spielstärkeunterschiede.

Für Engines gilt sie offenbar nicht oder eingeschränkt, der Grund ist mir nicht vollkommen klar.
Vielleicht finden auch sehr schwache Engines Lücken in den Angriffen der risikofreudigen Engines.
Da sie nicht wie Menschen unter Druck geraten oder erratisch reagieren.
Aber wenn solche Lücken da sind, müsste eine stärkere Engine sie eigentlich noch viel öfter aufdecken.
Das einzige, was Aggressivität im Engine Schach bringen sollte, sind "Zufallssiege" gegen stärkere Engines,
aufgrund der Erhöhung der Zufallsfaktors, und gelegentliche Kurzsiege.
Das könnte sich mit dem von dir beobachteten Verhalten (kürzere Siege, wenn die Engine denn gewinnt), aber generell schlechtere Ergebnisse (?) decken.
Aber dann sollten es auch bei sehr schlechten Engines kürzere Siege im Gewinnfall sein, das ist mir nach wie vor unklar.

Ich wiederhole jetzt den Test ein letztes Mal mit einer gleich starken Engine.
Vielleicht bringt das etwas Klarheit.


Moin Thomas,

das "Problem" hier könnten auch die Vegleichsengines sein: Denn die beiden etwa auf dem Celo-Level von Patricia und Cerberus liegenden Engines, die du hier zu Vergleichszwecken heranziehst, sind Komodo 14 und Stockfish HCE, beides Engines noch mit HCE und ohne NNUE. Die dritte Engine (aktueller Stockfish) hat zwar NNUE, aber ist in einer ganz anderen Spielstärkesphäre unterwegs.
Das könnte ein Problem sein. Denn HCE Engines zeigen in einer EAS Auswertung durchaus Abweichungen zu NNUE Engines: HCE Engines haben meist schlechtere Werte bei bad draws, dafür aber bessere Werte bei short wins und (das ist hier von Belang) eine geringere durchschnittliche Länge der Gewinnpartien als NNUE Engines. Probiere es doch mal mit einem alten Viridithas, der von der Spielstärke paßt (Version 11 oder 10 oder so), denn das ist eine NNUE-Engine und sie hat einen niedrigen EAS-Wert. Das wäre eine ideale Engine für deine Tests. Oder ein Black Marlin oder ein älteres RubiChess... eben NNUE-Engines, die etwa auf dem Celo-Level von Cerberus/Patricia liegen.
Zur Zeit vergleichst du leider eher Äpfel mit Birnen (HCE / NNUE), Birnen mit Birnen zu vergleichen wäre sicher besser.
Parent - By Max Siegfried Date 2025-01-05 11:24
Es dürfte hierbei auch auf den Spielertyp/Charakter der gegnerischen Engine ankommen.
ChessBase, Fritz 19 Tiere.
Man könnte sagen das alle Engine die gleichen Parameter haben, aber die Schwerpunkte unterschiedlich getunt/gesetzt wurden.
Eine aggressiv spielende Engine müsste gegen die passiv spielende Maus besser abschneiden, als z.B. gegen den Schwindler Fuchs, denn während der Fuchs Gambits und sehr scharfes, kompliziertes und zweischneidiges Spiel bevorzugt, steht die Maus die meiste Zeit nur hinten drin auf den eigenen 3 Reihen und wird von einer aggressiv spielenden Engine irgendwann ausmanövriert und zerquetscht.
Parent - By Thomas Zipproth Date 2025-01-05 23:49 Upvotes 2
Stefan Pohl schrieb:

Moin Thomas,

das "Problem" hier könnten auch die Vegleichsengines sein: Denn die beiden etwa auf dem Celo-Level von Patricia und Cerberus liegenden Engines, die du hier zu Vergleichszwecken heranziehst, sind Komodo 14 und Stockfish HCE, beides Engines noch mit HCE und ohne NNUE. Die dritte Engine (aktueller Stockfish) hat zwar NNUE, aber ist in einer ganz anderen Spielstärkesphäre unterwegs.
Das könnte ein Problem sein. Denn HCE Engines zeigen in einer EAS Auswertung durchaus Abweichungen zu NNUE Engines: HCE Engines haben meist schlechtere Werte bei bad draws, dafür aber bessere Werte bei short wins und (das ist hier von Belang) eine geringere durchschnittliche Länge der Gewinnpartien als NNUE Engines. Probiere es doch mal mit einem alten Viridithas, der von der Spielstärke paßt (Version 11 oder 10 oder so), denn das ist eine NNUE-Engine und sie hat einen niedrigen EAS-Wert. Das wäre eine ideale Engine für deine Tests. Oder ein Black Marlin oder ein älteres RubiChess... eben NNUE-Engines, die etwa auf dem Celo-Level von Cerberus/Patricia liegen.
Zur Zeit vergleichst du leider eher Äpfel mit Birnen (HCE / NNUE), Birnen mit Birnen zu vergleichen wäre sicher besser.


Hallo Stefan,

alles klar, verstehe was du meinst. Ich teste das auch noch, sobald ich dazu komme.

Und ich weiß jetzt:
Birne gegen Apfel: Schlecht
Birne gegen Birne: Gut

Sry, aber ich konnte nicht wiederstehen.

Parent - - By Lothar Jung Date 2025-01-03 09:51 Edited 2025-01-03 09:54
Irgendwie stimmt hier etwas nicht.
Ich kann mir aus der Tabelle keinen Reim machen.
Wieso ist die Remisrate so gering.
Hat nicht Fruit die ganze Tabelle stark beeinflusst.
Wie sähe es aus wenn Fruit außen vor bleibt?
Fruit war hier der Prügelknabe und hat allen Engines Siege gebracht.
Parent - By Thomas Zipproth Date 2025-01-03 13:21
Alle Engines haben nur gegen Fruit gespielt (1000 Partien).
Es war ja gerade der Sinn herauszufinden, wie sich Aggressivität beim Spiel gegen einen sehr viel schwächeren Gegner auswirkt.
Ich wiederhole den Test jetzt nochmal mit einer stärkeren Engine.
Up Topic Hauptforen / CSS-Forum / Test starker/aggressiver Engines gegen eine im Vergleich sehr schwache Engine.

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill