Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Kleines Turnier, 21.000 Partien ...
- - By Frank Quisinsky Date 2022-08-08 08:36 Edited 2022-08-08 08:58
Hallo zusammen,

hier ein kleines Turnier:
40 Züge in 8 Minuten, Ponder = off, 5-Steiner, 4.1Ghz Hardware, 512Mb Hash, Aufgabefaktor = off
Jeder gegen Jeden 100 Partien!

Im Feld sind Angreifer + Seer und Minic.
Minic und Seer gehören nicht zu den Angreifern nach der Eröffnungsphase, spielen aber sehr sicher.

Ermittelt wurde der Zügedurchschnitt.
Mit 100 Zügen trotz Contempt = 0 bei Minic zu hoch.
Auch erspielte Minic die höchste Anzahl an schnellen Verlusten.
Da muss ich nochmals das Feld ändern und probiere nochmals Berserk ohne Contempt aus.

Ziel ist es herauszufinden, welche Programme sich für Buchoptimierungen am besten eignen und dabei nicht durch einen hohen Zügedurchschnitt auffallen.
Komodo und Minic spielten ohne Contempt.
Bei den anderen steht in der Grundeinstellung Contempt richtiger Weise eh auf 0 (wenn Contempt einstellbar ist).

Turniertabelle:
https://www.amateurschach.de/fling/fcp_40in8_secret.html

Wer sich für die Partien interessiert (schön ist mit dieser Datenbank das neue Tool von Stefan auszuprobieren).
https://www.amateurschach.de/fling/fcp_40in8_secret.pgn

Code:

     Name                       Games     Win     Draw     Lose       Pts         S-B         %

Dragon 3 NN (Komodo)         :  2000  : 1082+  :  918=  :    0-  :  1541.0  : 1464171.25  :  77.05%
Revenge 3.0 NN exp           :  2000  :  755+  : 1185=  :   60-  :  1347.5  : 1268029.25  :  67.38%
SlowChess Blitz 2.9 NN       :  2000  :  631+  : 1294=  :   75-  :  1278.0  : 1208461.75  :  63.90%
rofChade 3.0 NN              :  2000  :  573+  : 1290=  :  137-  :  1218.0  : 1141377.75  :  60.90%
Stockfish 11                 :  2000  :  561+  : 1302=  :  137-  :  1212.0  : 1144723.25  :  60.60%
RubiChess 20220223 NN        :  2000  :  568+  : 1261=  :  171-  :  1198.5  : 1121720.00  :  59.93%
Andscacs 0.1 NNSf            :  2000  :  538+  : 1311=  :  151-  :  1193.5  : 1125823.00  :  59.68%
Seer 2.5.0 NN                :  2000  :  514+  : 1277=  :  209-  :  1152.5  : 1079287.00  :  57.63%
Arasan 23.3 NN               :  2000  :  388+  : 1266=  :  346-  :  1021.0  :  956811.50  :  51.05%
Minic 3.24 NN                :  2000  :  325+  : 1322=  :  353-  :   986.0  :  927614.75  :  49.30%
Igel 3.1.0 NN                :  2000  :  313+  : 1343=  :  344-  :   984.5  :  925570.75  :  49.23%
Uralochka 3.37c NN           :  2000  :  325+  : 1263=  :  412-  :   956.5  :  897615.00  :  47.83%
Fire 8.2                     :  2000  :  305+  : 1198=  :  497-  :   904.0  :  841121.00  :  45.20%
Wasp 5.58 NN dev             :  2000  :  253+  : 1251=  :  496-  :   878.5  :  824384.25  :  43.93%
Rodent 1.0 NNSf              :  2000  :  220+  : 1273=  :  507-  :   856.5  :  808504.50  :  42.83%
Tucano 10.00 NN              :  2000  :  211+  : 1245=  :  544-  :   833.5  :  781763.50  :  41.68%
Wasp 5.50 NN                 :  2000  :  175+  : 1125=  :  700-  :   737.5  :  687965.25  :  36.88%
Velvet 4.0.1 NN              :  2000  :  199+  : 1071=  :  730-  :   734.5  :  691062.75  :  36.73%
Booot 6.5                    :  2000  :  156+  : 1050=  :  794-  :   681.0  :  639304.75  :  34.05%
Xiphos 0.6                   :  2000  :  148+  : 1032=  :  820-  :   664.0  :  625303.50  :  33.20%
Marvin 6.0.0 NN              :  2000  :  126+  :  991=  :  883-  :   621.5  :  583717.25  :  31.08%


Interessant ist Stockfish 11 (letzte offizielle Version ohne NN).
Während Stockfish 11 ca. die gleiche Anzahl an schnellen Gewinnen produziert wie Stockfish 15 und keine Partien unter 60 Zügen verloren hat wurden dennoch 137 Partien verloren.
Der Unterschied von Stockfish 11 auf Stockfish 15 liegt bei ca. 140 Elo. Bei 40 Züge in 20 Minuten sind es 120 Elo.
Das Plus an Elo wird im Übergang zum Endspiel - Endspiel produziert.

Hatte es schon geschrieben:
Die schnellen Gewinne ohne NN wirken bei Stockfish 11 im Vergleich zu Stockfish 15 spekulativer.

Insofern ist klar zu sehen, dass im Mittelspiel noch Möglichkeiten vorhanden sind Spielstärken in heutigen Zeiten zu steigern.

Viele Grüße
Frank

PS: Wer sich die Datenbank genauer anschaut wird sich über verhältnismäßig wenige schnelle Gewinne unter 60 Zügen wundern.
Ist nicht verwunderlich ... wenn Angreifer - Angreifer spielen hält sich die Zahl in Grenzen. Es sind keine Engines im Feld die verhältnismäßig viele Partien
schnell verlieren wie z. B. Fritz 18 NN oder Zahak 10.00, Hiarcs 15.1. Die hatte ich erst drin aber das wäre bei diesen Gegnern gänzlich in die Hose gegangen.
Ferner produzieren Fritz 18 NN oder Zahak einen viel zu hohen Zügedurchschnitt.

Alles sehr moderat mit dem Zügedurchschnitt ... viel Testzeit wurde eingespart.
Lediglich Minic fällt wie beschrieben mit 100 Zügen unangenehm auf (trotz Contempt = 0).
In der Regel liegt der Zügedurchschnitt bei diesen Engines bei ca. 84-85 Zügen (Durchschnitt der Engines ohne Minic).
Parent - By Frank Quisinsky Date 2022-08-08 08:50 Edited 2022-08-08 08:54
Ah ...
Marvin gehört auch nicht zu den Angreifern hat aber zwei Vorteile:
Verteidigt großartig für die vorhandene Spielstärke und produziert einen super Zügedurchschnitt.

Wichtig war mir auch das einige "Nicht NN" Engines im Feld waren.
Für spätere Analysen der kurzen Gewinnpartien ...

Interessant auch Andscacs 0.1 mit Stockfish NN.
Als der Programmierer den Thread in TalkChess öffnete, das er diese Version als Testversion anbietet, wäre Andscacs zu diesem Zeitpunkt die Nummer 4 gewesen.
Nach Stockfish, Komodo und Lc0.

Das Turnier dient als Basis Turnier für die folgende Idee ...
Einen Test-Set mit den 50 aggressivsten Eröffnungen bilden und dann das Turnier wiederholen.

Es gilt die Remisquote, den Zügedurchschnitt weiter zu senken.
Daher musste ich zunächst mal ein Feld bilden um dieses Unterfangen besser zu bewerkstelligen bzw. einen guten Vergleich zu haben.
Dieses Turnier wurde mit meinem privaten FEOBOS Buch und vielen Ergänzungen gespielt (mein bestes Buchmaterial).

Spielen meist Angreifer wird die Bildung vom Test-Set schwieriger aber auch sinnvoller.

Muss aber bei den Engines nochmals ändern.
Minic muss raus ... hoffe Berserk produziert einen moderaten Zügedurchschnitt ohne Contempt.
Bei einem Test-Turnier sah das sehr gut aus.
Grundeinstellung bei Beserk ist glaube ich aus dem Kopf = Contempt = 12

Wenn ich dann später das Turnier mit den aggressiven Eröffnungslinien wiederholt habe melde ich mich.
Können wir mal schön vergleich was das beim Testen bringt.
Parent - - By Stefan Pohl Date 2022-08-08 11:13 Edited 2022-08-08 11:39
Frank Quisinsky schrieb:


Wer sich für die Partien interessiert (schön ist mit dieser Datenbank das neue Tool von Stefan auszuprobieren).


Ich persönlich nutze ja lieber mein EAS-Tool, weil das die wesentlichen Statistiken selber auswertet und mit Punkten eine Liste erstellt. Auch hier liegt Minic ganz hinten. Ohne, daß man sich "händisch" Statistik-Zahlen ansehen muß. Geht alles automatisch. Starten. 2 Minuten warten. Liste ist da. Schaut man auf den "shorts"-Wert (Kurzsiege bis 60 Züge insgesamt (natürlich immer prozentual zu der Gesamtzahl der Siege, nicht die absolut Zahlen)), dann sieht man hier, daß Minic und Seer desaströs abschneiden (schon der nächste Tabellennachbar Igel hat über 5x mehr short-wins)

Code:

*****************************************************************************
*** Engine Aggressiveness Tool V3.5 Score points Ratinglist
*****************************************************************************
Score is: (percent*100) of the percent-values of the sacs (1-5+ pawnunits)
calculated out of the won games by the engine, only.
So, a weak engine (with a small number of won games) can get
a high EAS-scoring, too, when the percent of sac-games in the won games
is high (and the number of short wins). Higher pawnunits-sacs give bonus-points:
1 pawnsac = 2x points  *** 2 pawnsac  = 10x points *** 3 pawnsac = 20x points
4 pawnsac = 40x points *** 5+ pawnsac = 80x points *** 5+ Queensac = 150x points
Additionally, very short won games (percent*100) give bonus-points. If the short
games ended before endgame (a check for low material is done), then these points
are doubled:
60 moves= 1x points *** 55 moves= 2x points *** 50 moves= 5x points
45 moves= 10x points *** 40 moves= 30x points. 
*****************************************************************************
*** Evaluated file: fcp_40in8_secret.pgn ***
*****************************************************************************
Rank  EAS-Score  sacs   shorts   Engine/player
-------------------------------------------------------------
001    051922   35.18%  19.10%  Velvet 4.0.1 NN
002    034659   27.38%  05.54%  Uralochka 3.37c NN
003    033984   21.33%  08.06%  Tucano 10.00 NN
004    029460   21.91%  07.47%  Arasan 23.3 NN
005    025017   16.56%  08.61%  Revenge 3.0 NN exp
006    023592   21.19%  10.41%  Andscacs 0.1 NNSf
007    020601   20.24%  10.63%  Dragon 3 NN (Komodo)
008    020224   18.70%  09.35%  SlowChess Blitz 2.9 NN
009    019989   23.02%  04.76%  Marvin 6.0.0 NN
010    018381   17.47%  13.37%  Stockfish 11
011    015234   14.74%  13.46%  Booot 6.5
012    013971   16.40%  07.16%  rofChade 3.0 NN
013    012147   25.45%  07.27%  Rodent 1.0 NNSf
014    012138   17.43%  06.34%  RubiChess 20220223 NN
015    011219   16.21%  08.30%  Wasp 5.58 NN dev
016    010889   10.29%  08.57%  Wasp 5.50 NN
017    008742   10.49%  06.89%  Fire 8.2
018    007757   09.46%  10.14%  Xiphos 0.6
019    007102   15.97%  06.39%  Igel 3.1.0 NN
020    006885   11.67%  01.17%  Seer 2.5.0 NN
021    006269   15.08%  01.23%  Minic 3.24 NN

*****************************************************************************
*** 2nd Ratinglist with all stats in percent-values *************************
*****************************************************************************
Rank  EAS-Score   wins    all sacs  sacsQ    sacs5+   sacs4    sacs3    sacs2    sacs1  ** all shorts  short40  short45  short50  short55  short60   Engine/player
--------------------------------------------------------------------------------------------------------------------------------------------------------------------------
001    051922    000199    35.18% =[00.00% + 00.00% + 04.02% + 02.51% + 12.06% + 16.58%]**   19.10% = [02.51% + 00.50% + 04.52% + 02.51% + 09.05%]  Velvet 4.0.1 NN
002    034659    000325    27.38% =[00.00% + 01.54% + 00.62% + 03.08% + 07.08% + 15.08%]**   05.54% = [00.31% + 00.31% + 01.85% + 01.23% + 01.85%]  Uralochka 3.37c NN
003    033984    000211    21.33% =[00.00% + 01.42% + 00.95% + 00.95% + 03.32% + 14.69%]**   08.06% = [01.42% + 00.47% + 01.90% + 00.95% + 03.32%]  Tucano 10.00 NN
004    029460    000388    21.91% =[00.00% + 01.03% + 00.77% + 02.32% + 05.67% + 12.11%]**   07.47% = [00.77% + 00.26% + 01.03% + 02.84% + 02.58%]  Arasan 23.3 NN
005    025017    000755    16.56% =[00.00% + 01.06% + 00.79% + 01.46% + 03.97% + 09.27%]**   08.61% = [00.40% + 01.32% + 00.79% + 02.25% + 03.84%]  Revenge 3.0 NN exp
006    023592    000538    21.19% =[00.00% + 00.37% + 00.56% + 00.74% + 06.51% + 13.01%]**   10.41% = [00.93% + 00.74% + 01.30% + 02.79% + 04.65%]  Andscacs 0.1 NNSf
007    020601    001082    20.24% =[00.00% + 00.37% + 00.65% + 01.29% + 05.91% + 12.01%]**   10.63% = [00.28% + 00.74% + 01.85% + 02.59% + 05.18%]  Dragon 3 NN (Komodo)
008    020224    000631    18.70% =[00.00% + 00.32% + 00.48% + 02.22% + 04.12% + 11.57%]**   09.35% = [00.48% + 01.43% + 00.79% + 01.43% + 05.23%]  SlowChess Blitz 2.9 NN
009    019989    000126    23.02% =[00.00% + 00.00% + 00.00% + 04.76% + 07.14% + 11.11%]**   04.76% = [00.00% + 00.00% + 01.59% + 00.00% + 03.17%]  Marvin 6.0.0 NN
010    018381    000561    17.47% =[00.00% + 00.18% + 01.25% + 00.53% + 02.85% + 12.66%]**   13.37% = [00.18% + 01.60% + 01.96% + 03.03% + 06.60%]  Stockfish 11
011    015234    000156    14.74% =[00.00% + 00.00% + 00.00% + 01.28% + 03.85% + 09.62%]**   13.46% = [01.28% + 00.00% + 03.21% + 04.49% + 04.49%]  Booot 6.5
012    013971    000573    16.40% =[00.00% + 00.00% + 00.17% + 01.22% + 04.01% + 10.99%]**   07.16% = [00.35% + 00.87% + 00.52% + 01.57% + 03.84%]  rofChade 3.0 NN
013    012147    000220    25.45% =[00.00% + 00.00% + 00.00% + 00.91% + 05.00% + 19.55%]**   07.27% = [00.00% + 00.45% + 00.00% + 03.18% + 03.64%]  Rodent 1.0 NNSf
014    012138    000568    17.43% =[00.00% + 00.00% + 00.35% + 01.23% + 04.23% + 11.62%]**   06.34% = [00.00% + 00.35% + 00.88% + 02.29% + 02.82%]  RubiChess 20220223 NN
015    011219    000253    16.21% =[00.00% + 00.00% + 00.40% + 01.19% + 02.77% + 11.86%]**   08.30% = [00.00% + 00.00% + 01.58% + 02.77% + 03.95%]  Wasp 5.58 NN dev
016    010889    000175    10.29% =[00.00% + 00.00% + 00.00% + 01.71% + 01.14% + 07.43%]**   08.57% = [00.57% + 00.00% + 02.86% + 02.86% + 02.29%]  Wasp 5.50 NN
017    008742    000305    10.49% =[00.00% + 00.00% + 00.00% + 00.33% + 02.62% + 07.54%]**   06.89% = [00.33% + 00.66% + 00.98% + 00.98% + 03.93%]  Fire 8.2
018    007757    000148    09.46% =[00.00% + 00.00% + 00.00% + 01.35% + 01.35% + 06.76%]**   10.14% = [00.00% + 00.68% + 01.35% + 02.03% + 06.08%]  Xiphos 0.6
019    007102    000313    15.97% =[00.00% + 00.00% + 00.00% + 00.32% + 01.92% + 13.74%]**   06.39% = [00.00% + 00.64% + 00.32% + 01.28% + 04.15%]  Igel 3.1.0 NN
020    006885    000514    11.67% =[00.00% + 00.00% + 00.39% + 00.58% + 01.75% + 08.95%]**   01.17% = [00.00% + 00.19% + 00.19% + 00.58% + 00.19%]  Seer 2.5.0 NN
021    006269    000325    15.08% =[00.00% + 00.00% + 00.00% + 00.31% + 02.77% + 12.00%]**   01.23% = [00.00% + 00.31% + 00.31% + 00.00% + 00.62%]  Minic 3.24 NN


EAS-Tool: https://www.sp-cc.de/files/engines_aggressiveness_statistics_tool.7z
Meine EAS-Rangliste: https://www.sp-cc.de/eas-ratinglist.htm

Generell ist es so, das alle statistischen Auswertungen, seien es nun Opfer, kurze Siegpartien, kurze Remisen, immer nur eine kleine Teilmenge der Gesamtpartienzahl sind. Sieht man ja auch hier in der EAS-Auswertung: Etliche Engines haben weniger als 200 Gewinnpartien insgesamt. Daher kann ich auch hier wieder nur sagen: Es ist für jedwede statistische Auswertung immer besser mehr Partien mit weniger Bedenkzeit zu spielen, als weniger Partien mit längerer Bedenkzeit. Man gewinnt viel mehr statistische Qualität durch die höhere Zahl an Partien dazu, als man an schachlicher Qualität durch die kürzere Bedenkzeit verliert (ob das schachliche Niveau nun bei 3500, 3400 oder 3300 Elo liegt, ist für jedwede Auswertung von Spielstilen etc völlig belanglos - ob ich aber 2000 Partien pro Engine habe, oder mindestens 7000 (wie in meiner Rangliste) macht für die Auswertungen und Statistiken einen Riesenunterschied, eben weil diese Statistiken immer nur kleine Teilmengen der insgesamt gespielten Partien auswerten!). Kann man bei einer Gesamtauswertung für die normale Elo-Leistung noch sagen, auch 2000 Partien geben schon ein halbwegs verläßliches Bild, so gilt das für die Teil-Statistiken eben leider nicht. Weil man hier dann oft nur noch 150 oder 200 Partien heranziehen kann und das macht diese Statistiken dann sehr fragwürdig.
Schaut man in meine EAS-Rangliste, haben Minic und Seer z.B. eine sehr ordentliche/normale Zahl von kurzen Siegen bis 60 Zügen abgeliefert. Warum? Weil die Auswertung hier jeweils auf über 1700 Gewinnpartien basierte und nicht auf 514 bzw. 325 Gewinnpartien. Das ist eben einfach ein viel zuverlässigerer Wert. Sieht man auch schön daran, wie dicht die beiden aktuellen Stockfish Dev-Versionen in der EAS-Rangliste beieinander liegen:
011    041027   26.79%  18.34%  Stockfish 220724 avx2
012    039101   26.36%  20.05%  Stockfish 220713 avx2
Warum? Beide Auswertungen basieren auf über 3000 Gewinnpartien. Nicht 325.

Tut mir ja leid für die Verfechter der langen Bedenkzeiten und des "höheren schachlichen Niveaus". Aber statistisch schießt man sich damit ins Knie. Ist so. Masse ist hier wichtiger als Klasse. Insbesondere, wenn die Klasse sowieso jenseits von 3000 Elo liegt.
Würde ich heute meine Rangliste (in Zeiten meiner zusätzlichen EAS-Rangliste) neu starten, würde ich vermutlich sogar mit noch kürzeren Bedenkzeiten spielen, um noch mehr Partienmaterial zu generieren, als nur 7000 pro Engine.
Parent - - By Frank Quisinsky Date 2022-08-08 11:35
Hallo Stefan,

tja bei Wasp sind die Stats verhältnismäßig besser, wenn die Engines die schnell verlieren im Feld waren. Es fällt aber auf, das Wasp bei der Aggressivität zulegen muss. John hat sich auf NN in den letzten zwei Jahren konzentriert. Auch wurde die Konkurrenz größer mit Velvet und Uralochka.

John arbeitet genau an diesem Punkt.

Gespannt bin ich auf die Vergleiche dieser Daten mit dem beabsichtigten TestSet. Meine Prognose wäre ...

1. Die Remisquote kann um 7% gesenkt werden.
2. Der Zuegedurchschnitt um 9

Werde aber zunächst Minic ersetzen. Viele Alternativen gibt es nicht mehr. Entweder ist der Zuegedurchschnitt zu hoch oder zu viele schnelle Verluste oder Engines passen nicht in dieses starke Feld.

Es gab ferner 2 GUI Hänger bei den 21000 Partien. Bei beiden war Minic beteiligt

Nur mit einem perfekten Feld wird der Vergleich ...
Buch gegen TestSet

aussagekräftiger.

So kann man die ersten 50 aggressiven Varianten prüfen und vergleichen, die nächsten 50 etc.

Und am Ende der Aktion dann mehr spannendes Schach beim Engine testen.

Viele Grüße
Frank Quisinsky

Wirklich ein Segen ... ich erspare mir mit Deinen Tools viel Zeit bei den Stats.
Parent - - By Stefan Pohl Date 2022-08-08 11:43 Edited 2022-08-08 11:52
Frank Quisinsky schrieb:

Hallo Stefan,

tja bei Wasp sind die Stats verhältnismäßig besser, wenn die Engines die schnell verlieren im Feld waren. Es fällt aber auf, das Wasp bei der Aggressivität zulegen muss. John hat sich auf NN in den letzten zwei Jahren konzentriert. Auch wurde die Konkurrenz größer mit Velvet und Uralochka.

John arbeitet genau an diesem Punkt.



Wird er auch müssen. Denn, wenn ich meine Full-Ratinglist EAS-Auswertung schaue, wird Wasp mit den 3 von mir getesteten Versionen in der EAS-Rangliste immer schlechter (Jeder der drei Wasp-EAS-Werte basiert auf um die 3000 Gewinnpartien):

Code:

014    050845   19.31%  27.57%  Wasp 5.00 avx
022    041869   16.96%  29.94%  Wasp 5.20 avx
023    040687   15.55%  29.89%  Wasp 5.50 avx


https://www.sp-cc.de/files/spcc_full_list.txt

Daß das auch anders geht, zeigt (mal wieder) Velvet, die Wunderengine (Velvet 4.0.0 hat 44.61% aller Gewinnpartien in maximal 60 Zügen abgewickelt, ein unfaßbarer Wert, ich spiele ja auch ohne Aufgabe, bis zum Matt oder einem 5-Steiner Endspiel)!):
002    086819   31.32%  44.61%  Velvet 4.0.0 avx2
003    083967   31.95%  34.51%  Velvet 3.3.0 avx2
081    022143   16.54%  18.45%  Velvet 3.2.0 avx2

Und Velvet 4.0.0 ist bei mir +84 Elo besser geworden als Velvet 3.2.0. Und +48 Elo besser als Velvet 3.3.0. Alle Velvets hatten über 2500 Gewinnpartien für die EAS-Auswertung.
Parent - By Frank Quisinsky Date 2022-08-08 12:09 Edited 2022-08-08 12:11
Hallo Stefan,

das ist der Fluch ...
Wird Wasp zwar stärker aber die Aggressivität lässt nach. Kannst du immer und immer wieder beobachten. Pedone / Revenge ist das perfekte Beispiel. Als du das erste Tool veröffentlicht hast schrieb ich Dir in Talkchess das die letzten Pedone Versionen wahrscheinlich auf Platz 1 liegen würden. Früher waren es Spark oder danach Hakka.

Wenn John nur gegen deutlich schlechter trainiert steigert er die Aggressivität. Aber er will nun steigern mit Dingen die nichts mit NN zu tun haben. Bin sehr gespannt denn Wasp muss nachlegen um den erarbeiteten Ruf zu halten.

VG
Frank
Parent - By Frank Quisinsky Date 2022-08-08 11:55 Edited 2022-08-08 12:00
Kurz, mit mehr Partien steigert sich logischer Weise die Aussagekraft. Allerdings mache ich solche Auswertungen schon seit vielen Jahren und die Stats sind zu 95% gleich. Für mich eher unerheblich wie genau die Stats sind, sondern eher wichtig die Sahnestücke für Eröffnungsanalysen zu ziehen.

Wir sehen ja seit Jahren wo der ELO Zuwachs liegt. Daher wird das Endspiel eher immer uninteressanter. So konzentriere ich mich lieber auf die spannendere Phase der Partie.

Seer gewinnt zwar nicht viele Partien schnell aber verliert auch nicht viele sehr schnell. Der Vorteil ist bei Seer, dass der Zuegedurchschnitt gut ist. So viele Angreifer haben wir nicht. Berserk ist zwar ein Angreifer aber der einzige der dann wieder einen hohen Züge Durchschnitt produziert. Beim Standardsetting mit Contempt produziert Berserk gar sehr deutlich den höchsten Zuegedurchschnitt der derzeitigen TOP-50.

Hätte ich z. B. die ganzen Engines im Feld die gerne schnell verlieren wären die Seer Stats besser. Aber die sind alle nicht im Feld.
Parent - By Frank Quisinsky Date 2022-08-10 05:01 Edited 2022-08-10 05:18
Hallo Stefan,

kannst Du bei Deinem Short-Game-Analyzer noch eine Änderung durchführen?
Habe mich jetzt zu sehr auf Dein Tool verlassen und bei Andscacs 0.1 NNSF eine Gemeinheit übersehen (geht gar nicht)!

Schaue mal hier, PNGS von Ferdinand:

Code:

1. Andscacs 0.1 NNSf              (538+,   1311=,   151-)  59.7%

          CATEGORIES   MOVE_AVE    GAMES    TOTAL  GAME_RATE
           all games         88     2000
           white won         81      380
           black won         86      158
          white draw        115      573
          black draw         71      738
          white loss         85       47
          black loss         87      104
            all wins         82      538     2000      26.9%
           all draws         90     1311     2000      65.5%
           all loses         86      151     2000       7.5%


Schaue auf "white draw" and "black draw" ... 44 Züge bei den Remispartien Unterschied!
Das hat Andscacs schon lange im Programm drin, macht mir aber jede Statistik kaputt.
Hatte das total vergessen weil ich mir das 2016 bei Andscacs zuletzt angesehen hatte.

Es wäre also gut wenn Dein Tool bei den Remisen unterscheiden könnte in
Black und White draw ...

Wasp hat in allen Bereichen (Spielstärke entsprechend) den perfekten Zügedurchschnitt!

Code:

19. Wasp 5.58 NN dev               (253+,   1251=,   496-)  43.9%

          CATEGORIES   MOVE_AVE    GAMES    TOTAL  GAME_RATE
           all games         81     2000
           white won         86      165
           black won         88       88
          white draw         77      706
          black draw         79      545
          white loss         90      129
          black loss         86      367
            all wins         87      253     2000      12.7%
           all draws         78     1251     2000      62.5%
           all loses         88      496     2000      24.8%


Genau, weicht nie um mehr als 2-3 Züge beim Zügedurchschnitt der Remisen zwischen weiß und schwarz ab.
Sehr viele Programme versuchen mit weiß eher "Remis" zu vermeiden und mit "Schwarz" zu forcieren.
Heute bei NN gar nicht notwendig, aber nun gut ...

---

Zügedurchschnitt ist wichtig für die Optimierung von einem Test-Set !!
Ich muss nicht nur schauen, wie reduziere ich die Remisquoten, sondern auch wie reduziert sich der Zügedurchschnitt dabei.

Das ist echt ein Unterfangen das richtige Engine-Teilnehmer-Feld hierfür zu generieren.
Entweder ich gehe von 21 runter auf 18 oder ich trixe mit verschiedenen Versionen einer Engine.

Minic ersetze ich gerade durch Berserk.
Berserk spielt einen 93er Zügedurchschnitt ohne Contempt, an der Schmerzgrenze ... 8 über Durchschnitt!
Bei Minic war es ein 100er Zügedurchschnitt ohne Contempt.
Dennoch eine kleine Verbesserung im Test-Feld, zumal Berserk nicht so viele Partien schnell verliert.

Werde Andscacs 0.1 NNSf ersetzen durch die letzte Pedone 3.1 NN Version.
Angreifer mit niedrigen Zügedurchschnitt.
Habe ja auch 2x Wasp drin, also warum nicht Revenge und Pedone.

Echt schwierig!

- entweder die Engines haben keinen einstellbaren Contempt: Stockfish, Rebel, Gingko, Koivisto, seit Version 23 auch ShashChess (macht einer einen Fehler ... immer wieder bei den Clones schön zu sehen) und erspielen bei den Remisen einen viel zu hohen Zügedurchschnitt oder
- die Engines verlieren zu viele Partien zu schnell: Zahak, Gingko, BlackMarlin, BitGenie, Chiron, Shredder, Halogen (leider auch Nemorino im Feld der Angreifer) und eignen sich für die Generierung von einen Test-Set mithin gar nicht.
- oder haben schlicht und ergreifend von der Spielstärke keine Chance im Teilnehmerfeld, z. B. Hiarcs, Weiss, Fizbo, Defenchess, DanaSah

Viele Grüße
Frank

Wäre gut wenn Du die Änderung noch durchführen könntest!
Muss ich nicht mehr auf PNGS und Dein Tool zurückgreifen.
Up Topic Hauptforen / CSS-Forum / Kleines Turnier, 21.000 Partien ...

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill