Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Was gibt es Neues auf Schach.de
- - By Reinhold Stibi Date 2023-09-01 17:05
Erfreulich ist die neue Engine Sun 1.0   By  E.Nemeth, M.Zerbinati, The Stockfish developers

Mit dieser Engine spiele ich z. Zt. auf Schach.de und auch Detlef  Uter, Detti.

Das ist ein gelungener Wurf; taktisch sehr gut, spielt ein erfrischendes Schach und gefällt
mir noch etwas besser als der neueste Stockfish.

Habe auf Schach.de nun meine Testphase mit Pamuk1 mit schwacher Hardware
abgeschlossen. Spielte auch mit einem MiniPC der nur 900 kN/s brachte aber doch
gut abschnitt. Natürlich verlor man da zwischendurch eine Partie und war auch anspruchsvoller
in der Eröffnungswahl. 

Nun spiele ich dort wieder mit meinem mittelstarken Standard PC der ca. 7000 kN/s mit Stockfish in der
Grundstellung bringt.
Der spielt mit einer guten Eröffnung erfolgreich. Da kann ich auch wieder die Italienische Eröffnung
bedenkenlos einsetzen.

Schach.de ist nicht tot, wie der Lothar mal bemerkte.
Mit Lc0 macht es dort weniger Spaß, weil Lc0 zu wenig gewinnt und kaum jemand damit spielt.
Parent - - By Benno Hartwig Date 2023-09-01 18:16

> Das ist ein gelungener Wurf; taktisch sehr gut, spielt ein erfrischendes Schach und gefällt
> mir noch etwas besser als der neueste Stockfish.


Thanx für die Einschätzung.
Was bedeutet es, dass das Schach "erfrischender" ist als das von Stockfish. Was ist da anders? Aggressiver? Häufiger überraschend?
Parent - By Reinhold Stibi Date 2023-09-01 18:51
Sun 1.0 spielt sehr angriffslustig, interessantes Schach; macht Spaß da zuzusehen.

So wie man es sich wünscht. Spielt dabei aber auch sicher. Wüste nicht was man
vom Spielstil da auszusetzen hätte; finde ich ideal.
   
Parent - - By Tommy Tulpe Date 2023-09-01 19:26
Reinhold Stibi schrieb:

Erfreulich ist die neue Engine Sun 1.0   By  E.Nemeth, M.Zerbinati, The Stockfish developers



Hallo Reinhold,
gibt es diese Engine  Sun 1.0  irgendwo zum Download für die Öffentlichkeit oder ist sie (bisher) privat?
Parent - By Tommy Tulpe Date 2023-09-01 21:43
Danke!
Parent - - By Kurt Utzinger Date 2023-09-01 20:47 Upvotes 1
Reinhold Stibi schrieb:

Erfreulich ist die neue Engine Sun 1.0   By  E.Nemeth, M.Zerbinati, The Stockfish developers

Mit dieser Engine spiele ich z. Zt. auf Schach.de und auch Detlef  Uter, Detti.

Das ist ein gelungener Wurf; taktisch sehr gut, spielt ein erfrischendes Schach und gefällt
mir noch etwas besser als der neueste Stockfish.

Habe auf Schach.de nun meine Testphase mit Pamuk1 mit schwacher Hardware
abgeschlossen. Spielte auch mit einem MiniPC der nur 900 kN/s brachte aber doch
gut abschnitt. Natürlich verlor man da zwischendurch eine Partie und war auch anspruchsvoller
in der Eröffnungswahl. 

Nun spiele ich dort wieder mit meinem mittelstarken Standard PC der ca. 7000 kN/s mit Stockfish in der
Grundstellung bringt. Der spielt mit einer guten Eröffnung erfolgreich. Da kann ich auch wieder die Italienische Eröffnung
bedenkenlos einsetzen.

Schach.de ist nicht tot, wie der Lothar mal bemerkte.
Mit Lc0 macht es dort weniger Spaß, weil Lc0 zu wenig gewinnt und kaum jemand damit spielt.


Hallo Reinhold
Sicher ist dir bekannt, dass "Sun" nichts weiter ist als CorChess mit einigen Features von Marco Zerbinati. Es gibt zwei Versionen: Normale Version und Version mit Netzwerk Dimension 2560 --> das ist ein nicht offizielles Netzwerk der SF Entwickler. CorChess basiert auf Stockfish. Manchmal braucht es nur wenige Änderungen, damit eine sonst schon gute Engine interessanteres Schach bietet.
Gruss
Kurt
Parent - - By Stefan Kleinert Date 2023-09-02 00:27
Sun 1.0   By  E.Nemeth ich lach mich kaputt )
Parent - - By Reinhold Stibi Date 2023-09-02 07:25 Edited 2023-09-02 07:57
Einige Beispiele über die taktische Stärke von Sun 1.0  mit Ryzen 3970X.

Meine Lieblingsteststellung mit Matt in:  Short - Timman, Tillburg 1991
Matt in 15   6  Sek.  35/30  tb 21

Behting Studie   1.Kc6 !   1 Sek.  20/18  +- 0.00   tb 200086

Fortness Detection Code, Festung, blockierte Stellung  von Torsten Cuber  gezeigt
1.La4 !   ef6:  -7.09  26/27  29 Sek.  tb 24374
             La4  -6.89   26/37  36 Sek.  tb 281 07
             La4  -4.76   52,54  1:39 Min.  tb 47810

Löse: C:\Schach\Tests\Eigenmann Test in cbh\Eigenmann Rapid Engine Test.cbh
Maximale Lösungszeit = 15s.

Ergebnis: 102 aus 111 = 91.8%. Durchschnittszeit = 0.38s / 13.25



Löse: C:\Schach\Tests\HTC  114\114\HTC114.cbh
Maximale Lösungszeit = 15s.


Ergebnis: 93 aus 114 = 81.5%. Durchschnittszeit = 1.94s / 20.22

Vergleich: Stockfish 16.08.23 avx2:   89   78.0 %   1,94 Sek.
Parent - - By Max Siegfried Date 2023-09-02 09:13
Den Test hätte man auch mit einer maximalen Lösungszeit von 1s durchführen können.
Parent - By Volker Göbel Date 2023-09-02 09:33 Upvotes 4
Jo, man hätte können, wenn man gewollt hätte!
Wenn man will, kann man auch einen Ziegenbock hinten herum heben.
Man muss es halt nur wollen.
Meistens hängt es nur am nötigen Willen, so wie bei Ihnen!
Sonst hätten Sie es ja jetzt gemacht, und uns hier alle informiert.
MfG
Parent - - By Torsten Cuber Date 2023-09-02 22:12 Upvotes 2
Hier ist der Original-Link zum Download von Sun 1.0:
https://solistachess.jimdosite.com/solista-news/
Ihr solltet diese Seite zum Download aufrufen, wenn möglich.
Auch aus Respekt vor E.Nemeth, der sich sehr viel Mühe gegeben hat.
Übrigens: Seine Engine "Leptir Analyzer" ist zusammen mit ShashChess GZ EXT-S absolut überragend bei der taktischen Analyse!
Liebe Grüße vom Schachfreund Torsten
Parent - - By Reinhold Stibi Date 2023-09-02 23:30
Hallo Torsten,

hast du den Direkt-Link zum Downloaden von Leptir und ShashChess GZEXT-S ?

Grüße

Reinhold
Parent - - By Torsten Cuber Date 2023-09-02 23:33 Upvotes 2
Lieber Reinhold, ich hab Leptir Analyzer auch bei Eduard Nemeths Homepage gefunden, ob er da noch zum Download steht kann ich allerdings nicht sagen.
Aber was ich sagen kann ist, daß Leptir Analyzer und ShashChess GZ die besten taktischen Engines sind, die ich bisher erlebt hab.
Ich hoffe, das hilft dir weiter.
Parent - - By Reinhold Stibi Date 2023-09-05 08:59
Lieber Torsten, leider habe ich Leptir Analyzer nicht auf Eduards Nemeths Homepage gefunden.

Hätte diese Engine gerne getestet. Weiß vielleicht Jemand wie man diese Engine bekommen kann ?
Parent - - By Reinhold Stibi Date 2023-09-05 10:05 Edited 2023-09-05 10:12
Sun 1.0 spielt mit meinem eingesetzten mittelstarken PC (7000 kN/s) prächtig
auf Schach.de. Gewann über Nacht im Autoplaymodus 2 Partien gegen einen starken
Gegner mit 3185 Elo und setzte sich damit mit 3230 Elo auf Platz 1 auf Schach.de.

Prima finde ich dass man bei Sun 1.0 Minimum Thinking Time einstellen kann.
Damit verliere ich auf Schach.de in Verbindung mit einer hohen Einstellung von
Move Overhead und Ausschaltung der TBs keine Partie mehr in extremer Zeitnot
und Partien über 100 Züge.
 
Konnte sich jetzt gerade auf Schach.de gegen einen Gegner mit einer
10x schnelleren Hardware Ryzen 3990X mit 128 Threads in 3 Spielen
behaupten.
Parent - - By Tommy Tulpe Date 2023-09-05 13:37
Verstehe ich dich richtig, Reinhold, dass Sun 1.0 für Onlinewettkämpfe einige Vorteile gegnüber Stockfish 16 bietet, für lange Fernschachanalysen aber nicht?
Parent - - By Reinhold Stibi Date 2023-09-05 13:55
Sun 1.0 ist taktisch etwas stärker als Stockfish und spielt ein sehr aktives Schach deshalb denke ich dass
die Engine auch für lange Fernschachanalysen geeignet ist.
Probier es aus.
Parent - By Tommy Tulpe Date 2023-09-05 17:22
Ich habe bisher keine Stellung gefunden, in der Sun 1.0 nach langer Analyse - sagen wir mindestens 60 min - einen anderen Zug spielt als Stockfish 16.

Wenn ich einige hätte, würde ich einen Versuch wagen um heraus zu inden, welche Engine die besseren Fortsetzungen vorschlägt.
Parent - - By Benno Hartwig Date 2023-09-06 07:11
Wenn das Schach von Sun einfach gefälliger ist, dann ist das sicherlich eine ganz tolle Eigenschaft.
Und es macht die Engine interessant.

Aber gibt es auch schon Einschätzungen dazu, wie die Sun-Spielstärke im Vergleich zu der von Stockfish steht? ("Wieviel hat dieses Gefällige gekostet?")
Vielleicht ermittelt durch direktes Spiel gegen Stockfish?
Oder ein Vergleich der Ergebnisse gegen ein größeres Teilnehmerfeld?
Parent - - By Lothar Jung Date 2023-09-06 08:01 Upvotes 1
Was ich an den Stockfish Clones bzw. privaten Engines aussetze:

1. Sie werden in den etablierten Ranglisten nicht geführt.

2. Sie veralten, wenn sich Stockfish durch Devs weiterentwickelt.

3. Sie nehmen nicht an TCEC/CCC-Turnieren teil.

4. Nicht alle sind unter Github veröffentlicht.

5. Private Engines sind nicht immer öffentlich verfügbar.

6. Mir ist unklar, ob die Änderungen (meistens in der Suche) immer dokumentiert werden.

Jedoch sind sie für die Analyse sehr geeignet und ein Gewinn.
Sie bieten zusätzliche Features wie bin Bücher, Suchalternativen, Spielstile etc..
Falls sie eigene Netze trainieren liegt eine substanzielle Verbesserung vor, falls sie sich realisiert.
Parent - By Reinhold Stibi Date 2023-09-06 08:35
Sun 1.0  ist wirklich prima; bin damit voll zufrieden.

Taktisch besser wie der neueste Stockfish und spielt auch im praktischen Spiel sehr sicher.

Mit Hippo100 und Pamuk1 auf Schach.de inzwischen nach den letzten je über 350 abgespeicherten
Partien keine Partie verloren und auch einige schöne Siege erzielt und das mit einer mittelstarken
Hardware (von ca. 7000 kN/S mit Stockfish aus der Grundstellung).
Konnte auch standhalten mit Gegnern von 3 bis 10-facher Leistung.

Ein Elo-Vergleich mit Stockfish ist sehr schwierig und hätte nur Sinn mit vorgegebenen Eröffnungen
wie bei TCEC. Denke, dass im praktischen Spiel da kein Unterschied wäre.

Super bei dieser Engine ist, im Gegensatz zu Stockfish, dass es eine Option gibt "Minimum Thinking Time"
damit verliert man keine Partie mehr bei extremer Zeitnot und über 100-200 Zügen.

Die Verbesserungen bei den neuesten Stockfishe sind sehr gering, vielleicht in einem Jahr 15 Elo, das
fällt kaum ins Gewicht.
Parent - - By Thomas Plaschke Date 2023-09-06 15:28 Upvotes 1
Wie's der Zufall will habe ich die Sun-Brüder letzte Nacht 1800 Partien gegen ihre Vorfahren spielen lassen, denn "... spielt ganz toll auf Schach.de." ist mir zu wenig.

Code:
Bullet (60 s + 0.6 s), Eröffnungsbibliothek von Stefan Pohl: UHO_2022_6mvs_+110_+119, 1 Thread, 512 MB Hash-Tabellen

    Program                          Elo    +   -   Games   Score   Av.Op.  Draws

  1 Stockfish-20230903             : 3010   14  14   900    51.8 %   2997   60.1 %
  2 Stockfish 16                   : 3005   14  14   900    51.0 %   2998   60.9 %
  3 Sun-1.0                        : 2993   14  14   900    48.6 %   3002   60.3 %
  4 Sun-1.0-2560                   : 2992   14  14   900    48.6 %   3003   60.2 %

So hatte ich's erwartet ... Nein, Sun-1.0-2560 hätte ich wegen des größeren Netzes und der (daraus resultierenden) geringeren Knotenleistung im Bullet für schwächer gehalten. Andererseits schneidet es im Stellungstest, den Peter Martan im März und dann nochmal im Juli 2022 vorgestellt hat, bei 15 s als bestes der 4 Programme ab (natürlich testet man nur mit 1 Thread). In dem Test ist Sugar AI Iccf vom 27.04.2023 - nach Lc0 mit den neuesten Netzen (und 2 Threads) - das stärkste Programm. Die Sun-Geschwister folgen durch wenige Punkte getrennt jeweils dahinter. Wenn ich weiß, dass Marco Zerbinati bei beiden Programmlinien seine Hände im Spiel hat, wundert mich das Ergebnis nicht.

Viele Grüße
Th. Plaschke
Parent - - By Reinhold Stibi Date 2023-09-06 16:30
Ist doch ein prima Ergebnis für Sun 1.0. Die Unterschiede der Elos schmelzen im praktischen Spiel und keine Vorgabeeröffnungen noch dahin wenn man mehrere Cores/Threads einsetzt.
Parent - - By Volker Göbel Date 2023-09-06 18:36
Reinhold Stibi schrieb:

Ist doch ein prima Ergebnis für Sun 1.0. Die Unterschiede der Elos schmelzen im praktischen Spiel und keine Vorgabeeröffnungen noch dahin wenn man mehrere Cores/Threads einsetzt.


Falls es noch nicht bemerkt wurde, mittlerweile gibt es Sun 1.1 zum download.
MfG
Parent - By Reinhold Stibi Date 2023-09-06 18:52
Habe ich schon bemerkt, aber da dürfte kein wesentlicher Unterschied zu Sun 1.0 sein.
Parent - - By Kurt Utzinger Date 2023-09-06 22:17 Edited 2023-09-06 22:54 Upvotes 1
Thomas Plaschke schrieb:

Wie's der Zufall will habe ich die Sun-Brüder letzte Nacht 1800 Partien gegen ihre Vorfahren spielen lassen, denn "... spielt ganz toll auf Schach.de." ist mir zu wenig.

Code:
Bullet (60 s + 0.6 s), Eröffnungsbibliothek von Stefan Pohl: UHO_2022_6mvs_+110_+119, 1 Thread, 512 MB Hash-Tabellen

    Program                          Elo    +   -   Games   Score   Av.Op.  Draws

  1 Stockfish-20230903             : 3010   14  14   900    51.8 %   2997   60.1 %
  2 Stockfish 16                   : 3005   14  14   900    51.0 %   2998   60.9 %
  3 Sun-1.0                        : 2993   14  14   900    48.6 %   3002   60.3 %
  4 Sun-1.0-2560                   : 2992   14  14   900    48.6 %   3003   60.2 %

So hatte ich's erwartet ... Nein, Sun-1.0-2560 hätte ich wegen des größeren Netzes und der (daraus resultierenden) geringeren Knotenleistung im Bullet für schwächer gehalten. Andererseits schneidet es im Stellungstest, den Peter Martan im März und dann nochmal im Juli 2022 vorgestellt hat, bei 15 s als bestes der 4 Programme ab (natürlich testet man nur mit 1 Thread). In dem Test ist Sugar AI Iccf vom 27.04.2023 - nach Lc0 mit den neuesten Netzen (und 2 Threads) - das stärkste Programm. Die Sun-Geschwister folgen durch wenige Punkte getrennt jeweils dahinter. Wenn ich weiß, dass Marco Zerbinati bei beiden Programmlinien seine Hände im Spiel hat, wundert mich das Ergebnis nicht.

Viele Grüße
Th. Plaschke


Hallo Thomas

Den Sinn dieses (deines Bullet-)Testes verstehe ich nicht ganz. So sind Sun 1.0 und 1.1 vom Suchcode doch komplett indentisch mit Stockfish-Corchess. So steht es auf der Homepage von Eduard. Infos zu CorChess gibt es hier

http://www.chess.ultimaiq.net/corchess.html
CorChess = Engine für correspondence chess.

Daraus geht hervor, dass CorChess nicht für Bullet entwickelt wurde. Ein Bullet Test macht auch deshalb wenig Sinn.

Gruss
Kurt
Parent - By Reinhold Stibi Date 2023-09-07 04:33
Der Bullet-Test gibt nur ein groben Überblick.

Je länger die Bedenkzeit desto mehr nähern sich die Engines in der Spielstärke an

Der 17 Elo-Vorsprung von Stockfish schmilzt dahin; sie sind letztlich gleich stark.

Die taktische Überlegenheit von Sun aber bleibt.

Auf Schach.de spielt Sun 1.0 mindestens gleich stark wie Stockfish; das konnte ich jetzt
mit ca. 800 Partien dort feststellen - Blitz 5 Min. Keine Partie verloren und zwischendurch
doch ein paar Partien gewonnen.
 
Parent - - By Thomas Plaschke Date 2023-09-07 08:56
Ein Einschätzung der Spielstärke der beiden Sun-Versionen war der Sinn des Tests. Ich überprüfe gerne die Behauptungen, dass clone x oder der neue Überflieger y Stockfish deutlich oder wenigstens merklich übertreffen. Dazu gehören auch praktische Tests. Ich war anfangs auch skeptisch, ob sich die Ergebnisse kurzer Bedenkzeiten Tests mit anderen Bedenkzeiten überflüssig machen. Überflüssig sind andere Tests nicht, aber interessant werden sie erst, wenn sie praktisch relevante Unterschiede zu den sehr kurzen Bedenkzeiten zeigen. - Und das kommt eher selten vor.

Nun zu Sun und Corchess. "Komplett identisch", wie Du schreibst werden sie nicht sein. Oder hat man nur den Namen getauscht und die Lernfunktion hinzugefügt, die ich für Tests immer abschalte? Ich weiß es nicht. Ich habe die Codes nicht verglichen. In den Stellungstests spielten sie nicht identisch, meine ich mich zu erinnern.
Das Corchess als eher für lange Bedenkzeiten geeignete Engine gilt, liegt wohl an der Absicht des Autors, eine Engine für Analysen haben zu wollen. Er selbst schreibt dazu no strict proof, but there is a hope. Er bezieht das auf die Grafik der von Dir verlinkten Website. Denn die Unterschiede der Graphen von Corchess und Stockfish sind nicht groß. Dabei gilt zu bedenken, dass Corchess 2 vom August 2022 verglichen wurde. Um zu sehen, ob Corchess bei Bullet-Bedenkzeiten schlecht spielt, habe ich die Version vom 25.08.2023 in den Test aufgenommen.

Code:
   Program                          Elo    +   -   Games   Score   Av.Op.  Draws

  1 Stockfish-20230903             : 3011   12  12  1200    51.9 %   2997   60.0 %
  2 Stockfish 16                   : 3006   12  12  1200    51.2 %   2998   62.2 %
  3 CorChess-20230825              : 2995   12  12  1200    49.1 %   3001   61.8 %
  4 Sun-1.0                        : 2994   12  12  1200    49.0 %   3001   60.3 %
  5 Sun-1.0-2560                   : 2994   12  12  1200    48.8 %   3002   60.5 %

Wie man sieht reiht es sich genau da ein, wo man es erwarten sollte. Resümee: Corchess und Sun erreichen Stockfish im praktischen Spiel nicht, sondern haben ihre Stärken in der (taktischen) Analyse.

Viele Grüße
Th. Plaschke
Parent - By Peter Martan Date 2023-09-07 09:27 Edited 2023-09-07 09:37
Thomas Plaschke schrieb:

Andererseits schneidet es im Stellungstest, den Peter Martan im März und dann nochmal im Juli 2022 vorgestellt hat, bei 15 s als bestes der 4 Programme ab (natürlich testet man nur mit 1 Thread). In dem Test ist Sugar AI Iccf vom 27.04.2023 - nach Lc0 mit den neuesten Netzen (und 2 Threads) - das stärkste Programm.

Danke für die Tests, Thomas. Zu der Suite, die du vermutlich meinst (im Juli des Vorjahres begann ich mir scheint sowohl die damals aktuelle Version der 128 als auch die der 256 zu posten) 15" single thread ist ok für die stärksten Engines, was die schwereren 128 angeht, damit hat man dann aber halt, wenn man nur die gelösten Stellungen zählt, zu wenig Sensitivität (Lösungen) für die schwächeren. EloStatTS gleicht da viel aus, aber natürlich nur im Rahmen der zur Verfügung gestellten Daten (Zahl und Stärke der Engines, Runs und gemeinsam von mehreren Engines gelösten Stellungen, was von allen bzw. jeweils einem Enginepaar, das in sich verglichen wird, nicht gelöst wird, bleibt im Remis- Dunkel und steigert damit die error bar des einzelnen Tests.

Hab mir mal das jüngste Kind von Eduard gezogen und Sun SE über die 256 mit 30 Threads im MultiPV=4 laufen lassen (in der Liste sind mittlerweile von den Starken wieder mehr so drin, heißen dann -MV4, die Engines mit Set- Bezeichnung laufen alle mit einem internen MultiPV- Modus, der in den Settings, die gelistet sind, meistens auch 4 Varianten zu Primaries erhebt) das schaut im interessanten oberen Abschnitt so aus:

    Program                                    Elo   +/-  Matches  Score   Av.Op.   S.Pos.   MST1    MST2   RIndex

  1 HypnoSIccf-NN240623-Set1                 : 3562    2   9637    59.6 %   3495   206/256    1.6s    2.2s   0.85
  2 SugaRXPrOIccf240623-Set1                 : 3561    2   9667    59.4 %   3495   200/256    1.4s    2.2s   0.84
  3 CrystalMZ040823-Set1                     : 3559    2   9623    59.0 %   3495   203/256    1.6s    2.3s   0.83
  4 HypnoSIccf-NN240623-Set0                 : 3558    2   9550    58.9 %   3495   199/256    1.5s    2.3s   0.84
  5 Crystal6PMT-MV4                          : 3549    3   9283    57.5 %   3496   186/256    1.4s    2.4s   0.81
  6 SugaRXPrOIccf150723-Set2                 : 3545    3   9150    57.0 %   3496   188/256    1.6s    2.5s   0.79
  7 ShashChessGZ-Tal+Capa                    : 3544    3   9222    56.8 %   3496   184/256    1.6s    2.5s   0.80
  8 SunSE-MV4                                : 3541    3   9055    56.5 %   3496   183/256    1.6s    2.6s   0.81
  9 StockfishMZ040823-MV4                    : 3541    3   8909    56.4 %   3496   180/256    1.5s    2.5s   0.82
10  CoolIris10.60-MV4                        : 3540    3   8805    56.2 %   3497   184/256    1.7s    2.6s   0.81
11  CorChess4dev-20230906-MV4                : 3540    3   8886    56.2 %   3496   179/256    1.5s    2.6s   0.80
...
15  Stockfishdev-20230903-MV4                : 3534    3   8698    55.4 %   3497   174/256    1.6s    2.7s   0.79
16  Stockfishdev-20230807-MV4                : 3532    3   8607    55.0 %   3497   167/256    1.4s    2.6s   0.80
...

MST1  : Mean solution time (solved positions only)
MST2  : Mean solution time (solved and unsolved positions)
RIndex: Score according to solution time ranking for each position


Um nicht immer nur die vermutlich eh schon bekannten Stellungen allein als .epd zu veröffentlichen, hab' ich hier mal die aktuelle Version der .cbh- Datenbank mit den jüngsten Einträgen der Engines hochgeladen, sagt denen, die sich näher damit befassen wollen, ja schon mehr, wenn man von jeder Engine, die gespeichert ist, Stellung für Stellung nachschauen kann, welche Engine welche Zeiten hat. Und die Fritz- User, die Stellungstests damit machen, wissen ja wohl auch, wie sie einzelne oder alle Einträge der Engines wieder aus der Datenbank raus bekommen, um wieder eine neue leere zu haben. Ich lösche immer regelmäßig aus der aktuellen Liste diejenigen raus, die mich nicht mehr so interessieren, lasse aber auch deshalb immer so um die 50 drin, weil das die error bar jeder einzelnen senkt. Das ist auch so ein großer Pluspunkt von EloStatTS. Von den Settings und Versionen behalte ich länger als zum direkten Versionsvergleich die mit der besten Performance. Single Thread könnte man ebenso wie Single Primary in derselben Liste führen, auch mit längeren TCs gemischt mit den kürzeren, da leg' ich aber lieber neue Einzel- Listen an, weil's sonst unübersichtlich wird, das längere TCs auch mit mehr Lösungen wegen der schlechteren Lösungszeiten schlechter gereiht werden, sieht man aber in gemischten Listen immer wieder, bei allen SF- Branches gilt bei diesen 256 und dieser Hardware- TC (30 Threads der 16x3.5GHz CPU, für LC0 3070ti GPU, 5"/Stellung), dass MultiPV=4 in aller Regel signifikant besser punktet als Single Primary.

2562.cbv:

https://www.dropbox.com/scl/fi/zp23hh7uae5ys9es4gl24/2562.cbv?rlkey=bqspz4h0xgqyxw6n95djr0w0i&dl=0
Parent - - By Reinhold Stibi Date 2023-09-07 10:28 Edited 2023-09-07 11:03
Zu Thomas Plaschke:

Das stimmt doch überhaupt nicht.

Klar, erreicht Sun die Spielstärke von Stockfish im praktischen Spiel.
Das habe ich doch bewiesen.

Der ganz geringe Vorsprung von Bullet-Partien von 17 Elo hat doch überhaupt
nichts zu sagen.
Im praktischen Spiel wird nicht nur mit 1 Core gespielt, wie bei deinem Test.
sondern mit 8 Cores oder darüber, das sind dann 16 Threads und mehr.
Außerdem nähert sich die Spielstärke bei längerer Bedenkzeit der Engines immer
mehr an; da bleibt dann von den 17 Elo-Punkten Vorsprung von Stockfish nichts
mehr übrig.

Meine über 800 Partien auf Schach.de Blitz mit Mehrkernprozessor und Sun 1.0
sind bestimmt viel aussagekräftiger als deine Bullet-Partien mit nur 1 Kern, weil
viel praxisgerechter.
Parent - - By Lothar Jung Date 2023-09-07 11:15
Der 1 Core Test von Thomas ist viel aussagekräftiger, da dort für alle Engines die Bedingungen gleich sind.
Das ist im Maschinenraum bei Schach.de überhaupt nicht der Fall. Die Gegner haben alle unterschiedliche Hardware, Threads, Einstellungen und Eröffnungsbücher.
Ein Test oder Spielergebnisse unter solch ungleichen Bedingungen ist/sind statistisch und empirisch wertlos.
Parent - By Reinhold Stibi Date 2023-09-07 11:41 Edited 2023-09-07 11:49
Da liegst du wieder, wie so oft,  falsch.
Argumente zählen bei dir nicht, oder kommen nicht an.
In der Praxis spielt niemand nur mit einem Core-Prozessor und Bullet Partien
sind grundsätzlich nicht aussagekräftig, sie geben nur einen oberflächlichen Überblick. 
Das ist ja gerade das interessante dass bei Schach.de das dort verschiedene Engines,
mit verschiedener Hardware und Eröffnungsbücher gegeneinander spielen. Gleichförmigkeit
ist langweilig.
Dass bei dir der Frust mit Lc0 bei Schach.de aufkommt; bei solchen, wenn man großzügig ist,
nur durchschnittlichen Ergebnissen, ist verständlich.
Wenn meine Engine  z.B. mit Sun gegen einen sehr starken Gegner wie Detlef Uter, Detti  30 Partien und mehr
spielt und das mit Erfolg ist das sicher viel aussagekräftiger als Bullet-Partien.
Parent - - By Thomas Plaschke Date 2023-09-07 13:42 Upvotes 4

>Das stimmt doch überhaupt nicht.


Doch.

>Das habe ich doch bewiesen.


Was hast Du wodurch bewiesen? Durch Partien auf Schach.de unter den SF-clones, die gerade der dernier-cris sind, lässt sich nur die Spielstärke einer Engine-Version mit einer konkreten Hardware und bestimmten Parametern (Threads, Hashtabellen etc.) erzielen, aber nicht beweisen. Schon gar nicht mit wechselnden Eröffnungsbibliotheken und wer-weiß-nicht-was. Wie viel Partien hast Du mit Sun gegen Sun gespielt? Kannst Du nicht wissen, weil der Enginename leicht zu ändern ist - und es sollen sich ja nicht nur Ehrenmänner im Spielbetrieb auf Schach.de aufhalten.
Du differenzierst nicht zwischen praktisch erreichbarer Spielstärke (dann Schach.de und gib' ihm Saures!) und Tests (penibel auf identische Spielbedingungen achten, am besten automatisierter Ablauf und verfälschende Einflüsse vermeidend, weil das Ergebnis sonst nichts wert oder zumindest anfechtbar ist), die statistisch möglichst präzise sein wollen. Sie müssen sogar wiederholbar sein, wenn die Nicht-Wiederholbarkeit nicht intrinsisch ist. Deswegen teste ich, wie Stefan Pohl, grundsätzlich nur mit 1 Thread.

>Der ganz geringe Vorsprung von Bullet-Partien von 17 Elo hat doch überhaupt nichts zu sagen.


Was habe ich zur Spielstärke gesagt? Bei der hohen Errorbar würde ich nur von einer Tendenz sprechen. Aber die hatte ich in der Tat erwartet. Mitnichten sind die Sun-Versionen stärker. Hat das wer behauptet?

>Meine über 800 Partien auf Schach.de Blitz mit Mehrkernprozessor und Sun 1.0 sind bestimmt viel aussagekräftiger als deine Bullet-Partien mit nur 1 Kern, weil viel praxisgerechter.


Aussagekräftiger? Tatsächlich? In welcher Hinsicht? Wie oben schon gesagt, treffen Tests wie meiner nur eine Aussage über die Spielstärke der teilnehmenden Engines untereinander (bei streng definierten Bedingungen). Dadurch lassen sich auf statistischem Weg auch valide Vergleiche mit anderen Engines ziehen. Selbstverständlich sind Tests wie diese aussagekräftiger als 800 Partien auf Schach.de, von denen Du ohne im Nachhinein nachzuzählen nicht wüsstest, gegen wie viele unterschiedliche Engines und Versionen, mit welch unterschiedlicher Hardware, mit was für Eröffnungsbibliotheken, Killervarianten, welchen Parametern, Lerndateien und Lernfunktion usw. Dieser "Test auf Schach.de" ist kein Test. Punkt. Das ist praktisches Spiel. Ein Wettbewerb, in dem sich die Bedingungen ständig ändern. Versteh mich nicht falsch: Das ist auch gut so und vordergründig der Sinn und Zweck von Schach-Engines. Vor allem dafür programmieren die Entwickler, glaube ich jedenfalls. Aber unter den Bedingungen von Schach.de ist es kein Vergleichstest. Dafür sind objektive und nachvollziehbare Ergebnisse, die unter kontrollierten Bedingungen erzielt wurden, nötig. Für Enthusiasten, die das anstreben, ist die Vergleichbarkeit und Reproduzierbarkeit der Testergebnisse bedeutender und die "Testbedingungen" von Schach.de schlicht inakzeptabel. Also warum oder in welcher Hinsicht sind Deine 800 Partien zur Spielstärke der Sun-Engines aussagekräftiger als meine 3000?

Viele Grüße
Th. Plaschke
Parent - - By Lothar Jung Date 2023-09-07 14:25
Er begreift das nicht.
Da ist Hopfen und Malz verloren.
Kann einem leid tun.
Parent - - By Tommy Tulpe Date 2023-09-07 15:27 Upvotes 1
Lothar Jung schrieb:

Er begreift das nicht.
Da ist Hopfen und Malz verloren.
Kann einem leid tun.


Lieber Schachfreund Lothar,

die Argumentation von Thomas komm mir keineswegs schwächer vor als deine, doch maße ich mir nicht an, darüber zu richten.
Von Postings, die andere runter machen und beleidigen, halte ich allerdings wenig oder besser gesagt gar nichts.

Grüße von Ulrich
Parent - - By Lothar Jung Date 2023-09-07 15:43
Lieber Schachfreund Tommy,

ich habe Thomas zugestimmt und ein „Gut“ vergeben, da er meine Argumentation gegenüber H. Stibi auch verwendet.
Die letzte Bemerkung war an H. Stibi gerichtet.
Keine Beleidigung, nur eine Feststellung.

Grüße von Lothar
Parent - - By Reinhold Stibi Date 2023-09-07 16:01
Der H. Jung verdreht doch dauernd nur Tatsachen; das ist doch
allgemein bekannt.
Sonst kann man doch nichts von ihm erwarten.
Parent - - By Tommy Tulpe Date 2023-09-07 16:55
Reinhold Stibi schrieb:

Der H. Jung verdreht doch dauernd nur Tatsachen; das ist doch
allgemein bekannt.
Sonst kann man doch nichts von ihm erwarten.


Vielleicht schaffst du es, dich in puncto Diskussionskultur NICHT anzupassen. Würde sehr für dich sprechen.
Parent - By Lothar Jung Date 2023-09-07 18:34
Ich habe eine objektive Discussionskultur.
Du liegst falsch.
Der Adressat war H. Stibi.
Wenn sich H. Stibi anpassen soll, also an mich, wäre alles ok.
Parent - - By Thomas Plaschke Date 2023-09-07 17:57
Ich habe mich nicht als Adressat von Lothars Kritik gesehen.

Viele Grüße
Th. Plaschke
Parent - By Reinhold Stibi Date 2023-09-10 01:16
Möchte mich an dieser Stelle noch ganz herzlich bei Eduard Nemeth bedanken
für die Mitwirkung und Bereitstellung der sehr interessanten Engines Sun,
Leptir u.a.
Mit  seiner Homepage steht er dem Computerschachfreund sehr hilfreich zur Seite, wie Engines,
Eröffnungen u.a.
Up Topic Hauptforen / CSS-Forum / Was gibt es Neues auf Schach.de

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill