Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / NNUE und die Spielstärke
- - By Clemens Keck Date 2020-07-26 12:14
mal ne Frage

jetzt kommen immer mehr NNUE engines raus.
Wie ist das jetzt mit der Spielstärke, wenn alle den selben NN.bin benutzen?

Reihen die sich dann auch so ein wie bei den A/B Ranglisten? Oder hat der NN.bin wesentlich mehr Einfluß, und alle spielen ähnlich?

C.K.
Parent - - By Detlef Uter Date 2020-07-26 12:36
Berechtigte Frage!

Das würde mich auch brennend interessieren.
Parent - - By Volker Göbel Date 2020-07-26 13:03
Wahrscheinlich wird es nur noch Remispartien hageln ohne Ende.        
Parent - By Benno Hartwig Date 2020-07-27 13:46 Edited 2020-07-27 14:29
Warum?

Oder extremer gefragt:
Ist die Remisquote denn wirklich im Durchschnitt signifikant höher, wenn eine Engine gegen sich selbst spielt, als wenn 2 ungefähr gleichstarke Engines verschiedener Linien aufeinander stoßen ?
Ich bin davon nicht überzeugt!

Besonders viel Remis würden wir wohl sehen, wenn eine Engine sich selbst als Gegner hat, die besonders ihre eigene Sicherheit im Auge hat. Ok.
Aber andere?
Parent - By Peter Martan Date 2020-07-26 13:12
Das meiste an Tests findest du im CCC- Unterforum Tournaments and Matches und im General Topics in diesem Thread:

http://talkchess.com/forum3/viewtopic.php?f=2&t=74520&start=10

In dem geht's ab der zweiten Seite so richtig los mit den Postings von Kai Laskos und Ed Schröder zu ihren laufenden Matches.

Und natürlich auf Discord, wenn man die richtigen Kanäle findet.
Parent - By Werner Schüle Date 2020-07-27 16:34
Clemens Keck schrieb:

mal ne Frage

jetzt kommen immer mehr NNUE engines raus.
Wie ist das jetzt mit der Spielstärke, wenn alle den selben NN.bin benutzen?

Reihen die sich dann auch so ein wie bei den A/B Ranglisten? Oder hat der NN.bin wesentlich mehr Einfluß, und alle spielen ähnlich?

C.K.

Hallo Clemens, das Netzwerk ersetzt die Bewertung, nicht die Suche. Ich kenne bislang allerdings nur Stockfish Engines, die so ein Netzwerk unterstützen (oder Derivate). Mit dem gleichen Netz spielen die mehr oder weniger gleich. Ich hoffe jedoch, dass andere Engines folgen, die dann sicher auch anders spielen.
Parent - - By Thomas Plaschke Date 2020-07-28 08:22
Ich habe drei Sergio-Netze gegen den Stockfish vom 11.07. spielen lassen.
Verwendet wurden die HERT250-Eröffnungen.

Zuerst war das Netz 20200725-2051 dran (TC: 120+1.2):
Code:
    Program                          Elo    +   -   Games   Score   Av.Op.  Draws

  1 Stockfish-200711               : 3033   16  15   500    59.5 %   2967   71.8 %
  2 Stockfish-NNUE                 : 2967   15  16   500    40.5 %   3033   71.8 %


Danach wurden die Netze 20200724-2344 (das vereinzelt besonders gelobt wurde) und 20200724-0207 getestet. Die guten Ergebnisse auf dem Playchess-Server wurden im 5-Minuten-Blitz erzielt. Also gab ich etwas Zeit hinzu: TC 180+1.8.
Ergebnis:
Code:
    Program                          Elo    +   -   Games   Score   Av.Op.  Draws

  1 Stockfish-200711               : 3049   14  13   584    60.4 %   2975   73.6 %
  2 SF-NNUE-200724-2344            : 2978   13  14   584    45.2 %   3011   76.4 %
  3 SF-NNUE-200728-0207            : 2974   14  14   584    44.3 %   3013   74.3 %

Ich habe den Testlauf aber dann abgebrochen, als klar war, dass beide Netze nicht mehr zur Stockfish A/B-Engine aufschließen würden. Die Netze standen übrigens nach Gewinnpartien gegeneinander bei 34:33 zu für das Netz vom 24.

Über 60 Elo-Punkte Unterschied ist schon eine Menge Holz. Vielleicht benötigen die Netze mehr Rechenleistung. Getestet wurde mit 1 Thread pro Engine. Andererseits wird für die meisten Ratinglisten mit 1 Thread getestet. Die HERT-Eröffnungen sind sicher nicht auf die NN zugeschnitten, aber so viel Einfluss aufs Ergebnis würde ich ihnen nicht beimessen.

Verwundert die Augen reibend
Th. Plaschke
Parent - - By Martin Steinwandter Date 2020-07-28 08:50 Edited 2020-07-28 08:55 Upvotes 1
Stockfish NNUE ist für mich die beste Engine, mit der ich jemals spielen durfte! Ich tippe Mal auf ein Fehler im Testset, Konfiguration. Siehe die Ergebnisse der SPCC von Stefan Pohl oder CCRL Blitz.
Parent - - By Thomas Lagershausen Date 2020-07-28 09:14
Volle Zustimmung.

Solch ein starkes Schach hat ein Stockfish noch nie gespielt.
Parent - By Martin Steinwandter Date 2020-07-28 09:34
Und die Netze brauchen nicht Wochen oder gar Monate an Training wie das LC0 Netz damit es unmerklich besser wird. Besonders brauchen sie schon gar nicht mehrere überteuerte GPUs.
Parent - By Thomas Plaschke Date 2020-07-28 11:34
Ich überprüfe es nochmal.
Th.
Parent - By Thomas Plaschke Date 2020-07-29 22:30 Upvotes 1
Nochmal mit aktuellem Netz bei kürzerer Bedenkzeit (60+0.6) durchlaufen lassen.
Dieses Ergebnis reiht sich in die von anderen erhaltenen Ergebnisse ein:
Code:
    Program                          Elo    +   -   Games   Score   Av.Op.  Draws

  1 SF-NNUE-200728-0207            : 3029    9   8  1500    55.4 %   2991   75.8 %
  2 SF-NNUE-200725-2051            : 3021    8   8  1500    53.9 %   2993   77.5 %
  3 SF-NNUE-200724-2344            : 3008    8   8  1500    51.6 %   2997   77.4 %
  4 Stockfish-200711               : 2942   11  11  1500    39.1 %   3019   60.7 %


Viele Grüße
Th. Plaschke
Parent - By Andreas Matthies Date 2020-07-28 09:59
Welches Binary hast du benutzt? Was für einen Prozessor hat dein Rechner?
Up Topic Hauptforen / CSS-Forum / NNUE und die Spielstärke

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill