Entwicklung von Lc0 Test30 NN

By Stefan Pohl Date 2018-11-30 12:41

Naja, aber hoffen worauf? Die 30xxx Nets werden ja demnächst auch ad acta gelegt. Wenn LC0 0.20.0 kommt, wird es eine neue Netzstruktur geben und damit auch (gezwungenermaßen) mal wieder einen Lern-Neustart bei 0.
Insofern hät sich mein Interesse an den 30xxx Netzen sehr in Grenzen.

By Tom Paul Date 2018-11-30 15:29

Stefan Pohl schrieb:

Dann muss man eben auch mal die Hardwarepower zum stiften verdoppeln.
Oder einfach mal deutlich mehr Werbung für die Teilnahme zum stiften der Hardware machen.

By Peter Martan Date 2018-11-30 19:43

Tom Paul schrieb:

Oder einfach mal deutlich mehr Werbung für die Teilnahme zum stiften der Hardware machen.

Oder nicht immer gleichzeitig auch noch Werbung für die Teilnahme zum Stiften der Hardware für Stockfish machen.
STOCKFISH
GET FAST INVOLVED: CLICK MY NAME

By Heiko Krauß Date 2018-12-01 10:45

Tom Paul schrieb:

Dann muss man eben auch mal die Hardwarepower zum stiften verdoppeln.

Frag doch mal in Langley nach , die verzehnfachen die Hardwarepower

By Stefan Pohl Date 2018-11-25 12:47 Edited 2018-11-25 12:51

Thomas Plaschke schrieb:

Ergebnis für 11260 gegen 31464 nach 24 Partien 15:9 für 11260, das nach Siegen 6:0 führt. Engine bei beiden lc0 v0.19, "normale" Eröffnungsvorgabe (Nunn2), Bedenkzeit 5'/3".
Habe dann abgebrochen. Nimmt man die anderen Berichte dazu, liegt die Schlussfolgerung auf der Hand ... Aber ich hör's ja schon jetzt: falsche Hardware für die 31xxx (war 'ne 1080), zu geringe Bedenkzeit (wie viel wäre denn genehm), 31xxx ist von der Knotenleistung benachteiligt (beide in etwa gleich) oder die Wildschweine hatten was falsches gefressen (frei nach Asterix bei den Olympischen Spielen).

Viele Grüße
Th. Plaschke

Das neueste 31551 Net ist laut Elo-Graph auf der Website ja schon 950 Elo besser als 31464 (LOL)...

Ich starte auch noch mal einen Testrun, bis morgen. Mit Drawkiller, versteht sich. Denn das aktuelle Net 31551 ist ja angeblich +375 Elo besser, als Net 31515, daß ich gestern gestestet hatte. Also müßte jetzt ja (gestern waren es +330 Elo für Net 11250) das Net 31551 schon besser sein als 11250...
Na, gucken wir mal.

By Stefan Pohl Date 2018-11-25 12:56

Man möge mich nicht falsch verstehen: Ich bin ein Riesenfan von Leela. Das NeuralNetz-Konzept ist absolut bahnbrechend und die Spielweise von Leela ist fantastisch (vom Endspiel mal abgesehen). Niemand würde sich mehr als ich freuen, wenn die neuen Netze wirklich die 11xxx Netze überholen könnten!

By Thomas Plaschke Date 2018-11-25 13:51

Völlig d'accord! Es geht mir genauso. Ich habe einen Heidenrespekt vor der Expertise der Leute, die dieses Projekt aus dem Boden gestampft haben und weiter voranbringen. Und ich finde die Begeisterung toll, mit der viele Enthusiasten durch ihre Rechenzeitspenden dem Projekt helfen. Auch, wenn ich bestenfalls nur oberflächlich verstehe, wie das funktioniert. - Eigentlich überrascht mich bereits, dass lc0 funktioniert.
Zu kritisieren hätte ich allenfalls die Darstellung der Testmethodik und die Absicherung der Ergebnisse. Es muss zwangsläufig zu Missverständnissen führen, wenn man die Selfplay-Elo für tatsächliche Spielstärkesteigerungen hält. Die muss immer im Spiel gegen andere Engines bewiesen werden.

Viele Grüße
Th. Plaschke

By Lothar Jung Date 2018-12-02 20:56

Neues Testtunier 31744 gegen 11245 ging knapp zugunsten von 11245 mit 2:1:7 aus.
Rahmenbedingungen wie sonst.

By Stefan Pohl Date 2018-11-25 09:05

Lothar Jung schrieb:

Die Performance von den aktuellen 31xxx Netzen hängen doch stark von der GPU-Hardware ab.
Die Einstellungen/Filter dieses Netzes sind aufwändiger als Netz 11xxx, sodass das Training länger dauert und eine stärkere GPU erforderlich ist, um die gleichen Rechentiefen zu erreichen.

Sorry, Lothar, aber das ist schlicht falsch. Die 30xxx Nets sind in ihrer Struktur identisch zu den 10xxx Nets. Und die Rechentiefe und die Art zu rechnen hängt nur von der lc0-Engine ab. Bei gleicher, interner Netzgröße und Struktur erreicht lc0 auf gleicher Hardware auch die gleichen Suchtiefen. Ich hab einige Partien live angesehen und die angezeigten Suchtiefen waren bei beiden Nets identisch - logischerweise, da ich beide Male lc0 0.19.0 benutzt habe.
Die 30xxx und die 20xxx und die 10xxx Nets unterscheiden sich nur durch ihre Lernwerte, also die Zahlenwerte an sich sind andere. Die interne Struktur der Nets ist absolut gleich. Und ebenso die Art, wie lc0 sie benutzt, wenn man immer dieselbe Version 0.19.0 benutzt.

By Lothar Jung Date 2018-11-27 14:55 Edited 2018-11-27 14:59

Hier sind die qualitativen Änderungen zwischen Test10, Test20 und Test30 dokumentiert:

http://blog.lczero.org/search?q=Test20

http://blog.lczero.org/search?q=Test30

Aktuelle Test30 Nets erreichen auf stärkerer Hardware und höherem TC relativ zu SF9 und Net 11250 bessere Ergebnisse.

By Stefan Pohl Date 2018-11-27 15:28

Lothar Jung schrieb:

Hier sind die qualitativen Änderungen zwischen Test10, Test20 und Test30 dokumentiert:

<a class='ura' href='http://blog.lczero.org/search?q=Test20'>http://blog.lczero.org/search?q=Test20</a>

<a class='ura' href='http://blog.lczero.org/search?q=Test30'>http://blog.lczero.org/search?q=Test30</a>

All dies beeinflußt nur die Zahlenwerte im Netz. Die Struktur, Größe und die Abarbeitung durch Leela bleibt immer gleich. Zudem basieren die Lernpartien nachwievor auf 800 Rollouts/Zug. Schon das schließt aus, daß einige Nets mit mehr Bedenkzeit plötzlich besser spielen als andere. Da ihr Lernen immer auf denselben Rechentiefe basiert.

Daß die 30er nets gegen Stockfish 9 und die 11er nets mit mehr Zeit besser scoren liegt nur an einem Effekt, den ich hier schon gefühlt 1000 mal erklärt habe:
Die Ergebnisse in einem Engine-Zweikampf rücken mit mehr Bedenkzeit und/oder besserer Hardware immer stärker Richtung 50%-Marke, weil es mehr Remisen gibt. Dadurch wird die schwächere Engine in einem Zweikampf immer scheinbar stärker und die bessere schwächer.
Kannst ja mal ein 30er Net gegen eine deutlich schwächere Engine spielen lassen, einmal mit wenig und einmal mit viel Bedenkzeit. Dann wird das 30er Net mit mehr Zeit plötzlich schlechter.

By Lothar Jung Date 2018-11-28 17:12 Edited 2018-11-28 17:16

Hier ist ein Link zu einem 2Minuten/12sec Blitz-Tunier mit Test30 NN 31630 auf einer RTX 2080ti gegen SF9 6 cores.
Ergebnis: Unentschieden.

https://groups.google.com/forum/m/#!topic/lczero/Z1V4o_o80_I

By Lothar Jung Date 2018-11-28 13:51

Hier ist ein Link zu einer Tabelle hinsichtlich von Partien von Test30 NN gegen Stockfish.
Die Tests laufen unter CCRL-40/40-Bedingungen (15 Minuten).
Das Netz 31627 ist genau auf Elo-Höhe von SF8 4 cores mit einer GTX 1070ti.
Das entspricht in etwa meinen Tests mit SF9 4 Cores mit einer 2x1080.

https://docs.google.com/spreadsheets/d/1QxAG6XVTvvTAGlZ-kpSSvv0VuMGh7RkJjgKqgT37vMU/htmlview#

By Lothar Jung Date 2018-12-01 20:29 Edited 2018-12-01 20:32

Test30 31703 mit Fortschritten, jetzt auf einer GTX 1080ti und 1min/1sec mit 3461 42 Elo unter SF8 4cores.

https://docs.google.com/spreadsheets/d/1ZAIuHR6n-5JTxKQc0XUSx1jyUrgVEcj8DNLKA7-urBw/htmlview#gid=763519729

By Tom Paul Date 2018-12-01 20:49

Lothar Jung schrieb:

Test30 31703 mit Fortschritten, jetzt auf einer GTX 1080ti und 1min/1sec mit 3461 42 Elo unter SF8 4cores.

<a class='ura' href='https://docs.google.com/spreadsheets/d/1ZAIuHR6n-5JTxKQc0XUSx1jyUrgVEcj8DNLKA7-urBw/htmlview#gid=763519729'>https://docs.google.com/spreadsheets/d/1ZAIuHR6n-5JTxKQc0XUSx1jyUrgVEcj8DNLKA7-urBw/htmlview#gid=763519729</a>

Und auf einer RTX 2080 Ti sieht die Sache schon ganz anders aus

.

Wann erscheint v0.20.0 eigentlich?
Und was hat es mit der neuen Architektur auf sich?
Oder bezieht sich das etwa auf die speziellen Verbesserungen bzgl. INT4 welche man vornehmen wollte?

By Lothar Jung Date 2018-12-06 13:14

Jetzt nur noch 35 Elo, siehe Link:

https://groups.google.com/forum/m/#!topic/lczero/JUEPl1fY0UU

By Reinhold Stibi Date 2018-12-06 14:45

Schön wäre es, wenn es so wäre !

Mit dem noch neueren Netzwerk 31830 bekam Lc0 auf meiner GTX 960

fürchterliche Prügel gegen Stockfish 10 mit 1 CPU, über 300 Elo im minus.

Auch wenn Lc0 noch aufgeholt hätte, wäre das Ergebnis gegen Stockfish 10
sehr schlecht ausgefallen. Habe deshalb den Test abgebrochen.

By Stefan Pohl Date 2018-12-06 16:29 Edited 2018-12-06 16:39

https://www.twitch.tv/potato_chess

Es geht hier auch langsam aufwärts. Mittlerweile "nur" noch ca. -80 Elo für die 30xxx Nets verglichen mit dem Bestwert von Net 11250. Bei dem Tempo wird (bzw. würde) das aber noch etliche Wochen dauern, bis Net 11250 erreicht würde. Falls die 30xxx bis dahin nicht schon gestoppt wurden. Sie werden ja auf jeden Fall nicht unbegrenzt weiter lernen. Sobald LC0 v0.20.0 kommt, geht es ja sowieso wieder bei Null los.

Das Net 11250 ist aber auch sehr stark. Ich habe ja mein long thinking-time Turnier wieder gestartet, mit meinem Drawkiller Tournament Buch. LC0 mit Net 11250 kommt mit diesen Eröffnungsvorgaben super zurecht (obwohl sie ja etwas komisch aussehen, aber sie sind eben auch sehr "unentwickelt", was Leela ja entgegenkommt) und liegt hier auf Augenhöhe mit Komodo 12.2.2 und Houdini 6. Das ist ja aller Ehren wert. Stockfish 181120 (also fast Stockfish 10) spielt allerdings mit Drawkiller Eröffnungen in einer eigenen Liga und spielt die Konkurrenz in Grund und Boden. Fire 7.1, der mit Drawkiller Eröffnungen sein langweiliges Remis-Schach nicht aufziehen kann, geht dafür mal so richtig unter.

Alle Infos plus Tabelle plus Partiendownload (PGN mit allen Bedenkzeiten, Suchtiefen und Bewertungen) hier:
https://www.sp-cc.de/long-thinkingtime.htm

By Tom Paul Date 2018-12-06 17:05

Reinhold Stibi schrieb:

Du hast ja auch 1. keine RTX 2080 Ti, sondern eine GTX 960

und 2. ein anderes Testverfahren.

By Stefan Pohl Date 2018-12-06 16:43 Edited 2018-12-06 17:11

Lothar Jung schrieb:

Jetzt nur noch 35 Elo, siehe Link:

<a class='ura' href='https://groups.google.com/forum/m/#!topic/lczero/JUEPl1fY0UU'>https://groups.google.com/forum/m/#!topic/lczero/JUEPl1fY0UU</a>

Und warum wohl? Superschnelle Hardware (RTX 2080Ti = 32000 rollouts/s für Leela) und daraus folgend exorbitant hohe Remisqoute (82% !). Das drückt zwangsläufig alle Ergebnisse nah an 50%. Was die schwächere Engine stärker wirken läßt. Wie oft muß ich das eigentlich hier noch erklären?!?? Man muß sich doch nur mal klarmachen, was 82 Remisen aus 100 Partien heißt: nur 18 Partien drücken das Ergebnis von der 50%-Marke (also 0 Elo Spielstärkeunterschied) weg, aber 82 Partien drücken das Ergebnis eben hin zu 50%-Marke. So KANN kein Ergebnis mit nennenswerten Eloabständen entstehen.
Sag dem Veranstalter dieses Tests mal, er soll das Ganze mal mit Drawkiller Eröffnungen wiederholen. Dann könnt ihr euch eure -35 Elo aber sowas von abschminken...

By Martin Steinwandter Date 2018-12-06 16:54

Wer ihr?
Ich sage lange schon das Team um LC0 macht keine aussagekräftige Tests. Trotzdem ist LC0 unter den Besten vier zu finden. Ist schon stark!

By Stefan Pohl Date 2018-12-06 17:08 Edited 2018-12-06 17:11

Die Testruns auf twitch (potatochess) sind m.E. die aussagekräftigsten Testruns von LC0, die man z.Zt. finden kann. Die sind ganz ordentlich. Jeder Run immerhin mit 200 Partien gegen 10 AB-Engines. Und dank der kurzen Bedenkzeit und nicht so schnellen Hardware ist auch die Remisqoute in einem statistisch noch vertretbaren Bereich.

By Stefan Pohl Date 2018-12-07 17:45

https://www.twitch.tv/edosani

Gerade startet dort ein Head-to-Head von LC0 v0.19.1-rc1 Net 31864 gegen Houdini 6 auf echter Monsterhardware (für beide Engines, sodaß eine Leela-Ratio von 0.65 rauskommt, was ziemlich "fair" ist (sofern man solche Vergleiche von CPU und GPU überhaupt machen kann). Zeit ist wohl 5'+1''. Irgendeine Standard Buch-Vorgabe, relativ kurzzügig.

Die extrem starke Hardware gepaart mit den klassischen Eröffnungsvorgaben läßt mich allerdings eine Remis-Orgie befürchten, die eine seriöse Ergebnisauswertung wahrscheinlich fast unmöglich macht. Die ersten 4 Partien sind schon mal Remis...

By Tom Paul Date 2018-12-07 17:58

Stefan Pohl schrieb:

<a class='ura' href='https://www.twitch.tv/edosani'>https://www.twitch.tv/edosani</a>

Gerade startet dort ein Head-to-Head von LC0 v0.19.1-rc1 Net 31864 gegen Houdini 6 auf echter Monsterhardware (für beide Engines, sodaß eine Leela-Ratio von 0.65 rauskommt, was ziemlich "fair" ist (sofern man solche Vergleiche von CPU und GPU überhaupt machen kann). Zeit ist wohl 5'+1''. Irgendeine Standard Buch-Vorgabe, relativ kurzzügig.

Die extrem starke Hardware gepaart mit den klassischen Eröffnungsvorgaben läßt mich allerdings eine Remis-Orgie befürchten, die eine seriöse Ergebnisauswertung wahrscheinlich fast unmöglich macht. Die ersten 4 Partien sind schon mal Remis...

Was für eine Hardware ist das?
LC0 hatte jetzt mehrere mal in der Anfangsstellung ~22k, somit sollte das eine RTX 2080 sein oder?

By Stefan Pohl Date 2018-12-12 08:57 Edited 2018-12-12 09:06

Der aktuelle Stand auf potatochess der 30XXX Nets ist wie folgt:

Net 31959 ist gerade durchgelaufen und erreichte 112.5 aus 200 = 56.3% (neuer Bestwert der 30XXX Nets)
Net 11250 hält nach wie vor den absoluten Bestwert mit 129.5 aus 200 = 64.8%

Laut Elotabelle ist also Net 31959 -62 Elo schwächer als 11250. Das klingt viel, allerdings ist in den Testruns der 30XXX Nets auf potatochess ein eindeutiger Aufwärtstrend erkennbar. Und wegen der kurzen Bedenkzeit und den nicht so hohen Suchtiefen (Leela kommt so auf ca. 2000 rollouts/s und die Gegnerengines laufen singlecore, SF9 mit ca. 1200 knps) ist das Ergebnis auch nicht durch eine exorbitant hohe Remisqoute "zerdrückt". Insofern ist der Rückstand auf Net 11250 mittlerweile recht überschaubar. Dennoch ist 11250 definitiv immer noch stärker. Leela-Ratio ist übrigens 1.5 bei Potatochess, also ein doch recht hoher Wert, der Leela zumindest etwas bevorteilt.

https://www.twitch.tv/potato_chess

PS: Da die Selfplay-Elo auf der LC0-Networkseite extrem inflatorisch sind, ist es schwer, hier wirklich seriös zu schätzen. Aber ich probiere es mal und wage die Prognose, daß die 30XXX Nets dort ca. 9500 "Leela-Selfplay-Elo" erreichen müßten, um Net 11250 zu überholen. Aber das ist eine "Pi mal Daumen" - Schätzung mit Ratefaktor... Stand jetzt ist so ca. 9140. Sollte die Kurve auf der LC0-Networkseite weiter in etwa gleichbeibendem Tempo ansteigen, könnten ca. 5 Millionen weitere Lernpartien dafür ausreichen. Also circa. 7-10 Tage, je nachdem, wieviele Partien pro Tag gespielt werden. Das ist aber ein optimistisches Szenario. Ich weiß zudem nicht, wann der nächste LR-drop kommen wird. Wie es dann nach diesem weitergeht mit den Selfplay-Elo, kann man sowieso nur schwer vorhersagen.

By Lothar Jung Date 2018-12-12 10:49

In diesem Tunier (100 Partien, 2min, 2080ti) wurde 11248 von einem aktuellen Test30 net 31954 um 10 Elo übertroffen:

https://groups.google.com/forum/m/#!topic/lczero/P4PfT-hrqhM

By Stefan Pohl Date 2018-12-12 11:43 Upvotes 1

Und? Nur 30 Vorgabestellungen für 100 Partien... Und 93% Remisqoute (also nur 7 nicht-Remisen)
Das ist kein “Turnier“, sondern ein schlechter Witz.
Wer sowas ernst nimmt, ist selbst schuld. Ich tue das jedenfalls bestimmt nicht.

By Horst Sikorsky Date 2018-11-25 17:27

1.e4 e6 2.d4 d5 3.Sd2 Le7 4.c3 c5 5.dxc5 Lxc5 6.Ld3 Sf6 7.e5 Sfd7 8.Sgf3 Dc7 9.Sb3 Sc6 10.Lf4 Le7 11.De2 b6 12.h4 Sc5
1.e4 e5 2.Sf3 Sc6 3.Lb5 f5 4.Sc3 Lc5
1.d4 Sf6 2.c4 g6 3.Sc3 Lg7 4.e4 d6 5.Sf3 0–0 6.Le2 e5 7.0–0 Sc6 8.d5 Se7 9.Se1
1.e4 c6 2.d4 d5 3.e5 Lf5 4.Sf3 e6
1.d4 f5 2.Lg5 h6 3.Lh4 g5 4.e3 Lg7
1.e4 e6 2.d4 d5 3.e5 c5 4.c3 Sc6 5.Sf3 Db6 6.a3
1.d4 d5 2.c4 c6 3.Sf3 Sf6 4.Sc3 e6 5.Lg5 h6 6.Lh4 dxc4 7.e4 g5 8.Lg3 b5
1.e4 e5 2.Sf3 Sc6 3.Lc4 Sf6 4.Sg5 Lc5
das waren die Vorgaben
PS Ryzen7x1800 CorChess 2cpu 3,6 GHz - LcO 1070 GTX

By Reinhold Stibi Date 2018-11-30 12:40

Irrtümlicherweise rutschte mein heutiger Beitrag nach weiter oben,
sollte aber unten landen, da neu.

By Horst Sikorsky Date 2018-12-06 21:24

Reinhold Stibi schrieb:

Horst, lasse doch mal Deine schnelle GTX Karte mit Lc0 und neuestem besten 3er Netzwerk

gegen Stockfish 10 mit 8 Threads spielen.

Das wäre doch der augenblickliche Stand um Platz 1 im Computerschach.

Schätze dass Lc0 mit 100 bis 160 Elo zurückliegt.

ich kann sogar meine Wahnsinnig schnelle GTX 1080

gegen Stockfish 10 mit 2CPU 3.6 MHz testen.
an die Experten ... ist da nicht LcO im Hartware- Vorteil?
Lauft leider schon ... ELO interessieren mich nicht, es reicht mir, was ich sehe

PS---- Net 31842

By Horst Sikorsky Date 2018-12-07 19:20

Horst Sikorsky schrieb:

Reinhold Stibi schrieb:

ich kann sogar meine Wahnsinnig schnelle GTX 1080

gegen Stockfish 10 mit 2CPU 3.6 MHz testen.
an die Experten ... ist da nicht LcO im Hartware- Vorteil?
Lauft leider schon ... ELO interessieren mich nicht, es reicht mir, was ich sehe

PS---- Net 31842

habe nach 22.Partien abgebrochen +8 =14. 15:7. 68,18% für Stockfish.
dies könnte das Kräfteverhältnis gegen das (die) schwache(n) Netz(e) einigermaßen entsprechen.

By Tom Paul Date 2018-12-07 19:26

Horst Sikorsky schrieb:

Reinhold Stibi schrieb:

ich kann sogar meine Wahnsinnig schnelle GTX 1080

gegen Stockfish 10 mit 2CPU 3.6 MHz testen.
an die Experten ... ist da nicht LcO im Hartware- Vorteil?
Lauft leider schon ... ELO interessieren mich nicht, es reicht mir, was ich sehe

PS---- Net 31842

Wahnsinnig schnelle GTX 1080

By Horst Sikorsky Date 2018-12-07 22:51 Upvotes 4

Tom Paul merkt nichts

By Ernest Bonnem Date 2018-12-08 02:06 Upvotes 1

+1 ...eine Tragödie !!!

By Guenter Stertenbrink Date 2018-12-14 15:47 Edited 2018-12-14 16:21

Willkommen im Chat!
3:45ModeratorVerifiziertNightbot: Leela vs Leela/Ender (take 2) on https://tcecbonus.club/

opening:
10/24 Depth 11/27
47 Knps Speed 51 Knps

http://www.chessdom.com/tcec-season-13-the-13th-top-chess-engine-championship/

TCEC Season 13 – the 13th Top Chess Engine Championship
Dec 14, 2018

tcec14Written by Guy Haworth and Nelson Hernandez
Reading, UK and Maryland, USA

This is the first in a new series of analytical articles on TCEC events....

-------------------------------
4:08ModeratorVerifiziertNightbot: Updates for Division 1: Laser 181205, Ginkgo 2.18, Chiron TCEC-S14
4:08ModeratorVerifiziertNightbot: Ben you are the lexcsMVP zombiMVP

-----------------------------------
:15madchuckle: Test30 was going strong it just needed two more drops, but since A0 papers came, new settings are on the table to be tried, and the drops are delayed for this
------------------------------------
4:18Twitch PrimeMacLnx: LR drop before the end of the year is what I read on Discord
---------------------------------------

By Reinhold Stibi Date 2018-12-16 17:11

Das 3er Netzwerk hat aufgeholt und liegt gegenüber 11150 nur noch ca. 40 Elo zurück.

Im Spiel gegen Stockfish 10 1 CPU   und Lc0 v0.19.1.1 mit GTX 960
Netzwerk 32044 9402 Elo   29.102 Partien vom 16.12.18

je mit 2 Min.6 Sek./

30 Partien   +2 =17 -11 = 35 % = -108

By Reinhold Stibi Date 2018-12-17 18:39

Allerdings ist das Netzwerk 32065 das noch geringfügig besser sein soll,

tatsächlich nach 22 Partien 200 Elo hinter Stockfish 10.

Also es gibt erheblich unterschiedliche 3er Netzwerke; die allgemeinen Angaben stimmen so nicht,
es muss ausgetestet werden.

By Reinhold Stibi Date 2018-12-17 19:40

Netzwerk 32065 9461 Elo 33.831 Partien vom 17.12.18 holt auf.

Nach 30 Partien gegen Stockfish 10 nur noch -120 Elo.

By Benno Hartwig Date 2018-12-17 20:42

ich finde diese Paarungen sehr interessant, Reinhold.
Auch dass du so kurze Zeiten nimmst finde ich ok, kannst du damit dann doch auch größere Partienanzahlen in erträglichen Zeiten erreichen.

Aber ich fänd gut, wenn du genau das dann auch machen würdest!
Also einfach mal wenigstens eine Hand voll Tage durchrechnen lassen und dann ein Ergebnis mit wenigstens ein paarhundert Partien erhalten.
30-Partien-Ergebnisse haben so eine grotesk hohe Streuung, dass man da raus wirklich nur sehr wenig ableiten kann.
Du brauchst dazu ja wirklich nur wenige Tage.

Benno