Reinhold Stibi schrieb:
Entschuldigung, habe mich verschrieben muss natürlich Net 42668 heißen !
Kann passieren.
Nichtdestotrotz lief der Testrun von 42668 bei mir ja nicht so berauschend und Netz 42595 war deutlich besser.
Instruktiv war aber die Tatsache, daß bis zu Partie 190-200 (von 700) das Net 42668 sogar ca. +7 Elo vor 42595 lag. Ich hatte den Zwischenstand auch an die CEGT weitergegeben, weswegen diese ja auch dann dieses Net für ihren Testrun benutzt haben. Und danach wurde es suksessive immer schlechter und kam dann nach über 700 Partien bei -20 Elo zu Net 42595 raus... Also -27 Elo von Partie 200 bis Partie 784. Ein schönes Beispiel dafür, daß eben bei nur 200 Partien das Ergebnis noch sehr unsicher ist. Leider.
Deswegen stelle ich meine Testruns von lc0 jetzt ja auch auf 3000 Partien pro Testrun um. Wenn man alle 6-7 Tage ein neues Net testet, sind (ähnlich wie bei meinen vielen Stockfish-Testruns) die Unterschiede zwischen den Nets so geringfügig, daß man mit nur 700 Partien einfach nicht sagen kann, ob ein neues Net wirklich ein Fort- oder Rückschritt ist, oder ob es schlicht Zufallsschwankungen sind.