By Stefan Pohl
Date 2019-02-13 05:22
Edited 2019-02-13 05:30
Das verspricht interessant zu werden! Da die 50xxx Nets wieder kleiner sind (10x128) und vor allem, da die Lernpartien mit 10000 rollouts pro Zug gespielt werden - in allen bisherigen Net Lernruns waren es nur 800 (!!!). Letzteres habe ich schon immer sehr kritisch gesehen, zumal es seit Einführung der CUDA-Leela für so niedrige Werte keinen rationalen Grund mehr gab. Nichtsdestotrotz wird die Umstellung von 800 auf 10000 rollouts pro Zug die Zahl der gespielten Partien und somit die Entwicklungsgeschwindigkeit der 50xxx Nets drastisch reduzieren. Dennoch eine richtige Entscheidung, meine ich, denn so besteht die Hoffnung, das das maximal erreichbare Eloniveau dieser Nets deutlich höher sein wird, bevor die Nets übersättigt sind und zu degenerieren beginnen. Wird spannend. Zumal dies die erste bewußte und drastische Abkehr von AlphaZero ist (dort waren es auch 800 rollouts pro Zug).
Hier die genauen Parameter (rollouts pro Zug heißen hier “visits“):
2 Alternative testing ["--visits=10000", "--cpuct=2.5", "--resign-percentage=4.0", "--resign-playthrough=20", "--temperature=1.2", "--temp-endgame=0.45", "--temp-cutoff-move=16", "--temp-visit-offset=-0.25", "--fpu-strategy=absolute", "--minimum-kldgain-per-node=0.000009", "--resign-wdlstyle=true"] 50002 true
1 Main run started January 9th 2019 ["--visits=800", "--cpuct=2.5", "--resign-percentage=4.0", "--resign-playthrough=20", "--temperature=1.1", "--temp-endgame=0.45", "--temp-cutoff-move=16", "--temp-visit-offset=-0.25", "--fpu-strategy=absolute"] 40850 true
Net 50001 läuft nicht unter Lc0 v0.20.2 und Lc0 v0.20.1.
Woran kann das liegen ?
Ich habe ja noch immer nicht verstanden, was diese Netze unterscheidet.
Sind es "nur" solche Parametersetzungen?
Oder stecken da dann auch überarbeitete Lern-Algorithmen hinter, solche die zu prinzipiell anderen Lernergebnissen führen?
Was ist da überhaupt immer wieder mit dieser Netzgröße gemeint?
In diesem Zusammenhang:
Bedeutet "neues Netz" einfach: mal einen etwas anderen Ansatz machen?
oder eher doch: eine Weiterentwicklung, aufbauend auch auf den Erfolgen früherer Netze?
Benno
Ah, Danke!
Das ziehe ich mir mal rein...
Benno
Das kleine Netz dient nur dazu um schnell verschiedene Dinge zu testen.
Es wird niemals stärker als 30, 40.
Danach kommt Netzwerk 60 und das soll viel größer werden.