Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Was tut sich bei Lc0 ? - schaut nicht schlecht aus !
- - By Reinhold Stibi Date 2021-06-08 09:17 Edited 2021-06-08 09:51
Angeregt durch Romanzev, Volker  der mit Lc0 v0.28.0-dev +git7b0a396
bei Schach.de z.Zt. mit 2735 Elo mit an der Spitze steht, unterziehe ich

Lc0 v0.27.0  69284 vom 04.06.21 einen theoretischen und praktischen Test
mit meinen zwei RTX 2070.

Mit den üblichen Grundeinstellungen, kein Tuning, schafft da Lc0 in der Grund-
stellung ganz ordentliche 30.000 kN/s das sind ca. 10 % mehr als mit den
alten Netzen.

Volker, könntest du uns verraten wie man deine Version von Lc0 einschließlich
Netz downloaden kann; das wäre sehr nett.

Reinhold
Parent - - By Tobias Lagemann Date 2021-06-08 09:48
Wo es Lc0 v0.28.0-dev +git7b0a396 gibt, stand schon vor knapp zwei Wochen hier im Forum ...
Parent - - By Lothar Jung Date 2021-06-08 11:00 Edited 2021-06-08 11:05
Hier Lc0 0.28 dev:

Lc0 0.28 liegt als Testversion vor (Verbesserungen: u.a. schnellere Speicherverwaltung, Smooth Timemanagement ).
https://ci.appveyor.com/api/buildjobs/6hebwks5sr8h7hem/artifacts/lc0-test-windows-gpu-nvidia-cuda-nodll.zip
https://github.com/borg323/lc0/commit/f7568a025db6b5c2cf8add342a10ca3c422729ad

Die endgültige Version soll wohl bald erscheinen; mit weiteren Verbesserungen.

Alle Netze hier zum runterladen:

https://training.lczero.org/networks/?show_all=0

Lothar
Parent - By Reinhold Stibi Date 2021-06-08 12:07
Danke Lothar,

da ich mich mit Eduard ungewollt verkracht habe, muss ich mich
jetzt mit Dir, als Lc0 Experten, wieder besser stellen.

 

Reinhold
Parent - - By Robert Bauer Date 2021-06-08 10:16
Die Knotenleistung aus der Grundstellung ist m.E. nicht besonders aussagekräftig.

Ist irgendwo auch ein Vergleich zu finden, was dies praktisch an ELO bringt über eine gewisse Zahl von Partien?
Parent - By Peter Martan Date 2021-06-08 12:25 Edited 2021-06-08 12:33
Die verschiedenen Listen wirst du wohl selbst kennen, in diesem Thread, von dem ich willkürlich das letzte Posting nehme, und in dem's auch viel um Ratings geht, wird auch wieder einmal festgestellt, wie sehr das mittlerweile von dem Engine- Pool abhängt, in dem getestet wird und natürlich auch von den Eröffnungen.

http://talkchess.com/forum3/viewtopic.php?p=895467#p895467

regards
Parent - - By Volker Göbel Date 2021-06-08 11:23
Hallo Reinhold,

Lothar hat ja schon alles gepostet, was anderes habe ich auch nicht.
Ich spiele Lc0 mit einer RTX 2080Ti, in etwa so schnell wie deine beiden RTX 2070 zusammen.

MfG
Parent - - By Lothar Jung Date 2021-06-08 12:12 Edited 2021-06-08 12:30
Das ist noch aktuell zu berichten.

Tuning von MovesLeftSlope für 69217:

**Tune of MovesLeftSlope**
**LC0 version:** v0.28.0-dev
**LC0 options:** Network: 69217, Threads=1, MinibatchSize=64, Backend=cuda-fp16, MoveOverheadMs=0
**Tuning ranges:** MovesLeftSlope: [0.0001,0.004]
**Tuning configuration:** acq function: mes, 400 iterations/2000 rounds/4000 games
**Hardware:** Ryzen 9 3950X (3.5GHz) + RTX 3080
**Book:** balanced 3-move book
**Tablebases:** 6-man
**Adjudication:** 6-man TBs + -resign movecount=3 score=500, -draw movenumber=20 movecount=5 score=10
**Software:** chess-tuning-tools 0.7.2
**Time control:** 1.5s/game+0.025s/move (LC0), 3.6s/game+0.06s/move (SF)
**SF options:** SF-dev, Threads=1, Hash=4, Contempt=0, "Move Overhead"=0, SyzygyProbeDepth=10
**Speed:** ≈1000 nodes/move (LC0)
**Optimum found:**
```
Current optimum:
{'MovesLeftSlope': 0.00136}
``````
Parameter       Lower bound  Upper bound
----------------------------------------
MovesLeftSlope       0.0001        0.004
```
**Time control:** 6s/game+0.1s/move (LC0), 14.4s/game+0.24s/move (SF)
**LC0 options:** Threads=2, MinibatchSize=112
**SF options:** Threads=2, Hash=8
**Speed:** ≈4500 nodes/move (LC0)
**Tuning configuration:** acq function: mes, 420 iterations/2100 rounds/4200 games
**Optimum found:**
```
INFO     Current optimum:
{'MovesLeftSlope': 0.00384}

``````
Parameter       Lower bound  Upper bound
----------------------------------------
MovesLeftSlope      0.00143        0.004```

https://cdn.discordapp.com/attachments/766262364949315614/849302481518985216/Screenshot_from_2021-06-01_17-03-59.png

Sowie aktueller Zwischenstand bei CCC-Tunier (Lc0 v0.27.0-rc2 führt weiterhin, Netz 69146):

# PLAYER : RATING POINTS PLAYED (%)
1 Lc0 : 3611.2 46.0 69 67
2 Stockfish : 3603.1 44.5 68 65
3 Dragon : 3563.3 40.5 68 60
4 Stoofvlees : 3492.1 35.5 72 49
5 Komodo : 3466.1 27.0 60 45
6 Rubi : 3458.5 30.5 70 44
7 Ethereal : 3455.5 29.5 69 43
8 Xiphos : 3350.2 19.5 70 28

Lothar
Parent - - By Reinhold Stibi Date 2021-06-08 15:34 Edited 2021-06-08 16:07
Danke,

spiele gerade auf Schach.de mit Lc0.

Leider habe ich, nicht Lc0, gleich die erste Partie vergeigt und 17 Punkte verloren,
weil ich eine falsch installierte Lc0, die gleich nach der Eröffnung nicht zog, nahm. 

Aber gleich danach, mit einer richtig installierten Lc0,  immerhin gegen einen 64 Kerner remis gespielt.

Jetzt geht es wieder aufwärts.

Wow, wer hätte das gedacht, mein Fehlgriff wurde durch einen Sieg von Lc0 wieder wettgemacht.
Parent - - By Reinhold Stibi Date 2021-06-08 16:39 Edited 2021-06-08 17:02
Lothar, Du glaubst es nicht.

Habe innerhalt kurzer Zeit mit Lc0  2 Partien auf Schach.de gewonnen,

zuletzt gegen den Spitzenspieler Turkey.

Da kommt ja Begeisterung auf !

Reinhold
Parent - - By Max Siegfried Date 2021-06-08 19:27 Upvotes 1
Teste LC0 doch mal gegen den Stockfish auf deinem PC.
Parent - - By Reinhold Stibi Date 2021-06-08 21:15 Edited 2021-06-08 21:29
Wer hätte das gedacht.

Lc0 spielt auch ganz hervorragend Bullet Blitz 1 Min.

Das heutige Bullet-Turnier auf Schach.de 19 Runden mit 3 ausgespielten
Gewinnpartien mit Vorsprung gewonnen.

 

Was mir aufgefallen ist das Lc0 mit den 69erNetzen auch schneller auf Touren kommt wie mit den
älteren Netzen; das wirkt sich natürlich bei den 1 Min. Partien sehr positiv aus.
Parent - - By Reinhold Stibi Date 2021-06-09 15:41
Bin echt überrascht,

mit Lc0 bin ich jetzt sogar Spitzenreiter auf Schach.de mit 2751 Elo.

Das hätte ich nicht erwartet da ich bei Lc0 keine ganz starke Hardware habe.

Zwei RTX 3080er wären schon prächtig; die sind jetzt aber viel zu teuer, vielleicht
in zwei Jahren.

Parent - - By Volker Göbel Date 2021-06-09 19:15
Das lohnt nicht, 2 RTX 3080 zu kaufen.
Viel mehr wirst du mit denen auch nicht reißen, als jetzt.

Spare dir die Knete.

MfG
Parent - - By Reinhold Stibi Date 2021-06-09 22:26
Mit Lc0 bekommt man Wechselbäder verpasst.

Mal ganz toll und dann wieder enttäuschend, wie heute im Bullet Turnier mit 2 Niederlagen.

Da fehlt die Beständigkeit.
Parent - - By Max Siegfried Date 2021-06-09 22:49
Reinhold Stibi schrieb:

Mit Lc0 bekommt man Wechselbäder verpasst.

Mal ganz toll und dann wieder enttäuschend, wie heute im Bullet Turnier mit 2 Niederlagen.

Da fehlt die Beständigkeit.


Da fehlen die 4x RTX 3090.
Parent - By Benno Hartwig Date 2021-06-11 13:13

> Oder es fehlen gerade mal 10000.-Euronen, die diese 4 RTX 3090-mal eben kosten.



In was für ein System könnte man denn viere von solchen Boliden reinstopfen?
Parent - - By Benno Hartwig Date 2021-06-09 23:33 Edited 2021-06-09 23:38

> Viel mehr wirst du mit denen auch nicht reißen, als jetzt.


Wie wirkt sich hier der Unterschied mit 1 oder 2 solcher Karten eigentlich aus?
Um welchen Faktor wird ein gegebenes Problem im Mittel mit 2 Karten schneller gelöst?
Und lässt sich schätzen, wieviel Elo man bei mittleren Zeiten mit der 2. Karte hinzugewinnt?

Zeiten und Elo-Gewinn vielleicht auch im Vergleich zum Stockfish, dem z.B. statt 8 Threads nun 16 gönnt.
Parent - By Reinhold Stibi Date 2021-06-10 08:15
Bei Lc0:

Nach J.W. von Goethe: Himmelhoch jauchzend, zum Tode betrübt.

Leider skaliert Lc0 noch immer nicht gut; wahrscheinlich systembedingt, durch die im Verhältnis zu Stockfish,
geringen Rechentiefe.

Lc0 kann ganz hervorragend spielen; auch gestern im Blitzturnier auf Schach.de mit einem Sieg gegen einen
sehr starken Gegner Cactus mit sehr starker Hardware mit 71 !  Threads

und dann wieder enttäuschend  im Bullet 1 Min. 19 Runden mit 2 Niederlagen und keinem Sieg; am Vortag noch ganz
hervorragend mit 3 Siegen Erster.

Als Lothar noch auf Schach.de mit ganz starker Hardware spielte machte er die gleichen Erfahrungen.

Also wie es scheint bringt auch ganz starke Hardware - wie auch Romanzev, Volker meint - nicht viel mehr, weil die
Schwächen von Lc0 damit in der Regel nicht ausgebügelt werden.

Vom Spielstil gefällt mir Lc0 immer noch am besten, tauscht nicht so viel ab, sehr schöner Königsangriff, bringt auch
im Endspiel den König schnell ins Spiel, bei geschlossenen Stellungen die beste Einschätzung.

Bei Lc0 ist aber noch Einiges in Entwicklung, wie z.B. Lc0 v0.28.0 und da können noch Verbesserungen kommen.
Parent - - By Lothar Jung Date 2021-06-10 09:15
Der Unterschied zwischen einer oder zwei gleichen GPUs sind:

1. Doppelte Kn/sec Geschwindigkeit und dadurch höhere Rechentiefe.

2. Benutzung des besseren Demux Backend, da die beiden Karten wie eine angesprochen werden können und die Multiplexing Synchronisation wegfällt.

Der Spielstärkengewinn bei 2 RTX 3080 ist erheblich.

Lothar
Parent - - By Benno Hartwig Date 2021-06-10 13:21 Edited 2021-06-10 13:25

> 1. Doppelte Kn/sec Geschwindigkeit und dadurch höhere Rechentiefe.


Und wirkt sich dies wirklich (wenigstens so annähernd) so aus, dass gegebene Probleme in der halben Zeit gelöst werden?
Wieviel dies dann bewirkt im praktischen Spiel, ist dann ja eine ganz andere und viel schwierigere Frage, die ich an dieser Stelle gar nicht stellen möchte.

     BTW:
     der Mephisto 3 nahm seinerzeit an einem wichtigen Event teil mit dramatisch getunter Hardware.
     Aber er spielte trotzdem nur mäßig, und sein Betreuer meinte hinterher:
     "Er macht dieselben Fehler wie immer, nur eben viel schneller!" ;-
Parent - - By Lothar Jung Date 2021-06-10 13:42
Hier eine wissenschaftliche Analyse des grundsätzlichen Problems:

https://arxiv.org/pdf/1607.04186.pdf

Lothar
Parent - By Benno Hartwig Date 2021-06-10 22:30
Wow, Danke.
Der Text hat wohl wirklich viel Substanz.
Und kann helfen, mit Voruteilen und Vermutungen aufzuräumen.
Und ggf. ist er aber auch nicht ganz einfach zu verdauen.
Aber es lohnt wohl schon, ihn genauer anzusehen. Mal schauen...
Parent - - By Clemens Keck Date 2021-06-11 07:46 Upvotes 1
Moin

ca. 90 % der ganz groben Fehler werden auch mit 75.000 nps noch gespielt. Manchmal gibt es Abweichungen vom Fehlerzug, aber erst nach erheblich mehr Rechenzeit.
2 GPUS absolut gleicher Bauart laufen nicht wirklich synchron. Ich kann eine Schwankungsbreite von 100 MHz feststellen.
Das BAckend demux benötigt eine Menge an Parametereinstellungen die per Hand vorgenommen werden müssen. Einige Parameter müssen mit der Anzahl der GPUs multipliziert werden, wie zB minibatchsize.
Ich finde das backend roundrobin ganz gut bei 2 gleichen GPU.
Die Rechentiefe bei Lc0 sagt so gut wie gar nichts aus, und ist nicht vergleichbar mit A/B engines.
Wer Lc0 was gutes tun möchte, sollte Rechenzeit spenden. Die Zahl derer die an der Entwicklung mitwirken, die sogenannten active users ist teilweise nur noch bei 15 !!
Wenn man die 2 ganz großen abzieht, wäre die Weiterentwicklung bei parktisch null.
Einfach den clienten anschmeissen, name passwort nach wunsch, der Rest geht von ganz alleine.
Dann mal ein paar TAge durch laufen lassen.
Danke

C.K.

Lothar Jung schrieb:

Der Unterschied zwischen einer oder zwei gleichen GPUs sind:

1. Doppelte Kn/sec Geschwindigkeit und dadurch höhere Rechentiefe.

2. Benutzung des besseren Demux Backend, da die beiden Karten wie eine angesprochen werden können und die Multiplexing Synchronisation wegfällt.

Der Spielstärkengewinn bei 2 RTX 3080 ist erheblich.

Lothar
Parent - - By Reinhold Stibi Date 2021-06-11 10:21
Clemens, du bist wahrscheinlich der Einzige der hier im Forum über den praktischen  Einsatz von 2 RTX 3090er oder

2 RTX 3080er, die wahrscheinlich den 3090er nicht viel nachstehen werden, im Internet-Computerschach berichten kann

im Vergleich zu Stockfish mit starker Hardware.

Leider testet Lothar seine sehr starke GPU Hardware nur;  bringt sie aber nicht in Einsatz im praktischen Spiel.

Wäre sehr interessant, da ich mit meinen 2 RTX 2070er gemischte Erfahrungen gemacht habe.
Parent - By Horst Sikorsky Date 2021-06-11 10:39
Sogar ich (Depp) kann jetzt (RTX 3060 läuft) Leela spenden 
Los Lothar und Reinhold macht mit und Wehe ... wenn nicht
Parent - - By Lothar Jung Date 2021-06-11 11:24 Edited 2021-06-11 12:09
Hallo Clemens,

Danke für deinen Beitrag.

Jetzt muß ich doch noch etwas tiefer „bohren“!

Demux ist performanter, benutzt eine größere MinibatchSize und rechnet parallel mit einem Thread.

Hier ein Test auf Discord der backends mit mimalloc:

Initial Testing 5 min + 5 seconds
Games 40/400
Mimalloc: Demux / Roundrobin / Multiplexing
Master: Multiplexing

MEDIANS
```Name                     Games    Depth       NPS        Nodes per move
-------------------------------------------------------------------------------------
Stockfish 080621     :      40     37        112771284   922975562
v0.27.0-J94-100m     :      10     20           106278     1832943
v0.27.0-J94-100rr    :      10     18           110458     1681564
v0.27.0-J94-100d     :      10     19           121348     1883294
v0.27.0-J94-100      :      10     18            94244     1455036```

Hier die config für demux für 2 GPUs:

For reference the current CCC settings:
```    "MoveOverheadMs", "1000"

    "MaxCollisionVisits", "1000"
           
    "MultiGather", "true"
           
   "Threads", "2"

    "Backend", "demux"

    "BackendOptions", "backend=cuda-fp16,res_block_fusing=true,(gpu=0),(gpu=1)"

    "NNCacheSize", "20000000"

    "MinibatchSize", "192"

    "MaxPrefetch", "48"

    "MaxCollisionEvents", "917"

    "MaxOutOfOrderEvalsFactor", "2.4"

    "CPuct", "1.745"

    "RootHasOwnCpuctParams", "false"

    "CPuctBase", "38739"

    "FpuValue", "0.330"

    "CPuctFactor", "3.894"

    "PolicyTemperature", "1.359"

    "SmartPruningMinimumBatches", "100"

    "MovesLeftMaxEffect", "0.2"

    "MovesLeftThreshold", "0.0"

    "MovesLeftSlope", "0.004"

    "MovesLeftQuadraticFactor", "0.0"

    "MovesLeftScaledFactor", "1.0"

    "MovesLeftConstantFactor", "0.0"

    "TimeManager", "legacy(steepness=4.0)"

    "VerboseMoveStats", "true"

    "Ponder", "false"

    "UCI_ShowWDL", "true"

    "UCI_ShowMovesLeft", "true"

    "StrictTiming", "true"

Hier eine Erklärung zu demux im Verhältnis zu multiplexing und roundrobin:

demux

Does the opposite from what multiplexing does: takes large batch which comes from search, splits into smaller batches and sends them to children backends to compute in parallel.
May be useful for multi-GPU configurations, or multicore CPU configurations too.

As with roundrobin backend, it’s important that all child backends have the same performance, otherwise everyone will wait for the slowest one.

Lothar
Parent - - By Reinhold Stibi Date 2021-06-12 06:46
Heute Nacht auf Schach.de im Autoplaymodus gespielt. Es spielte Niemand mit Lc0.

Mit Stockfish und Ryzen 3970 von den letzten 10 Partien vier gewonnen; mit Lc0
hätte ich das nicht erreicht.

 
Parent - - By Max Siegfried Date 2021-06-12 07:23
Reinhold Stibi schrieb:

Heute Nacht auf Schach.de im Autoplaymodus gespielt. Es spielte Niemand mit Lc0.


Die Anderen haben geschlafen
Parent - - By Reinhold Stibi Date 2021-06-12 07:38
Habe doch gleich im nächsten Satz, den du nicht bringst,
mitgeteilt dass Stockfish mit Ryzen 3970 gespielt hat.

Schaff Dir doch endlich einen starken PC an; mit Deinem Oldtimer kannst Du da nicht
so mitreden.

Parent - - By Benno Hartwig Date 2021-06-12 11:42 Upvotes 2

> Schaff Dir doch endlich einen starken PC an; mit Deinem Oldtimer kannst Du da nicht so mitreden.


Richtig erfolgreich sein in Events kann man mit einem älteren, schwächeren PC vielleicht nicht.
Den meisten wird sowas auch überhaupt nicht wichtig sein.
Jede Menge erkennen über Computerschach und dann auch mitreden kann man aber auch mit magerer Hardware ganz sicher!
Parent - By Reinhold Stibi Date 2021-06-12 12:24
Ja, Benno  aber noch etwas besser mit starker Hardware;

du tut man sich auch etwas leichter, besonders in der Analyse.
Up Topic Hauptforen / CSS-Forum / Was tut sich bei Lc0 ? - schaut nicht schlecht aus !

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill