Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Lc0 0.26.3-rc2 veröffentlicht
- - By Lothar Jung Date 2020-10-03 17:08
Lc0 Release 0.26.3-rc2 is now available. <https://github.com/LeelaChessZero/lc0/releases>
This fixes a bug found in rc1 and includes a new package (`cuda`) with just the cuda backend and built with cuda 11.1 (requiring very recent drivers). The old `cuda` package is renamed to `cudnn`. In addition there is windows support for more than 64 threads, mainly useful with cpu backends.

Fix for uninitialized variable that led to crashes with the cudnn backend.
Correct windows support for systems with more than 64 threads.
A new package is built for the cuda backend with cuda 11.1. The old cuda package is renamed to cudnn.

Lothar
Parent - - By Clemens Keck Date 2020-10-04 09:49
moin moin

das

lc0-v0.26.3-rc2-windows-gpu-nvidia-cuda.zip

ist mit Abstand das schnellste compile was man derzeit für Lc0 haben kann.

Sogar noch schneller als cuda 11.1 + cudnn 7.6.5 !
Zum Vergleich:
26.3-rc2 mit cudnn + J92-220 macht 9700nps auf 2080 super
26.3-rc2 mit cuda + J92-220 macht 15100 nps auf 2080 super das sind + 50% 

wichtig
es funktioniert nur mit dem neusten NVIDIA Treiber 456.38 oder neuer (ich hab Version 456.55 installiert)

C.K.
Parent - - By Lothar Jung Date 2020-10-04 10:08
Danke, Clemens!

Ja, das ist eine erhebliche Steigerung.
Besonders für uns mit mehreren GPUs.
J92-190 schlägt sich im TCEC-Tunier nicht schlecht.
J92-210 soll sogar ein bisschen besser sein. Es erreicht z.B. mehr Eigenmann-Punkte.

Ich komme erst am 15. November aus Frankreich zurück.
Ich hoffe, dass sich die Lieferprobleme und Qualität der RTX 3080 verbessert.
Bis dahin werden bestimmt auch schon belastbare Tests auf Discord zur Verfügung stehen.
Ich schätze es wird ca. die doppelte Geschwindigkeit von zwei RTX 2070 Super erreicht.
Fraglich ist, ob sich die addierten kN/sec. auch in einer Spielstärkensteigerung gegen SF NNUE niederschlagen.

Gruß

Lothar
Parent - By Clemens Keck Date 2020-10-04 10:18
Moin Lothar

ich habe 2 Testmatches gegen einen sehr starken cfish zu bieten. Werde jetzt auch erstmal bei der cfish Version bleiben um die matches besser vergleichen zu können.
10min +5sec
ponder ON
cfish auf 16cores
Lc0 auf RTX 2080super
180 Spiele, eine Partie dauert ca. 30 min, ein Match ca. 4 Tage.
Code:
10 Minutes/Game + 5 Seconds/Move  2020

Cfish 200920 64 BMI2 NUMA [ne   - Lc0 v0.26.2+J92-220               93.0 - 87.0    +19/-13/=148    51.67%
Cfish 200920 64 BMI2 NUMA [ne   - Lc0 v0.26.2+J92-190               95.5 - 84.5    +23/-12/=145    53.06%

-21 ELO für J92-190
-11 ELO für J92-220

C.K.
Parent - - By Volker Göbel Date 2020-10-04 10:11
Clemens Keck schrieb:

moin moin

das

lc0-v0.26.3-rc2-windows-gpu-nvidia-cuda.zip

ist mit Abstand das schnellste compile was man derzeit für Lc0 haben kann.

Sogar noch schneller als cuda 11.1 + cudnn 7.6.5 !
Zum Vergleich:
26.3-rc2 mit cudnn + J92-220 macht 9700nps auf 2080 super
26.3-rc2 mit cuda + J92-220 macht 15100 nps auf 2080 super das sind + 50% 

wichtig
es funktioniert nur mit dem neusten NVIDIA Treiber 456.38 oder neuer (ich hab Version 456.55 installiert)

C.K.


Hallo,
Auf meiner RTX 2080 Ti komme ich mit dem Netz J92-220,  und v0.26.3-rc2 cuda sogar auf 20730 nps

V.G.
Parent - By Clemens Keck Date 2020-10-04 10:33
verdammt ist deine 2080ti schnell Volker !
Ich schaffe mit 2070 + 2060 etwa das gleiche ( 21.000 nps) aber brauche bei 2 GPU viel mehr Strom...
C.K.

Volker Göbel schrieb:


Hallo,
Auf meiner RTX 2080 Ti komme ich mit dem Netz J92-220,  und v0.26.3-rc2 cuda sogar auf 20730 nps

V.G.
Parent - - By Detlef Uter Date 2020-10-04 10:41
Und ich komme mit meiner RTX 2080 Ti und Netz J92-190
sogar auf 24 KN pro Sek. und v0.26.3-rc2 CUDA 11.
Parent - By Reinhold Stibi Date 2020-10-04 11:25 Edited 2020-10-04 11:33
Ich komme mit Lc0 v0.26.3-rc2 mit  RTX 2070 super und RTX 2070 mit neuestem Treiber   jeweils mit J92-190

mit cudnn auf 22 kN/s

mit cuda  auf  18 kN/s.

mit Lc0 v0.26.2  Cuda11 cudnn7  25 kN/s.
Parent - By Clemens Keck Date 2020-10-04 11:46
Detlef Uter schrieb:

Und ich komme mit meiner RTX 2080 Ti und Netz J92-190
sogar auf 24 KN pro Sek. und v0.26.3-rc2 CUDA 11.



gute Zeiten für lc0 Spieler- da kann man erst mal ruhig abwarten wie sich das entwickelt mit den RTX 3080, 3090 und co.


CK
Parent - By Detlef Uter Date 2020-10-05 05:58
Und mit den Netz  J92-230 komme ich sogar auf 25 kN/s
Up Topic Hauptforen / CSS-Forum / Lc0 0.26.3-rc2 veröffentlicht

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill