Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / CUDA 11 wurde veröffentlicht
- - By Lothar Jung Date 2020-06-06 06:30
Hier sind die umfangreichen Release Notes:

https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html

CUDA 11 stellt einen großen Versions-Sprung dar.
Es bietet auch spezielle Features für die im Herbst erscheinenden RTX 3000 Grafikkarten.

Die Lc0-Entwickler werden CUDA 11 in der nächsten LC0-Version umsetzen (vgl. Diskussion auf Discord).

Man darf wohl Performancesteigerungen auch auf RTX 2000 Hardware erwarten.

Lothar
Parent - - By Lothar Jung Date 2020-06-06 09:23
Ein erster Test auf einer RTX 2070ti ist ernüchternd:

```
C:\Users\Gareth\Documents\GitHub\lc0\build>lc0 backendbench --backend-opts=gpu=1,custom_winograd=false
       _
|   _ | |
|_ |_ |_| v0.26.0-dev+git.dirty built Jun  6 2020
Found pb network file: C:\Users\Gareth\Documents\GitHub\lc0\build/384x30-t60-3972.pb.gz
Creating backend [cudnn-auto]...
Switching to [cudnn-fp16]...
CUDA Runtime version: 11.0.0
Cudnn version: 8.0.0
Latest version of CUDA supported by the driver: 11.0.0
GPU: GeForce RTX 2080 Ti
GPU memory: 11 Gb
GPU clock frequency: 1770 MHz
GPU compute capability: 7.5
Benchmark batch size 1 with inference average time 61.9206ms - throughput 16.1497 nps.
Benchmark batch size 2 with inference average time 107.933ms - throughput 18.5299 nps.
Benchmark batch size 3 with inference average time 168.162ms - throughput 17.8399 nps.
Benchmark batch size 4 with inference average time 164.269ms - throughput 24.3503 nps.
Benchmark batch size 5 with inference average time 210.593ms - throughput 23.7425 nps.
```
Parent - - By Lothar Jung Date 2020-06-12 22:23 Upvotes 1
Hier ein erster Test mit CUDA 11:

For anyone who wants to test this, here is a packaged build with cuda 11 and cudnn 7.6.5: <https://ci.appveyor.com/api/buildjobs/xtnt8wj8092962u7/artifacts/lc0-test-windows-gpu-nvidia-cuda.zip>

Lothar
Parent - - By Lothar Jung Date 2020-06-13 08:17
Hier ein Test auf einer RTX 2070 Super mit CUDA 11:

```
GPU: Nvidia RTX 2070 Super @ 1995 MHz
mbs  CUDA10  CUDA11  %change
80   63261   70090   +10.8%
160   77846   78433    +0.8%
240   80972   84973    +4.9%
```
Parent - - By Lothar Jung Date 2020-06-13 09:09 Edited 2020-06-13 09:52
Ich habe CUDA 11 installiert (mit Lc0 0.26 dev).
Pathfinder 7 (CUDA 10) 39 kn/sec nach 1 min.
Pathfinder 8 (CUDA 11) 46 kn/sec nach 1 min.

Steigerung rd. 18%

Das entspricht dem Gewindigkeits-Unterschied zwischen RTX 2070s und RTX 2080s.

PS: Den neuen Nvidia-Treiber 451.22 muß ich noch installieren, könnte noch was bringen.

https://developer.nvidia.com/cuda-downloads

Dies gilt auch für die spezifische Umstellung von Lc0 auf neuen CUDA 11 Code.

Lothar
Parent - By Lothar Jung Date 2020-06-13 10:12
Nach Grafiktreiberinstallation und SLI aus, nunmehr 47 kn/sec, also +20%.
Parent - - By Christian Ullrich Date 2020-06-13 20:43
Hallo Lothar, auf der Github Seite finde ich als letzte "stable version" v0.25.1.Wo hast du die 26er her? Läuft auch schon die genannte 25er-Version mit Cuda 11 ?
Grüße Christian
Parent - - By Lothar Jung Date 2020-06-13 22:47
Die 0.26 ist noch nicht veröffentlicht.
Die 0.26 dev ist in den Dateien enthalten, die ich im dem o.a. Link gepostet habe.
Alles runterladen und entpacken.
Cuda 11 läuft nicht auf lc0 0.25.1.

Gruß
Lothar
Parent - - By Christian Ullrich Date 2020-06-13 23:54 Edited 2020-06-14 00:25
Danke für die schnelle Antwort !

Ich fahre unter der GUI Arena 351. RTX 2070 , Nvidia- Treiber : 441.66. Das Ganze stürzt zwar nicht ab , die Zeitanzeige läuft , aber es erfolgt keinerlei Berechnung der Stellung. Ist der Treiber 441.66 zu alt (Januar 2020) ? Die bisherigen Versionen laufen einwandfrei unter Arena und dem besagten Treiber.

Grüße Christian
Parent - - By Christian Ullrich Date 2020-06-14 01:54 Edited 2020-06-14 02:08
Hallo,es lag (Gott sei Dank !) am Treiber !! Mit dem neuen 446.14 (den Volker unten erwähnt für die 2080ti ( auch für die 2070) - einen neueren habe ich nicht gefunden) läuft alles bestens ! Ein Vergleich :

RTX 2070 Netz T40 B4-160 default  LC0 v24 (März 2020) Grundstellung nach 1 min. CUDA 10  : 30knps

RTX 2070 Netz T40 B4-160 default  LC0 v26dev (Juni 2020) Grundstellung nach 1 min. CUDA 11  : 37knps

Das deckt sich mit den Ergebnissen von Lothar!
Parent - By Eduard Nemeth Date 2020-06-14 02:31
Ja. Ich habe nur eine GTX 1050 Ti, und mit dem neusten Treiber 446.14 funktioniert es nun auch. Ich kann allerdings keine Steigerung feststellen, die kn/s sind ziemlich identisch mit der v0.25.1 Version von CUDA 10.2 (die hat jemand auf Discord veröffentlicht). Vermutlich gibt es nur eine Steigerung mit GTX Karten.
Parent - By Lothar Jung Date 2020-06-14 08:48 Edited 2020-06-14 08:54
CUDA 11 und Lc0 0.26dev stellen nur ein schnelle und vorläufige Umsetzung dar.

Erst wenn die endgültige Version cudnn 8 erscheint steht den Entwicklern die erweiterten Möglichkeiten der neuen Plattform zu Verfügung. Zur Zeit wird noch die cudnn64 Version 7 eingesetzt.
Deshalb ist noch mit zukünftigen Performancesteigerungen zu rechnen.

Natürlich schöpft erst die neue RTX-Version 30XX mit den schnelleren Datentypen von fp16 die volle Leistungsfähigkeit aus, vgl.

https://docs.nvidia.com/deeplearning/sdk/cudnn-developer-guide/index.html

Hoffentlich können die derzeitigen Netze die Leistung denn auch auf die Straße bringen.

Lothar
Parent - By Thomas Lagershausen Date 2020-06-14 11:22
Großen Dank an Lothar auch von mir.

Tolle 30% Mehrleistung

RTX 2060 Super Palite Jetstream 9,3 kn/s

RTX 2060 Super +Lc0  Cuda 11  12,3 kn/s.

Parent - - By Eduard Nemeth Date 2020-06-13 14:28
Bei mir läuft diese Version nicht, nicht unter Fritz und nicht unter Nibbler. Unter Nibbler kommt die Meldung "No Cuda Driver". Was mache ich falsch?
Parent - By Lothar Jung Date 2020-06-13 14:35 Edited 2020-06-13 14:37
Hast Du den neuen Treiber geladen?
Läßt sich Lc0 starten?
Bisher wurde nur auf RTX-Karten getestet.
Läuft bei mir einwandfrei jetzt beim Tunier mit SV 4082.
Und lief auch im Machienenraum unter T60.

LG Lothar
Parent - By Volker Göbel Date 2020-06-13 15:31
Bei mir läuft es gut.
RTX 2080Ti Nvidia Treiber
Version:  446.14  WHQL
Parent - By Detlef Uter Date 2020-06-14 07:02 Edited 2020-06-14 07:09
Hier nun meine Testergebnisse zu CUDA 11:

49152 GB RAM Nvidea GeForce GigaByte RTX 2080 Ti Aorus Xtreme mit 1770 GHz Boost Takt
          rund 76 kN/s nach einer Minute Rechenzeit aus der Grundstellung     - lc0 v0.25.1                                                                                                              - NNCaceSize = 60000000
          rund 79 kN/s nach einer Minute Rechenzeit aus der Grundstellung     - lc0 v0.26.0-dev + CUDA 11.0                                                                                 - NNCaceSize = 60000000
          rund 80 kN/s nach einer Minute Rechenzeit aus der Grundstellung     - lc0 v0.26.0-dev + CUDA 11.0                                            + Grafiktreiber 451.22  - NNCaceSize = 60000000
          rund     14 kN/s nach einer Minute Rechenzeit aus der Grundstellung - lc0 v0.25.1                              + Sergio 384x30-t60-3010                                      - NNCaceSize = 60000000
          rund     14 kN/s nach einer Minute Rechenzeit aus der Grundstellung - lc0 v0.25.1                              + Sergio 384x30-t60-3010 + Grafiktreiber 451.22  - NNCaceSize = 60000000
          rund     21 kN/s nach einer Minute Rechenzeit aus der Grundstellung - lc0 v0.26.0-dev + CUDA 11.0 + Sergio 384x30-t60-3010 + Grafiktreiber 451.22  - NNCaceSize = 60000000

Gruß
Detti
Up Topic Hauptforen / CSS-Forum / CUDA 11 wurde veröffentlicht

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill