Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Erster Benchmark der RTX 3090
- - By Lothar Jung Date 2020-10-01 14:18
Auf discord unter "help":

Ok I ran now lc0-v3.exe benchmark --backend=cuda-fp16 --minibatch-size=240 > J92-190-bench-backend-cuda-fp16.txt 2>&1

Total time (ms) : 340488
Nodes searched  : 10478698
Nodes/second    : 30775

@ankan @Chad

J92-190-bench-backend-cuda-fp16.txt
76.22 KB

Nicht schlecht, aber sehr teuer.
Ich bin gespannt auf das Ergebnis einer RTX 3080.

Lothar
Parent - - By Clemens Keck Date 2020-10-01 19:33
Das ist schon der bench mit winograd optimierungen (die ja nicht bei jedem funktionieren)
ohne optimierungen waren es immerhin noch 26.000

hier ist der post von Ankan vom 24 September
Code:
c0 benchmark with sv-3010 network (384x30),

default settings (minibatch-size=256)
---------------------------------------------
GPU         baseline  optimized   perf gain (%)
---------------------------------------------
Titan RTX   17443     20084       15.1
RTX 3090    26820     29767       11.0
A100        41785     48815       16.8

minibatch-size=1024, all other settings default:
---------------------------------------------
GPU         baseline  optimized   perf gain (%)
---------------------------------------------
Titan RTX   20211     23003       13.8
RTX 3090    33032     36924       11.8
A100        52732     59134       12.1


mit minibatchsize 1024 muß man vorsichtig sein, die kns sind schmeichelhaft, aber die Suche wird negativ beeinflusst durch diese Größe

CK
Lothar Jung schrieb:

Auf discord unter "help":

Ok I ran now lc0-v3.exe benchmark --backend=cuda-fp16 --minibatch-size=240 > J92-190-bench-backend-cuda-fp16.txt 2>&1

Total time (ms) : 340488
Nodes searched  : 10478698
Nodes/second    : 30775

@ankan @Chad

J92-190-bench-backend-cuda-fp16.txt
76.22 KB

Nicht schlecht, aber sehr teuer.
Ich bin gespannt auf das Ergebnis einer RTX 3080.

Lothar
Parent - - By Lothar Jung Date 2020-10-01 19:45
Danke Clemens,

meine 3 RTX 2070 hatten eine errechnete MinibatchSize von 240, ich erreichte ohne CUDA 11 Optimierung 30 kN/sec.
Daher ist die erste Tabelle realistisch.
Hast Du mal winograd Optimierung versucht?
Wovon ist es abhängig, ob diese Optimierung funktioniert?

Grüße

Lothar
Parent - - By Clemens Keck Date 2020-10-01 21:47 Upvotes 1
die optimierung ist in 26.3rc1 integriert und aktiviert.
bei mir waren es allerdings MINUS 2000 nps im Vergleich zu 26.2
und sogar -5000 nps im Vergleich zu cuda 11+cudnn 7.6.5

Ich bin sicher "die" basteln noch daran rum, bis es wirklich was bringt. Habe einige benchmarks für borg gemacht mit diversen GPU und diversen compiles.

Ich bin mittlererweile gar nicht mehr so heiss auf die RTX 3000 Serie.
Erst den launcht total verpfuscht
PC King bietet die 3090 für horrende 2299 € an, dabei haben wir den Schlamassel solchen Verkäufern zu verdanken.
DAnn die ganzen crashes, die jetzt mit neuen Treibern abgefangen werden.
Weckt alles kein Vertrauen. Auch die Gerüchte nicht.
3080 mit 20GB Speicher.
2070ti
usw.
Ich glaube man kann schnell viel Geld in den Sand setzen wenn mann hastig kauft.

CK

Lothar Jung schrieb:

Danke Clemens,

meine 3 RTX 2070 hatten eine errechnete MinibatchSize von 240, ich erreichte ohne CUDA 11 Optimierung 30 kN/sec.
Daher ist die erste Tabelle realistisch.
Hast Du mal winograd Optimierung versucht?
Wovon ist es abhängig, ob diese Optimierung funktioniert?

Grüße

Lothar
Parent - By Lothar Jung Date 2020-10-02 10:04
Moin Clemens,

ja, das ist schon krass.

Jetzt auch eine überteuerte RTX 3080 zu kaufen ist total verfrüht.

Zuviel Unsicherheiten wegen Qualität und Performance.
CUDA 11 ivm cudnn 8 ist noch nicht ausgereift.

Das backend cuda nicht nicht optimiert.
Die Nvidia Treiber werden ohnehin laufend angepasst.

Nicht zuletzt sollte man den Geschwindigkeitsunterschied zwischen RTX 3080 und 3070 für Lc0 wissen.

Ich für meinen Teil muß auch einschätzen können, inwieweit eine weitere RTX von der Spielstärke her skaliert.

Lothar
Parent - - By Clemens Keck Date 2020-10-04 11:30 Edited 2020-10-04 11:36
so, jetzt gibt es auch den ersten Benchmark mit einer RTX 3080 und lc0-26.3-rc2

RTX 3080

lc0 benchmark --weights=384x30-t60-4619.pb.gz --num-positions=1
Total time (ms) : 10021
Nodes searched  : 232729
Nodes/second    : 23222

Zum Vergleich :

RTX 2080super

lc0 benchmark --weights=384x30-t60-4619.pb.gz --num-positions=1
===========================
Total time (ms) : 10037
Nodes searched  : 149715
Nodes/second    : 14915

C.K.
Parent - By Reinhold Stibi Date 2020-10-04 11:46
Das ist doch Spitze:

Die RTX 3080 ist ca. so schnell wie 2 RTX 2070.
Parent - By Thomas Lagershausen Date 2020-10-05 08:52
Dank für die Info.

Das macht also 55,7%.
Up Topic Hauptforen / CSS-Forum / Erster Benchmark der RTX 3090

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill