Gewaltiger Fortschritt von Lc0 von Vers.17 bis 19 (mit History always).

By Stefan Pohl Date 2018-11-12 09:18 Edited 2018-11-12 09:24

Ohne Angabe der Leela-Ratio für den jeweiligen Test, sind Testergebnisse völlig ohne Aussagekraft. Das ist so, als würde man bei einem Testrun zweier "normaler", klassischer Engines, die genutzte Hardware nicht angeben.

By Tom Paul Date 2018-11-12 10:40

Reinhold Stibi schrieb:

Beim Engine Match Lc0 19 mit History always gegen Stockfish 03.09.18 Nicolet
mit GTX 960 und X5680 1 CPU   mit 2 Min.+ 6 Sek.Zug.

zieht inzwischen Lc0 gleichauf mit Stockfish   22 Partien +4   =14   -4

Bei weiteren Durchläufen mit insgesamt 40 Partien führt Stockfish nur mit + 21 Elo

Lasse ich Stockfish mit 24 Threads dagegen spielen führt Stockkfish mit 120 bis 150 Elo.

Die Frage ist könnte eine RTX 2080 Ti mit Xeon X5680   24 Threads mithalten ?

Erstaunlich ist dass meine CPU Xeon X 5680 ,die inzwischen 8 1/2 Jahre auf dem Buckel hat,
noch mit den heutigen CPUs gut mithalten kann.

LC0 v0.19.0 auf einer RTX 2080 Ti gewinnt gegen einen 8 Kerne Stockfish deutlich, gegen einen 16 Kerne Stockfish knapp, verliert gegen einen 32 Kerne Stockfish. Verliert gegen einen 44 Kerne Stockfish deutlich.

Meinst du 12 echte Kerne / 24 virtuelle Kerne oder meinst du 24 echte Kerne?
Hierbei kommt es auf den jeweiligen Prozessor an und auch auf die GHz!.
Aber wenn du schon mit so einer schwachen GPU ein solches Ergebnis gegen 24 Threads Stockfish erreicht hast, dann sollte LC0 auf einer RTX 2080 Ti gewinnen.

LC0 wird nicht nur besser durch stärkere Networks, sondern auch durch größere Netze und auch durch neuere Versionen...v0.20.0 erscheint in den nächsten Tagen

By Tom Paul Date 2018-11-12 15:42

Reinhold Stibi schrieb:

Beim Engine Match Lc0 19 mit History always

Warum benutzt du eigentlich History always anstatt fen_only?

By Lothar Jung Date 2018-11-12 09:07 Edited 2018-11-12 09:20

Die RTX 2080ti kostet bei Amazon 1.500 €, eine RTX 2070 nur 519 €.
Dreimal so teuer für nur 20 bis 30 % Performanceunterschied.

https://www.phoronix.com/scan.php?page=article&item=nvidia-rtx2070-compute&num=4

Cudabenchmark: RTX 2080ti: 38.037; RTX 2070: 25.819

Die RTX 2070 verbraucht 225 Watt, die RTX 2080ti 260 Watt.
Die RTX hat einen erheblichen Preisleistungsvorteil.
Im übrigen bleibt abzuwarten, wie sich der Leistungsunterschiede der beiden Karten in ELO-Punkten realisiert.

By Stefan Pohl Date 2018-11-12 09:17 Edited 2018-11-12 09:23

Lothar Jung schrieb:

Die RTX 2080ti kostet bei Amazon 1.500 €, eine RTX 2070 nur 519 €.
Dreimal so teuer für nur 20 bis 30 % Performanceunterschied.
Die RTX 2070 verbraucht 225 Watt, die RTX 2080ti 260 Watt.
Die RTX hat einen erheblichen Preisleistungsvorteil.
Im übrigen bleibt abzuwarten, wie sich der Leistungsunterschiede der beiden Karten in ELO-Punkten realisiert.

So isses. Wer sich eine neue Karte für die LC0-Nutzung zulegen will, sollte unbedingt auf die RTX 2070 setzen. Auf RTX-Karten läuft Leela 2.7x schneller, als auf GTX-Karten (bei einem angenommenen, identischen CUDA-Benchmark-Wert) und die RTX 2080er Karten sind viel zu teuer und bringen nur knapp 30% mehr LC0-Leistung als die RTX 2070.
Sich heute noch eine GTX-Karte für die LC0-Nutzung zu kaufen, wäre nun wirklich dumm, weil Leela auf RTX-Karten eben 2.7x schneller läuft, als auf GTX-Karten (bei einem angenommenen, identischen CUDA-Benchmark-Wert) und die Diskrepanz könnte sich in Zukunft sogar noch vergößern, wenn LC0 auf Integer-Verarbeitung umgestellt werden sollte.

By Stefan Pohl Date 2018-11-12 09:13

Reinhold Stibi schrieb:

Eine RTX 2080 Ti ist von den Cuda-Benchmark ca. 3x schneller als eine GTX 1070.

Das kann doch nicht sooo schwer zu begreifen sein, daß die RTX-Karten mit Leela erheblich schneller laufen, als die Cuda-Benchmarks nahelegen. Eine RTX 2080Ti ist mit Leela daher nicht 3x schneller als eine GTX 1070. Sondern circa 8.4 mal schneller! Und wenn Leela von Fließkomma-Operationen (s.u.) auf Integer-Operationen umprogrammiert wird, dürfte Leela auf den RTX-Karten noch mal erheblich schneller werden.

Also poste ich es jetzt zum dritten Mal (!):

Wer sich fragt, wie schnell lc0 auf seiner NVIDIA-Karte laufen wird, wenn er sich eine anschafft, hier der Link zu den CUDA-Benchmarks: https://browser.geekbench.com/cuda-benchmarks
Den dortigen BenchWert teilt man durch ca. 42 und das ist dann etwa die Zahl der rollouts/s (von den ChessGUIs fälschlicherweise als nodes/s ausgegeben), die Leela CUDA auf der entsprechenden Karte schaffen sollte. Zumindest, sofern man ein neuronales Netz der Größe 20x256 nutzt, welches ja momentan die aktuelle Größe darstellt, die die 11xxx und 20xxx Nets haben.
Meine alte mobile Karte GTX 950m hat dort einen Wert von gut 43000 und bei mir schafft Leela gut 1000-1100 rollouts/s bei vollem Brett.
Dies gilt NICHT für die neuen RTX Karten! Wer stolzer Besitzer einer solchen ist, kann lc0 in den UCI-Optionen von fp32 auf fp16 setzen. Dies reduziert die Fließkommaoperations-Bandbreite von 32 auf 16 bit, was logischerweise eine beträchtliche Geschwindigkeitssteigerung mit sich bringt, nämlich ca. Faktor 2.7 (!). Ergo teilt man bei den neuen RTX Karten den CUDA-Benchwert nur durch ca. 15 (statt 42). Eine RTX 2080 (Benchwert 409466) erreicht also sagenhafte 27000 rollouts/s (in etwa), die RTX 2080 Ti sogar ca. 36000 (!).
Wer also eine neue Grafikkarte für lc0 anschaffen will, sollte unbedingt eine der neuen RTX Karten kaufen. Das ist eine andere Dimension!

By Lothar Jung Date 2018-11-12 12:11

Ich habe im Lc0-Forum die Frage gepostet, ob es ohne SLI möglich wäre 2 GPU - auch unterschiedliche - unter Lc0 anzusprechen.

https://groups.google.com/forum/m/#!topic/lczero/W-h75rETafc

Es ist möglich!
Somit kann man auch zwei RTX 2070 einsetzen, was wohl schneller und billiger sein dürfte, als eine RTX 2080ti.

By Stefan Pohl Date 2018-11-12 12:25

Lothar Jung schrieb:

Ich habe im Lc0-Forum die Frage gepostet, ob es ohne SLI möglich wäre 2 GPU - auch unterschiedliche - unter Lc0 anzusprechen.

<a class='ura' href='https://groups.google.com/forum/m/#!topic/lczero/W-h75rETafc'>https://groups.google.com/forum/m/#!topic/lczero/W-h75rETafc</a>

Es ist möglich!
Somit kann man auch zwei RTX 2070 einsetzen, was wohl schneller und billiger sein dürfte, als eine RTX 2080ti.

Tolle Sache. Mir wäre das zu teuer, sowohl in der Anschaffung als auch im Stromverbrauch. Aber bei wem der Geldbeutel prall genug ist, da ist man mit zwei RTX 2070 auf jeden Fall besser bedient, als mit einer RTX 2080Ti.

By Tom Paul Date 2018-11-12 12:25

Lothar Jung schrieb:

und was den Stromverbrauch fast verdoppelt, was wiederum preislich einer zweiten RTX 2080 Ti entsprechen würde

By Thomas Müller Date 2018-11-12 13:25 Edited 2018-11-12 13:29

schön!
Zu bedenken wäre noch, dass die RTX 2xxx 2,5 oder oft sogar 3 slots an Platz belegen.
Also da wird es dann schön eng auf dem Board/im Gehäuse....warm evtl. auch.

EDIT:
es gibt auch welche die 2 slots belegen...haben dann kleinere lüfter vermutlich.

Tja...ich warte noch bis n. Weihnachten dann mal schauen was preislich sich getan hat.
Aktuell habe ich ja "nur" eine GTX 970...aber ich hole mir eine nicht wegen lco sondern wegem zocken!

By Tom Paul Date 2018-11-12 10:28

Reinhold Stibi schrieb:

Eine RTX 2080 Ti ist von den Cuda-Benchmark ca. 3x schneller als eine GTX 1070.

LC0 auf einer RTX 2080 Ti (evtl. noch leicht übertaktet wer es braucht) ist deutlich schneller.

By Guenter Stertenbrink Date 2018-11-12 17:34

hier eine Tabelle der Leela-Ratios von verschiedenen Karten und threads :

https://docs.google.com/spreadsheets/d/11vXZe4Dm7nIXWIYD9EoZguR4xOuRWUQHpzSfQW2HaMo/edit#gid=559387003