Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Lc0 mit guten Ergebnissen im Stellungstest und im praktischen Spiel
- - By Reinhold Stibi Date 2025-08-01 09:44 Edited 2025-08-01 09:52
Lc0  v0.31.0  BT3 2660000 mit RTX 2070  erzielte im

HTC 114  15 Sek. 72 gelöste Stellungen aus 114  63,1 %   2,09 Sek. Durchschnittszeit

HTC 114  30 Sek. 80   "                                      70,1 %   4,16   "

ERET       15 Sek. 94   gelöste Stellungen aus 111  84,6 %   1 Sek. Durchschnittszeit

Sind doch beachtliche Ergebnisse. 

Im praktischen Spiel im Internet auf PlayChess  musste ich mein gutes Buch
ergänzen bzw. berichtigen bei Sizilianisch  und Spanisch. Danach spielte
Lc0 sehr sicher; bei 300 Partien Keine verloren und eine ausgespielte Partie gewonnen.

Ideal wäre ein RTX 4060 die doppelt so schnell sein dürfte.

Es braucht schon viele Spiele, auch bei Stockfish und Abkömmlinge, um eine ausgespielte Partie
(also keine Abbruchpartie) zu gewinnen. Auch ein gutes Buch hat manche Schwächen die durch
diese Partien berichtigt werden können.
Parent - By Lothar Jung Date 2025-08-01 11:33
Das freut mich.
Ich habe auch ein spezielles Buch für Lc0.
Eduard hat es mit sehr vielen Partien auf meiner 3060 Laptop entwickelt.
Im Endeffekt habe ich keine Partie mehr verloren.
Natürlich sind meine 2 4070 ti fast unschlagbar, aber meine 4070 Laptop dürfte mit der neuen LcO Engine und einem 1740 Netz nicht mehr verlieren.
Ich werde in Frankreich mit meinen neuen Notebook wieder im Maschinenraum antreten.
Im übrigen, LcO wird unterschätzt.

Gruß

Lothar
Parent - - By Lothar Jung Date 2025-08-01 14:38
Meine guter Benchmark Werte mit 1 Minute von der Grundstellung sind zutreffend.

Es liegt an der 0.32 Lc0 Version und Fp16 Einstellung.
Bisher nur 1 Partie verloren, es lag an der Eröffnung. Kann man bereinigen.
Im übrigen sind verlorene Partien ein Geschenk für das Eröffnungsbuch.
Parent - - By Reinhold Stibi Date 2025-08-01 16:36
Durch verlorene Partien kann man eine Engine im Eröffnungsbuch trimmen.

Danke Lothar auf Deinen Hinweis auf das sehr gute BT4 1740 Netz.
Damit steigerte Lc0  das Ergebnis mit dem HTC 114 Test 15 Sek. von 72 (BT3) auf 80 gelöste
Stellungen; ein erheblicher Fortschritt.

Dieses Netz ist um 1/3 langsamer, aus der Grundstellung 2,1 kN/s,  als das BT3 Netz dürfte aber für die RTX 2070 für
das Spiel im Internet noch ausreichen
Parent - - By Lothar Jung Date 2025-08-01 16:55 Edited 2025-08-01 17:05
Hast Du fp16 aktiviert ?
ERET?
LcO ist ein solider Problemlöser.
Ich habe für mich ein Ziel erreicht, mit einem Notebook, sowohl mit Lc0 als auch mit Stockfish ganz oben mitspielen zu können.
Und das mit verhältnismäßigem Energieverbrauch.
Ziel für heute 3300 Elo.
Parent - - By Reinhold Stibi Date 2025-08-01 17:25 Edited 2025-08-01 17:32
Ja, mit auto.

ERET 15  Sek. 95   85,5 %   0,80 Sek.  ist sogar um 20 % schneller

1 Stellung mehr gelöst als mit Netz BT3.

Bei mir mit MiniPC  70 Watt  und mein großer PC Ryzen 3970X mit 64 Threads

und bei der RTX 2070  mit Lc0 läuft es ganz ordentlich. Habe aber schon
eine RTX 4060 um 309 EUR bestellt die wahrscheinlich am Montag kommen
wird für meinen kleineren PC der wesentlich weniger Strom braucht.

Die RTX 4060 dürfte nur unwesentlich langsamer sein als deine 4070 Notebook.
Parent - By Lothar Jung Date 2025-08-01 17:38 Edited 2025-08-01 17:40
Sie sind etwa gleich schnell.

Beide 115 Watt.

https://technical.city/en/video/GeForce-RTX-4060-vs-GeForce-RTX-4070-mobile

Glückwunsch!!
Parent - By Lothar Jung Date 2025-08-01 18:06
In dem Feld ist keiner schwach. Haben gute Eröffnungsbücher.
Ein Weg geht über geschlossene Stellungen, die liegen LcO noch immer.
Parent - By Lothar Jung Date 2025-08-01 18:22
lc0-benchmark (34 pos.)
latest nvidia driver version: 577.00
RTX 4070 Ti, mbs=80, bt4-1740.pb,  lc0 with "classic".
```     
lc0-v0.32.0-rc1  (cuda 11)
===========================
Total time (ms) : 340828
Nodes searched  : 3489201
Nodes/second    : 10237

lc0-v0.32.0-rc1  (cuda 12)
===========================
Total time (ms) : 340812
Nodes searched  : 3486674
Nodes/second    : 10230

lc0-v0.32.0-rc1  (onnx-trt)
===========================
Total time (ms) : 340715
Nodes searched  : 3912430
Nodes/second    : 11483```

Letzteres bringt nochmal 11 % Steigerung.
Parent - - By Lothar Jung Date 2025-08-02 08:38
Schritt für Schritt, Lc0 mit ONNX + TensorRT unter Windows



1. Voraussetzungen

  •  Eine aktuelle Lc0-Version (mind. v0.31.0 oder besser v0.32.0-rc1)
  •  ONNX-Modell deines gewünschten Netzes (z. B. BT4-1740.onnx)
  •  TensorRT Runtime für Windows (von NVIDIA)
  •  Aktuellen NVIDIA-Treiber (mind. v530, besser: v550+)
  •  CUDA muss nicht separat installiert werden



2. ONNX-Netz herunterladen

ONNX-Versionen der besten Netze auf z. B.:

https://training.lczero.org/networks/
https://github.com/LeelaChessZero/lc0-training-data
Oder direkt BT4-1740 als .onnx:
https://training.lczero.org/networks/best/ → „onnx“

Beispiel-Datei:

bt4-1740.onnx

Lege sie im Ordner ab, wo deine Lc0-Exe liegt.



3. Lc0 konfigurieren (lc0.json)

Bearbeite oder erstelle die Datei lc0.json im Lc0-Verzeichnis. Beispielkonfiguration für ONNX + TensorRT auf deiner RTX 4070:

{
  "backend": "tensorrt",
  "net": "bt4-1740.onnx",
  "tensorrt.precision": "fp16",
  "tensorrt.batchsize": 1,
  "tensorrt.device": 0
}

Hinweise:
  •  "fp16" ist optimal für deine GPU
  •  "batchsize": 1 ist ideal für 5+0 und Einzel-Analyse
  •  "device": 0 steht für die erste CUDA-fähige GPU

Wenn du verschiedene Netze testen willst, kannst du auch "net": "networks\\bt4-1740.onnx" anpassen (Pfad beachten).



4. TensorRT installieren

Gehe auf:

https://developer.nvidia.com/tensorrt
  •  Wähle TensorRT 8.6 oder höher für Windows
  •  Lade das passende .zip-Paket (nicht das .tar oder Docker-Zeug)
  •  Entpacke es z. B. nach C:\TensorRT

Dann:
  •  Füge den Pfad zur TensorRT-Bibliothek zur Windows-Umgebungsvariable PATH hinzu:

Beispiel:

C:\TensorRT\lib

(Je nach Version ggf. C:\TensorRT-8.6.X.X\lib)

Du kannst auch die DLLs direkt in den Lc0-Ordner kopieren:

nvinfer.dll
nvinfer_plugin.dll
nvonnxparser.dll



5. Testlauf starten

Öffne ein Terminal (z. B. PowerShell) und wechsle in den Lc0-Ordner:

.\lc0.exe

Lc0 sollte dann melden:

Using backend: tensorrt
Network loaded: bt4-1740.onnx
Precision: fp16

Und beim Spielen / Benchmark:

Nodes per second: 11450 auf RTX 4070

Das ist dein ONNX-TensorRT-Speedboost.



Optional: Benchmark prüfen

Du kannst direkt vergleichen:

.\lc0.exe benchmark --nodes 1000 --backend=tensorrt --net=bt4-1740.onnx

Mit CUDA:

.\lc0.exe benchmark --nodes 1000 --backend=cuda --net=bt4-1740.pb.gz



Fertig! Du nutzt jetzt TensorRT für Lc0.
Parent - - By Reinhold Stibi Date 2025-08-02 10:00 Edited 2025-08-02 10:17
Danke, mal probieren

Lc0 v0.32.0-rc1 lieferte bei mir mit RTX 2070 bei den Stellungstests
etwas schlechtere Werte wie Lc0 v0.31.0   ERET 15 Sek. 92 zu 95.

HTC 114  je 80  aber zeitlich etwas schlechter 2,59 zu 2,31 Sek.

Das BT4 1740  ist mit meiner RTX 2070 gut einsetzbar auf PlayChess
bisher keine Partie damit verloren.
Die Rechentiefe ist jetzt mit Lc0 überraschend tief; auch im Endspiel
auch bei schneller Zugfolge keine Probleme.

Prima Dein Link Vergleich RTX 4070 Laptop  zu  RTX 4060 PC.

Super auch der wesentlich geringerer Energieverbrauch trotz höherer Leistung
bei RTX 4070 Laptop und RTX 4060 PC.

Vielleicht kommt heute schon die RTX 4060, da ist dann noch mehr Spielraum;
freue mich schon darauf.


Grüße
Reinhold
Parent - By Lothar Jung Date 2025-08-02 13:43
Kannst Dich wirklich darauf freuen und mit dem anderen Netz bist Du nochmal 12% schneller.
Up Topic Hauptforen / CSS-Forum / Lc0 mit guten Ergebnissen im Stellungstest und im praktischen Spiel

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill