Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Benötige Hilfe bei Lc0 ...
1 2 Previous Next  
- - By Frank Quisinsky Date 2022-01-05 00:43 Edited 2022-01-05 01:15
Hallo zusammen,

hier gibt es ja nun einige Lc0 Fans.
Ich benötige eine gute Konfiguration für folgendes Szenario:

Auf einer RTX-3700 soll Lc0 mit voller Power gegen die TOP-41 antreten.
Die TOP-41 spielen mit einem Core.
Bedenkzeit ist 40 Züge in 20 Minuten, also ca. 1:20 Stunden Partien bei einem derzeitigen Zügedurchschnitt der TOP-41 von 89 Zügen ohne Aufgabefaktor.

Gibt es Parameter die ich bei Lc0 entsprechend anpassen muss, z. B. den NN-Cache.

Wenn ich einen Test-Run starte können bei der Bedenkzeit 16 Partien pro Tag gespielt werden.
Der Test-Run mit 1.200 Partien würde ca. 75 Tage laufen.

Mich interessiert persönlich die Leistung im Vergleich zur 1-Core CPU-Leistung.

Es wäre also super wenn mir die Lc0 Fans schreiben könnten ob ich bestimmte Parameter bei der Bedenkezeit anzupassen habe.
Bitte nicht auf das Lc0-Forum verweisen um dort zu fragen, dafür melde ich mich dort nicht an.
Lc0 ist und bleibt für mich eine Engine von vielen anderen, die ich einfach mal selbst abtesten möchte.

Für Hinweise wäre ich wirklich dankbar!

Viele Grüße
Frank

zusammengefasst

1. Welche der angebotenen GPU Versionen sollte ich nutzen (bei RTX-3700)
2. Muss ich zusätzlich noch einen oder zwei Cores der CPU geben?
3. Gibt es Settings, die ich bei der Bedenkzeit setzen muss, wie z. B. höherer NN-Cache etc?
4. Gibt es sonst irgend etwas bei der Konfiguration zu beachten?
5. Welches Netz?

Wenn die Konfiguration steht ziehe ich einen Core für die CPU-Gegner und evtl. 1-2 Cores, die ich für die die GPU Version evtl. zuzüglich nutzen sollte / müsste vom laufenden FCP-Tourney-KI ab.
Den gesonderten Test-Run kann ich mit einer Replay-Zone über meine Webseite einblenden. Die Ergebnisse gehen dann in die neue KI-Ratingliste ein.

Kommt die Grafikkarte auch mal zum Einsatz bevor sich Spinnenweben bilden.
Parent - - By Peter Martan Date 2022-01-05 08:57 Edited 2022-01-05 09:14
Frank Quisinsky schrieb:

1. Welche der angebotenen GPU Versionen sollte ich nutzen (bei RTX-3700)
2. Muss ich zusätzlich noch einen oder zwei Cores der CPU geben?
3. Gibt es Settings, die ich bei der Bedenkzeit setzen muss, wie z. B. höherer NN-Cache etc?
4. Gibt es sonst irgend etwas bei der Konfiguration zu beachten?
5. Welches Netz?

Ohne Fachmann zu sein (du hast dich ja an die Fans gewendet ):
1.Für Nvidia 3070 die Cuda- Version.
2.Bei mir hat sich automatisch für die 3070 (ti) 2 CPU- cores eingestellt.
3.NN- Cache ist default mit 200 Mb eher klein, für deine TCs würde ich vielleicht eine Null anhängen auf 2Gb, aber das soll vielleicht auch noch ein echter Fachmann korrigieren.
4.Fällt mir momentan nichts ein.
5.Das ist echte Geschmackssache, uups, Sache des second level support Such dir hier eins von den Neueren aus, die schon genug Testpartien haben:

http://training.lczero.org/networks/1

Edit: die Frage nach der "Leela- ratio" habe ich zuerst auch absichtlich unbeantwortet gelassen, vermuten würde ich aber, dass diese LC0- Installation auf dieser GPU bei SF zur Hardware- Chancengleichheit 4 gute CPU- Kerne (sagen wir 3.5GHz avx2-fahig) bräuchte. Abstinken wird SF auf einem solchen Kern aber auch nicht, die anderen Engines hingegen schon, außer vielleicht einer Riege aus Dragon, Ethereal, Fire, Revenge, Koivisto, SlowChess und RubiChess (Berserk vielleicht noch, naja, es sind schon einige andere NNUE- Engines auch dazu gekommen, die auf single core vielleicht schon irgendwie mithalten können, aber ich will dir ja nicht deine ganze neue Rangliste vorwegnehmen )
Parent - - By Reinhold Stibi Date 2022-01-05 09:23 Edited 2022-01-05 10:08
Hallo Frank,

für die starke RTX 3070 bräuchte man  für eine ausgeglichene Hardware (Leela-ratio) 12 echte Kerne von Intel oder AMD Ryzen (also nicht nur Threads).

Das ist doch auch verständlich wenn man die Prozessoren von GPU und CPU vergleicht.

Wenn man z.B. für Stockfish nur 4 Kerne einsetzt, dann ist das so als wenn man einen Leichtgewichtsboxer gegen ein Schwergewichtsboxer
antreten lässt.

Solche Matche mit so einer Ungleichheit bei der Hardware kannst du in die Tonne schmeißen.

Grüße
Reinhold
Parent - - By Reinhold Stibi Date 2022-01-05 10:52
Mit dem Vorschlag die Leistungsunterschiede zwischen GPU und CPU durch einheitliche kN/s auszugleichen
bräuchte man bei einer RTX 3070  und Lc0 im Vergleich zu Ryzen 3970X und Stockfish gleich 25 Kerne für Stockfish

Meine 2 RTX 2070 im Verbund sind etwa gleich zu setzen mit einer RTX 3070
und bringen in der Grundstellung nach 1 Min. und Lc0 v28.2 und 60er Netz 30 kN/s.

Mein Ryzen 3970X mit 32 Cores, reduziert mit Fritz GUI und Stockfish schaffen mit
25 Kernen/Cores ebenfalls 30.000 kN/s.
Parent - By Max Siegfried Date 2022-01-05 21:33
Reinhold Stibi schrieb:

Mit dem Vorschlag die Leistungsunterschiede zwischen GPU und CPU durch einheitliche kN/s auszugleichen
bräuchte man bei einer RTX 3070  und Lc0 im Vergleich zu Ryzen 3970X und Stockfish gleich 25 Kerne für Stockfish

Meine 2 RTX 2070 im Verbund sind etwa gleich zu setzen mit einer RTX 3070
und bringen in der Grundstellung nach 1 Min. und Lc0 v28.2 und 60er Netz 30 kN/s.

Mein Ryzen 3970X mit 32 Cores, reduziert mit Fritz GUI und Stockfish schaffen mit
25 Kernen/Cores ebenfalls 30.000 kN/s.


Jeder vergleicht anders.
Wer damals vier RTX 3080 gekauft hat (4x 730 Euro) und dazu eine AMD Threadripper CPU mit 32 echten Kernen (2190 Euro) + Mainboard 730 Euro, der kann jetzt entsprechende Vergleiche durchführen.
Parent - By Stefan Pohl Date 2022-01-05 11:51 Edited 2022-01-05 12:00 Upvotes 1
Reinhold Stibi schrieb:

Hallo Frank,

für die starke RTX 3070 bräuchte man  für eine ausgeglichene Hardware (Leela-ratio) 12 echte Kerne von Intel oder AMD Ryzen (also nicht nur Threads).

Das ist doch auch verständlich wenn man die Prozessoren von GPU und CPU vergleicht.

Wenn man z.B. für Stockfish nur 4 Kerne einsetzt, dann ist das so als wenn man einen Leichtgewichtsboxer gegen ein Schwergewichtsboxer
antreten lässt.

Solche Matche mit so einer Ungleichheit bei der Hardware kannst du in die Tonne schmeißen.

Grüße
Reinhold


Das ist im Prinzip korrekt. Ich habe mal die Berechnung der Leela-Ratio für neuere Stockfishe (mit NNUE und avx2) (ursprüngliche Leela-Ratio war mit SF 8) und Lc0 mit einem größeren T60-Netz (ursprüngliche Leela-Ratio war ein 20x256 Netz) "aktualisiert", damit man das einfacher berechnen kann... Da die T60 erheblich größer und damit langsamer sind, erhöht sich der Faktor von 875 auf ca. 1500. Also
Leela-Ratio ist somit: (Lc0 mit T60 Netz nps in der Grundstellung * 1500) / neuer Stockfish (nnue und avx2) nps in der Grundstellung
Hier sollte ein Wert von um die 1.0 herauskommen. Mit einer RTX 3070 ist das gegen singlecore CPU-Engines absolut unmöglich, selbst wenn man die RTX 3070 maximal runtertaktet. Einzige Möglichkeit für faire Verhältnisse wäre somit, die Bedenkzeit von Lc0 im Vergleich zu den CPU-Engines entsprechend soweit zu reduzieren, daß die Leela-Ratio stimmt. Ob das mit der Steinzeit Shredder GUI möglich ist (also unterschiedlich lange Bedenkzeiten in Turnieren), weiß ich allerdings nicht. Alternativ gibt es aber in den neuen Lc0 Binaries den Parameter "NodesPerSecondLimit". Damit ist es möglich die nps herunterzusetzen. Das ist dann zwar Ressourcenverschwendung, aber das sollte auf jeden Fall ermöglichen, die Leela-Ratio auf ungefähr 1.0 zu drücken.

(Bitte keine neue Diskussion über die Leela-Ratio, ich werde mich dazu jedenfalls nicht mehr äußern. Es ist aber ein Fakt, daß im TCEC (zumindest in den letzten Seasons) und auch beim CCC und in der FGRL-Rangliste und auch in meinen NN-Tests, eine Leela-Ratio von ca. 1.0 verwendet wird.)
Wollte nur mal eine Hilfestellung für aktuelle Leela-Ratio geben, ansonsten bin ich hier dann wieder raus.

PS: Im aktuellen FRC-final im TCEC läuf SF leider deutlich zu langsam (und Lc0 zu schnell)...Hier hat man z.Zt. eine Leela-Ratio von um die 5 (!!!), was wohl auch die Führung von Lc0 gegen SF erklärt...
Parent - By Lothar Jung Date 2022-01-05 09:17
Hallo Frank,

Peter hat Deine Fragen schon zutreffend beantwortet.

Ich werde zu  Tuningparameter, Netzauswahl, Chancengleichheit und Energieverbrauch bald (Hilfe-) Stellung nehmen.

Viele Grüße

Lothar
Parent - - By Lothar Jung Date 2022-01-05 10:03 Edited 2022-01-05 11:00
Hallo Frank,

jetzt zu Deinen Fragen:

1. GPU Hardware:

In den Tests auf Discord, von Stefan Pohl und SSDF werden folgende Nvidia GPUs eingesetzt:

Discord: RTX 3060 bis 3080; High-End z.B. TCEC 4x3080

Stefan Pohl: RTX 2060: https://www.sp-cc.de/view-sf-lc0-games.htm

SSDF: 3060 ti : https://ssdf.bosjo.net/

Bei längeren Testsuites setzte ich mein Notebook mit 8/16 Kernen/Threads und einer RTX 3060m ein.

Die Leistungsunterschiede kann man ziemlich genau mit der jeweiligen Bedenkzeit normieren.

Hier ein Beispiel:

**Hardware:** AMD Ryzen 9 5900X CPU @ 3.70GHz, 12 cores, 64GB, gpu RTX 3080, 10GB
**Gauntlet:** SF-dev vs. LC0 384x30b nets
**Network IDs:** J94-100, 607646, 607831, 607892, 607925, 607971, 607996, 608059, 608112, 608169, 608207, 608242, 608285, 608326, 608363, 608405, 608446, 608497, 608551, 608604, 608653, 608703, 608744, 608795, 608856, 608904, 608960, 690013, 609051, 609085, 609119, 609146, 609169, 609188, 609202, 609288, 609288, 609471, 609524, 609626, 609677, 609722, 609833, 609841, 609953, 609958, 609969, 609973, 609996, 610016, 610024, 610031, 610034, 610035, 610038, 610044, 610053, 610093, 610110, 610161, 610221, 610357, 610363, 610366, 610369, 610428, 610566, 610792, 610889, 611090
**LC0-version:** v0.27.0
**LC0-options:** minibatch-size=112, MultiGather=true, _zz suffix for zz4032 tune <https://discordapp.com/channels/425419482568196106/766262364949315614/911901584894615582>
**SF-version:** SF-dev 20120516
**SF-options:** 4 Threads, 512MB Hash
**Software:** Cutechess-CLI
**Time control:** LC0: 1,500 nodes/move, SF-dev: 500,000 nodes/move
**Book:** Chad's 8-ply book with 10000 positions, order=sequential
**Tablebases:** 6-men
**Adjudication:** -draw movenumber=50 movecount=5 score=8 -resign movecount=5 score=1000
**Ordo:** -a 0  -A "Stockfish.dev" -W -D -U "0,1,2,3,4,5,6,7,8,9,10" -s 2000 -n 1
**Comment:** The aim of the test is to order T60 nets. The order is considered sure with 99% CFS (a bit more than 5 Elo). CFS matrix and detailed results in 7z file.

```diff
   # PLAYER               :  RATING  ERROR    POINTS   PLAYED   (%)  CFS(%)       W       D       L  D(%)
   1 lc0.net.610566_zz    :    49.3    2.9
   2 lc0.net.610792_zz    :    49.1    2.9
   3 lc0.net.609958_zz    :    48.2    2.9
...
+ 26 lc0.net.611090       :    38.3    2.9   11061.5    20000    55      52    4820   12483    2697    62
...
  73 Stockfish.dev        :     0.0

White advantage = 55.34 +/- 0.18
Draw rate (equal opponents) = 65.01 % +/- 0.04
```
**PGN:**

Ein anderes Vorgehen ist, die Leistungsunterschiede zwischen GPU und CPU durch einheitliche kN/sec. auszugleichen.
Mit einer RTX 3070 liegt’s Du schon richtig. Vielleicht ist eine TTX 3060ti jedenfalls ausreichend und energiesparender.

2. Energieverbrauch:

75 Tage fast nonstop bei 100 - 300 Watt/Stunde, da kommt einiges an Stromkosten zusammen.
Durch das Tool nvidiainspector könnte man mit der Reduzierung von Volt und Taktfrequenz Strom sparen.

3. Netze

Du hast die Auswahl mit einem aktuell starken 30b oder einem 40b-Netz.
Tiefe gegen Genauigkeit.
Bei TCEC wird das Netz 610826 eingesetzt. Auf Discord auch das 40b Viren6-Netz 20000000.
hier: https://github.com/Viren6/lc0/wiki/40B-Net

Jedenfalls liegen bei beiden Netze gute Testergebnisse gegen SF vor.

4. Engine-Parameter

Auch hier das Du auch eine Auswahl zwischen den default und den getunten Parameter.

Hier die getunten Parameter mit der Testumgebung:

**Tune of search parameters II**
**LC0 version:** v0.28.0
**LC0 options:** Network: 610461, MinibatchSize=256, Backend=cuda-fp16, MoveOverheadMs=0, NNCacheSize=2000000, StrictTiming=true
**SF options:** SF 14.1, Threads=7, Hash=32, "Move Overhead"=0, SyzygyProbeDepth=10
**Tuning ranges:** CPuct: [0.5,2.5], CPuctBase [20000.0,60000.0], CPuctFactor [2.0,6.0], FpuValue [0.0,1.0], PolicyTemperature [1.0,2.0]
**Tuning configuration:** acq function: mes, 1350 iterations/6750 rounds/13500 games
**Hardware:** Ryzen 7 5800H (4.4GHz) + RTX 3070M
**Time control:** 27.0s/game+0.225s/move (LC0), 6.24s/game+0.052s/move (SF)
**Speed:** ≈10 Knodes/move (LC0)
**Book:** unbalanced 3-move book (60-90cp)
**Tablebases:** 6-man
**Adjudication:** 6-man TBs, -resign movecount=3 score=500, -draw movenumber=20 movecount=5 score=10
**Software:** chess-tuning-tools 0.8.1, Cutechess (restart=on)
**Comment:** Important changes to previous search tuning (https://discord.com/channels/425419482568196106/766262364949315614/786487743001001994) are a newer network and higher batchsize .
**Optimum found:**
```
                     tuned  default
CPuct             1.473   1.745
CPuctFactor    3.973   3.894
CPuctBase      45669   38739
FpuValue        0.279   0.330
PolicyTemperature 1.206   1.359``````
Parameter          Lower bound  Upper bound
-------------------------------------------
CPuct                      0.5          2.3
CPuctBase              21224.0      56612.0
CPuctFactor                2.1          5.5
FpuValue                  0.09         0.98
PolicyTemperature         1.04         1.92```**Test result:** https://discord.com/channels/425419482568196106/530486338236055583/913336444259561482

Hier die optimierte policytemperature:

**Tune of PolicyTemperature**
**LC0 version:** v0.28.0
**LC0 options:** Network: 610461, MinibatchSize=256, Backend=cuda-fp16, MoveOverheadMs=0, NNCacheSize=2000000, StrictTiming=true, CPuct=1.473, CPuctFactor=3.973, CPuctBase=45669, FpuValue=0.279
**SF options:** SF-dev, Threads=7, Hash=256, "Move Overhead"=0, SyzygyProbeDepth=10
**Tuning ranges:** PolicyTemperature [1.0,2.0]
**Tuning configuration:** acq function: mes, 125 iterations/625 rounds/1250 games
**Hardware:** Ryzen 7 5800H (4.4GHz) + RTX 3070M
**Time control:** 152.64s/game+0.636s/move (LC0), 31.68s/game+0.132s/move (SF)
**Speed:** ≈60 Knodes/move (LC0)
**Book:** unbalanced 3-move book (60-90cp)
**Tablebases:** 6-man
**Adjudication:** 6-man TBs, -resign movecount=3 score=400, -draw movenumber=20 movecount=5 score=10
**Software:** chess-tuning-tools 0.8.1, Cutechess (restart=on)
**Comment:** Tuning of PolicyTemperature with 4x TC with other search parameters values from previous tuning. Looks like optimal value of PolicyTemperature scales with TC.
**Optimum found:**
```
                         tuned (≈60Knodes)  tuned (≈10Knodes)   default
PolicyTemperature       1.295             1.206            1.359``````
Parameter          Lower bound  Upper bound
-------------------------------------------
PolicyTemperature          1.0         1.81```

Bei der minibatchsize würde ich 94 nehmen.
Moveoverhead den default Wert.
Backend: demux
BackendOptions:multi-gather=on

5. Eröffnungsbuch

Ich würde ein ausbalanciertes kurzes Buch, z.B. 4 - 8 Züge einsetzen.

6. Tablebases

6-Steiner

7. Remisadjucation

zur Spielverkürzung.

8. CPU-Kerne/Threads

Bei einer RTX 3060 8 Kerne, darüber mindestens 12 Kerne.

Verständnisfragen sind willkommen!

Viele Grüße

Lothar
Parent - - By Frank Quisinsky Date 2022-01-05 17:32 Edited 2022-01-05 17:46
Ein Wahnsinn, das war SUPER!
Ein Dank an allen Gleichgesinnten.

Werde das später am Abend oder Morgen ausprobieren.

Super viele Tipps und Hinweise, damit werde ich die Konfiguration hinbekommen.

Stefan Pohl hat ja schon geschrieben ... altertümliche GUI.
So Unrecht hat er da gar nicht mehr.

Daher ...

Bei der Shredder 12 GUI:
Gesetzte Lc0 (die CPU-Version) Parameter werden nicht angenommen.
Arbeite ich mit der lc0.config, setzte ich dort die Parameter die nicht angenommenen werden umgehe ich dieses Shredder GUI Problem.
Betrifft 5 der möglichen Parameter, 5 oder 4 sofern ich mich erinnere.
Daher habe ich immer die lco.config bei der CPU-Version im Lc0 Verzeichnis.

Bei der Shredder 13 GUI:
Augenscheinlich werden die gesetzen Parameter wie NN-Cache als Beispiel genommen.
Tatsächlich aber dann doch nicht bzw. auch wenn es korrekt angezeigt wird.
Betrifft 5 der möglichen Parameter.

Das Problem ist mir aufgefallen, als ich Parameter für Deuterium setzen wolle die auch nicht gegriffen haben.
Deuterium hat auch ein solch umfangreiches UCI-Parameter Menü.
Wahrscheinlich liegt es daran das nur eine gewisse Anzahl an UCI-Optionen möglich ist.

Das teilte ich Stefan auch schon vor mehr als einem Jahr mit (bei den Konfigurationen für das FCP-Tourney-2021 aufgefallen).

---

Damit Lc0 GPU dann läuft muss ich sehr wahrscheinlich wieder mit einer lc0.config arbeiten.
Bzw. die Tuning Tipps von Lothar sind genial und auch das schaue ich mir an.

Hoffe eine lc0.config funktioniert genauso bei der GPU Version wie bei der CPU Version?

Werde dann 2 Cores nutzen.
Beim Netz nehme ich das größere "wissensbasierte" weil die Bedenkezeit schon recht hoch ist.

---

Zu den Hinweisen von Lothar / Reinhold:

Bei einem wirklichen Vergleich muss ich natürlich z. B. Stockfish mehr Cores geben. Dachte 16 wären ausreichend aber es sind wie hier beschrieben sicherlich mehr. Aber, gar nicht mein Ziel. Mich beschäftigt das Thema "1-Core CPU Engines". Ich denke, dass bei der verwendeten Bedenkzeit auch die besten 1-Core CPU-Engines nicht so weit von Lc0 auf RTX-3700 wegliegen. Verdoppelung der Geschwindigkeit = x Elo (vor 3-4 Jahren vermuteten wir noch max. 50) ist durch NN nicht mehr. Ich denke das z. B. die aktuelle Stockfish Version auf nur einem Core keine 80 Elo von Lc0 auf RTX-3700 mit voller Power entfernt liegt. Ich denke auch, dass Stockfish und Lc0 ca. auf einem Level +-20 sind. Das zeigen uns ja auch die Testergebnisse.

Insofern reizt es mich enorm, Lc0 0.28.2 RTX-3700 mit voller Power gegen die TOP-41 1-Core Engines antreten zu lassen.
Meine, ich habe die Wahrheit natürlich auch nicht gefressen und musste schon oft korrigiert werden / zurückrundern aber irgendwie ...

Wir können ja Wetten abschließen!

Ich sage:
Stockfish 31122021 NN 1Core ist max. 80 Elo schwächer als Lc0 auf RTX-3700 2 Cores mit voller Power bei einer Bedenkezeit von 40 Züge in 20 Minuten.
NN Wert wie hier beschrieben passe ich an, Stockfish hat 768Mb für Hash.

--

Nochmals vielen Dank!!
Wenn die Konfigurdation steht stelle ich die in diesen Thread.
Werde spätetestens am Wochenende den externen Test-Run konfigurieren und mit Replay-Zone auf meiner Startseite einblenden.
Lc0 0.28.2 2Cores + GPU RTX-3700 ... 30 Partien gegen jede der TOP-41 Engines (natürlich nicht gegen Lc0 0.28.2 CPU).

Gebe dann auch eine kurze Rückmeldung wenn alles läuft.

Wenn ich die neue Ratingliste schon "KI-Ratings" taufe muss auch KI drin sein.
Sonst habe ich mir wieder selbst ein Ei gelegt.



Viele Grüße
Frank
Parent - - By Frank Quisinsky Date 2022-01-05 23:30 Edited 2022-01-05 23:38
Hallo,

also, so interessant die Spezial-Settings von Lothar sind (die habe ich mir natürlich gesavt und werde die gleich bei ein paar gesammelten Test-Stellungen ausprobieren), bin am hin- und herüberlegen.
Habe mit Jörg Burwitz telefoniert, der mir seit geraumer Zeit auch immer hilfreiche Tipps gibt. Wenn ich mich immer nur mit 1-Core CPU beschäftige gehe ich auch nicht gerade immer mit der Zeit.
Allerdings perfekt zum Austesten der reinen Spielstärke (dabei bleibe ich).

Bei dieser von mir genutzten Bedenkzeit kann ich nicht experimentieren wenn ein Test-Run 75 Tage läuft.

Einzig was ich machen kann ist:

v0.28.2 GPU

- NN-Cache anheben
- mich auf die zuverlässigen Arbeiten von Stefan Pohl verlassen und das von Stefan getestete beste Netz nehmen anstatt Netz was beiliegt.

Alles andere auf Standard belassen, auch die 2 CPU-Cores!
Hinsichtlich öffentlicher Testarbeit vertraue ich absolut bei der Netz Frage auf Stefan!
Der hat davon so viel Ahnung und Erfahrung davon wie ich von meinem Fahrrad. Bei dem komplizierten Teil ist mir auch keine Schraube unbekannt.
Meine lockeren Schrauben kenne ich natürlich fast alle.



Eier ist hier rum, kann ich alles nach wenigen Wochen wieder in den Müll werfen und dafür wird der Test-Run zu teuer (Stromverbrauch).

Werde weiter probieren, denke ich kann in 1-2 Tagen starten.
Melde mich wieder ... bin froh wenn die Grafikkarte jetzt auch mal zum Einsatz kommt bzw. ich selbst austesten kann ob Lc0 bei voller Power taktisch
eher schwächer nach den Eröffnungszügen im frühen Mittelspiel bleibt und wie stark der Übergang zum Endspiel im Vergleich zu Stockfish
ist. Kann mir nicht vorstellen dass Lc0 zu einem taktischen Monster in der frühen Partiephase wird wie es z. B. Stockfish ist.

Viele Grüße
Frank
Parent - - By Lothar Jung Date 2022-01-06 15:06 Edited 2022-01-06 15:13
Hallo Frank,

das Du Dich an die Test-Tuniere von Stefan Pohl orientierest ist gut.
Die Leela-Ratio ist in Ordnung, wenn auch nur wegen der Vergleichbarkeit.

Bei den unterschiedlichen Netzgrößen 20b, 30b, 40b, 60b und Netz 78 gibt es absteigende kN/sec-Werte bei gleicher Hardware.
Verändert man Hardware und/oder Netz ergeben sich halt unterschiedliche Leela-Ratios.

Der NN-Cache muß jedenfalls bei längeren Bedenkzeiten erhöht werden.
Die minibatchsize ist abhängig von der Hardware. Er läßt sich durch den Konsolenbefehl „backendbench“ Netz- und Hardwarespezifisch ermitteln.
Die getunten Parameter werden bei Tunieren regelmäßig eingesetzt, so auch der Parameter „multi-gathering=true“ und 6 TBs.

Hier ist halt vieles anders als bei Stockfish.
Auch bei den Eröffnungsbücher. Leela hat wegen seiner Netzpolicy KI-bedingt ein „Buch“.
Ob kein/kurzes-ausgeglichenes Buch oder „spezielle“ Bücher einsetzt werden, hat größere Auswirkungen.

Viele Grüße

Lothar
Parent - - By Frank Quisinsky Date 2022-01-06 15:48 Edited 2022-01-06 15:55
Hallo Lothar,

bin dran, aber ich muss zunächst mal das 610062 Net finden.
Was für ein unaufgeräumtes Durcheinander, blicke da überhaupt nicht durch.

Wird schon ...

Ah, habs schon ...
Aus einer Liste einer Auswahl von unendlichen Nets.
https://training.lczero.org/networks/?show_all=1

Und diese ganzen Nets haben je meist über 30.000 Partien gespielt?
Nun ja, mit 1+1 und so Scherze geht das natürlich schnell.
Das man sich dafür begeistern kann, da geht es doch gar nicht mehr ums zusehen, kann kein Mensch folgen.

Soll mir egal sein ...

Könnte natürlich auch das Standard Netz nehmen, was beiliegt.
Sind die Ergebnisse bei längeren Bedenkezeiten nicht so wie erwartet schreien alle, Frank das Netz ist überholt.
Du hättest dieses oder jenes testen müssen.

Das sind so Geschichten die mich eher abschrecken.
Aber nun gut, nehme das Netz und gehe durch die User-Hölle.

Gruß
Frank
Parent - By Lothar Jung Date 2022-01-06 17:50
Hallo Frank,

Du wählst ein Netz beim o.a. Link aus.
Es gibt 61xxxx, 77xxxx und 78xxxx Netze.
Die 77er Netze sind für schwache Hardware, CPUs.
Die 78er Netze sind die neuen großen 40b-Netze.

Dich interessieren nur die 30b 61er Netze.
In der Liste haben sie die langen Nummern, beim Runterladen wird daraus ein weigths Netnummer gz File, den Du in den Lc0-Ordner kopierst. Lc0 lädt immer das aktuellere Netz.

Die Netze die bisher gut abgeschnitten haben, sind in deinem erwähnten Link markiert.

Grüße

Lothar
Parent - - By Lothar Jung Date 2022-01-06 17:55
Keinesfalls das default Netz nehmen!!!!

Es ist da drin, da es auf jeder Hardware läuft.

Es ist ein kleines 10b Netz.
Parent - - By Frank Quisinsky Date 2022-01-06 18:18 Edited 2022-01-06 18:29
Hi Lothar,

OK, also
Lc0 0.28.2 611062 GPUcuda
läuft.

Gebe ich z. B. in der Grundstellung: 1. h3 bei 40 Züge in 20 Minuten ein, sehe ich 18.700 n/s
Gebe ich z. B. in der Grundstellung: 1. d3 bei 40 Züge in 20 Minuten ein, sehe ich 19.200 n/s

Ob das nun schnell ist oder nicht kann ich nicht beurteilen.
Benutze ja eine RTX-3700-Ti

Geändert habe ich nur ...
Netz umbenannt in 611062.pb.gz und das Standard Netz aus dem Verzeichnis gelöscht.
lc0.config in das Verzeichnis hinzukopiert (weil sonst erkennt Shredder einige Parameter nicht).

In meiner lco.config steht:

--threads=2
--nncache=2000000
--show-hidden
--syzygy-paths=c:\Chess\_syzygybases-5

Aus nncache=200000 ein nncache=2000000 gebastelt.
Mehr habe ich nicht verändert.

Dann werde ich jetzt mal den Test-Run konfigurieren.
Fling-Plus (FTP-Client) auf den AMD Rechner installieren.
Die Replay-Zone von "firefather" kopieren und konfigurieren.
Alle Links auf die Webseite einblenden.
Und vor allem den geposteten Link zu den Nets noch in meine Engine Rubrik aufnehmen.
Das kann ein paar Stunden dauern, bin heute nicht so schnell.

Bei 40 Züge in 20 Minuten werden täglich 16 Partien gespielt.
Wie gesagt, dass wird 75 Tage laufen bis 1.200 Partien durch sind.

Dann schaun wir uns mal die Ergebnisse an!
Werde dann später Lc0 auch gegen neuere Engines spielen lassen (wie z. B. Hiarcs 15.0, vorerst nur gegen die TOP-40 die aktuell im Turnier sind).

Gruß
Frank

PS: Hatte noch mit Jörg Burwitz telefoniert der mir auch noch einige Sachen erklärt hat.
Also Lc0 im Spießroutenlauf gegen die TOP-40 CPU Engines mit 1-Core!
Das kann heiter werden und es wird schnelle Verlustpartien gegen die 1-Core CPU Engines hageln.
Traue dem Teil taktisch nach Infos die mir von einigen vorliegen wenig zu.
Allerdings wird Lc0 bei weniger Figuren aufdrehen.
Meine persönliche Einschätzung vor dem Test-Run ist: Keine 60 Elo stärker als Stockfish 31122021 mit einem Core, eher noch deutlich weniger ... vielleicht 30 Elo mehr.
Parent - - By Lothar Jung Date 2022-01-06 18:32
Du solltest die default minibatchsize=256 noch ändern.
Für Deine GPU dürfte ein Wert von 94 - 128 optimal sein.
Das kannst Du von der Konsole mit Lc0 und dann mit dem Kommando „backend bench“ von 1 - 256 den besten kN/sec. ermitteln.

Als Backend solltest Du „demux“ wählen.

Lothar
Parent - - By Frank Quisinsky Date 2022-01-06 19:11 Edited 2022-01-06 19:15
Hallo Lothar,

muss immer aufpassen bei Parameter-Änderungen.
Shredder GUI versteht nur max. 80 Parameter (siehst Du in ucidebug).
Die, die nicht genommen werden aus den UCI Parameter sind versteckt.

1. Habe auf "Demux" per UCI-Optionen umgestellt, der Parameter hat gegriffen.

Hier die *.eng der Engine-Konfiguration:

[ENGINE]
Name=Lc0 0.28.2 611062 GPU
Author=the LCZero Authors
Filename=C:\Chess\Shredder_12\Engines\Lc0-GPU-cuda\lc0.exe
[OPTIONS]
Backend=demux

2. Habe Minibatch drin ...

--threads=2
--nncache=2000000
--minibatch-size=253
--show-hidden
--syzygy-paths=c:\Chess\_syzygybases-5

backendbatch im Consolenmode gibt aus: 11154.4 (höchster Wert) ist 253
Also setze ich minibatch-size=253

Übrigens, werden alle Parameter aus der "lco.config" richtig gesetzt wenn ich über ucidebug beim Laden in der Shredder GUI prüfe.

Nun sollte alles korrekt sein, oder?

Viele Grüße
Frank
Parent - - By Lothar Jung Date 2022-01-06 19:21
Hallo Frank,

sieht schon mal gut aus.
Ist MultiGather on? Das beschleunigt um Einiges.

kN/sec. Müßte höher sein.

Die optimierten zz-Parameter verbessern die Qualität der Engine.

Dies kann man mit einer Testsuite prüfen, am besten mit HTC114.

Grüße

Lothar
Parent - - By Frank Quisinsky Date 2022-01-06 19:27
Hi Lothar,

Watt für nen Ding ...
MultiGather?

Ah, MultiGather (was immer das ist) ... also da ist ein Häckchen drin.

Vielleicht ist kn/sec niedriger wegen dem verwendeten Netz?
Lasse jetzt alles so!

Und mache mich mal an die restliche Arbeit um den Spießroutenlauf zum Laufen zu bringen.

Hoffe Lc0 stürzt nicht ab wenn zu viele Partien schnell verloren werden.
Traue dem Teil immer noch nicht.

Mehr als 80 Parameter?!
Die Lc0 Leute scheinen nichts zu tun zu haben.
Ist der Rasen schön grün ...

Gruß
Frank
Parent - - By Lothar Jung Date 2022-01-06 19:33 Edited 2022-01-06 19:35
Es ist gut, wie Du die Sache angehst.

Schritt für Schritt, mit Rückschlägen.
Aber damit lernt man am besten.

Lc0 ist ein neues Terrain.
Aber es macht Spaß.
Das Teil hat Charakter.

Viele Grüße und Spaß

Lothar

Lass in doch mal gegen Wasp laufen.
Da siehst Du am besten, wie Leela sich schlägt.
Parent - - By Frank Quisinsky Date 2022-01-06 19:38
Hallo Lothar,

da hast Du Recht!!

Habe den Spießroutenlauf schon gestartet.
Muss mal schauen wie ich das jetzt auf die Webseite bringen.

Wird ein wenig dauern.
Lc0 wird nun zunächst mal von Andscacs zertrümmert, oder umgekehrt ... mal schauen.

Vielen Dank nochmal!

Gruß
Frank
Parent - By Frank Quisinsky Date 2022-01-06 20:15
Hi Lothar,

nochmal mit Jörg Burwitz gesprochen.

Backend=demux sollte ich wieder raus holen und auf Standard belassen.

Der Parameter:
minibatch-size
Sollte durch 8 teilbar sein und keinesfalls so hoch stehen.
Der schnellste ist nicht der Beste Wert.

Es beginnt über 10.000 ns zu laufen bei ca. 110.
Bleibt dann recht beständig.
Habe den Wert von 253 auf 128 geändert.

Und das erste Match gegen Andscacs aus dem Spießroutenlauf neu gestartet.

Gruß
Frank
Parent - - By Frank Quisinsky Date 2022-01-06 16:32


Das Netz 610062 ist aber keine Datei wie z. B. das Standard Netz: 752187.pb.gz?
Im Grunde irgend etwas ohne Dateiendung und 137Mb groß!

Da blicke ich überhaupt nicht durch.

Offenbar muss ich auch diese 2.6Gb Cuda Horror Datei installieren?
Parent - - By Frank Quisinsky Date 2022-01-06 16:37
Von wegen Böhmische Dörfer ...
Dat sind Böhmische Ozeane!!
Parent - - By Frank Quisinsky Date 2022-01-06 17:33 Edited 2022-01-06 17:36
OK,
Die Datei mit den langen Dateinamen muss einfach in Netzname.pb.gz umbenannt werden.

Die guten Netze finden sich offenbar hier:
http://zz4032.bplaced.net/lc0/charts.html

Und die NVidia Setup Datei muss auch nicht installiert werden, weil die maßgeblichen *.dll Dateien im lc0 Download sind.

Soweit so gut ...
Mal weiter schauen ...

Ein heilloses Durcheinander, da blickt niemand der damit starten will durch.

Sofern ich das richtig überblicke ...
Scheint 611002 insteressanter zu sein als 610062, wobei sich da ja kaum etwas regt.
Wenige Elo+ im letzten Jahr, insofern ist das Netz bei längeren Bedenkzeiten gar fast egal.
Parent - By Lothar Jung Date 2022-01-06 18:23
Die Eloangaben sind SelfElo-Werte, sie geben nur einen relativen Verlauf wieder, sagen aber nicht immer was über die Spielstärke aus.
Die beste Netze werden in Tests auf Discord ermittelt.
Als Anhaltspunkt kann das dienen, da neuere Netze mit einem hohen EloWert potenziell besser sind,  aber das müssen sie in Tests beweisen.
Parent - By Lothar Jung Date 2022-01-06 17:52
Die Cuda dlls sind in der Lc0 28.0/28.2 Cuda Installationsdatei schon enthalten.
Parent - - By Clemens Keck Date 2022-01-06 19:47 Upvotes 3
Hallo

ich habe das Gefühl, je mehr geschrieben wird, um so unklarer wird es, auch wenn von den "tollen Informationen" gesprochen wird.
Warum die Sache nicht ganz einfach halten?!
Warum mit experimentellen Parameter spielen, obwohl man keine Ahnung darüber hat?
zB minibatchsize ist GIFT wenn sie nicht an der eigenen GPU ermittelt wird.

Lass doch das Ding so spielen, wie es die Entwickler voreingestellt haben !
Lc0_v-28.2 herunterladen.
https://github.com/LeelaChessZero/lc0/releases/download/v0.28.2/lc0-v0.28.2-windows-gpu-nvidia-cuda.zip
Da ist alles drin was man braucht. ALLES ! bis auf das Netzwerk. da ist zwar auch eines dabei, aber bitte eines aus der T60 Reihe herunter laden.
T 60er Netze:
https://training.lczero.org/networks/?show_all=0
am besten das 611062  (weit runter scrollen) "speichern unter" dann geht das mit dem download.
Das alles in einen Ordner.
eine lc0.config anlegen. dort werden die Parameter für Lc0 hinterlegt. TB-Pfad anpassen.
--threads=2
--nncache=20000000
--move-overhead=5000
--backend-opts=multi_stream=true
--syzygy-paths=E:\syzygy-5;E:\6-wdl;E:\6-dtz

fertig.

C.K.
Parent - - By Frank Quisinsky Date 2022-01-06 19:54
Hi Clemens,

habe ich doch ...
An der eigenen GPU ermittelt.
Gibt 253 aus.

Und die lco.config ist sehr wichtig, weil nochmals ...
Mehr als 80 UCI Paramenter und Shredder GUI muss passen.

Die lco.config ist der UCI-Konfiguration under der Shredder GUI vorgeschaltet und kann das Problem umgehen.
Das Netz 611062 habe ich ja auch drin.

Also, es läuft alles wirklich wunderbar.

Schaue mal ...

Nee, läuft nicht so gut.
Bewertung von Lc0 gegen Andscacs geht irgendwie immer höher.
Da muss ein Bug in Andscacs sein (erste Partie vom Spießroutenlauf).

Gruß
Frank
Parent - - By Clemens Keck Date 2022-01-06 20:10
80 UCI Parameter für Lc0?
Du wirst doch nicht 80 parameter eingetragen haben ?
Alle LC0 Parameter sind default voreingestellt.
Nur Abweichungen müssen in die Lc0.config.

Frank Quisinsky schrieb:

Hi Clemens,

habe ich doch ...
An der eigenen GPU ermittelt.
Gibt 253 aus.

Und die lco.config ist sehr wichtig, weil nochmals ...
Mehr als 80 UCI Paramenter und Shredder GUI muss passen.

Die lco.config ist der UCI-Konfiguration under der Shredder GUI vorgeschaltet und kann das Problem umgehen.
Das Netz 611062 habe ich ja auch drin.

Also, es läuft alles wirklich wunderbar.

Schaue mal ...

Nee, läuft nicht so gut.
Bewertung von Lc0 gegen Andscacs geht irgendwie immer höher.
Da muss ein Bug in Andscacs sein (erste Partie vom Spießroutenlauf).

Gruß
Frank
Parent - By Frank Quisinsky Date 2022-01-06 20:23 Edited 2022-01-06 20:28
Hallo Clemens,

hast mich missverstanden.

Die Shredder GUI kann maximal 80 UCI Parameter verwalten.
Lc0 hat ein paar mehr.

Insofern werden z. B. voreingestellte Standardwerte wie nncache nicht erkannt.
Daher die lc0.config.

Hier habe ich 5 Parameter gesetzt, weil die Standardparameter der Shredder GUI nicht erkannt werden.
Config Dateien werden vor den UCI-Parametern bei der Shredder-GUI abgefragt.

Hier nochmals die lc0.config:

--threads=2
--nncache=2000000
--minibatch-size=128
--show-hidden
--syzygy-paths=c:\Chess\_syzygybases-5

Diese Parameter mus sich leider setzen.
Oder lco spielt z. B. komplett ohne nncache.

Schaue ich in ucidebug der Shredder GUI sehe ich das diese Parameter durch die lco.config auch korrekt abgefragt wurden.

Ist nicht nur Lc0.
Auch das Programm von Ferdi (Deuterium) hat mehr als 80.
Gleiches Problem mit dem Unterschied ... Deuterium hat keine config Datei.
Insofern kann ich letzte Version nicht korrekt testen, weil Standardparameter fehlen.
Deuterium spielt dann ca. 200 Elo schwächer.

Habe nicht ohne Grund Stefan die ganzen Bugs vor mehr als einem Jahr gemailt.
Aber ein Update kommt ja nicht.

Gibt noch andere Dinge in der GUI die wirklich unbedingt mal gefixt werden müssen.
Habe ich alles schon x-mal geschrieben ...

Gruß
Frank
Parent - - By Frank Quisinsky Date 2022-01-06 21:47 Edited 2022-01-06 22:08
Hallo zusammen,

der Spießroutenlauf läuft:

Die LIVE-Links und die Replay-Zone ist eingerichtet.
Wird wie beschrieben über 70 Tage laufen, am Tag ca. 16-17 Partien.
Eine Partie läuft bei 40 in 20 ohne Aufgabefaktor ca. 1 Stunde, 20 Minuten.

Frank's Chess Page:
https://www.amateurschach.de

Viele Grüße
Frank
Parent - - By Wolfgang Battig Date 2022-01-06 21:59
Warum schreibst Du eigentlich konstant RTX3700ti?
Parent - - By Frank Quisinsky Date 2022-01-06 22:01 Edited 2022-01-06 22:17
Shit, hast Recht.
Ehrlich, weil mir die Grafikkarten nicht so wichtig sind und ich auf die genaue Bezeichnung noch nie so genau geachtet habe.
Muss das auf der Webseite ändern.

Daran erkennst Du wie egal mir eigentlich Computerschach auf Grafikkarten ist, weil ich darin keinen wirklich Sinn erkennen kann.
Den Test hatte ich aber beim Start vom FCP Tourney-2022 angekündigt und ziehe das jetzt einfach durch.

Interessant für mich ist eigentlich nur der tatsächliche Spielstärke Abstand zu 1-Core Engines und ob sich irgend etwas wichtiges
zu Spielstileigenschaften ergibt. Nach geprüften Partien kann ich das zwar nicht erkennen aber nun gut.

Danke für den Hinweis!
Genug Schach für heute, kein Bock mehr.
Parent - - By Frank Quisinsky Date 2022-01-07 08:31
Hallo,

noch ein Hinweis zum Test-Run (Spießroutenlauf).
Der läuft ohne Elo-Angaben, weil ich diese zur Zeit noch nicht habe.
Die füge ich in ca. 20 Tagen ein.

Um die Spielstärke von Stockfish 311221 NN auf einem Core zu erreichen braucht Lc0 0.28.2 GPU auf dieser komischen RTX Karte ca. 82-84%.
1% sind ca. 7 Elo. Um nur 30 Elo besser zu sein als Stockfish mit einem Core wird also ca. 86-88% benötigt.

Genau das kann ich mir nicht vorstellen.
Habe die Hype um Lc0 noch nie verstanden aber ich lasse mich gerne eines Besseren belehren.

Nochmals vielen Dank den ganzen Helfern.
Gelernt habe ich mal wieder, dass die Ansichten zu den Einstellungen unterschiedlich sind.

Bin froh das die Grafikkarte nun mal zum Einsatz kommt.
Benötige die zwar für andere Dinge aber derzeit habe ich für diese "anderen Dinge" eh keine Zeit.

Viele Grüße
Frank
Parent - - By Lothar Jung Date 2022-01-07 13:42
Hallo Frank,

wie siehst aus?

Mich würden insbesondere die taktischen Verlustpartien und die Gewinne mit Schwarz bei Lc0 interessieren.

Natürlich ist SF mit einem Kern mit NNUE nicht leicht zu schlagen.

Jedenfalls kannst Du die Kernanzahl der A/B-Engines erhöhen.

Die RTX 3070 ti ist eine gute Grafikkarte für Lc0. Eine RTX 3080 ti kannst Du mit einer Erhöhung der Bedenkzeit emulieren.

Viele Grüße und viel Spaß am Tunier

Lothar
Parent - By Reinhold Stibi Date 2022-01-07 13:55 Edited 2022-01-07 14:10
Ein sehr ungleiches Match von der Hardware. Stockfish müsste von der Hardware 16 echte Kerne
gegen eine RTX 3070Ti bekommen.
Das Ergebnis ist nur ein Experiment und besagt überhaupt nichts von der Spielstärke.
Unter Umständen blamiert sich Lc0 und der RTX 3070Ti mit der weit überlegenen Hardware
So ein Match ist unter sportlichen Bedingungen nicht fair und kann nur der Belustigung dienen;
aber vielleicht kommen da ja interessante Partien heraus wenn Goliath gegen David spielt.
Parent - - By Frank Quisinsky Date 2022-01-07 15:16 Edited 2022-01-07 15:36
Hi Lothar,

kannst Du live verfolgen.
Partien (PGN) herunterladen, online Nachspielen oder nur den aktuellen Stand hinsichtlich Ergenisse mittels Tabelle zum Spießroutenlauf.

Siehe die unteren 3 Live Links auf https://www.amateurschach.de

11 Partien sind rum.
5x remis und 6x gewonnen.
3 der 6 gewonnenen Partien wurden sehr druckvoll gewonnen.

Um wirklich nur 30 Elo besser zu sein als Stockfish auf einem Core müssten ca. 88% her.
Derzeit hat Lc0 72,73%.

Auch für Reinhold ... Du darfst nie vergessen, dass die Zeiten bei denen vielen Cores die Programme enorm puschen durch NN schon lange vorbei sind.
Das ist heute Geschichte, erst Recht wenn nicht geblitzt wird. Klar sind mehrere Cores besser aber auf dem hohen Niveau und NN fällt z. B. eine
einfache Verdoppelung oder 4Cores zu einem Core kaum noch ins Gewicht im Vergleich zu früher.

Wenn Stockfish bei gleicher Hardwareleistung ca. 50 Elo stärker ist, braucht Lc0 eine enorme Leistung um dann wieder 30 Elo stärker als Stockfish zu sein.
Mehr als 1 Core für eine Engine im Computerschach einzusetzen ist wirklich Ressourcenverschwendung, lieber analysieren mit vielen Engines.
Und ob Lc0 nun eine RTX 3070-Ti (Wolfgang habe aufgepasst) hat oder eine RTX 3090-Ti oder 4 RTX 3900-Ti ... das sind kaum relevante
Unterschiede.

Das schreibe ich schon viele Jahre.
Für einige hier wird dieser Test-Run sehr ernüchternd sein.
Das ist gut, weil dann viele unnötige Diskussionen endlich mal verblassen.

Schaun wir mal wie es weiter geht aber ungleich ist dieser Vergleich nicht, sondern meines Erachtens zeitgemäß und genau richtig für Lc0.

Viele Grüße
Frank

PS: Wird dauern um mehr sagen zu können, die Partien gegen Komodo ging an die 300 Züge und dauerte viele Stunden bei 40 Züge in 20 Minuten.
Und erst Recht wenn die TOP-41 drin sind. Die können richtig geiles Schach spielen und Remispartien wird es gegen die "Schwächeren" hageln.
Das treibt die Elo enorm nach unten, dieses Problem hatte auch Stockfish beim FCP Tourney-2022. Wird Lc0 nicht anders ergehen.
Parent - - By Frank Quisinsky Date 2022-01-07 15:45
Mal geschaut ...
Die laufende Partie gegen Fire wird auch Remis.
Fire hat einen Bauern mehr im Endspiel (T und 2B - T und 1B) wird aber nicht gewinnen können.

Fire hat übrigens bessere Endspiel Statistiken beim FCP Tourney-2022 gehabt als Stockfish oder Dragon nach 1.200 Partien.
Und Dragon bessere als Stockfish im Übergang zum Endspiel (war aber immer so).
Stockfish hingegen unglaubliche Statistiken bei vielen Figuren auf dem Brett, ein Monster!!

Also in Partie 12 ein Remis und die die 72,73% nach 11 Partien fallen weiter.
Aber ich bin ganz zuversichtlich das es mindestens 82% werden.
Nach so wenigen Partien kann man nun wirklich nichts sagen.
Parent - - By Reinhold Stibi Date 2022-01-07 21:13 Edited 2022-01-07 21:16
Frank,
viel Spaß mit deinem Turnier.
Natürlich spielt Stockfish auch mit 1 Core sehr gut.
Nur 1 zu 16 Core dürften nach meiner Schätzung  80 Elo ausmachen und bei einem Hardware
ausgeglichenem Match (oder Turnier) dürfte Stockfish 50, eher 80 Elo besser sein als Lc0.
Bei 16 zu 32 Core oder 32 zu 64 Core sind die Unterschiede viel geringer.
Werde demnächst ein Turnier mit Lc0 mit 2 RTX 2070 im Verbund (entspricht einer RTX 3070er) und bestem 60er Netz
gegen neuestem Stockfish und anderen Engines mit Ryzen 3970X und 16 Cores durchführen. Zeit pro Partie 5 Min. + 1 Sek.  und Stefan Pohl
4 Züge Vorgabebuch.
Das dürfte die aussagekräftigsten Ergebnisse bringen; viel besser als mit Super-Hardware mit der fast niemand spielt.

Grüße
Reinhold
Parent - - By Benno Hartwig Date 2022-01-07 22:47

> Nur 1 zu 16 Core dürften nach meiner Schätzung  80 Elo ausmachen


1 zu 16 Core bedeutet 4 mal Verdopplung der Kerne.
Sind wir so weit, dass eine Kernverdopplung nur noch 20 Elo ausmachen?

<vertraeumtGucken>Als ich in den 80ern begann, mich für Computerschach zu interessieren, wurde noch ca. 70 Elo für eine Geschwindigkeitsverdopplung geschätzt.</vertraeumtGucken>
Parent - By Hauke Lutz Date 2022-01-07 22:54
Eher gestaffelt, aber das sollte passen.
Parent - - By Detlef Uter Date 2022-01-07 23:26
Naja, ich hatte mal noch vor NNUE-Zeiten einen Test gemacht
mit 7 Threads gegen 28 Threads bei sonst gleichen Bedingungen.

Und da kamen nur popelige 17 ELO Zuwachs bei einer
Vervierfachung  der Rechenleistung raus! 
Parent - - By Reinhold Stibi Date 2022-01-07 23:49
Am meisten bringt eine Kernverdoppelung von 1 zu 2 Kernen, dann 2 zu 4 Kernen
und dann wird es immer weniger von 4 auf 8,  8 auf 16, 16 auf 32, 32 auf 64.

Machst Du gerade Pause auf Schach. de ?  ist man gar nicht gewohnt.

Parent - By Detlef Uter Date 2022-01-08 00:35
Gut beobachtet lieber Reinhold.

Aber ich nehme auf meinem System leichte Umstrukturierungen vor,
wobei ich mein Netzwerk stark beanspruche, weil ich dort z. Z.
bis zu fünf Kopiervorgänge gleichzeitig am laufen habe, und
deshalb keine Server-Verbindungsabrüche riskieren will.

Lg
Detti
Parent - By Benno Hartwig Date 2022-01-08 00:35

> Am meisten bringt eine Kernverdoppelung von 1 zu 2 Kernen, dann 2 zu 4 Kernen und dann wird es immer weniger von 4 auf 8,  8 auf 16, 16 auf 32, 32 auf 64.


Andreas Strangmüller hatte dazu mal sehr interessante Experimente gemacht:
http://www.fastgm.de/threads5.html

Die Grafik ganz unten dort läßt vermuten
- dass deine These bis einschleßlich Stockfish 6 wohl passt
- dass aber ab Stockfish 7 jede Thread-Verdopplung (bis 16) ziemlich genau den gleichen Nutzen (Elo-Steigerung) hat.
Ok, oberhalb von 16 mag sich der jeweilige Elo-Gewinn trotzdem verringern. Vielleicht.
Parent - - By Benno Hartwig Date 2022-01-08 00:27
Dann ist der Hardware-Einsatz bei TCEC zwar irgendwie faszinierend, aber auch irgendwie doch unsinnig.
Hmmm.
Parent - By Frank Quisinsky Date 2022-01-08 09:18
Hi Benno,

ich erlaube mir ein "Bravo" zu setzen.
Erkannt ...

Die ernorme Hardwareleistung dort blendet und die Werbung nervt.
Und jeder kann interessante Dinge selbst feststellen, dafür wird kein TCEC benötigt.
Partien am heimischen PC zu verfolgen, selbst der Herr über das zu sein was man sehen möchte, ist viel schöner.

Und das alles geht auch mit deutlich langsamerer Hardware, weil die im Grunde fast egal ist.
Jedes aktuellere Standardsystem offenbart uns enorme Elo Ausgaben bei den Engines.

Zugegeben, die Darstellung der Partien, die Chat-Möglichkeit ... da steckt sicherlich auch sehr viel Arbeit bei TCEC.
Einiges ist natürlich sehr gut umgesetzt, unzweifelhaft.

Aber dieses Turnier sagt im Grunde aufgrund der wenigen Partien nichts aus.
Die Eröffnungsvorgaben sind mehr als nur zweifelhaft.
Gibt so viele Gründe warum mich TCEC noch nie interessiert hat.

Gruß
Frank
Parent - - By Andreas Mader Date 2022-01-07 23:31
Benno Hartwig schrieb:

Sind wir so weit, dass eine Kernverdopplung nur noch 20 Elo ausmachen?

<vertraeumtGucken>Als ich in den 80ern begann, mich für Computerschach zu interessieren, wurde noch ca. 70 Elo für eine Geschwindigkeitsverdopplung geschätzt.</vertraeumtGucken>


Eine Kernverdopplung ist nicht das selbe wie eine Geschwindigkeitsverdopplung.
Parent - - By Benno Hartwig Date 2022-01-08 00:25
Das weiß ich, aber es geht in die selbe Richtung.
Ein Kernverdopplung mag vielleicht 80% der Effizienz einer Geschwindigkeitsverdopplung haben.
Der Bruch 70 -> 20 Elo hat seinen Grund im Wesentlichen also nicht in diesem Unterschied.
Up Topic Hauptforen / CSS-Forum / Benötige Hilfe bei Lc0 ...
1 2 Previous Next  

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill