Stockfish 11, Contempt=0 - Lc0 0.23.2 (Kiudee Settings) 20x256 S.Vieri T40-1541

By Tom Paul Date 2020-01-29 22:28

Ein negativer Contempt ist viel besser für Stockfish.

Z.B. -10 oder -20 oder -25

Da hätte LC0 wahrscheinlich nur mit +5 -2 gewonnen.

By Michael Scheidl Date 2020-01-29 23:36 Upvotes 2

Mamma mia, hör doch auf, einmal ist ein negativer contempt "viel besser" (wofür zum geier, wer will denn das sehen?!), nächstes mal ist ein positiver contempt besser, dann wiederum gilt alles nix weil mit oder ohne pondern gespielt wurde oder weil der Mars nicht im quadrat des Jupiter war...

Ich würde nur mit defaults testen und wenn die suboptimal sind, haben halt die programmierer so entschieden. In der praxis, also fürs analysieren stelle ich stockfish auf contempt=12 als kompromiß, die hälfte denn ein bißchen optimistisch darf ein Stockfish bei mir immer sein

By Tom Paul Date 2020-01-30 12:24

Der negative Contempt führt zu einer viel höheren Remisquote.
Somit ist der ELO Unterschied geringer.
Es geht nicht darum ob es einem gefällt.

By Andreas Strangmüller Date 2020-01-29 23:48

Bin auf Deine Tests mit Contempt=0 im Vergleich zu einem negativen Contempt gespannt.
Behaupten ist leicht, Fakten zählen!

By Heinz Hagenstein Date 2020-01-29 23:33

Da hat eine schwache CPU gegen eine starke GPU gespielt,kein Wunder das es so aus ging.

Gruß Heinz

By Andreas Strangmüller Date 2020-01-29 23:43

Hallo Heinz,

die Leela-Ratio liegt bei 1,28 auf diesem System.
Da ist von schwacher CPU, immerhin 10 Intel Kerne, oder von überaus starker GPU überhaupt nicht die Rede.

Grüße,
Andreas

By Benno Hartwig Date 2020-01-30 15:16

"eine Schwache CPU" bei 10 Kernen.

Da werden ich und mein kleines Notebook ganz still...

By Andreas Strangmüller Date 2020-01-30 00:35

Mein Test bestätigt übrigens die ca. +40 Elo zu Stockfish 11, siehe Post von Stefan Pohl:
https://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?tid=10910

By Clemens Keck Date 2020-01-30 07:18 Upvotes 1

Andreas Strangmüller schrieb:

Mein Test bestätigt übrigens die ca. +40 Elo zu Stockfish 11, siehe Post von Stefan Pohl:
<a class='urs' href='https://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?tid=10910'>https://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?tid=10910</a>

Moin moin

danke für den Test ! Hattest Du das match auch mal mit contempt 24 gespielt? Fände ich interessant.
Kiudee setting schneidet echt stark ab im Bullet.

Ich mach mal 200 Spiele mit 10 +2 ponder on.
Beim letzten run, allerdings nur 100 Spiele , war sv 1541-kiudee etwas schwächer als default.

Code:

sv1541, Blitz 10m+2s  2020

                                
1   Stockfish 11 64 BMI2-12cpu  +14/-7/=79 53.50%   53.5/100
2   Lc0,v0.23.2+git.c8d9095     +7/-14/=79 46.50%   46.5/100

Code:

sv1541-kiudee, Blitz 10m+2s  2020

                                
1   Stockfish 11 64 BMI2-12cpu  +17/-8/=75 54.50%   54.5/100
2   Lc0,v0.23.2+git.c8d9095     +8/-17/=75 45.50%   45.5/100

hier noch das match mit 3+2

Code:

sv1541, Blitz 3m+2s  2020

                                
1   Lc0,v0.23.2+git.c8d9095     +15/-11/=74 52.00%   52.0/100
2   Stockfish 11 64 BMI2-12cpu  +11/-15/=74 48.00%   48.0/100

C.K.

By Peter Martan Date 2020-01-30 08:06

Clemens Keck schrieb:

Ich mach mal 200 Spiele mit 10 +2 ponder on.

Das wär' fein.
Was nimmst du für Eröffnungen?

By Eduard Nemeth Date 2020-01-30 08:38

Deine Tests finde ich sehr gut. Die Stufe von 10+2 ist klasse, ebenso dass du Ponder On verwendest. Damit kann man sich besser vorstellen was die Engine im richtigen Turnierspiel zu leisten vermag (auf Infinity wird ja mit 12+2 gespielt und auf Schach.de ist eine der Disziplinen 16+2). Wenn das Kiudee dafür nicht besser ist, ist es für die Katz.

Ich werde jetzt auch Ponder On verwenden wenn ich das austrainierte T59 gegen Stockfish testen werde. Ich habe die vage Befürchtung dass es für Lc0 ein Desaster werden könnte. Weil ich mir sicher bin dass Stockfish von Ponder On mehr profitiert. Allerdings lasse ich mit Tablebases spielen, und hier sogar mit vielen 7 Steinern, davon könnte Lc0 mehr profitieren. Sollte das T59 nur 100 Elo schwächer sein als Stockfish, es wäre ein spitze Ergebnis! Auf meiner GTX 1050 Ti schafft das T40
Netz in der Grundstellung etwa 1,8 Kns und Stockfish auf einem Thread 1800 kns. Damit ist die Hardware gleich.

By Andreas Strangmüller Date 2020-01-30 09:36

Clemens Keck schrieb:

Moin moin

danke für den Test ! Hattest Du das match auch mal mit contempt 24 gespielt? Fände ich interessant.
Kiudee setting schneidet echt stark ab im Bullet.

Danke für Deine Ergebnisse, Clemens!

Es überrascht mich, dass auf Deinem System die Kiudee-Settings fast keinen Einfluss auf die Ergebnisse haben.
Es hat den Anschein, also ob ponder=on Stockfish mehr nützt als Lc0.
Die Bedenkzeit schließe ich eher aus, da Stefan Pohl ja auch mit 8 Min. + 5 Sek. getestet hat.

Werde mein Match zum Vergleich mit dem Standard Contempt=24 wiederholen.

Grüße
Andreas

By Reinhold Stibi Date 2020-01-30 12:36

Match Lc0 v0.23.2 Sergio t40-1541 mit Kuidee Settings RTX 2070 gegen Stockfish 11 24 Threads X5690 Contempt 0

4-Züge Eröffnungsvorgabe von Stefan Pohl 1 Min. + 1 Sek. pro Zug GUI Fritz 16

Bisher 20 Partien gespielt +3 =16 -1 = 55,0 % = + 35 Elo für Lc0. Match läuft bis 200 Partien.

Sehr guter Anfang für Lc0 Sergio 1541.

Hätte nicht gedacht dass sich das Sergio Net innerhalb so kurzer Zeit steigern könnte.

Bei der Installation habe ich sofort die Kuidee Settings bei Lc0 eingebunden um sicher zu gehen, dass sie auch vollständig
übernommen werden.

Bin gespannt auf den weiteren Fortgang. Sollte Lc0 Sorgio bis zum Schluss einen Vorsprung von 30 Elo halten können
würde ich Stefan Pohl rechtgeben mit seiner Behauptung dass nun Lc0 die Nr. 1 ist.

By Eduard Nemeth Date 2020-01-30 12:41 Edited 2020-01-30 12:52

Im Bullet+Blitz. Und ohne Ponder. Wenn bei Clemens auf Stufe 10+2 und Ponder ON Stockish besser ist, dann ist das für mich das wichtigere Ergebnis. Und das bestätigt nur die Ergebnisse auf Schach.de wo auch mit Ponder ON gespielt wird, und Stockfish da einen Tick besser ist.

By Reinhold Stibi Date 2020-01-30 12:51

Kann ich verstehen.

Wie sind denn die Testbedingungen bei Clemens, Vollständigkeit wäre gut, damit man sich ein Bild machen kann.

By Peter Martan Date 2020-01-30 12:56

Andreas Strangmüller schrieb:

Die Bedenkzeit schließe ich eher aus, da Stefan Pohl ja auch mit 8 Min. + 5 Sek. getestet hat.

Naja, das 10'+2" imit ponder on ist aber auf Clemens Hardware schon was anderes als 8'+'5" auf Stefans mit ponder off.

By Eduard Nemeth Date 2020-01-30 13:07

Kann man wohl sagen!

By Reinhold Stibi Date 2020-01-30 15:10

Mein Match wie weiter oben angeführt,

Lc0 v0.23.2 Sergio t40-1541 mit Kuidee-Settings gegen Stockfish 11 Contempt 0 Xeon X 5690 24 Threads

nach nun 54 Partien ist Lc0 Sergio t40-1541 in den Ergebnissen abgesackt.

+8 = 37 -9 =49,1 % = - 6 Elo.

abwarten bis die 200 Spiele zu ende sind.

Der übermäßige Elozuwachs wie von Stefan Pohl und Andreas Strangmüller scheint nicht nachvollziehbar zu sein.

By Clemens Keck Date 2020-01-30 16:04

Andreas Strangmüller schrieb:

Es überrascht mich, dass auf Deinem System die Kiudee-Settings fast keinen Einfluss auf die Ergebnisse haben.

geht mir genauso ! Ich würde mir wünschen in etwa gleich zu liegen mit den anderen Tests.
denn letzten endes will ich ( so nebenbei) das beste Lc0 setup finden für meine täglichen online engine Spiele.

100 Spiele sind schon sehr ungenau, deswegen bin ich zu 200 bzw. 300 übergegangen.
Trotzdem weicht es oft noch gravierend ab von den meisten Tests. Das verunsichert mich.
Dachte auch vielleicht ist SF 11 zu stark mit 12 cpu, aber so habe ich vor einem Jahr auch die T40 getestet. Möchte das beibehalten.
10+2 ist mir wichtig, das pondern auch, bietet sich ja quasi an wenn man genug cpu Kerne zur Verfügung hat.
Meine 200er Tests laufen auf zwei 16 core Maschinen, und selbst da habe ich noch 10 ELO Abweichungen. Beides zusammen sollte aber einen verlässlichen Mittelwert geben.

C.K.

By Reinhold Stibi Date 2020-01-30 16:41

10+2 mit pondern ist schon prima.

Nehme an dass du eine RTX 2060 verwendest. Da sind 12 Kerne m.E. gerade richtig, aber bestimmt nicht zu viel.

Für eine RTX 2070 braucht man für Ausgeglichenheit 15 Kerne.

Leider ist bei vielen Testern keine Ausgeglichenheit der Hardware gegeben. Die wenigsten haben 15 Kerne und mehr.
So werden dann auch Ergebnisse verfälscht.

Verlasse dich doch auf deine eigenen Tests, das tue ich übrigens auch.

200 Partien für ein Match finde ich richtig, darüber tut sich nicht mehr viel.

Für online engine Spiele sind aber doch in erster Linie die Eröffnungsbücher ausschlaggebend und nicht ob eine Engine
10 oder 20 Elo mehr hat; so ist meine Erfahrung von früher.

Ponder on würde mein Computersystem (von der CPU Erwärmung) bei voller Leistung auf Dauer überfordern und der
Lärmpegel für die Kühlung wäre mir zu laut.

By Peter Weise Date 2020-01-30 17:21

Reinhold Stibi schrieb:

Leider ist bei vielen Testern keine Ausgeglichenheit der Hardware gegeben. Die wenigsten haben 15 Kerne und mehr.
So werden dann auch Ergebnisse verfälscht.

Ausgeglichenkeit im Sinne des Leela-Ratio läßt sich auch für RTX-Karten leicht herstellen:
- als backend cudnn wählen, nicht cudnn-fp16 oder auto
- mittels Grafikkartentool die Geschwindigkeit reduzieren
- nur einen "worker-thread" für LC0 einstellen
Und schon ist LC0 auch auf einer RTX-Karte deutlich langsamer!

By Reinhold Stibi Date 2020-01-30 17:42

Das wäre doch für Wolfgang Battig und sein CEGT Team eine Überlegung wert um die Leela Ratio bei Lc0 auf 1.0 zu bringen.

By Reinhold Stibi Date 2020-01-30 18:40

Nach nun 100 Partien mein Match wie etwas weiter oben

Lc0 Sergio 1451 Kiudee RTX 2070 gegen Stockfish 11 24 Threads Contempt 0

+14 =76 -10 = 52,0 % = +14 Elo für Lc0

Ordentliches Zwischenergebnis

By Peter Weise Date 2020-01-30 19:55

Welches Ratio hast du bei deiner Hardware ermittelt?
Ich persönlich denke das alles zwischen 0,7 - 1,3 als "unbedenklich" gelten darf.

By Reinhold Stibi Date 2020-01-31 05:37 Edited 2020-01-31 05:47

Zwischen 0,7 und 1,3 besteht ein Unterschied von 0,6.

Das ist erheblich und hat sicher große Auswirkungen auf Testergebnisse.

Glaubst du wirklich dass über 50 % bessere Hardware unbedenklich sind ?, ich glaube das nicht.

Bei meinem Computer dürfte die Leela Ratio bei 1,0 liegen.

By Reinhold Stibi Date 2020-01-31 06:09

Nun ist mein Match nach 234 Partien beendet.

Lc0 v0.23.2 Sergio t40-1541 mit Kuidee RTX 2070 gegen Stockfish 11 Contempt 0 24 Threads
(entspricht ca.16 echten Kernen)

+ 30 = 183 -21 =51,9 % = + 13 Elo für Lc0.

Das knappe Ergebnis bedeutet praktisch Gleichstand; das ist nicht eindeutig besser.

Beim letzten Test Lc0 23.1 Sergio gegen Stockfish 10.12.19 lag nach 250 Partien Stockfish noch mit + 8 Elo vorne.

Das Sergio Netz 1541 hat also nach kurzer Zeit 21 Elo dazugewonnen.

By Peter Weise Date 2020-01-31 08:54

Reinhold Stibi schrieb:

Bei meinem Computer dürfte die Leela Ratio bei 1,0 liegen.

Hast du genaue Zahlen zur Hand, also kn/s von LC0 und Stockfish 8?

By Peter Martan Date 2020-01-31 09:41

Peter Weise schrieb:

Hast du genaue Zahlen zur Hand, also kn/s von LC0 und Stockfish 8?

Und bei LC0 die Version 0.18 mit dem Netz 11248?

http://talkchess.com/forum3/viewtopic.php?p=827616#p827616

Zitat:

A much more useful question would be “how do I know if matches run on two different machines between gpu and cpu engines are comparable?” A primitive approach has been to determine the nps ratio from the start position for sf8 and 11248 running on lc0 v18.

Und das ist laut Dietrich Kappe, für mich einer der echten NN- Experten, auch nur "a primitive approach".

By Peter Weise Date 2020-01-31 10:26

Peter Martan schrieb:

Und das ist laut Dietrich Kappe, für mich einer der echten NN- Experten, auch nur "a primitive approach".

Das stimmt, nur wer hat etwas besseres zu bieten?

By Peter Martan Date 2020-01-31 13:43

Ich!

By Peter Weise Date 2020-01-31 14:46

Und wie sieht das aus?

By Peter Martan Date 2020-01-31 14:49

Sag' ich nicht, hab' gerade Schreibpause.

By Peter Weise Date 2020-01-31 15:02

Und ich dachte schon da würde Substanz dahinter stecken, mein Fehler.
Es gibt eh keine bessere Lösung als das Ratio, auch solche Dinge wie die Kosten der Hardware zu berücksichtigen scheitern an sehr vielen Dingen.

By Peter Martan Date 2020-01-31 16:45

Also gut, du gibst ja doch keine Ruhe.
Der Stromverbrauch wäre eine leicht zu messende Größe, physikalisch tatsächlich relevant, auch ökonomisch und ökologisch von Interesse, und schachlich mindestens so wenig irrelevant wie Knotenzahlen.

Ich kann mich noch gut an Zeiten erinnern, da hätten "Tester" schon beim aufkeimenden Versuch von "Nichttestern", verschiedene A-B-Engines untereinander anhand ihrer Knotenzahlen schachlich zu vergleichen, aufgejault.

Natürlich kann man einen Benchmark für eine einzelne Engine auf einer bestimmten Hardware aus Knoten/Zeit festmachen, aber diese Benchmarks jetzt zwischen verschiedenen Engines, verschiedenen Netzwerken und zwischen den Leistungen von GPUs und CPUs heranzuziehen, um die Hardware- Nutzung von grundverschiedenen Programmen schachlich zu vergleichen, das braucht schon wirklich ziemlich an den Haaren herbeigezogene völlig neue willkürliche Übereinkünfte, über die man beim Computerschach vor der Zeit der AI nur gelacht hätte.

Stell dir vor, du hättest seinerzeit behauptet, Rybka sei auf AMD- CPUs gegenüber Zappa im Nachteil, weil er auf denen weniger Knoten/s relativ zu denen auf Intel- CPUs angezeigt hätte. Ich hätte Ingo Bauer darauf reagieren sehen mögen.

Ich war aber aus dieser Diskussion schon ein paar Mal raus, diskutiere daher, wenn du's wieder mal diskutieren willst, gerne weiter mit dir selbst und anderen Jüngern der "Leela- Ratio" hier und in anderen Threads des Hauptforums weiter, ich bin in Schreibpause, bis ich ein eigenes Subforum mit dem Titel "Andere als LC0-SF-und deren Matches- Themen" bekomme.

By Benno Hartwig Date 2020-01-31 17:44

> Ich kann mich noch gut an Zeiten erinnern, da hätten "Tester" schon beim aufkeimenden Versuch von "Nichttestern", verschiedene A-B-Engines untereinander anhand ihrer Knotenzahlen schachlich zu vergleichen, aufgejault.

Und mit Recht!
Wie absurd ein Vergleich von Rybka mit anderen wäre, wenn man ähnliche nps-Werte erzwingt, sagtest du ja schon.
Ich stelle mir gerade den alten Mephisto III vor und andere Rechner, die du ähnlich weit runterbremst. Grotesk.

Nein:
Der Entwickler bekommt die Hardware und soll damit was zaubern. Ob er nun die Knotenleistung tunt, oder ob er diese zugunsten irgendeiner stärkesteigernden Intelligenz runterkurbelt, ist seine Freiheit.

Und die NNs haben doch eine grundsätzlich andere Logik. Wie ich es verstand: Trotz rechenstärkerer Hardware kleinere nps-Werte.
Bei gleicher Hardeware (CPU-Version) viiieel kleinere nps-Werte.

Dann den nackten nps-Wert als Ratio-Kriterium zu nehmen erschiene mir kaum vernünftiger als die Byte-Zahl der Anwendung oder die Farbe der Verpackung.
nps taugt als Ratio-Kriterium nur bei (annähernd) gleichen Engines auf dann naturgemäß gleichen Hardware-Linien. (Mutterns uralt Pentium <-> mein preisgünstiges i5-Notebook <-> das TCEC-System)

Ich denke "was ist gerecht" ist eine Frage , die sich so einfach nicht fachlich beantworten lässt.
"Welcher Vergleich interessiert am meisten?" kann man fragen und irgendwie darauf nach Übereinkunft eine ratio-Norm definieren.
Und ich finde: der vergleichbare Erstehungspreis des Gesamtsystems sollte Basis sein.
"Gerecht", wenn das eine System das dreifache des anderen kostet, erschiene mir beispielsweise sehr unpassend.

Benno

By Peter Martan Date 2020-01-31 18:14

Benno Hartwig schrieb:

Und ich finde: der vergleichbare Erstehungspreis des Gesamtsystems sollte Basis sein.
"Gerecht", wenn das eine System das dreifache des anderen kostet, erschiene mir beispielsweise sehr unpassend.

Die Preise sind zu sehr von Marktschwankungen abhänig, Benno.

Die neueren GPUs und CPUs kosten immer zuerst mal mehr, weil sie neu sind, obwohl sie meistens mehr Leistung aus weniger Stromverbrauch bieten. Dann setzen sie sich am Markt durch, werden mehr gekauft und der Preis sinkt, obwohl ihre Leistung natürlich gleich bleibt.

Dann fängt dasselbe Spiel mit der nächsten Generation von vorn an.

Außerdem sind gerade bei den GPUs die Leistungen für die übrigen viel größeren Märkte der echten Gamer andere, die die Nachfrage bestimmen und damit den Preis.

Mit dem Stromverbrauch hast du ein viel einfacheres und konstantes Leistungsmerkmal, was die einzelne CPU und GPU angeht, und was dann welche Engine aus welchem Stromverbrauch macht, da treffen wir uns wieder in dem, was du auch sagst.

By Benno Hartwig Date 2020-01-31 23:34

> Mit dem Stromverbrauch hast du ein viel einfacheres und konstantes Leistungsmerkmal, was die einzelne CPU und GPU angeht...

Ja, nur finde ich das so schrecklich, schrecklich irrelevant!
Es würde mich ähnlich wenig interessieren wie andere Dinge (Farbschachtel), die wir wohl beide uninteressant finden.

Es stört aber doch überhaupt nicht, dass sich Preise ändern.
Wenn grundverschiedene Dinge verglichen werden sollen, dann passiert eben mal, dass heute etwas interessant erscheint, und morgen etwas ganz anderes. So what.
Viel besser erscheint mir das, als wenn man etwas ausgesprochen Willkürliches zum Maßstab nimmt, nur weil dies gerade mal so schön messbar ist.

Klar, andere mögen andere Vorstellungen haben, aber mir geht es so:
Zwei Dinge interessieren mich beim Vergleich unterschiedlicher Ansätze ganz besonders:
- das was preislich ungefähr in einer Liga spielt
- das was technisch überhaupt möglich ist

Aber Interessen sind halt verschieden.

By Peter Weise Date 2020-01-31 19:31

Ich bin kein Leela-Ratio-Jünger, ganz sicher nicht!
Nur, bisher konnte ich (und auch alle anderen, sogar Fachleute) nichts besseres finden.

Messung des Stromverbrauches kann und wird nicht funktionieren (ebenso wie die Bewertung der Hardwarekosten) weil:
- wie soll man messen was gerade die CPU und/oder die GPU verbraucht?
- verlässt man sich einfach "nur" auf die Herstellerangaben?
- wie viel braucht denn eine CPU, eine GPU, bei "nicht full load" oder bei "full load" oder bei "idle"?
- sehr oft braucht die GPU die CPU um Befehle zu empfangen und zu verarbeiten, wem rechnet man diesen Verbrauch zu?
- wie bewertet man den Verbrauch wenn es zusätzlich noch eine Onboard-GraKa gibt (fast immer bei Notebooks)?
- und wie verteilt man die übrigen Verbraucher des PCs auf NN und A/B?

Zudem braucht LC0 halt auch immer einen Teil der CPU für den/die worker-thread(s), wie messen?

Besser wäre dann doch zwei unterschiedliche PCs zu verwenden und zu vergleichen z.B.:
- einen optimiert auf GPU mit einer schwächeren CPU
- einen optimiert auf CPU mit einer schwächeren GPU

Nur wer macht/kann das?

Alles in allem bleibe ich erst einmal (mit nur einem Ryzen im Besitz) beim Leela-Ratio (dessen Fan ich trotzdem nicht bin).

By Andreas Strangmüller Date 2020-01-31 08:07

Hier das Ergebnis mit Stockfish 11 default Contempt=24

1   Lc0 0.23.2 256x20-T40-1541   +52  +62/=163/-25 57.40%  143.5/250
2   Stockfish 11                 -52  +25/=163/-62 42.60%  106.5/250

+52 Elo

By Tom Paul Date 2020-01-31 08:16

Andreas Strangmüller schrieb:

Hier das Ergebnis mit Stockfish 11 default Contempt=24

<code>1 Lc0 0.23.2 256x20-T40-1541 +52 +62/=163/-25 57.40% 143.5/250
2 Stockfish 11 -52 +25/=163/-62 42.60% 106.5/250</code>

+52 Elo

Und wie wir anhand der vielen Tests sehen können: Je kleiner der Contempt, desto besser ist das Ergebnis für Stockfish.

By Horst Sikorsky Date 2020-01-31 09:29

Kiudee, Blitz 2m+4s 2020
1   Lc0,v0.23.2+git.c8d9095 +5/=14/-5 50.00%   12.0/24 144.00
2   Stockfish 11 64 POPCNT   +5/=14/-5 50.00%   12.0/24 144.00

aber mit meinen 12 Eröffnungen unterschiedlicher Längen. LCO RTX 2060 Threads= 1 Backend cudnn also 2x geschwächt.
Stockfish 11 mit 5 Kerne 3,98 GHz ... und natürlich pondern an.
Größter Eröffnungsvorteil 1.e2 e5 2.Sf3 f6 Stockfish gewann in 29 LCO brauchte 58 Züge

By Horst Sikorsky Date 2020-01-31 09:53 Edited 2020-01-31 09:59

eine Auserwählte mit 2 Züge Vorgabe

[Event "Kiudee, Blitz 2m+4s"] [Site "?"] [Date "2020.01.31"] [Round "11.1"] [White "Stockfish 11 64 POPCNT"] [Black "Lc0, v0.23.2+git.c8d9095"] [Result "1-0"] [ECO "B03"] [Annotator "0.53;0.63"] [PlyCount "97"] [EventDate "2020.01.31"] [EventType "tourn"] [SourceTitle "Fritz Engine Tournament"]  {Intel(R) Core(TM) i7-4930K CPU @ 3.40GHz 3400 MHz W=28.1 plies; 9.241kN/s B=14.1 plies; 11kN/s} 1. e4 Nf6 2. e5 Nd5 3. d4 {[%eval 53,24] [%emt 0:00:08]} d6 {[%eval 63,14] [%emt 0:00:04]} 4. c4 {[%eval 76,26] [%emt 0:00:04]} Nb6 { [%eval 64,15] [%emt 0:00:01]} 5. f4 {[%eval 95,28] [%emt 0:00:05] (exd6)} dxe5 {[%eval 60,15] [%emt 0:00:11]} 6. fxe5 {[%eval 43,27] [%emt 0:00:01]} Bf5 { [%eval 57,16] [%emt 0:00:03]} 7. Nc3 {[%eval 44,29] [%emt 0:00:16]} Nc6 { [%eval 57,18] [%emt 0:00:04]} 8. Be3 {[%eval 50,28] [%emt 0:00:14]} e6 { [%eval 56,18] [%emt 0:00:00]} 9. Nf3 {[%eval 65,29] [%emt 0:00:11]} Bb4 { [%eval 56,17] [%emt 0:00:06] (Le7)} 10. Be2 {[%eval 71,24] [%emt 0:00:03]} Na5 {[%eval 58,16] [%emt 0:00:02]} 11. c5 {[%eval 65,24] [%emt 0:00:04]} Nd5 { [%eval 61,16] [%emt 0:00:04]} 12. Bd2 {[%eval 93,26] [%emt 0:00:00]} Ne7 { [%eval 63,15] [%emt 0:00:16]} 13. O-O {[%eval 121,28] [%emt 0:00:04]} Nac6 { [%eval 67,16] [%emt 0:00:05] (0-0)} 14. Be3 {[%eval 112,25] [%emt 0:00:04]  (Lg5)} Bxc3 {[%eval 76,15] [%emt 0:00:16]} 15. bxc3 {[%eval 74,28] [%emt 0:00: 04]} Nd5 {[%eval 69,16] [%emt 0:00:01] (b6)} 16. Bd2 {[%eval 130,26] [%emt 0: 00:05]} O-O {[%eval 71,17] [%emt 0:00:00]} 17. Rc1 {[%eval 124,26] [%emt 0:00: 05] (De1)} h6 {[%eval 68,13] [%emt 0:00:12]} 18. Qe1 {[%eval 141,28] [%emt 0: 00:00]} b6 {[%eval 73,17] [%emt 0:00:08] (Kh8)} 19. Qg3 {[%eval 135,24] [%emt 0:00:03]} Kh8 {[%eval 76,21] [%emt 0:00:00]} 20. Bb5 {[%eval 155,27] [%emt 0: 00:04]} Na5 {[%eval 89,19] [%emt 0:00:02]} 21. Bg5 {[%eval 160,28] [%emt 0:00: 05] (Sh4)} f6 {[%eval 131,15] [%emt 0:00:14]} 22. exf6 {[%eval 162,31] [%emt 0: 00:00]} Nxf6 {[%eval 135,14] [%emt 0:00:05]} 23. Bxf6 {[%eval 162,29] [%emt 0: 00:04]} Rxf6 {[%eval 141,13] [%emt 0:00:00]} 24. cxb6 {[%eval 163,30] [%emt 0: 00:10] (Se5)} axb6 {[%eval 150,12] [%emt 0:00:17]} 25. Ne5 {[%eval 168,31]  [%emt 0:00:00]} Qd5 {[%eval 152,12] [%emt 0:00:12] (c6)} 26. a4 {[%eval 193,29] [%emt 0:00:07]} c6 {[%eval 155,10] [%emt 0:00:03]} 27. Be2 {[%eval 192,28]  [%emt 0:00:02]} Raf8 {[%eval 155,13] [%emt 0:00:06]} 28. Bf3 {[%eval 207,28]  [%emt 0:00:00] (h4)} Qd8 {[%eval 173,11] [%emt 0:00:12]} 29. Rf2 {[%eval 207, 30] [%emt 0:00:00] (Tce1)} Qe7 {[%eval 175,9] [%emt 0:00:09] (De8)} 30. Re1 { [%eval 224,28] [%emt 0:00:07]} Kg8 {[%eval 179,10] [%emt 0:00:05] (Kh7)} 31. Bh5 {[%eval 237,30] [%emt 0:00:15] (h3)} Kh7 {[%eval 197,11] [%emt 0:00:06]  (Tc8)} 32. Rb2 {[%eval 260,29] [%emt 0:00:12] (De3)} c5 {[%eval 150,13] [%emt 0:00:06] (Dd8)} 33. Qe3 {[%eval 263,29] [%emt 0:00:06]} Rc8 {[%eval 182,13]  [%emt 0:00:05] (cxd4)} 34. Rxb6 {[%eval 301,29] [%emt 0:00:06]} cxd4 {[%eval 203,14] [%emt 0:00:01]} 35. Qxd4 {[%eval 323,29] [%emt 0:00:07]} Rd8 {[%eval 206,12] [%emt 0:00:04] (Kh8)} 36. Qb4 {[%eval 344,30] [%emt 0:00:07] (De3)} Qa7 {[%eval 211,12] [%emt 0:00:09]} 37. Kh1 {[%eval 354,32] [%emt 0:00:00]} Rc8 { [%eval 213,12] [%emt 0:00:08]} 38. Rg1 {[%eval 371,33] [%emt 0:00:00]} Bc2 { [%eval 226,13] [%emt 0:00:18] (Tc7)} 39. Bf3 {[%eval 409,30] [%emt 0:00:06]  (h3)} Rf4 {[%eval 206,13] [%emt 0:00:06] (Tf5)} 40. Qxf4 {[%eval 559,28] [%emt 0:00:06]} Qxb6 {[%eval 241,11] [%emt 0:00:00]} 41. Rc1 {[%eval 569,29] [%emt 0: 00:06]} Bb1 {[%eval 264,10] [%emt 0:00:08]} 42. Rf1 {[%eval 604,30] [%emt 0:00: 00] (Lg4)} Bf5 {[%eval 327,10] [%emt 0:00:11] (Db3)} 43. g4 {[%eval 823,29]  [%emt 0:00:07] (Le4)} Bc2 {[%eval 232,11] [%emt 0:00:03]} 44. Be4+ {[%eval 1069,29] [%emt 0:00:03] (g5)} Bxe4+ {[%eval 365,9] [%emt 0:00:04]} 45. Qxe4+ { [%eval 1171,30] [%emt 0:00:01]} Kg8 {[%eval 436,8] [%emt 0:00:02]} 46. Rf7 { [%eval 1266,28] [%emt 0:00:04]} Rc7 {[%eval 709,6] [%emt 0:00:09]} 47. Nd7 { [%eval 1490,30] [%emt 0:00:19]} Qd6 {[%eval 1048,8] [%emt 0:00:07] (Txd7)} 48. Rf8+ {[%eval 1837,26] [%emt 0:00:06]} Qxf8 {[%eval 2589,8] [%emt 0:00:00]} 49. Nxf8 {[%eval 1976,24] [%emt 0:00:05]} 1-0

Event:

Ort:

Datum:

Weiss:

Schwarz:

Ergebnis

Board

By Horst Sikorsky Date 2020-01-31 16:06

Horst Sikorsky schrieb:

auf was man alles Achten muss. Es war das Netz 256x20.T40B.4-swa-200000
bestimmt fehlt noch einiges

By Reinhold Stibi Date 2020-01-31 09:59 Edited 2020-01-31 10:02

Das hohe Ergebnis für Lc0 Sergio bei Andreas Strangmüller und Stefan Pohl kommt wahrscheinlich auch deshalb zustande:

1. weil Stockfish nicht mit Contempt 0 gespielt hat

2. weil Lc0 von der Hardware bevorzugt wurde Leela Ratio 1.28 u. 1.30

3. aus der Eröffnungswahl

und zur Nachfrage von Peter Weise wegen der Leela Ratio

Mein Computer Xeon X5690:

2 Prozessoren X5690 mit je 6 echten Kernen und 6 in Hyperthreading je Kern mit 3.46 GHz, je Proz. 12 MB Cache

Leistung in der Grundstellung mit Stockfish 11 bei 24 Threads ca. 20.000 kN/s, entspricht ca. 16 echten Kernen
da mein Comp. trotz der sehr guten Leistung schon älter ist, würde ich sagen dass die 24 Threads bei
neueren Prozessoren ca. 14 echten Kernen entsprechen.

Die RTX 2070 bringt bei mir in der Grundstellung mit Sergio Net wie oben getestet ca. 25 bis 27 kn/s Anzeige durch die Fritz 15 GUI

Das dürfte eine Leela Ratio von 1,0 bedeuten - im Vergleich hier im Schachforum.
Ich habe wirkliich keine Lust die Leela Ratio bis 0,01 hinter dem Komma zu berechnen. Die Vergleichswerte genügen mir vollkommen
und da dürfte ich auch richtig liegen.

By Eduard Nemeth Date 2020-01-31 10:07 Edited 2020-01-31 10:22

27 kns gegen 20000 kns, ist da der Ratio nicht höher als 1? Ausserdem sollen die neuen 256x20 Netze etwas langsamer sein als früher. Aber ich will nicht meckern damit, wie du testest ist klasse! Ich finde übrigens man sollte auch mit anderen Vorgaben testen als Hert250. Nicht weil ich sie schlecht finde. Aber viele Züge werden gleich ausgespielt, egal welches Netz und fast egal welche Zeikontrolle. Und bei Stockfish ähnlich. Beispiel: Gleich in der ersten Variante unterbindet Lc0 mittels frühem a2-a4 einen Gegenstoss b5. Jede Lc0 Version spielt so. Und Stockfish spielt selten a4, wonach Lc0 mittels Rb8 dann b5 zieht.

By Peter Weise Date 2020-01-31 10:22

Reinhold Stibi schrieb:

Leistung in der Grundstellung mit Stockfish 11 bei 24 Threads ca. 20.000 kN/s, entspricht ca. 16 echten Kernen
da mein Comp. trotz der sehr guten Leistung schon älter ist, würde ich sagen dass die 24 Threads bei
neueren Prozessoren ca. 14 echten Kernen entsprechen.

Die RTX 2070 bringt bei mir in der Grundstellung mit Sergio Net wie oben getestet ca. 25 bis 27 kn/s Anzeige durch die Fritz 15 GUI

Das dürfte eine Leela Ratio von 1,0 bedeuten - im Vergleich hier im Schachforum.
Ich habe wirkliich keine Lust die Leela Ratio bis 0,01 hinter dem Komma zu berechnen. Die Vergleichswerte genügen mir vollkommen
und da dürfte ich auch richtig liegen.

Danke für die Werte!
Da Stockfish 8 etwas schneller ist als Stockfish 11 bezüglich der kn/s, ergibt sich bei dir ein Ratio von ca. 1.08 [(875x26)/21000]. Das ist ein guter Wert! Kannst Du auch mal LC0 v1.8 mit Netz 11248 messen und wenn es geht auch Stockfish 8.0?

By Andreas Strangmüller Date 2020-01-31 18:13

Reinhold Stibi schrieb:

Hallo Reinhold,

1. Stockfish hat mit Contempt 0 gespielt, siehe Eingangsposting.

2. Lc0 wurde etwas bevorzugt, aber m. E. ist eine Leela-Ratio zwischen 0,7 und 1,3 völlig o.k.

3. Wieso? Die Eröffnungen wurden mit vertauschten Farben wiederholt. Jeder hatte somit die gleiche Ausgangsposition.

Andreas

By Reinhold Stibi Date 2020-01-31 19:46

Hallo Andreas,

da unsere Testbedingungen sehr ähnlich sind, wundere ich mich doch über die relativ
große Abweichung der Ergebnisse.

Ich führe dies nun in erster Linie auf das Eröffnungsbuch zurück.

Mit Stefan Pohls 4-Züge-Eröffnungsvorgaben habe ich sehr gute Erfahrungen gemacht und die
Ergebnisse sind plausibel.
Auch ist die Anzahl der Remispartien damit nicht übermäßig hoch.

Du verwendest das Herth 250 Buch. Dazu kann ich nicht viel sagen, weil ich mich damit noch nicht beschäftigt habe.
Eduard Nemeth, der auch Eröffnungsexperte ist und viel im Internet spielt, hält von den Herth 250 Eröffnungen
nicht so viel. S. seine Anmerkungen etwas weiter oben hier im Thread.

Interessant wäre, wenn du zum Vergleich auch mal die 4-Züge-Eröffnungsvorgaben von Stefan Pohl verwenden könntest.
Ob dann die Unterschiede der Ergebnisse dann auch noch so hoch wären, ist die Frage.
Wenn mir die Zeit es erlaubt probiere ich auch ein Match mit dem Herth 250 Buch.

Noch großes Lob an deine Webseite; sie ist so klar und übersichtlich wie die von Stefan Pohl.

Reinhold

By Andreas Strangmüller Date 2020-01-31 20:19

Hallo Reinhold,

danke, es freut mich das Dir meine Webseite gefällt.

Auch ich wundere mich über die großen Abweichungen der Ergebnisse bei Dir und Clemens. Die Kiudee-Settings zeigen praktisch keine Auswirkung.
Führst Du die Tests mit der Fritz-GUI durch? Clemens glaube ich auch.
Stefan und ich testen mit dem Tool Cutechess-Cli.

Neben dem Eröffnungsbuch ist das der einzige Unterschied der mir noch in den Sinn kommt. Werden hier die Lc0-Settings nicht richtig übernommen?
Vielleicht kann man über die Lc0 Option Logfile (option name LogFile type string default) eine Log-Datei erstellen und das mal überprüfen?
Ich werde den Test auf jeden Fall mit dem 4-Züge Buch von Stefan wiederholen. Glaube zwar nicht an einen großen Unterschied, aber wer weiß?

Grüße
Andreas