LC0 Netzwerk 40 x 256 soll/ist unglaublich gut

By Eduard Nemeth Date 2019-05-24 04:56 Upvotes 1

Woran erkennt man dass diese Netze so gut sind/werden?

By Tom Paul Date 2019-05-24 13:52

Eduard Nemeth schrieb:

Woran erkennt man dass diese Netze so gut sind/werden?

Da gibt es ganz viele Beispiele.
Z.B. brauchen diese 40 x 256 Netze nur ein Drittel des Arbeitsspeicher im Vergleich zu den 20 x 256 Netzen.

Oder anders ausgedrückt: Während dein Arbeitsspeicher voll ist und deine Engine aufhört weiter zu rechnen, rechnet meine Engine mit dem 40 x 256 noch 3 mal so lange, was zu einer Steigerung von mindestens +75 ELO führt.

By Klaus Wlotzka Date 2019-05-25 11:57 Upvotes 1

Tom Paul schrieb:

Eduard Nemeth schrieb:

Woran erkennt man dass diese Netze so gut sind/werden?

Da gibt es ganz viele Beispiele.
Z.B. brauchen diese 40 x 256 Netze nur ein Drittel des Arbeitsspeicher im Vergleich zu den 20 x 256 Netzen.

Oder anders ausgedrückt: Während dein Arbeitsspeicher voll ist und deine Engine aufhört weiter zu rechnen, rechnet meine Engine mit dem 40 x 256 noch 3 mal so lange, was zu einer Steigerung von mindestens +75 ELO führt.

Ich habe schon lange nicht mehr so einen Schwachsinn gelesen. Das ist so daneben, dass es fast schon wieder amüsiant ist.

By Martin Steinwandter Date 2019-05-25 12:11

So ist halt das Schlitzohr Tom Paul
Interessanter ist schon die Frage, die ich mir stelle: Warum ist die Zahl der Trainingsspiele so unglaublich gesunken? Nur noch knapp über 150.000 pro Tag.
Da gab es schon Mal drei Millionen
Netzgröße?
fehlendes Interesse?

By Stefan Pohl Date 2019-05-25 12:41 Edited 2019-05-25 12:46

Der Mainserver ist seit knapp 10 Tagen defekt.

https://blog.lczero.org/?m=1

By Tom Paul Date 2019-05-25 13:17

Stefan Pohl schrieb:

Der Mainserver ist seit knapp 10 Tagen defekt.

<a class='ura' href='https://blog.lczero.org/?m=1'>https://blog.lczero.org/?m=1</a>

Das ist doch eh unwichtig.
Es sind schon längst alle, die GPU Power stiften wollen, zum neuen 40 x 256 Netz gewechselt: http://157.230.189.191:8080/

By Florian Wieting Date 2019-05-25 13:36

Zitat:

Es sind schon längst alle, die GPU Power stiften wollen, zum neuen 40 x 256 Netz gewechselt:

Nein, sind sie bei Weitem nicht!
Ich bin der User "Dithyrambus" und habe die Zahlen der Vergangenheit und der Gegenwart genau beobachten können.

By Tom Paul Date 2019-05-25 13:15

Martin Steinwandter schrieb:

So ist halt das Schlitzohr Tom Paul
Interessanter ist schon die Frage, die ich mir stelle: Warum ist die Zahl der Trainingsspiele so unglaublich gesunken? Nur noch knapp über 150.000 pro Tag.
Da gab es schon Mal drei Millionen
Netzgröße?
fehlendes Interesse?

Da verwechselst du etwas.
Mein 40 x 256 Netz hat: 40 users in the last day have played 170540 games. Gestern am Morgen waren es noch 30 und einpaar Tage davor nur 7 sowie nur ungefähr 10000 Spiele. Das liegt alles an der größeren Netzgröße und dem steigenden Interesse. -> http://157.230.189.191:8080/
Dein 20 x 256 Netz hat: 25 users in the last day have played 122551 games. Die 3 Millionen waren bei dir vorhanden und nicht bei mir, deshalb gebe ich gerne deine Fragen zurück an dich: Liegt es vielleicht an der 20 x 256 Netzgröße oder am fehlenden Interesse oder sogar beides?

By Florian Wieting Date 2019-05-25 13:26

Zitat:

Mein 40 x 256 Netz ...

Wirst du jetzt schrittweise größenwahnsinnig?

By Martin Steinwandter Date 2019-05-25 16:22

Tom Paul schrieb:

Da verwechselst du etwas.
Mein 40 x 256 Netz hat: 40 users in the last day have played 170540 games. Gestern am Morgen waren es noch 30 und einpaar Tage davor nur 7 sowie nur ungefähr 10000 Spiele. Das liegt alles an der größeren Netzgröße und dem steigenden Interesse. -> <a class='ura' href='http://157.230.189.191:8080/'>http://157.230.189.191:8080/</a>
Dein 20 x 256 Netz hat: 25 users in the last day have played 122551 games. Die 3 Millionen waren bei dir vorhanden und nicht bei mir, deshalb gebe ich gerne deine Fragen zurück an dich: Liegt es vielleicht an der 20 x 256 Netzgröße oder am fehlenden Interesse oder sogar beides?

WAS SCHREIBST DU DA?
Mir gehört da gar Nichts, nicht mein Netz 20x.... oder 40x oder meine drei Millionen....! Das ist mir doch WURSCHT
WER LESEN KANN IST KLAR IM VORTEIL
Und ja, ich meine es agressiv wie ich es schreibe

By Wolfgang Battig Date 2019-05-25 17:40

Reg dich doch nicht über diesen Troll auf...

By Tobias Lagemann Date 2019-05-26 06:39

Och. Dann müsste man ja, um "faire" Bedingungen" zu schaffen, bei Turnieren auf Bedenkzeiten verzichten. Denn bei (d)einem vollen Arbeitsspeicher würde (d)eine Engine das mehr an Zeit nicht verwenden können, ggfs. ja wäre eine Engine gar nicht in der Lage z.B. 2h für 40 Züge auszunutzen, weil eben der Arbeitsspeicher dafür nicht ausreicht.

Okay, Butter bei die Fischer, wie sehen denn deine Turniere zum Thema "Engineturniere mit Arbeitsspeicher Größe X als Faktor für die Rechentiefe" aus? Und: Welchen Einfluss hat ein kleinerer Arbeitsspeicher? Hast du vielleicht sogar schon Tabellen zur Hand, die zeigen, wie viel Arbeitsspeicher Engines bei welchen Prozessoren (Grafikkarten) brauchen, damit sie in altmodischen Partien mit z.B. langer Bedenkzeit nicht das Rechnen einstellen? O weh, ich mag gar nicht daran denken, wie viele Tester da möglicherweise nun Zeit in Testturniere verschwendet haben, die letztlich nicht aussagekräftig sind, weil die Engine oft einfach nicht lange genug hat rechnen können, wohingegen die andere Engine (z.B. ein 40 x 256 Netz) 3x so lange rechnen konnte ...

By Stefan Pohl Date 2019-05-25 08:54 Upvotes 1

Ich habe einen Testrun vom 24. dieser Nets gestartet. Nach nun 110 Partien sieht es nach ca. -100 Elo zum Net aus, was gerade im TCEC Superfinal spielt und damit ca. -130 Elo zum bei mir stärksten Net 42100. Aber mit nur 110 Partien ist das natürlich noch ein sehr.wackeliges Ergebnis.
Da sonst z.Zt. wegen der Serverprobleme keine neuen Nets dazukommen, lasse ich den Test durchlaufen, bis die 700 Partien durch sind.
Aber Stand jetzt sind die 40x256 Nets noch ziemlich schwach. Man muß sich ja auch bewußt sein, daß diese Nets wegen ihrer Größe nur halb so schnell abgearbeitet werden können, die Knotenleistung sinkt also auf ca. 50% ab, verglichen mit den 20x256 Nets. Das kostet natürlich erst mal Elo, die man dann durch höhere Net-Qualität auch erst mal wieder reinholen muß...

By Tom Paul Date 2019-05-25 09:35

Stefan Pohl schrieb:

Aber Stand jetzt sind die 40x256 Nets noch ziemlich schwach. Man muß sich ja auch bewußt sein, daß diese Nets wegen ihrer Größe nur halb so schnell abgearbeitet werden können, die Knotenleistung sinkt also auf ca. 50% ab, verglichen mit den 20x256 Nets. Das kostet natürlich erst mal Elo, die man dann durch höhere Net-Qualität auch erst mal wieder reinholen muß...

Wie definierst du ziemlich schwach?
Das die Netze nur halb so schnell abgearbeitet werden können bzw. die Knotenleistung 50% weniger ist, dass ist doch nicht so wichtig wenn dafür ein viel größeres 40 x 256 anstatt nur 20 x 256 verwendet wird. Wie wir alle wissen ist mehr Tiefe im Falle von LC0 ziemlich unwichtig im Vergleich zu Stockfish und Co.
Wenn du beide LC0s auf identischer Hardware testen würdest und maximaler Power für beide, dann stellst du auch fest das dass 40 x 256 Netz 3 mal so lange rechnen kann bis der Arbeitsspeicher voll ist also +75 ELO hinzubekommt.
Wenn du jetzt von deinen -100 ELO die 75 ELO abziehst, dann sind es nur noch -25 ELO Unterschied.
Davon mal abgesehen das dass 40 x 256 Netzwerk exponentiell stärker spielt je länger die Bedenkzeit ist im Vergleich zu einem 20 x 256 Netzwerk.
Davon mal abgesehen geht die ELO bei den 40 x 256 deutlich schneller nach oben, da es hier deutlich einfacher ist neue Sachen zu entdecken/trainieren.

By Stefan Pohl Date 2019-06-17 13:08 Edited 2019-06-17 13:17

Träum weiter.

Für alle Realisten hier der Testrun des 103. Nets aus der 40x256-Entwicklung, frisch aktualisiert:
https://www.sp-cc.de

Nicht nur, daß Net 103 ein meßbarer Rückschritt zu Net 24 ist, es hat auch eine übelst hohe Remisqoute an den Tag gelegt.


 
     Program                         Elo    +    -   Games   Score   Av.Op.  Draws
   1 Stockfish 190504 bmi2         : 3523    7    7  5724    72.9 %   3342   46.0 %
   2 Lc0 0.21.1 N:42100            : 3523   20   20   700    73.2 %   3334   43.3 %
   3 Stockfish 10 181129           : 3508    7    7  8200    73.8 %   3318   43.8 %
   4 Lc0 0.21.1 N:42488            : 3507   19   19   798    70.6 %   3341   48.5 %
   5 Lc0 0.21.1 N:JH.T8.610        : 3487   19   19   700    68.6 %   3340   49.9 %
   6 Lc0 0.21.1 N:42392            : 3486   20   20   700    68.4 %   3341   48.1 %
   7 Lc0 0.21.1 N:32930            : 3455   19   19   700    65.6 %   3334   49.6 %
   8 Allie 0.4 N:42392             : 3430   19   19   700    61.6 %   3341   55.7 %
   9 Houdini 6 pext                : 3427    6    6  9924    59.4 %   3355   52.9 %
  10 Lc0 0.21.1 N:11260            : 3421   19   19   700    60.7 %   3340   59.4 %
  11 Komodo 13.01 bmi2             : 3406    7    7  5524    56.3 %   3359   53.4 %
  12 Komodo 12.3 bmi2              : 3396    6    6  8400    56.3 %   3348   51.4 %
  13 Lc0 0.21.1 BT40(40x256)24     : 3386   18   18   742    56.1 %   3341   51.5 %
  14 Lc0 0.21.2 BT40(40x256)103    : 3349   18   18   728    51.2 %   3341   58.4 %
  15 Fire 7.1 popc                 : 3286    6    6  9924    39.3 %   3370   52.5 %
  16 Xiphos 0.5.3 bmi2             : 3275    6    6  7724    33.3 %   3404   49.9 %
  17 Ethereal 11.25 pext           : 3258    6    6  9924    35.4 %   3373   49.4 %
  18 Xiphos 0.5 bmi2               : 3247    8    8  5200    33.0 %   3380   46.8 %
  19 Laser 1.7 bmi2                : 3213    7    7  5924    28.3 %   3387   44.3 %

Die vergleichende Errorbar der beiden 40x256 Nets ist übrigens sqrt((18*18)+(18*18))= 25.5 Elo. Somit steht statistisch zweifelsfrei fest, daß Net 103 schlechter als Net 24 ist, denn es scorte -37 Elo schlechter. Tja, Selfplay-Elo Fortschritte sind eben noch lange keine Fortschritte gegen andere Engines. Laut der Selfplay-Elos auf der entsprechenden Seite, müßte Net 103 +113 Elo besser als Net 24 sein...

By Tom Paul Date 2019-06-17 13:22

Stefan Pohl schrieb:

Träum weiter.

Für alle Realisten hier der Testrun des 103. Nets aus der 40x256-Entwicklung, frisch aktualisiert:
<a class='ura' href='https://www.sp-cc.de'>https://www.sp-cc.de</a>

Nicht nur, daß Net 103 ein meßbarer Rückschritt zu Net 24 ist, es hat auch eine übelst hohe Remisqoute an den Tag gelegt.

<code>

   Program    Elo + -   Games   Score   Av.Op. Draws
   1 Stockfish 190504 bmi2    : 3523 7 7 5724 72.9 %   3342   46.0 %
   2 Lc0 0.21.1 N:42100 : 3523   20   20   700 73.2 %   3334   43.3 %
   3 Stockfish 10 181129    : 3508 7 7 8200 73.8 %   3318   43.8 %
   4 Lc0 0.21.1 N:42488 : 3507   19   19   798 70.6 %   3341   48.5 %
   5 Lc0 0.21.1 N:JH.T8.610 : 3487   19   19   700 68.6 %   3340   49.9 %
   6 Lc0 0.21.1 N:42392 : 3486   20   20   700 68.4 %   3341   48.1 %
   7 Lc0 0.21.1 N:32930 : 3455   19   19   700 65.6 %   3334   49.6 %
   8 Allie 0.4 N:42392    : 3430   19   19   700 61.6 %   3341   55.7 %
   9 Houdini 6 pext : 3427 6 6 9924 59.4 %   3355   52.9 %
10 Lc0 0.21.1 N:11260 : 3421   19   19   700 60.7 %   3340   59.4 %
11 Komodo 13.01 bmi2    : 3406 7 7 5524 56.3 %   3359   53.4 %
12 Komodo 12.3 bmi2 : 3396 6 6 8400 56.3 %   3348   51.4 %
13 Lc0 0.21.1 BT40(40x256)24    : 3386   18   18   742 56.1 %   3341   51.5 %
14 Lc0 0.21.2 BT40(40x256)103 : 3349   18   18   728 51.2 %   3341   58.4 %
15 Fire 7.1 popc    : 3286 6 6 9924 39.3 %   3370   52.5 %
16 Xiphos 0.5.3 bmi2    : 3275 6 6 7724 33.3 %   3404   49.9 %
17 Ethereal 11.25 pext    : 3258 6 6 9924 35.4 %   3373   49.4 %
18 Xiphos 0.5 bmi2    : 3247 8 8 5200 33.0 %   3380   46.8 %
19 Laser 1.7 bmi2 : 3213 7 7 5924 28.3 %   3387   44.3 %
</code>

Träumen kannst du gerne selber, schließlich waren das alles Fakten und keine Behauptungen:
Gestern hat der Graph des 40x256 nun mal fast 3370 ELO gezeigt, dafür kann ich doch nichts

.
Beim 20x256 zeigt dessen Graph nur 3260 ELO und gurkt da weiter rum. PS. Dafür kann ich auch nichts

.
Und du weißt selbst das deine Testbedingungen für ein gigantisches 40x256 Netz ein Witz sind, wegen der schwachen Hardware und der viel zu kurzen Bedenkzeit und wo sind eigentlich die kompletten Eröffnungsphasen geblieben???

By Wolfgang Battig Date 2019-06-17 22:33 Upvotes 1

Tom Paul schrieb:

...
Und du weißt selbst das deine Testbedingungen für ein gigantisches 40x256 Netz ein Witz sind, wegen der schwachen Hardware und der viel zu kurzen Bedenkzeit und wo sind eigentlich die kompletten Eröffnungsphasen geblieben???

Diese alte Leier ist echt nicht totzukriegen und widert mich ehrlich gesagt langsam an.
Schneidet der "gigantische Liebling" nicht so ab, wie der "tolle" Fan es sich wünscht wird wahlweise der Tester verunglimpft ("Testbedingungen sind ein Witz", "schwache Hardware") oder alles auf angeblich zu kurze Bedenkzeiten, "falsche" Eröffnungen oder sonst was geschoben.

Die Testbedingungen sind für ALLE gleich und eine RTX2060 ist keineswegs schwach. Aber ok, ich vergaß, Du Superheld hast ja 2080ti am Start und dann natürlich gleich mehrere davon. Wer's glaubt...
Wo kommen wir denn hin, wenn alles auf EINE Engine abgestimmt wird?? Wenn ein Programm mit üblicher "normaler" Hardware nicht klarkommt => Pech gehabt!
Mein Lieblings-"Argument" ist das mit der Bedenkzeit. Zu kurz, zu lang, zu geringer Fischer-Bonus oder sonst was. Natürlich nur, wenn der Superliebling nicht klarkommt, sonst ist alles super-duper-toll. Bin immer wieder erstaunt wie kreativ die Hardcorefans sind. Kommt der Liebling mit z.B. 5'+3" nicht klar wird halt mit so einem Unsinn wie 1'+9" gespielt. Pech nur, wenn's damit auch nicht reicht...

Leider kann ich mich nicht immer beherrschen und antworte Dir.
Ich versuche mich zu bessern
In diesem Sinne: Don't feed the troll

By Florian Wieting Date 2019-06-18 00:08

Ich bin neidisch, weil selten ist es mir gelungen dem Troll so exzellent zu antworten!

By Guenter Stertenbrink Date 2019-06-18 04:52 Edited 2019-06-18 05:13 Upvotes 1

es ist anzunehmen, dass Lc0 bei besserer Hardware, laengerer Bedenkzeit
an Elo zulegt. Dafuer gibt es mehrere Hinweise.
Ich wuesste jetzt keine AB-engine, bei der ich aehnliches beobachtet haette.
Komodo, ja, aber nicht so viel, vielleicht 5 Elo pro Bedenkzeitverdopplung,
bei LC0 im unterer Bereich sind es bei mir 50 (auf CPU) .
Bei CEGT kann ich allerdings diesen Effekt nicht sehen.
Ich denke, man sollte immer mehrere Bedenkzeiten testen, da muesste
es doch fertige Software geben, die das optimiert und automatisiert ?!

------------------------------

http://www.thechessmind.net/blog/2019/3/13/leela-chess-rating-scaling.html
> Looks like about 50 elo between a 2060 and a 2080ti, but depends on time control,
> according to people on Leela's Discord Channel.

By Peter Weise Date 2019-06-18 11:27

Also ich sehe einen Unterschied bei der CEGT.


40/4
Stockfish 10 --- 3454 Differenz = 33 
LC0 32930    --- 3421

5+3
Stockfish 10 --- 3444 Differenz = 32 
LC0 32930    --- 3412

40/20
Stockfish 10 --- 3422 Differenz = 20 (!)
LC0 32930    --- 3402

By Guenter Stertenbrink Date 2019-06-18 11:48 Edited 2019-06-18 11:59

es haengt ja davon ab, gegen wieviele schwache engines Lc0 jeweils spielt.

wenn ich nur die 6 identischen Gegner nehme in CEGT 40/4 und 40/20,
so ist Lc0 bei 40/4 deutlich(27Elo) besser
[ist das wirklich exakt dieselbe Hardware+Buch bei 40/4 und 40/20 ?]


                               40/4 ,40/20
Stockfish 10.0 x64 1CPU      - 46.3%,49.5%   +3.2
Houdini 6.0 x64 1CPU         - 57.0%,49.5%   -7.5
Komodo 13.01 x64 1CPU        - 61.5%,58.9%   -2.6
Komodo 12.3 x64 1CPU (MCTS)  - 72.0%,75.5%   +3.5
Fire 7.1 x64 1CPU            - 75.5%,75.5%   +0.0
Ethereal 11.25 x64 1CPU      - 69.5%,60.0%   -9.5
------------------------------------------------------
                               3818 , 3689

Stockfish 10.0 x64 1CPU      - 3454 200 + 33 =119 - 48 46.3 % 3429
Houdini 6.0 x64 1CPU         - 3374 200 + 59 =110 - 31 57.0 % 3422
Komodo 13.01 x64 1CPU        - 3344 100 + 32 = 59 -  9 61.5 % 3425
Komodo 12.3 x64 1CPU (MCTS)  - 3219 200 +100 = 88 - 12 72.0 % 3384
Fire 7.1 x64 1CPU            - 3242 100 + 57 = 37 -  6 75.5 % 3439
Ethereal 11.25 x64 1CPU      - 3210 200 + 91 = 96 - 13 69.5 % 3353

Stockfish 10.0 x64 1CPU      - 3422 100 + 13 = 73 - 14 49.5 % 3419
Houdini 6.0 x64 1CPU         - 3349 100 + 15 = 69 - 16 49.5 % 3346
Komodo 13.01 x64 1CPU        - 3342  90 + 27 = 52 - 11 58.9 % 3404
Komodo 12.3 x64 1CPU (MCTS)  - 3191 100 + 55 = 41 -  4 75.5 % 3388
Fire 7.1 x64 1CPU            - 3231 100 + 54 = 43 -  3 75.5 % 3428
Ethereal 11.25 x64 1CPU      - 3204 100 + 45 = 30 - 25 60.0 % 3274

Stockfish 10.0 x64 2CPU      - 3528 100 + 13 = 65 - 22 45.5 % 3497
Stockfish 20190320 x64 1CPU  - 3474 200 + 37 =128 - 35 50.5 % 3477
Stockfish 10.0 x64 1CPU      - 3454 200 + 33 =119 - 48 46.3 % 3429
Houdini 6.0 x64 2CPU         - 3432 100 + 15 = 74 - 11 52.0 % 3446
Houdini 6.0 x64 1CPU         - 3374 200 + 59 =110 - 31 57.0 % 3422
Komodo 12.2.1 x64 1CPU       - 3349 200 + 52 =127 - 21 57.8 % 3403
Komodo 13.01 x64 4CPU (MCTS) - 3344 100 + 36 = 54 - 10 63.0 % 3436
Komodo 13.01 x64 1CPU        - 3344 100 + 32 = 59 -  9 61.5 % 3425
Stockfish 8.0 x64 1CPU       - 3332 200 + 58 =122 - 20 59.5 % 3398
Xiphos 0.5 x64 4CPU          - 3303 100 + 39 = 55 -  6 66.5 % 3422
Fire 7.1 x64 2CPU            - 3303 100 + 33 = 59 -  8 62.5 % 3391
Komodo 13.01 x64 1CPU (MCTS) - 3255 200 +111 = 74 - 15 74.0 % 3438
Fire 7.1 x64 1CPU            - 3242 100 + 57 = 37 -  6 75.5 % 3439
Fizbo 2.0 x64 4CPU           - 3239 100 + 50 = 39 - 11 69.5 % 3382
Fire 7.0 x64 1CPU            - 3237 100 + 52 = 40 -  8 72.0 % 3402
Komodo 12.3 x64 1CPU (MCTS)  - 3219 200 +100 = 88 - 12 72.0 % 3384
Ethereal 11.25 x64 1CPU      - 3210 200 + 91 = 96 - 13 69.5 % 3353
Laser 1.7 x64 2CPU           - 3209 100 + 55 = 40 -  5 75.0 % 3401

Stockfish 10.0 x64 8CPU     - 3520 100 +  9 = 77 - 14 47.5 % 3503
Stockfish 10.0 x64 4CPU     - 3493 100 +  8 = 72 - 20 44.0 % 3452
Houdini 6.0 x64 4CPU        - 3432 100 + 17 = 71 - 12 52.5 % 3449
Stockfish 10.0 x64 1CPU     - 3422 100 + 13 = 73 - 14 49.5 % 3419
Komodo 13.02 x64 4CPU       - 3417 100 + 18 = 72 - 10 54.0 % 3444
Komodo 12.1.1 x64 4CPU      - 3417 100 + 11 = 74 - 15 48.0 % 3403
Houdini 6.0 x64 1CPU        - 3349 100 + 15 = 69 - 16 49.5 % 3346
Komodo 13.01 x64 1CPU       - 3342  90 + 27 = 52 - 11 58.9 % 3404
StoofVlees II a9            - 3323 100 + 47 = 35 - 18 64.5 % 3426
Fire 7.1 x64 1CPU           - 3231 100 + 54 = 43 -  3 75.5 % 3428
Ethereal 11.25 x64 1CPU     - 3204 100 + 45 = 30 - 25 60.0 % 3274
Komodo 12.3 x64 1CPU (MCTS) - 3191 100 + 55 = 41 -  4 75.5 % 3388
Xiphos 0.5 x64 1CPU         - 3184 100 + 54 = 39 -  7 73.5 % 3362
Laser 1.7 x64 1CPU          - 3159 100 + 48 = 47 -  5 71.5 % 3319
Booot 6.3.1 x64 1CPU        - 3156 100 + 61 = 38 -  1 80.0 % 3397
Deep Shredder 13 x64 1CPU   - 3154 100 + 52 = 47 -  1 75.5 % 3351

LCZero 0.20.2 Cuda (32930)  -3421 2600 +923 -291 =1386 62.2 % perf.  40/4
LCZero 0.20.2 Cuda (32930)  -3402 1590 +534 -176 = 880 61.3 % perf.  40/20
 
CEGT 40/4
CEGT 40/20

By Stefan Pohl Date 2019-06-18 08:55

Wolfgang Battig schrieb:

Tom Paul schrieb:

...
Und du weißt selbst das deine Testbedingungen für ein gigantisches 40x256 Netz ein Witz sind, wegen der schwachen Hardware und der viel zu kurzen Bedenkzeit und wo sind eigentlich die kompletten Eröffnungsphasen geblieben???

Diese alte Leier ist echt nicht totzukriegen und widert mich ehrlich gesagt langsam an.
Schneidet der "gigantische Liebling" nicht so ab, wie der "tolle" Fan es sich wünscht wird wahlweise der Tester verunglimpft ("Testbedingungen sind ein Witz", "schwache Hardware") oder alles auf angeblich zu kurze Bedenkzeiten, "falsche" Eröffnungen oder sonst was geschoben.

Die Testbedingungen sind für ALLE gleich und eine RTX2060 ist keineswegs schwach. Aber ok, ich vergaß, Du Superheld hast ja 2080ti am Start und dann natürlich gleich mehrere davon. Wer's glaubt...
Wo kommen wir denn hin, wenn alles auf EINE Engine abgestimmt wird?? Wenn ein Programm mit üblicher "normaler" Hardware nicht klarkommt => Pech gehabt!
Mein Lieblings-"Argument" ist das mit der Bedenkzeit. Zu kurz, zu lang, zu geringer Fischer-Bonus oder sonst was. Natürlich nur, wenn der Superliebling nicht klarkommt, sonst ist alles super-duper-toll. Bin immer wieder erstaunt wie kreativ die Hardcorefans sind. Kommt der Liebling mit z.B. 5'+3" nicht klar wird halt mit so einem Unsinn wie 1'+9" gespielt. Pech nur, wenn's damit auch nicht reicht...

Leider kann ich mich nicht immer beherrschen und antworte Dir.
Ich versuche mich zu bessern
In diesem Sinne: Don't feed the troll

Zumal noch dazu kommt, daß, wenn man nur die Ergebnisse der beiden 40x256 Net-Testruns miteinander vergleicht, es sowieso logischerweise völlig unerheblich ist, ob kurze oder lange Bedenkzeit, schnelle oder langsame Hardware. Denn egal, ob das größere Net nun mit irgendeiner Testbedingung besser oder schlechter klarkommt, als die 20x256 Netze, wenn man nur die beiden 40x256 Testruns miteinander vergleicht, wären ja beide gleich gehandicapped oder bevorteilt. Insofern ist diese Kritik in diesem konkreten Beispiel noch unsinniger als sonst (und das will ja was heißen!). Die Regression des 103er 40x256 Nets verglichen zum 24er 40x256 Net ist und bleibt also Fakt.
Und das ist ja auch gar nicht so tragisch. Es zeigt nur mal wieder eindrücklich, daß eben Selfplay-Elos mit größter Vorsicht zu genießen sind.

Viel interessanter finde ich, daß sich in meinen Testruns der "offiziellen" 40xxx 20x256 Nets seit 42100 kein Fortschritt mehr zeigt - im Gegenteil. Ob hier schon das Maximum erreicht ist? Vorstellbar wäre das durchaus. Auch die 10xxx und die 30xxx Nets wurden ja irgendwann nicht mehr besser und dann auch beendet. Das Gute ist aber, daß sich in meinen Testruns mit jeder neuen Generation ein meßbarer Fortschritt zeigt. Auch bei den 40xxx ist das ja der Fall, was ich auch hoffen wollte, denn immerhin kam ja hier eine verbesserte Netzstruktur (SE-Nets) zum Einsatz. Dennoch scheint es aber so zu sein, daß es eben schon einen Endpunkt in der Fortentwicklung der Netze einer fixen Bauart gibt. Ob größere Netzstrukturen wirklich einen weiteren Fortschritt bringen können, ist eben die Frage. Viele (auch ich) sind der Meinung, daß Lc0 und der ganze (ja generell sehr langsame) NN-Ansatz von mehr Bedenkzeit und/oder mehr Hardware-Power mehr profitiert, als die klassischen AB-Engines. Sollte dem so sein, so heißt das natürlich im Umkehrschluß logischerweise, daß eine Vergößerung der Netzstruktur, die ja immer auch eine entsprechende Verlangsamung der Verarbeitung bedeutet, Lc0 auch (elomäßig) sehr schwer trifft und inwieweit die größere Netzstruktur das dann elomäßig ausgleichen oder eben sogar übertreffen kann, das ist die Frage. Ich vermute mal, daß Google, die ja nun wirklich schnelle Hardware hatten, sich schon aus einem guten Grund für die Netzgröße 20x256 für ihre Schaukämpfe gegen Stockfish entschieden haben - vermutlich war Google der Meinung, daß noch größere Netze mehr Elo durch langsamere Verarbeitung verlieren, als sie durch besseres Positionsspiel noch hinzugewinnen können. Das ist natülich nur eine Annahme meinerseits. Aber sicher keine ganz unplausible.
Aber die 20x256 Nets können ja sicherlich intern noch weiter verbessert werden. Das SE-Konzept muß hier noch lange nicht der Weisheit letzter Schluß sein. Verbesserungen in der internen Netzstruktur halte ich daher für erfolgsversprechender, als Netze einfach zu vergrößern.
So oder so bleibt es interessant!

By Guenter Stertenbrink Date 2019-06-18 11:40

wenn man jetzt die Bedenkzeit der Trainingspartien runter setzt,
dann muesste Lc0 doch im Blitz besser werden ???
Und schlechter bei TCEC, ok.

Ausserdem wuerde das Training dann schneller gehen ... wer macht's ?

Waere ja evtl. auch theoretisch interessant, fuer die ganze KI-Sache

By Stefan Pohl Date 2019-06-18 12:04 Edited 2019-06-18 12:10

Guenter Stertenbrink schrieb:

wenn man jetzt die Bedenkzeit der Trainingspartien runter setzt,
dann muesste Lc0 doch im Blitz besser werden ???
Und schlechter bei TCEC, ok.

Ausserdem wuerde das Training dann schneller gehen ... wer macht's ?

Waere ja evtl. auch theoretisch interessant, fuer die ganze KI-Sache

Nein. Bei den 40xxx Nets wird ja mit nur 800 rollouts/s pro Zug in den Lernpartien gespielt. Das ist schon extrem schnell. Auf einer RTX 2060, die so 16.000 pro Sekunde schafft, wäre das eine.Bedenkzeit pro Zug von ca. 0.05 Sekunden(!), auf einer RTX 2080 noch weniger. Also ist es jetzt schon Hyperbullet, sofern man eine RTX Karte hat.

Das Lerntempo hat nichts mit der Stärke oder Schwäche von lc0 bei weniger oder mehr Bedenkzeit zu tun. Das liegt einfach an der Langsamkeit der Verarbeitung der Neuronalnetze, die eben fast 1000mal langsamer ist, als z.B. Stockfish für einen Knoten braucht. Es ist also systembedingt. Und liegt nicht an den gelernten Inhalten der Netze.
Generell sollte man eher mit mehr rollouts pro Sekunde lernen, meine ich, weil die Qualität der Lernpartien dadurch höher wird und somit auch “Besseres“ gelernt wird. Natürlich verringert das die Zahl der gespielten Lernpartien pro Tag entsprechend, man müßte also länger warten, bis die Netze an Stärke gewinnen. Dafür könnte die Stärke aber ein höheres Niveau erreichen.

http://lczero.org/training_runs

Hier kann man das sehen. Entscheidend ist der Parameter visits. Dieser spezifiziert die Zahl der rollouts/s. Im sog. Main-Run (z.Zt. der unterste) ist dieser eben nur 800.
Diese niedrige Zahl ist eigentlich ein Relikt aus der vor-RTX- und vor-CUDA-Zeit. Schon die ersten Netze lernten mit 800... ich verstehe nicht, warum man das heutzutage nicht mal deutlich anhebt. Der neue alternative Lernrun (ganz oben) lernt ja z.B. mit 10000. Das hielte ich auch bei den Main-Runs für einen sinnvollen Wert. Leider habe ich darauf keinen Einfluß.

By Guenter Stertenbrink Date 2019-06-18 12:16 Edited 2019-06-18 12:41 Upvotes 1

OK, danke.
Es wuerde aber auch noch schneller gehen, mit RTX, oder ?
Gab er Versuche, die beste Bedenkzeit fuer die Trainingspartien zu finden,
oder hat man das einfach von A0 uebernommen ?
Und die hatten es vermutlich von Leela-Go uebernommen, was aber wohl doch
irgendwie,irgendwann mal ausprobiert und optimiert wurde ?

-----------------------------------

2) 54016 , alternative testing --visits=10000
1) 42601 , main run --visits=800
3) 49901 , Run for even crazier experiments --visits=800

By Stefan Pohl Date 2019-06-18 14:31

Ich muß wohl nochmals betonen, daß es bei den Lernpartien keine Bedenkzeiteinteilung gibt. Sondern rollouts pro Zug (z.Zt. eben 800). Das ist auch die einzig sinnvolle Methode, da die gespendete Hardware unterschiedlich leistungsstark ist. Nur so hat man eine einheitliche Qualität in den Lernpartien, egal ob jemand eine AMD, GTX oder RTX Karte hat. Daher generiert man mit einer RTX Karte eben mehr Lernpartien in gleicher Zeit, als mit AMD oder GTX. Aber in der identischen Qualität.
Wo der Wert von 800 rollouts pro Zug herkommt, weiß ich auch nicht. Ich glaube mal gelesen zu haben, daß Google damit AlphaZero trainiert (die Schachversion) hat, sicher bin ich da aber nicht.

By Stefan Pohl Date 2019-07-01 12:16 Upvotes 2

Guenter Stertenbrink schrieb:

<a class='ura' href='http://talkchess.com/forum3/viewtopic.php?f=6&t=71018'>http://talkchess.com/forum3/viewtopic.php?f=6&t=71018</a>

> LC0 40x256 is 9 elo weaker than LC0 20x256.

Wers glaubt wird selig.

Zunächst mal nur 40 Partien, noch dazu im Selfplay lc0 - lc0. Damit ist so ein Ergebnis schon mal statistisch ein Witz. Zudem stammt es von "Hai", hier besser bekannt als Troll Paul (oder so ähnlich)... mehr muß ich dazu wohl eigentlich nicht sagen.

Zudem hab ich Netz 103 der 40x256 Netze bei mir getestet. Mit 728 Partien: -175 Elo zum besten 20x256 Netz...

Aber, wenn mein Testrun von 42668 durch ist, teste ich das dann aktuelle 40x256 Netz, zumindest ist das momentan der Plan, auch, wenn die Selfplay-Elos auf dem Server da gerade im freien Fall sind.

By Tom Paul Date 2019-07-03 00:34

Stefan Pohl schrieb:

Guenter Stertenbrink schrieb:

<a class='ura' href='<a class='ura' href='http://talkchess.com/forum3/viewtopic.php?f=6&t=71018'>http://talkchess.com/forum3/viewtopic.php?f=6&t=71018</a>'>http://talkchess.com/forum3/viewtopic.php?f=6&t=71018</a>

> LC0 40x256 is 9 elo weaker than LC0 20x256.

Wers glaubt wird selig.

Zunächst mal nur 40 Partien, noch dazu im Selfplay lc0 - lc0. Damit ist so ein Ergebnis schon mal statistisch ein Witz. Zudem stammt es von "Hai", hier besser bekannt als Troll Paul (oder so ähnlich)... mehr muß ich dazu wohl eigentlich nicht sagen.

Zudem hab ich Netz 103 der 40x256 Netze bei mir getestet. Mit 728 Partien: -175 Elo zum besten 20x256 Netz...

Aber, wenn mein Testrun von 42668 durch ist, teste ich das dann aktuelle 40x256 Netz, zumindest ist das momentan der Plan, auch, wenn die Selfplay-Elos auf dem Server da gerade im freien Fall sind.

Hmm hab mir da mal die Partien heruntergeladen, bei ~180 Zügen pro Engine und 10 Sekunden pro Zug Bonus (standard Zeit nicht mitgezählt) macht das ~30 Minuten pro Engine bzw. über eine Stunde pro Partie.
Qualitativ sind somit diese Partien um ein vielfaches besser als deine Partien in Lichtgeschwindigkeit.
Hinzu kommt noch das dort zwei GPUs und auch noch viel stärkere RTX GPUs verwendet werden.
Dadurch steigt der qualitative Unterschied nochmals deutlich an.
Dazu kommt noch das dort anscheinend mit Ponder On gespielt wurde.
Dadurch wird der inzwischen schon gigantisch große qualitative Unterschied doppelt so groß.

Es ist schon lustig zu sehen das so ziemlich jede Person die anderer Meinung ist als Andere bzw. genau oder ähnlich der Meinung ist wie ich, seit längerer Zeit für mich gehalten wird und das scheinen sehr viele Personen zu sein und immer mehr zu werden

.
PS. bei mir waren es übrigens +75 ELO und das schon vor viel längerer Zeit.

By Tom Paul Date 2019-07-03 00:15

Guenter Stertenbrink schrieb:

<a class='ura' href='http://talkchess.com/forum3/viewtopic.php?f=6&t=71018'>http://talkchess.com/forum3/viewtopic.php?f=6&t=71018</a>

> LC0 40x256 is 9 elo weaker than LC0 20x256.

Danke, damit sei quasi bewiesen dass das 40x256 Netz viel besser ist.