Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Entwicklung von Lc0 Test30 NN
1 2 3 Previous Next  
Parent - - By Lothar Jung Date 2018-11-25 14:59
Bisher nur Remis in 7 Partien.
Eher symmetrische und langweilige Partien.
Parent - - By Stefan Pohl Date 2018-11-25 15:20
Lothar Jung schrieb:

Bisher nur Remis in 7 Partien.
Eher symmetrische und langweilige Partien.


Tja, nimm Drawkiller, dann hat sich das mit der Langeweile ganz schnell erledigt. Und mit der Symmetrie auch. 

Drawkiller Tournament und die Eröffnungsstellung auf jeden Fall mit vertauschten Farben wiederholen. Bei nur 50 Partien eliminiert das doch etwas Zufallsschwankung. Also nicht das Eröffnungsbuch nehmen, sondern das PGN-file (oder EPD-file) als Vorgabeset.
Parent - By Lothar Jung Date 2018-11-25 16:37
Tja, alle 10 Partien remis.
Ich warte auf eine weitere reale Elo-Steigerung bis ich wieder allein für nur für ein 10er-Tunier über 1kw Strom verbrauche.
Da die Engines abwechselt immer rechnen werden allein von den GPUs 400 Watt pro Stunde verbraucht.
Parent - By Lothar Jung Date 2018-11-25 15:04
Bisher nur Remis in 7 Partien.
Die Netze spielen ein eher symmetrisches, langweiliges Schach.
Parent - - By Reinhold Stibi Date 2018-11-30 12:36
Bisher lag das 3er Netz um ca. 200 Elo hinter 11150 und Stockfish 25.10.18

Ein sehr gutes 3er Netz ist das 31670  8250 Elo  98.334 Partien !  vom 29.11.18.

52 Partien gegen Stockfish 25.10.18  1 CPU .

Lc0 v0.19.0  31670  8250 Elo  98.334 Partien mit GTX 960  2 Min. +6 Sek.Z.
und Pohl Buch 4 Züge Vorgabe

+4    =23   -25   = 29,8%  = -149 Elo.

Damit hat Lc0 ca. 50 Elo aufgeholt.

Lc0 gewann in dem Match 4 Partien durch schönes Angriffsschach.

Das Ergebnis lässt hoffen.

Von der Zeit sollte man nicht mehr geben. Im Computerschach sind schnelle Ergebnisse
interessant. Wer möchte sich ewig lange mit einer Computerschachpartie abgeben.
Außerdem wären es dann viel weniger Partien und schlechtere Engines würden sich dann
eher an die besseren Engines, wie Stefan Pohl richtigerweise anführte, annähern.
Parent - - By Stefan Pohl Date 2018-11-30 12:41
Naja, aber hoffen worauf? Die 30xxx Nets werden ja demnächst auch ad acta gelegt. Wenn LC0 0.20.0 kommt, wird es eine neue Netzstruktur geben und damit auch (gezwungenermaßen) mal wieder einen Lern-Neustart bei 0.
Insofern hät sich mein Interesse an den 30xxx Netzen sehr in Grenzen.
Parent - - By Tom Paul Date 2018-11-30 15:29
Stefan Pohl schrieb:

Naja, aber hoffen worauf? Die 30xxx Nets werden ja demnächst auch ad acta gelegt. Wenn LC0 0.20.0 kommt, wird es eine neue Netzstruktur geben und damit auch (gezwungenermaßen) mal wieder einen Lern-Neustart bei 0.
Insofern hät sich mein Interesse an den 30xxx Netzen sehr in Grenzen.


Dann muss man eben auch mal die Hardwarepower zum stiften verdoppeln.
Oder einfach mal deutlich mehr Werbung für die Teilnahme zum stiften der Hardware machen.
Parent - By Peter Martan Date 2018-11-30 19:43
Tom Paul schrieb:

Oder einfach mal deutlich mehr Werbung für die Teilnahme zum stiften der Hardware machen.

Oder nicht immer gleichzeitig auch noch Werbung für die Teilnahme zum Stiften der Hardware für Stockfish machen.
STOCKFISH
GET FAST INVOLVED: CLICK MY NAME
Parent - By Heiko Krauß Date 2018-12-01 10:45
Tom Paul schrieb:

Dann muss man eben auch mal die Hardwarepower zum stiften verdoppeln.


Frag doch mal in Langley nach , die verzehnfachen die Hardwarepower
Parent - - By Stefan Pohl Date 2018-11-25 12:47 Edited 2018-11-25 12:51
Thomas Plaschke schrieb:

Ergebnis für 11260 gegen 31464 nach 24 Partien 15:9 für 11260, das nach Siegen 6:0 führt. Engine bei beiden lc0 v0.19, "normale" Eröffnungsvorgabe (Nunn2), Bedenkzeit 5'/3".
Habe dann abgebrochen. Nimmt man die anderen Berichte dazu, liegt die Schlussfolgerung auf der Hand ... Aber ich hör's ja schon jetzt: falsche Hardware für die 31xxx (war 'ne 1080), zu geringe Bedenkzeit (wie viel wäre denn genehm), 31xxx ist von der Knotenleistung benachteiligt (beide in etwa gleich) oder die Wildschweine hatten was falsches gefressen (frei nach Asterix bei den Olympischen Spielen).

Viele Grüße
Th. Plaschke


Das neueste 31551 Net ist laut Elo-Graph auf der Website ja schon 950 Elo besser als 31464 (LOL)...

Ich starte auch noch mal einen Testrun, bis morgen. Mit Drawkiller, versteht sich. Denn das aktuelle Net 31551 ist ja angeblich +375 Elo besser, als Net 31515, daß ich gestern gestestet hatte. Also müßte jetzt ja (gestern waren es +330 Elo für Net 11250) das Net 31551 schon besser sein als 11250...
Na, gucken wir mal.
Parent - - By Stefan Pohl Date 2018-11-25 12:56
Man möge mich nicht falsch verstehen: Ich bin ein Riesenfan von Leela. Das NeuralNetz-Konzept ist absolut bahnbrechend und die Spielweise von Leela ist fantastisch (vom Endspiel mal abgesehen). Niemand würde sich mehr als ich freuen, wenn die neuen Netze wirklich die 11xxx Netze überholen könnten!
Parent - By Thomas Plaschke Date 2018-11-25 13:51
Völlig d'accord! Es geht mir genauso. Ich habe einen Heidenrespekt vor der Expertise der Leute, die dieses Projekt aus dem Boden gestampft haben und weiter voranbringen. Und ich finde die Begeisterung toll, mit der viele Enthusiasten durch ihre Rechenzeitspenden dem Projekt helfen. Auch, wenn ich bestenfalls nur oberflächlich verstehe, wie das funktioniert. - Eigentlich überrascht mich bereits, dass lc0 funktioniert.
Zu kritisieren hätte ich allenfalls die Darstellung der Testmethodik und die Absicherung der Ergebnisse. Es muss zwangsläufig zu Missverständnissen führen, wenn man die Selfplay-Elo für tatsächliche Spielstärkesteigerungen hält. Die muss immer im Spiel gegen andere Engines bewiesen werden.

Viele Grüße
Th. Plaschke
Parent - By Tom Paul Date 2018-11-25 13:36
Stefan Pohl schrieb:

Das neueste 31551 Net ist laut Elo-Graph auf der Website ja schon 950 Elo besser als 31464 (LOL)...


Was ist daran so lustig?
Die 950 Selfplay ELO entsprechen +47,5 echten ELO.
Und das passt perfekt.
Parent - - By Lothar Jung Date 2018-11-26 15:44
Mein neues Tunier Lc0 0.19 11250 gegen 31579 ging mit 1:1:8 unentschieden aus. TC: 5min/5sec jeweils 4 cores und gleichen Einstellungen, keine TB, keine Eröffnungen. Interessante Partien, umkämpft.
Nur Test NN 31xxx werden weiter trainiert. Sind jetzt schon auf der Hardwareebene SLI 1080, 2080, 2070 gegenüber bisher stärksten Netz 11259 und SF9 4 cores aud Augenhöhe.
Es wird weiter trainiert und es stehen noch 2 LR Drops aus.
Parent - By Lothar Jung Date 2018-12-02 20:56
Neues Testtunier 31744 gegen 11245 ging knapp zugunsten von 11245 mit 2:1:7 aus.
Rahmenbedingungen wie sonst.
Parent - - By Lothar Jung Date 2018-11-24 18:53 Edited 2018-11-24 18:57
Die Performance von den aktuellen 31xxx Netzen hängen doch stark von der GPU-Hardware ab.
Die Einstellungen/Filter dieses Netzes sind aufwändiger als Netz 11xxx, sodass das Training länger dauert und eine stärkere GPU erforderlich ist, um die gleichen Rechentiefen zu erreichen.
Auf meiner SLI-1080-Hardware ist lc0 0.19 mit einem aktuelleren Netz auf dem Niveau von SF9 4 cores (siehe Beiträge).
Heute gewann Lc0 das dritte Blitztunier (5min/5sec) gegen SF9 4 cores wieder knapp mit 1:0:9.
Es wurde keine Eröffnungsbibliothek eingesetzt.
Auf einer 2080ti gewann Lc0 31503 2:0:7 gegen SFdev. Siehe Beitrag mit Link.
Parent - - By Stefan Pohl Date 2018-11-25 09:05
Lothar Jung schrieb:

Die Performance von den aktuellen 31xxx Netzen hängen doch stark von der GPU-Hardware ab.
Die Einstellungen/Filter dieses Netzes sind aufwändiger als Netz 11xxx, sodass das Training länger dauert und eine stärkere GPU erforderlich ist, um die gleichen Rechentiefen zu erreichen.


Sorry, Lothar, aber das ist schlicht falsch. Die 30xxx Nets sind in ihrer Struktur identisch zu den 10xxx Nets. Und die Rechentiefe und die Art zu rechnen hängt nur von der lc0-Engine ab. Bei gleicher, interner Netzgröße und Struktur erreicht lc0 auf gleicher Hardware auch die gleichen Suchtiefen. Ich hab einige Partien live angesehen und die angezeigten Suchtiefen waren bei beiden Nets identisch - logischerweise, da ich beide Male lc0 0.19.0 benutzt habe.
Die 30xxx und die 20xxx und die 10xxx Nets unterscheiden sich nur durch ihre Lernwerte, also die Zahlenwerte an sich sind andere. Die interne Struktur der Nets  ist absolut gleich. Und ebenso die Art, wie lc0 sie benutzt, wenn man immer dieselbe Version 0.19.0 benutzt.
Parent - - By Lothar Jung Date 2018-11-27 14:55 Edited 2018-11-27 14:59
Hier sind die qualitativen Änderungen zwischen Test10, Test20 und Test30 dokumentiert:

http://blog.lczero.org/search?q=Test20

http://blog.lczero.org/search?q=Test30

Aktuelle Test30 Nets erreichen auf stärkerer Hardware und höherem TC relativ zu SF9 und Net 11250 bessere Ergebnisse.
Parent - - By Stefan Pohl Date 2018-11-27 15:28
Lothar Jung schrieb:

Hier sind die qualitativen Änderungen zwischen Test10, Test20 und Test30 dokumentiert:

<a class='ura' href='http://blog.lczero.org/search?q=Test20'>http://blog.lczero.org/search?q=Test20</a>

<a class='ura' href='http://blog.lczero.org/search?q=Test30'>http://blog.lczero.org/search?q=Test30</a>



All dies beeinflußt nur die Zahlenwerte im Netz. Die Struktur, Größe und die Abarbeitung durch Leela bleibt immer gleich. Zudem basieren die Lernpartien nachwievor auf 800 Rollouts/Zug. Schon das schließt aus, daß einige Nets mit mehr Bedenkzeit plötzlich besser spielen als andere. Da ihr Lernen immer auf denselben Rechentiefe basiert.

Daß die 30er nets gegen Stockfish 9 und die 11er nets mit mehr Zeit besser scoren liegt nur an einem Effekt, den ich hier schon gefühlt 1000 mal erklärt habe:
Die Ergebnisse in einem Engine-Zweikampf rücken mit mehr Bedenkzeit und/oder besserer Hardware immer stärker Richtung 50%-Marke, weil es mehr Remisen gibt. Dadurch wird die schwächere Engine in einem Zweikampf immer scheinbar stärker und die bessere schwächer.
Kannst ja mal ein 30er Net gegen eine deutlich schwächere Engine spielen lassen, einmal mit wenig und einmal mit viel Bedenkzeit. Dann wird das 30er Net mit mehr Zeit plötzlich schlechter.
Parent - By Lothar Jung Date 2018-11-28 17:12 Edited 2018-11-28 17:16
Hier ist ein Link zu einem 2Minuten/12sec  Blitz-Tunier mit Test30 NN 31630 auf einer RTX 2080ti gegen SF9 6 cores.
Ergebnis: Unentschieden.

https://groups.google.com/forum/m/#!topic/lczero/Z1V4o_o80_I
Parent - - By Lothar Jung Date 2018-11-28 13:51
Hier ist ein Link zu einer Tabelle hinsichtlich von Partien von Test30 NN gegen Stockfish.
Die Tests laufen unter CCRL-40/40-Bedingungen (15 Minuten).
Das Netz 31627 ist genau auf Elo-Höhe von SF8 4 cores mit einer GTX 1070ti.
Das entspricht in etwa meinen Tests mit SF9 4 Cores mit einer 2x1080.

https://docs.google.com/spreadsheets/d/1QxAG6XVTvvTAGlZ-kpSSvv0VuMGh7RkJjgKqgT37vMU/htmlview#
Parent - - By Lothar Jung Date 2018-12-01 20:29 Edited 2018-12-01 20:32
Test30 31703 mit Fortschritten,  jetzt auf einer GTX 1080ti und 1min/1sec mit 3461 42 Elo unter SF8 4cores.

https://docs.google.com/spreadsheets/d/1ZAIuHR6n-5JTxKQc0XUSx1jyUrgVEcj8DNLKA7-urBw/htmlview#gid=763519729
Parent - By Tom Paul Date 2018-12-01 20:49
Lothar Jung schrieb:

Test30 31703 mit Fortschritten,  jetzt auf einer GTX 1080ti und 1min/1sec mit 3461 42 Elo unter SF8 4cores.

<a class='ura' href='https://docs.google.com/spreadsheets/d/1ZAIuHR6n-5JTxKQc0XUSx1jyUrgVEcj8DNLKA7-urBw/htmlview#gid=763519729'>https://docs.google.com/spreadsheets/d/1ZAIuHR6n-5JTxKQc0XUSx1jyUrgVEcj8DNLKA7-urBw/htmlview#gid=763519729</a>


Und auf einer RTX 2080 Ti sieht die Sache schon ganz anders aus     .

Wann erscheint v0.20.0 eigentlich?
Und was hat es mit der neuen Architektur auf sich?
Oder bezieht sich das etwa auf die speziellen Verbesserungen bzgl. INT4 welche man vornehmen wollte?
Parent - - By Stefan Pohl Date 2018-11-27 14:01
Es läuft auf Twitch immer noch (bei potatochess) der LC0 Dauer-Test gegen 10 AB-Engines. Jedes Netz immer 200 Partien, 1'+1'', Leela Ratio: 1.5 (also sehr gut für LC0, da Ratio höher als 1).

https://www.twitch.tv/potato_chess

Das beste Netz bisher ist 11250, das hatte 129 Punkte aus 200 Partien. Die 30xxx liegen bisher noch alle unter 100 Punkte von 200 Partien, also meilenweit schlechter (über -100 Elo)
Parent - - By Lothar Jung Date 2018-12-06 13:14
Parent - - By Reinhold Stibi Date 2018-12-06 14:45
Schön wäre es, wenn es so wäre !

Mit dem noch neueren Netzwerk 31830 bekam Lc0 auf meiner GTX 960

fürchterliche Prügel gegen Stockfish 10  mit 1 CPU,    über 300 Elo im minus.

Auch wenn Lc0 noch aufgeholt hätte, wäre das Ergebnis gegen Stockfish 10
sehr schlecht ausgefallen. Habe deshalb den Test abgebrochen.
Parent - By Stefan Pohl Date 2018-12-06 16:29 Edited 2018-12-06 16:39
https://www.twitch.tv/potato_chess

Es geht hier auch langsam aufwärts. Mittlerweile "nur" noch ca. -80 Elo für die 30xxx Nets verglichen mit dem Bestwert von Net 11250. Bei dem Tempo wird (bzw. würde) das aber noch etliche Wochen dauern, bis Net 11250 erreicht würde. Falls die 30xxx bis dahin nicht schon gestoppt wurden. Sie werden ja auf jeden Fall nicht unbegrenzt weiter lernen. Sobald LC0 v0.20.0 kommt, geht es ja sowieso wieder bei Null los.

Das Net 11250 ist aber auch sehr stark. Ich habe ja mein long thinking-time Turnier wieder gestartet, mit meinem Drawkiller Tournament Buch. LC0 mit Net 11250 kommt mit diesen Eröffnungsvorgaben super zurecht (obwohl sie ja etwas komisch aussehen, aber sie sind eben auch sehr "unentwickelt", was Leela ja entgegenkommt) und liegt hier auf Augenhöhe mit Komodo 12.2.2 und Houdini 6. Das ist ja aller Ehren wert. Stockfish 181120 (also fast Stockfish 10) spielt allerdings mit Drawkiller Eröffnungen in einer eigenen Liga und spielt die Konkurrenz in Grund und Boden. Fire 7.1, der mit Drawkiller Eröffnungen sein langweiliges Remis-Schach nicht aufziehen kann, geht dafür mal so richtig unter.

Alle Infos plus Tabelle plus Partiendownload (PGN mit allen Bedenkzeiten, Suchtiefen und Bewertungen) hier:
https://www.sp-cc.de/long-thinkingtime.htm
Parent - By Tom Paul Date 2018-12-06 17:05
Reinhold Stibi schrieb:

Schön wäre es, wenn es so wäre !

Mit dem noch neueren Netzwerk 31830 bekam Lc0 auf meiner GTX 960

fürchterliche Prügel gegen Stockfish 10  mit 1 CPU,    über 300 Elo im minus.

Auch wenn Lc0 noch aufgeholt hätte, wäre das Ergebnis gegen Stockfish 10
sehr schlecht ausgefallen. Habe deshalb den Test abgebrochen.


Du hast ja auch 1. keine RTX 2080 Ti, sondern eine GTX 960 und 2. ein anderes Testverfahren.
Parent - - By Stefan Pohl Date 2018-12-06 16:43 Edited 2018-12-06 17:11
Lothar Jung schrieb:

Jetzt nur noch 35 Elo, siehe Link:

<a class='ura' href='https://groups.google.com/forum/m/#!topic/lczero/JUEPl1fY0UU'>https://groups.google.com/forum/m/#!topic/lczero/JUEPl1fY0UU</a>


Und warum wohl? Superschnelle Hardware (RTX 2080Ti = 32000 rollouts/s für Leela) und daraus folgend exorbitant hohe Remisqoute (82% !). Das drückt zwangsläufig alle Ergebnisse nah an 50%. Was die schwächere Engine stärker wirken läßt. Wie oft muß ich das eigentlich hier noch erklären?!?? Man muß sich doch nur mal klarmachen, was 82 Remisen aus 100 Partien heißt: nur 18 Partien drücken das Ergebnis von der 50%-Marke (also 0 Elo Spielstärkeunterschied) weg, aber 82 Partien drücken das Ergebnis eben hin zu 50%-Marke. So KANN kein Ergebnis mit nennenswerten Eloabständen entstehen.
Sag dem Veranstalter dieses Tests mal, er soll das Ganze mal mit Drawkiller Eröffnungen wiederholen. Dann könnt ihr euch eure -35 Elo aber sowas von abschminken...
Parent - - By Martin Steinwandter Date 2018-12-06 16:54
Wer ihr?
Ich sage lange schon das Team um LC0 macht keine aussagekräftige Tests. Trotzdem ist LC0 unter den Besten vier zu finden. Ist schon stark!
Parent - - By Stefan Pohl Date 2018-12-06 17:08 Edited 2018-12-06 17:11
Die Testruns auf twitch (potatochess) sind m.E. die aussagekräftigsten Testruns von LC0, die man z.Zt. finden kann. Die sind ganz ordentlich. Jeder Run immerhin mit 200 Partien gegen 10 AB-Engines. Und dank der kurzen Bedenkzeit und nicht so schnellen Hardware ist auch die Remisqoute in einem statistisch noch vertretbaren Bereich.
Parent - - By Stefan Pohl Date 2018-12-07 17:45
https://www.twitch.tv/edosani

Gerade startet dort ein Head-to-Head von LC0 v0.19.1-rc1 Net 31864 gegen Houdini 6 auf echter Monsterhardware (für beide Engines, sodaß eine Leela-Ratio von 0.65 rauskommt, was ziemlich "fair" ist (sofern man solche Vergleiche von CPU und GPU überhaupt machen kann). Zeit ist wohl 5'+1''. Irgendeine Standard Buch-Vorgabe, relativ kurzzügig.

Die extrem starke Hardware gepaart mit den klassischen Eröffnungsvorgaben läßt mich allerdings eine Remis-Orgie befürchten, die eine seriöse Ergebnisauswertung wahrscheinlich fast unmöglich macht. Die ersten 4 Partien sind schon mal Remis...
Parent - By Tom Paul Date 2018-12-07 17:58
Stefan Pohl schrieb:

<a class='ura' href='https://www.twitch.tv/edosani'>https://www.twitch.tv/edosani</a>

Gerade startet dort ein Head-to-Head von LC0 v0.19.1-rc1 Net 31864 gegen Houdini 6 auf echter Monsterhardware (für beide Engines, sodaß eine Leela-Ratio von 0.65 rauskommt, was ziemlich "fair" ist (sofern man solche Vergleiche von CPU und GPU überhaupt machen kann). Zeit ist wohl 5'+1''. Irgendeine Standard Buch-Vorgabe, relativ kurzzügig.

Die extrem starke Hardware gepaart mit den klassischen Eröffnungsvorgaben läßt mich allerdings eine Remis-Orgie befürchten, die eine seriöse Ergebnisauswertung wahrscheinlich fast unmöglich macht. Die ersten 4 Partien sind schon mal Remis...


Was für eine Hardware ist das?
LC0 hatte jetzt mehrere mal in der Anfangsstellung ~22k, somit sollte das eine RTX 2080 sein oder?
Parent - - By Stefan Pohl Date 2018-12-12 08:57 Edited 2018-12-12 09:06
Der aktuelle Stand auf potatochess der 30XXX Nets ist wie folgt:

Net 31959 ist gerade durchgelaufen und erreichte 112.5 aus 200 = 56.3% (neuer Bestwert der 30XXX Nets)
Net 11250 hält nach wie vor den absoluten Bestwert mit 129.5 aus 200 = 64.8%

Laut Elotabelle ist also Net 31959 -62 Elo schwächer als 11250. Das klingt viel, allerdings ist in den Testruns der 30XXX Nets auf potatochess ein eindeutiger Aufwärtstrend erkennbar. Und wegen der kurzen Bedenkzeit und den nicht so hohen Suchtiefen (Leela kommt so auf ca. 2000 rollouts/s und die Gegnerengines laufen singlecore, SF9 mit ca. 1200 knps) ist das Ergebnis auch nicht durch eine exorbitant hohe Remisqoute "zerdrückt". Insofern ist der Rückstand auf Net 11250 mittlerweile recht überschaubar. Dennoch ist 11250 definitiv immer noch stärker. Leela-Ratio ist übrigens 1.5 bei Potatochess, also ein doch recht hoher Wert, der Leela zumindest etwas bevorteilt.

https://www.twitch.tv/potato_chess

PS: Da die Selfplay-Elo auf der LC0-Networkseite extrem inflatorisch sind, ist es schwer, hier wirklich seriös zu schätzen. Aber ich probiere es mal und wage die Prognose, daß die 30XXX Nets dort ca. 9500 "Leela-Selfplay-Elo" erreichen müßten, um Net 11250 zu überholen. Aber das ist eine "Pi mal Daumen" - Schätzung mit Ratefaktor... Stand jetzt ist so ca. 9140. Sollte die Kurve auf der LC0-Networkseite weiter in etwa gleichbeibendem Tempo ansteigen, könnten ca. 5 Millionen weitere Lernpartien dafür ausreichen. Also circa. 7-10 Tage, je nachdem, wieviele Partien pro Tag gespielt werden. Das ist aber ein optimistisches Szenario. Ich weiß zudem nicht, wann der nächste LR-drop kommen wird. Wie es dann nach diesem weitergeht mit den Selfplay-Elo, kann man sowieso nur schwer vorhersagen.
Parent - - By Lothar Jung Date 2018-12-12 10:49
In diesem Tunier (100 Partien, 2min, 2080ti) wurde 11248 von einem aktuellen Test30 net 31954 um 10 Elo übertroffen:

https://groups.google.com/forum/m/#!topic/lczero/P4PfT-hrqhM
Parent - By Stefan Pohl Date 2018-12-12 11:43 Upvotes 1
Und? Nur 30 Vorgabestellungen für 100 Partien... Und 93% Remisqoute (also nur 7 nicht-Remisen)
Das ist kein “Turnier“, sondern ein schlechter Witz.
Wer sowas ernst nimmt, ist selbst schuld. Ich tue das jedenfalls bestimmt nicht.
- - By Horst Sikorsky Date 2018-11-25 16:58
LcO 19 11250 - Corchess 191118, 5min+20s pro Zug


                                         1234567890123456
1   Lc0 v0.19.0                     +22   1½10½½1½½½0½½½½½   8.5/16
2   CorChess 2.6 191118 64 POPCNT   -22  0½01½½0½½½1½½½½½    7.5/16

Parent - - By Horst Sikorsky Date 2018-11-25 17:27
1.e4 e6 2.d4 d5 3.Sd2 Le7 4.c3 c5 5.dxc5 Lxc5 6.Ld3 Sf6 7.e5 Sfd7 8.Sgf3 Dc7 9.Sb3 Sc6 10.Lf4 Le7 11.De2 b6 12.h4 Sc5
1.e4 e5 2.Sf3 Sc6 3.Lb5 f5 4.Sc3 Lc5
1.d4 Sf6 2.c4 g6 3.Sc3 Lg7 4.e4 d6 5.Sf3 0–0 6.Le2 e5 7.0–0 Sc6 8.d5 Se7 9.Se1
1.e4 c6 2.d4 d5 3.e5 Lf5 4.Sf3 e6
1.d4 f5 2.Lg5 h6 3.Lh4 g5 4.e3 Lg7
1.e4 e6 2.d4 d5 3.e5 c5 4.c3 Sc6 5.Sf3 Db6 6.a3
1.d4 d5 2.c4 c6 3.Sf3 Sf6 4.Sc3 e6 5.Lg5 h6 6.Lh4 dxc4 7.e4 g5 8.Lg3 b5
1.e4 e5 2.Sf3 Sc6 3.Lc4 Sf6 4.Sg5 Lc5
das waren die Vorgaben
PS Ryzen7x1800 CorChess 2cpu 3,6 GHz - LcO 1070 GTX
Parent - By Reinhold Stibi Date 2018-11-30 12:40
Irrtümlicherweise rutschte mein heutiger Beitrag nach weiter oben,
sollte aber unten landen, da neu.
- - By Reinhold Stibi Date 2018-12-06 15:38
Horst, lasse doch mal Deine schnelle GTX Karte mit Lc0 und neuestem besten 3er Netzwerk

gegen Stockfish 10 mit 8 Threads spielen.

Das wäre doch der augenblickliche Stand um Platz 1 im Computerschach.

Schätze dass Lc0 mit 100 bis 160 Elo zurückliegt.
Parent - - By Horst Sikorsky Date 2018-12-06 21:24
Reinhold Stibi schrieb:

Horst, lasse doch mal Deine schnelle GTX Karte mit Lc0 und neuestem besten 3er Netzwerk

gegen Stockfish 10 mit 8 Threads spielen.

Das wäre doch der augenblickliche Stand um Platz 1 im Computerschach.

Schätze dass Lc0 mit 100 bis 160 Elo zurückliegt.

ich kann sogar meine Wahnsinnig schnelle GTX 1080    gegen Stockfish 10 mit 2CPU 3.6 MHz testen.
an die Experten ... ist da nicht LcO im Hartware- Vorteil?
Lauft leider schon ... ELO interessieren mich nicht, es reicht mir, was ich sehe 
PS---- Net 31842
Parent - By Horst Sikorsky Date 2018-12-07 19:20
Horst Sikorsky schrieb:

Reinhold Stibi schrieb:

Horst, lasse doch mal Deine schnelle GTX Karte mit Lc0 und neuestem besten 3er Netzwerk

gegen Stockfish 10 mit 8 Threads spielen.

Das wäre doch der augenblickliche Stand um Platz 1 im Computerschach.

Schätze dass Lc0 mit 100 bis 160 Elo zurückliegt.

ich kann sogar meine Wahnsinnig schnelle GTX 1080    gegen Stockfish 10 mit 2CPU 3.6 MHz testen.
an die Experten ... ist da nicht LcO im Hartware- Vorteil?
Lauft leider schon ... ELO interessieren mich nicht, es reicht mir, was ich sehe 
PS---- Net 31842

habe nach 22.Partien abgebrochen +8 =14. 15:7. 68,18% für Stockfish.
dies könnte das Kräfteverhältnis gegen das (die) schwache(n) Netz(e) einigermaßen entsprechen.
Parent - - By Tom Paul Date 2018-12-07 19:26
Horst Sikorsky schrieb:

Reinhold Stibi schrieb:

Horst, lasse doch mal Deine schnelle GTX Karte mit Lc0 und neuestem besten 3er Netzwerk

gegen Stockfish 10 mit 8 Threads spielen.

Das wäre doch der augenblickliche Stand um Platz 1 im Computerschach.

Schätze dass Lc0 mit 100 bis 160 Elo zurückliegt.

ich kann sogar meine Wahnsinnig schnelle GTX 1080    gegen Stockfish 10 mit 2CPU 3.6 MHz testen.
an die Experten ... ist da nicht LcO im Hartware- Vorteil?
Lauft leider schon ... ELO interessieren mich nicht, es reicht mir, was ich sehe 
PS---- Net 31842


Wahnsinnig schnelle GTX 1080    
Parent - - By Horst Sikorsky Date 2018-12-07 22:51 Upvotes 4
Tom Paul merkt nichts 
Parent - - By Ernest Bonnem Date 2018-12-08 02:06 Upvotes 1
+1   ...eine Tragödie !!!       
Parent - - By Guenter Stertenbrink Date 2018-12-14 15:47 Edited 2018-12-14 16:21
Willkommen im Chat!
3:45ModeratorVerifiziertNightbot: Leela vs Leela/Ender (take 2) on https://tcecbonus.club/

opening:
10/24   Depth   11/27
47 Knps   Speed   51 Knps

http://www.chessdom.com/tcec-season-13-the-13th-top-chess-engine-championship/

TCEC Season 13 – the 13th Top Chess Engine Championship
Dec 14, 2018

tcec14Written by Guy Haworth and Nelson Hernandez
Reading, UK and Maryland, USA

This is the first in a new series of analytical articles on TCEC events....

-------------------------------
4:08ModeratorVerifiziertNightbot: Updates for Division 1: Laser 181205, Ginkgo 2.18, Chiron TCEC-S14
4:08ModeratorVerifiziertNightbot: Ben you are the lexcsMVP zombiMVP

-----------------------------------
:15madchuckle: Test30 was going strong it just needed two more drops, but since A0 papers came, new settings are on the table to be tried, and the drops are delayed for this
------------------------------------
4:18Twitch PrimeMacLnx: LR drop before the end of the year is what I read on Discord
---------------------------------------
Parent - - By Reinhold Stibi Date 2018-12-16 17:11
Das 3er Netzwerk hat aufgeholt und liegt gegenüber 11150 nur noch ca. 40 Elo zurück.

Im Spiel gegen Stockfish 10  1 CPU   und Lc0 v0.19.1.1 mit GTX 960 
                                                            Netzwerk 32044  9402 Elo   29.102 Partien vom 16.12.18

je mit 2 Min.6 Sek./

30 Partien   +2  =17  -11  = 35 %  = -108
Parent - - By Reinhold Stibi Date 2018-12-17 18:39
Allerdings ist das Netzwerk 32065 das noch geringfügig besser sein soll,

tatsächlich nach 22 Partien   200 Elo hinter Stockfish 10.

Also es gibt erheblich unterschiedliche 3er Netzwerke; die allgemeinen Angaben stimmen so nicht,
es muss ausgetestet werden.
Parent - - By Reinhold Stibi Date 2018-12-17 19:40
Netzwerk 32065  9461 Elo   33.831 Partien   vom 17.12.18 holt auf.

Nach 30 Partien gegen Stockfish 10  nur noch -120 Elo.
Parent - - By Benno Hartwig Date 2018-12-17 20:42
ich finde diese Paarungen sehr interessant, Reinhold.
Auch dass du so kurze Zeiten nimmst finde ich ok, kannst du damit dann doch auch größere Partienanzahlen in erträglichen Zeiten erreichen.

Aber ich fänd gut, wenn du genau das dann auch machen würdest!
Also einfach mal wenigstens eine Hand voll Tage durchrechnen lassen und dann ein Ergebnis mit wenigstens ein paarhundert Partien erhalten.
30-Partien-Ergebnisse haben so eine grotesk hohe Streuung, dass man da raus wirklich nur sehr wenig ableiten kann.
Du brauchst dazu ja wirklich nur wenige Tage.

Benno
Up Topic Hauptforen / CSS-Forum / Entwicklung von Lc0 Test30 NN
1 2 3 Previous Next  

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill