Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / LC Zero CUDA erstes Testfazit
1 2 Previous Next  
- - By Stefan Pohl Date 2018-07-08 07:13 Edited 2018-07-08 07:16 Upvotes 3
Hallo,

soeben habe ich meine Website mit dem letzten Testrun von LC0 Cuda Net 452 aktualisiert. Jeder Testrun besteht aus mindestens 300 Partien mit 12'+5'' (Partiedauer ca. 30-35 Minuten) gegen 10 Engines mit einem Elo-Schnitt von 3000 CEGT-Elo (40mvs/20', singlecore Eloliste).

https://www.sp-cc.de/long-thinkingtime.htm

Mittlerweile sind 5 Testruns mit LC0 CUDA durch (insgesamt wurden 1520 Partien gespielt), wobei das erste getestete Net 322 40 Tage älter ist, als das zuletzt getestete Net 452. Somit hier nun ein erstes Fazit:

Zunächst einmal ist festzustellen, daß LC0 Cuda in der Fritz16 GUI stabil läuft, es gab weder Crashes noch timelosses.

Interessant ist die Entwicklung der Spielstärke von LC0 CUDA: In 40 Tagen stieg die Elo-performance von 2944 Elo auf 3019 Elo. Das bedeutet, es wurden +75 Elo in 40 Tagen dazugewonnen. Das wären im Schnitt also +1.875 Elo pro Tag. Das finde ich sehr beeindruckend. In einem Spielstärkebereich von um die 3000 Elo fallen die Elopunkte nun sicher nicht vom Himmel. In solchen Spielstärkeregionen ist im Gegenteil die Luft für weitere Elo-Fortschritte sehr, sehr dünn.
Natürlich sind 300 Partien pro Testrun nicht eben viel und die Errorbars sind deshalb hoch. Dennoch zeichnet sich in den 5 Testruns ein klarer Trend ab, siehe dazu auch die Grafik auf meiner Website.

Jetzt läuft der Testrun mit Net 473. Das wird jetzt wieder eine Woche dauern.

Stefan (SPCC)
Parent - - By Stefan Pohl Date 2018-07-09 13:04
Wer gerade nichts anderes zum testen hat, sollte sich mal LC0 (Cuda) mit dem Net 473 zur Brust nehmen. Der Test läuft bei mir jetzt seit gut anderthalb Tagen und nach 77 Partien steht der Erfolgsscore bei unglaublichen 59%. Das wäre eine Elo-Performance von 3063 und damit ein Zuwachs von +44 Elo zu meinem letzten Testrun mit Net 352, welches ja nur eine Woche älter ist... 
Vielleicht nur ein statistischer Ausreißer, der sich noch einpegelt?!? Mal sehen.

Meine Testbedingungen und die Gegnerengines stehen ja bekanntermaßen zum Nachlesen auf meiner Website, daher spare ich mir diese Angaben jetzt.

https://www.sp-cc.de/long-thinkingtime.htm

Stefan
Parent - - By Lothar Jung Date 2018-07-10 09:25
Hallo Stefan,
Danke für Deine Test-Infos!
Die Entwicklung ist weiterhin sehr erfreulich.
Hier ein interessanter Tread im Leela-Forum:
https://groups.google.com/forum/m/#!topic/lczero/dpPqiWNfv40
Grüße
Lothar
Parent - By Stefan Pohl Date 2018-07-10 11:12
Ich hab einen Tippfehler im letzten Post: mein letzter Testrun war natürlich mit Net 452 nicht 352...sorry
Der Testrun mit Net 473 läuft weiterhin überragend. Nach nun 117 Partien hat lc0 mit Net 473 einen Erfolgsscore von 58.5% (gegen 3000 Eloschnitt), also eine Performance 3060. Also immer noch +41 Elo in einer Woche.

Grüße - Stefan
Parent - - By Guenter Stertenbrink Date 2018-07-10 13:41 Edited 2018-07-10 13:55
sehr interessant , 200 Elo Vorteil bei  50kn/Zug-->500kn/Zug

wieviel kn/s bei Stefan,Lothar,vprelovac ?

http://magictour.free.fr/lc0sc1.GIF

----------edit---------------
A 1080ti is used; averaging around 16,000 Nodes per Second.
At 50,000 vs 400,000 Nodes per Move the average game takes around 20 minutes.
[20 min. auf 1080ti bei 50kn/move ?]

50kn/move , 16kn/s , 150 (half)moves/game --> 7.8min/game

also vermutlich volle Zuege und Partien-Abschaetzung und 400kn/HalbZug
Parent - - By Stefan Pohl Date 2018-07-10 14:06 Edited 2018-07-10 14:10
Steht doch auf meiner Website:

GPU (used by LC Zero): Nvidia Cuda Gforce GTX 950M (4GB memory, grafics: 914 MHz, memory: 1.25 GHz). LC Zero CUDA calculates around 2600 rollouts/s in the starting position (measured with "go infinte"-command until depth 37)

GPU Cuda Benches hier: https://browser.geekbench.com/cuda-benchmarks
Parent - - By Guenter Stertenbrink Date 2018-07-10 15:04
also 110500 rollouts per move (=kn/move ?) , Stufe 2 in dem Chart , +42 Elo

[?]
Parent - - By Stefan Pohl Date 2018-07-10 15:33
Guenter Stertenbrink schrieb:

also 110500 rollouts per move (=kn/move ?) , Stufe 2 in dem Chart , +42 Elo

[?]


Bei 12'+5“ dauert eine Partie 30-35 Minuten. Falls das weiterhilft. Wie lang die Zugzeiten sind, steht ja in den Partie-PGNs, die man downloaden kann.
Parent - - By Peter Martan Date 2018-07-10 20:00 Edited 2018-07-10 20:05
Merkt man eigentlich schon was an der Remishäufigkeit?

Ich würde ja logisch finden, dass ein Maschine, die sich das Schach nur selbst im Autoplay beibringt, noch mehr als im angepassten Entwickeln gegen verschiedene Gegner das Remis als ohnehin wahrscheinlichstes Ergebnis umso mehr auch im neuronalen Netz mit steigendem Niveau als "Muster" "erkennen" und (er)finden müsste, erst recht, wenn Taktik nicht ihre größte Stärke ist.

Wäre für mich übrigens auch eine naheliegende Erklärung dafür, dass die Taktikstärke verhältnismäßig weniger schnell wächst, forcierte Züge werden weniger gefunden, daher wieder weniger gesucht und so weiter.
Parent - - By Lothar Jung Date 2018-07-10 20:09
Sehr richtig!
KI ist Mustererkennung und nicht tiefes Rechnen.
Lothar
Parent - By Peter Martan Date 2018-07-10 20:36 Edited 2018-07-10 20:45
Naja, so wie sich Menschen das halt vorstellen, tatsächlich wissen wir's ja von uns selbst auch nicht, wie's im einzig echten neuronalen Netz funktioniert.

Mir fällt die alte Frage vom Journalisten an Botwinnik ein, auf sein Statement, man müsste dem Computer beibringen, wie ein Mensch zu denken, "Weiß Botwinnik, wie Botwinnik denkt?"
Dem Muster der Mustererkennung folgend, wäre die raffinierte Wendung dann ja aber immer noch erst das wieder "aus dem Feld gehen", in unserem Fall aus dem Muster.
Parent - - By Guenter Stertenbrink Date 2018-07-10 21:42
Parent - - By Peter Martan Date 2018-07-10 21:49
Danke, der Anstieg scheint ja ziemlich gleichmäßig bis 400 und dann zu stagnieren.
Korrelliert das in dem Bereich vielleicht auch ungefähr mit den Elo im Selfplay? (Aus dem ist die Graphik ja wohl, oder?)

50% ist allerdings an und für sich wenig, da hat Leela wohl bis zur größeren Häufigkeit des an die Perfektion heranreichenden Selfplays noch einen weiten Weg.

Oder beginnt sie ab einem gewissen Niveau immer mehr mit Weiß zu gewinnen und mit Schwarz zu verlieren? Dann müsste die Remishäufigkeit ja sogar wieder sinken.

Für einen schachlich wahrscheinlichen Niveau- Fortschritt, so wie man sich den als menschlicher Spieler vorstellen würde, schiene mir das hingegen eben eher unwahrscheinlich.
Parent - - By Guenter Stertenbrink Date 2018-07-11 01:37
Elo und White-Score sind jetzt eingefuegt :  http://magictour.free.fr/lc0draw.GIF
Parent - By Peter Martan Date 2018-07-11 07:11
Suppi!
Parent - - By Stefan Pohl Date 2018-07-11 06:06 Edited 2018-07-11 06:41
Peter Martan schrieb:

Merkt man eigentlich schon was an der Remishäufigkeit?

Ich würde ja logisch finden, dass ein Maschine, die sich das Schach nur selbst im Autoplay beibringt, noch mehr als im angepassten Entwickeln gegen verschiedene Gegner das Remis als ohnehin wahrscheinlichstes Ergebnis umso mehr auch im neuronalen Netz mit steigendem Niveau als "Muster" "erkennen" und (er)finden müsste, erst recht, wenn Taktik nicht ihre größte Stärke ist.


Es scheint eher das Gegenteil der Fall zu sein. Faszinierenderweise hat das neuronale Netz von Leela eine starke Abneigung gegen Remisen entwickelt. Die Bewertungen, die Leela als UCI-Engine auswirft, sind zwar nur Umrechnungen von Gewinnwahrscheinlichkeiten, die für die Züge errechnet werden, aber generell sind diese Bewertungen sehr optimistisch. Und zwar oft geradezu selbstmörderisch optimistisch. Es passiert durchaus nicht selten, daß Leela remisliche Stellungen gewaltsam aufbricht (und dann verliert), um Remis durch 3fach oder 50Zug zu vemeiden. Bei einer "normalen" Engine passiert so etwas nur, wenn man den Remisfaktor extrem hoch einstellt. Und ich rede hier nicht von +0.25 oder ähnlichem, sondern +1.00 oder so etwas in der Richtung.

Das liegt wahrscheinlich am Lernprozess selbst: In diesem ist Remis nämlich keinesfalls, wie von dir eigentlich richtig postuliert, das häufigste Ergebnis. Im Gegenteil. Bei den selfplay-Lern-Partien wird ja nur mit 800 rollouts pro Zug gespielt. Das ist extrem wenig. LC0 Cuda benötigt selbst auf meiner langsamen mobilen Grafikkarte GTX 950m nur 0.3 Sekunden für 800 Rollouts und auf einer GTX 1080 wohl nur ca. 0.04 Sekunden... Wir reden hier also von extrem flachen Berechnungen und demzufolge von extrem schwachem schachlichen Niveau. Und je niedriger das schachliche Niveau ist, desto mehr Fehler werden gemacht und desto seltener enden Partien remis. Was ja im Umkehrschluß auch die immer weiter steigenden Remsiqouten im Spitzen-Engineschach erklärt. Insofern ist Remis im Lernprozess von Leela der seltenste Partieausgang, nicht der häufigste. Selbst heute noch, nach über 20 Mio Lernpartien. Erst Recht zu Beginn des Lernprozesses.

Das erklärt übrigens meiner Meinung nach auch, warum Leela so lange gebraucht hat, bis sie halbwegs Endspiele konnte: Bei diesem schlechten schachlichen Niveau der Lernpartien kommt es einfach sehr selten überhaupt zu ausgeglichenen Endspielen, aus denen Leela dann etwas lernen kann. Die allermeisten Partien werden schon viel früher entschieden und es kommt, wenn überhaupt, nur zu klar gewonnenen/verlorerenen Endspielen. Insofern ist der Partienpool für halbwegs normale, praxisrelevante Endspiele einfach viel, viel kleiner, als der Gesamt-Partienpool. Es ist logisch, daß Leela in Endspielen viel schwächer agiert, als im Mittelspiel. Einfach weil es viel weniger Lernmaterial gibt.
Man kann nur hoffen, daß, wenn auch für das Lernen lc0 (mit CUDA-Unterstützung) benutzt werden wird (soll ja bald soweit sein), die Zahl der rollouts pro gespieltem Zug deutlich angehoben wird. Dann würden sich sicher die Endspielfähigkeiten von Leela verbessern und die Remisabneigung sollte dann auch spürbar abnehmen. Beides wäre der Elo-Spielstärke sicher sehr zuträglich. Es könnte allerdings sein, daß auch der spektakuläre Spielstil darunter leidet.

So oder so, das Leela-Projekt bleibt auf jeden Fall spannend!

PS: Hier noch der aktuelle Blog-Eintrag zur Frage, wann lc0 (mit CUDA) den Lernprozess übernehmen wird:

"What’s stopping us from rolling out lc0 to main net?
The network compression is possibly the single most important outstanding thing. There are attempts to reduce precision to fp16 (worked well), and int8 (didn’t work well so far, ~150 Elo drop on same nodes).
Merging both of @Cyanogenoid’s training PRs.
We’d like to see cpuct 1.7 or 1.8, and perhaps resign-playthru set to 20% instead of 10%.
Given the above changes, we’d like to see one more test run that’s really really short, to verify that the previous at least work correctly. It doesn’t even need to reach first LR drop, only a couple of days is necessary
Then promote!"
Parent - By Stefan Pohl Date 2018-07-11 06:59
Dazu als Ergänzung: Wenn der Lernprozeß auf LC0 (CUDA) umgestellt wird, ist ja der Plan, von Null neu zu beginnen und dann aber gleich mit der nochmals erhöhten Netgröße von 20x256 (z.Zt. hat das Netz ja eine Größe von 15x192). Die Größe steigt also um den Faktor 1.77. Im gleichen Maße steigt der Berechnungsaufwand und somit nimmt die Zahl der rollouts pro Sekunde (auf identischer Hardware) im gleichen Maße ab. Auf der anderen Seite läuft lc0 mit CUDA je nach GPU um Faktor 5 bis 10 schneller als die jetzige lczero.exe und fast alle Hardware-Spender dürften ja eine NVidia-GPU haben, die auch Cuda unterstützt. Insofern kann man davon ausgehen, daß  nach der Umstellung wohl 2.5-3.5x höhere rollout/s Werte (im Schnitt) erreicht werden dürften. Ergo könnte im Lernprozeß die Zahl der Rollouts pro Zug problemlos von 800 auf 2000 erhöht werden und man würde immer noch ca. 100000 Partien pro Tag schaffen (gleiche Zahl von Hardwarespendern  vorausgesetzt). Ob das allerdings so gemacht werden wird, das weiß ich natürlich nicht. Sinnvoll wäre es meiner Meinung nach auf jeden Fall.
Parent - By Peter Martan Date 2018-07-11 07:17 Edited 2018-07-11 07:22
Stefan Pohl schrieb:

Das liegt wahrscheinlich am Lernprozess selbst: In diesem ist Remis nämlich keinesfalls, wie von dir eigentlich richtig postuliert, das häufigste Ergebnis. Im Gegenteil. Bei den selfplay-Lern-Partien wird ja nur mit 800 rollouts pro Zug gespielt. Das ist extrem wenig. LC0 Cuda benötigt selbst auf meiner langsamen mobilen Grafikkarte GTX 950m nur 0.3 Sekunden für 800 Rollouts und auf einer GTX 1080 wohl nur ca. 0.04 Sekunden... Wir reden hier also von extrem flachen Berechnungen und demzufolge von extrem schwachem schachlichen Niveau. Und je niedriger das schachliche Niveau ist, desto mehr Fehler werden gemacht und desto seltener enden Partien remis. Was ja im Umkehrschluß auch die immer weiter steigenden Remsiqouten im Spitzen-Engineschach erklärt. Insofern ist Remis im Lernprozess von Leela der seltenste Partieausgang, nicht der häufigste. Selbst heute noch, nach über 20 Mio Lernpartien. ...

Man kann nur hoffen, daß, wenn auch für das Lernen lc0 (mit CUDA-Unterstützung) benutzt werden wird (soll ja bald soweit sein), die Zahl der rollouts pro gespieltem Zug deutlich angehoben wird. Dann würden sich sicher die Endspielfähigkeiten von Leela verbessern und die Remisabneigung sollte dann auch spürbar abnehmen. Beides wäre der Elo-Spielstärke sicher sehr zuträglich. Es könnte allerdings sein, daß auch der spektakuläre Spielstil darunter leidet.

So oder so, das Leela-Projekt bleibt auf jeden Fall spannend!


Danke, Stefan.
Im Wesentlichen bestätigst du aber meine Vermutung schon einfach. Er sie es lernt (zumindest vorläufig noch) aus Partien Schachspielen, für die ein Anfänger im Kurs ständig vom Lehrer gescholten würde werden. Zugute muss man dem Schüler halten, dass er dadurch in keiner Weise entmutigt wird, er spielt einfach um das umso fleißiger seine Schmarrn- Partien weiter und versucht unverdrossen, die Qualtität durch Quantität zu ersetzten, und das erstaunlichste daran, er hat offenbar Erfolg damit.

Bleibt eben abzuwarten, ob zuerst der Elo- Fortschritt langsamer werden oder die Remishäufigkeit schneller steigen wird.
Parent - - By Lothar Jung Date 2018-07-10 15:11
Meine GPUs 2x 1080 OC werden bei ca. 30.000 n/sec. liegen.
Ich teste immer mit 4 cores/treads.
Deshalb ist der Beitrag so informativ.
Höhere Threads oder TCEC-Bedingungen sind derzeit von den GPU-Hardware-Anforderungen unrealistisch bzw. reiner Luxus.
Lothar
Parent - By Stefan Pohl Date 2018-07-11 07:01
Lothar Jung schrieb:

Meine GPUs 2x 1080 OC werden bei ca. 30.000 n/sec. liegen.



Sehr nice! Und man braucht den Raum, in dem der Rechner steht, im Winter auch nicht mehr zu heizen...
Parent - - By Stefan Pohl Date 2018-07-11 10:48
Hallo,

da ich diverse Anfragen erhalten habe, warum ich die Möglichkeit gestrichen habe, interessante Kurzpartien direkt auf meiner Website per pgn-Viewer nachspielen zu können, habe ich das Feature nun wieder reaktiviert. Nach einigen Versuchen habe ich mich dazu entschieden, nun den pgn-Viewer von ChessBase zu nutzen. Dieser läßt sich sehr einfach in eine Website einbetten und bietet zudem das tolle Feature, per Klick eine online Engine-Analyse zur aktuellen Brettstellung zu starten (das kleine Propeller-Icon rechts von den Pfeilen unter den Schachbrett). Sehr, sehr cool.
Man kann nun die kurzen Gewinnpartien von Leela aus dem jeweils letzten long thinking-time Testrun dort anschauen. Ich hoffe, es gefällt!

https://www.sp-cc.de/view-lc-zero-games.htm

Stefan (SPCC)
Parent - - By Robert Bauer Date 2018-07-11 12:03
Hallo Stefan,

perfekt! Das gefällt wirklich.

Gerade die beiden Partien, die LC0 gegen Stockfish 4 gespielt hat, sind wirklich überragende doppelte Bauernopfer für Initiative.  
Wäre 11.b4 aus der Partie LC0 gegen SF4 auch gegen einen aktuellen Stockfish durchschlagend? 
Parent - - By Stefan Pohl Date 2018-07-11 12:44
Danke für das Lob, freut mich.
Ob Leela diese Partie so oder ähnlich auch gegen Stockfish 9 gewinnen könnte, kann ich nicht sagen. Meine Rechner sind zur Zeit voll ausgelastet...zudem könnte Leela dann sicher auch eine stärkere Grafikkarte gebrauchen, als meine GTX 950m, wenn es gegen Stockfish 9 geht. Vielleicht kann das ja mal jemand anderes probieren?! Interessant wäre es auf jeden Fall.
Parent - - By Lothar Jung Date 2018-07-11 13:33
Ich würde es sehr gerne versuchen.
Leela neues Net -2x1080 OC- gegen SF9 1 core?
Kannst Du mir die Partie zur Verfügung stellen und sagen, ab welchem Zug ich in die Partie einsteigen soll.
Gruß
Lothar
Parent - - By Stefan Pohl Date 2018-07-11 15:16 Edited 2018-07-11 16:05
Lothar Jung schrieb:

Ich würde es sehr gerne versuchen.
Leela neues Net -2x1080 OC- gegen SF9 1 core?
Kannst Du mir die Partie zur Verfügung stellen und sagen, ab welchem Zug ich in die Partie einsteigen soll.
Gruß
Lothar


Du kannst die Partie (es ist die alleroberste (leela mit Weiß gegen Stockfish)) direkt im pgn-Viewer von meiner Website herunterladen. Unter der Partienotation gibt es einige Icons, darunter ein Disketten-Icon. Das lädt die Partie herunter. Falls du die Diskette nicht siehst (z.B. auf dem kleineren Smartphone-Bildschirm), dann zuerst den Fullscreenmodus des pgn-Viewers einstellen ( das Quadrat-Icon direkt rechts von den Nachspielpfeilen), dann sollte das Disketten-Icon sichtbar werden.
Die Partie wird ja schon in 36 Zügen Matt. Interessant wird es mit dem Bauernopfer 11.b4 von Leela.
Auf der eigentlichen Leela Testseite kann man natürlich auch alle gespielten Partien herunterladen...

Grüße - Stefan
Parent - - By Stefan Pohl Date 2018-07-11 17:41
Event:
Ort:
Datum:

Weiss:
Schwarz:

Ergebnis
Board


Dies ist die erste Partie aus meinen aktuellen kurz-Partien im pgn-Viewer. Leela setzt hier Stockfish 4 in 36 Zügen Matt. Sehenswert. Insbesondere wegen der Opfer. Es beginnt mit 11.b4! Und 10 Züge später ist es eigentlich schon vorbei.
Ich wäre gespannt auf Analysen von schachlich kompetenten Menschen (zu denen ich leider nicht gehöre). Die Partie ist wirklich interessant, meine ich.

Stefan
Parent - - By Peter Martan Date 2018-07-11 18:41 Edited 2018-07-11 19:29
Stefan Pohl schrieb:

Ich wäre gespannt auf Analysen von schachlich kompetenten Menschen (zu denen ich leider nicht gehöre). Die Partie ist wirklich interessant, meine ich.

Schon, ja, zweifellos.
Aber zu analysieren gibt's eigentlich nicht sehr viel.

Vor dem 11.b4:



Analysis by asmFishW_2018-07-11_popcnt:

11.b4 Da4 12.bxc5 b6 13.cxb6 axb6 14.Sf4 Sc6 15.Sh5 g6 16.Sf4 La6 17.Lxa6 Dxa6 18.Dg4 Tfc8 19.h4 Dc4 20.Ld2 Tg8 21.Sg5 Tg7 22.De2 Sa5 23.Dxc4 Sxc4 24.Ke2 Ta3 25.Sd3 h6 26.Sf3 Kh7 27.h5 g5 28.Sfe1 Tg8 29.Sc2 Ta5 30.Sdb4 Lxb4 31.cxb4 Ta4 32.a3 Tga8 33.b5 Kg7 34.Thc1 g4 35.f4 Sxa3
  +/=  (0.52)   Tiefe: 32/55   00:01:48  240MN

Und danach:



Analysis by asmFishW_2018-07-11_popcnt:

11...Da4 12.bxc5 b6 13.cxb6 axb6 14.Sf4 La6 15.Sh5 g6 16.Lxa6 Dxa6 17.Sf4 Sc6 18.h4 Dc4 19.Ld2 b5 20.h5 gxh5 21.Dh3 Tg8 22.Dxh5 Tg7 23.Se2 Txa2 24.Txa2 Dxa2 25.0-0 Dc4 26.Te1 Kg8 27.Le3 b4 28.cxb4 Lxb4 29.Tc1 Dxe2 30.Txc6
  +/=  (0.40)   Tiefe: 31/38   00:00:36  61705kN

Und nach dem 11...cxb4 (?):



Analysis by asmFishW_2018-07-11_popcnt:

12.Sf4 Da4 13.Ld3 Sc6 14.Dh3 h6 15.Se2 f5 16.Lxh6 Tf7 17.Lg5+ Kg8 18.0-0 bxc3 19.Sxc3 Da3 20.Ld2 Sf8 21.Tfc1 Ld7 22.Tab1 Sa5 23.Lb5 Lxb5 24.Sxb5 Da4 25.Sd6 Lxd6 26.exd6
  +-  (2.42)   Tiefe: 25/51   00:01:01  103MN

Und jetzt im Backward zurück zur Stellung vor dem 10...Db5 (?)



Analysis by asmFishW_2018-07-11_popcnt:

10...Sc6 11.a3 b5 12.dxc5 b4 13.Sfd4 bxc3 14.Sxc3 Sxd4 15.Lxd4 Lxc5 16.Lxc5 Dxc5 17.b4 Dc7 18.Le2 Dxe5 19.Td1 Tb8 20.0-0 Dxg3 21.hxg3 Sf6 22.Tc1 Ld7 23.Tfd1 Kg8 24.La6 h6 25.Kh1 Sh7
  -/+  (-0.78)   Tiefe: 24/43   00:00:48  82281kN

Kurzum, Schwarz hätte nicht 10...Db5 spielen dürfen und dann das (zugegeben schöne) Bauernopfer auf 11.b4 nicht annehmen.

Aber immerhin hat Leela das schön verwertet, alle Achtung!
Parent - - By Stefan Pohl Date 2018-07-12 06:16
Interessant, danke.

Es ist wohl so, daß nach 11....c:b4 der Drops schon gelutscht ist. Ich frage mich nun noch, ob Schwarz sich danach noch besser verteidigen kann, sodaß es nicht schon nach 36 Zügen ein Matt gibt?!?
Parent - By Peter Martan Date 2018-07-12 06:22 Edited 2018-07-12 06:58
Hab's mir noch nicht angeschaut, würde aber davon ausgehen, wenn die zwei Patzer an der entscheidenden Stelle eigentlich schon gereicht haben, dass SF4 hier mit der Hardwarebedenkzeit, die er hat, halt noch kein wirklich superstarkes Computerschach spielt.

Und dann ist der Weg zum Matt einfach gar nicht mehr soo kurz, wenn nach 10 Zügen schon der Ofen aus ist. Fehler in der Eröffnung wirken sich allemal mehrfach fatal aus, im Mittelspiel zählen Evals, selbst wenn sie ím Wesentlichen korrekt sind, schon weniger, im Endspiel nochmals eine Nummer weniger.
Eine Engine, die das mehr berücksichtigt, wär' auch mal was.

Eigentlich sollte ja gerade die MCTS das besser machen als die AB- Evals das können, bewertet sie die Gewinnwahrscheinlichkeiten doch nach Rollouts. Oder ich verstehe da wieder mal oder immer noch was falsch am Prinzip.
Parent - - By Lothar Jung Date 2018-07-12 11:30
Hallo Stefan!
Ich habe Deine pgn-Datei heruntergeladen und in Arena geöffnet.
Leela und SF9 1 Core sind als Engines geladen.
Ich kann nun die Engines an jeder Stelle der jeweiligen Partien analysieren lassen.
Wie bekomme ich es hin, die Engines ab einer definierten Stelle mit Deiner Zeitvorgabe wechselseitig weiter rechnen zu lassen?
Grüße
Lothar
Parent - - By Stefan Pohl Date 2018-07-12 11:35
Ich benutze Arena nicht.
Aber ich würde in jeder GUI folgendes machen: die pgn-Notation an der fraglichen Stelle abschneiden (mit dem Windows-Texteditor). Und dann die pgn als Vorgabestellung für ein Engine-Turnier oder -Zweikampf nehmen. Dort kann man dann auch die Bedenkzeit wie gewünscht einstellen.

Stefan
Parent - By Horst Sikorsky Date 2018-07-12 12:16
(Lc0_1 (3000) - Houdini 6 -1 cpu (3000) [B12]

1.e4 c6 2.d4 d5 3.e5 Lf5 4.Sf3 e6 5.Le2 Sd7 6.0–0 Se7 7.Sbd2 h6 8.c3 g5 9.Te1 Lg6 10.Sf1 c5 11.h3 Tc8 12.Ld3 Lg7 13.Sg3 Dc7 14.De2 0–0 15.Le3 Tfe8 16.Tad1 Sc6 17.a3 a6 18.Sh2 c4 19.Lxg6 fxg6 20.f4 gxf4 21.Lxf4 Kh7 22.Tf1 Tf8 23.Sg4 Db6 24.Tf2 h5 25.Se3 Kg8 26.Dd2 Tf7
27.Tdf1 Td8 28.Dc2 Scxe5 29.Lxe5 Txf2 30.Dxf2 Sxe5 31.dxe5 Tf8 32.Dd2 Txf1+ 33.Kxf1 Dc7 34.Se2 Dxe5 35.Sd4 Lh6 36.Kf2 Kf7 37.Sf3 Df4 38.g3 De4 39.Dd4 Lxe3+ 40.Dxe3 Dc2+ 41.De2 Dxe2+ 42.Kxe2 Kf6 43.a4 b6 44.g4 e5 45.Ke3 Ke6 46.Kd2 Kf6 47.Ke2 Ke6
48.Kf1 Kf6 49.Kf2 hxg4 50.hxg4 Ke6 51.Kg3 Kf6 52.Kh4 a5 53.Kh3 Ke6 54.Kg3 d4 55.Sd2 Kd6 56.Sxc4+ Kc5 57.Sxe5 g5 58.cxd4+ Kd6
1–0
auf Arena Horst
Parent - By Lothar Jung Date 2018-07-12 14:23
SF9 verliert ab Zug 10 mit Matt!
Parent - By Kurt Utzinger Date 2018-07-12 18:20
[quote="Stefan Pohl
Ich benutze Arena nicht.
Aber ich würde in jeder GUI folgendes machen: die pgn-Notation an der fraglichen Stelle abschneiden (mit dem Windows-Texteditor). Und dann die pgn als Vorgabestellung für ein Engine-Turnier oder -Zweikampf nehmen. Dort kann man dann auch die Bedenkzeit wie gewünscht einstellen.

Stefan
[/quote]

Hallo Stefan
Das ist die m.E. einzig richtige Vorgehensweise, um Matches ab einer bestimmten Stellung durchzuführen.
Gruss
Kurt
Parent - By Peter Martan Date 2018-07-12 11:57
Lothar Jung schrieb:

Wie bekomme ich es hin, die Engines ab einer definierten Stelle mit Deiner Zeitvorgabe wechselseitig weiter rechnen zu lassen?

Im Menü Motoren-Turnier unter Optionen:
Anfangsstellung-Aus PGN/EPD laden
Lade PGN bis Zug Nr...
Parent - - By Stefan Pohl Date 2018-07-12 17:41 Edited 2018-07-12 17:44 Upvotes 1
Kurt hat im Schachcomputer-Forum die Partie sehr ausführlich analysiert. Sehr interessant!

https://www.schachcomputer.info/forum/showthread.php?t=5030&page=52

(Anmerkung: Es wurde ein 4 Vollzuge tiefes (bzw. flaches) Buch von mir verwendet. Ab Zug 5 spielten beide Seiten selbstständig.)
Parent - - By Lothar Jung Date 2018-07-12 18:47
Mit 4-Züge-Buch schlägt Leela Net 483  (2xGPU 1080 OC) die neueste Version von Boot 6.3.1 mit 2 Threads mit 3:0:7 ( 5 Min./3sec.).
Grüße
Lothar
Parent - - By Horst Sikorsky Date 2018-07-14 22:59
kann LcO pondern wenn ja.
woran merkt man es 
Parent - - By Tom Paul Date 2018-07-15 00:01
Horst Sikorsky schrieb:

kann LcO pondern wenn ja.
woran merkt man es 


Man merkt es daran, dass eine Engine rechnet während der Gegner am Zug ist.
Es wäre schon extrem schwach und peinlich wenn ausgerechnet eine Top Engine nicht Pondern könnte.
Zumal Pondern als Option schnell gemacht ist.
Parent - By Lothar Jung Date 2018-07-15 00:11
Leela pondert nicht.
GPU ist inaktiv, wenn Gegner am Zug ist.
Lothar
Parent - By Horst Sikorsky Date 2018-07-15 08:56
das weiß ich eigentlich-sah beim blitz manchmal so aus als ob
"Zumal Pondern als Option schnell gemacht ist."
da habe ich kein Ahnung 
Parent - - By Stefan Pohl Date 2018-07-25 17:47 Upvotes 1
Inzwischen gibt es auch ein youtube-Video mit Analysen zu dieser tollen Partie, die auf meinem PC gespielt wurde (12'+5'' Bedenkzeit, 4 Züge flaches Buch), erstellt von "Kingcrusher", der schon viele Partien auf youtube analysiert hat. Allerdings auf Englisch, aber gut verständlich, da er relativ langsam und akzentarm spricht. Lohnt das Anschauen! Und zeigt nochmal bildhaft den einzigartigen Spielstil von Leela.

https://www.youtube.com/watch?v=OvDa5TNYOZM
Parent - By Ernest Bonnem Date 2018-07-26 00:57
Danke Stefan !
Schöne Übertragung !
Parent - By Michael Scheidl Date 2018-07-26 09:34
Sf6-e8! war sehr elegant.
Parent - By Stefan Pohl Date 2018-07-15 06:22
Stefan Pohl schrieb:

Hallo,

soeben habe ich meine Website mit dem letzten Testrun von LC0 Cuda Net 452 aktualisiert. Jeder Testrun besteht aus mindestens 300 Partien mit 12'+5'' (Partiedauer ca. 30-35 Minuten) gegen 10 Engines mit einem Elo-Schnitt von 3000 CEGT-Elo (40mvs/20', singlecore Eloliste).

<a class='ura' href='https://www.sp-cc.de/long-thinkingtime.htm'>https://www.sp-cc.de/long-thinkingtime.htm</a>

Mittlerweile sind 5 Testruns mit LC0 CUDA durch (insgesamt wurden 1520 Partien gespielt), wobei das erste getestete Net 322 40 Tage älter ist, als das zuletzt getestete Net 452. Somit hier nun ein erstes Fazit:

Zunächst einmal ist festzustellen, daß LC0 Cuda in der Fritz16 GUI stabil läuft, es gab weder Crashes noch timelosses.

Interessant ist die Entwicklung der Spielstärke von LC0 CUDA: In 40 Tagen stieg die Elo-performance von 2944 Elo auf 3019 Elo. Das bedeutet, es wurden +75 Elo in 40 Tagen dazugewonnen. Das wären im Schnitt also +1.875 Elo pro Tag. Das finde ich sehr beeindruckend. In einem Spielstärkebereich von um die 3000 Elo fallen die Elopunkte nun sicher nicht vom Himmel. In solchen Spielstärkeregionen ist im Gegenteil die Luft für weitere Elo-Fortschritte sehr, sehr dünn.
Natürlich sind 300 Partien pro Testrun nicht eben viel und die Errorbars sind deshalb hoch. Dennoch zeichnet sich in den 5 Testruns ein klarer Trend ab, siehe dazu auch die Grafik auf meiner Website.

Jetzt läuft der Testrun mit Net 473. Das wird jetzt wieder eine Woche dauern.

Stefan (SPCC)


So, der Testrun mit Net 473 ist durch und meine Website wurde soeben aktualisiert. +16 Elo zu Net 452 (nur 8 Tage älter!!!). Der Elozuwachs ist in seiner Geschwindigkeit wirklich erstaunlich. Vom 20.Mai bis zum 7.Juli (also 48 Tage) +91 Elo. Also durchschnittlich knapp +1.9 Elo pro Tag. Und das in der Region 3000 Elo, wo nun die Elos wirklich nicht mehr vom Himmel fallen.
Hier noch mal die gesammelten Testrun-Ergebnisse mit LC0 (CUDA):

LC0 Cuda(180619) N 473 (size: 15x192)(date: 180707): 300 (+101,=128,- 71)
55.0 % (opponent-Elo: 3000) Elo-performance: 3035

LC0 Cuda(180619) N 452 (size: 15x192)(date: 180629): 320 (+101,=136,- 83)
52.8 % (opponent-Elo: 3000) Elo-performance: 3019

LC0 Cuda(180619) N 432 (size: 15x192)(date: 180622): 300 (+ 85,=138,- 77)
51.3 % (opponent-Elo: 3000) Elo-performance: 3009

LC0 Cuda(180602) N 374 (size: 15x192)(date: 180604): 300 (+ 86,=114,-100)
47.7 % (opponent-Elo: 3000) Elo-performance: 2984

LC0 Cuda(180530) N 359 (size: 15x192)(date: 180530): 300 (+ 79,=113,-108)
45.2 % (opponent-Elo: 3000) Elo-performance: 2967

LC0 Cuda(180521) N 322 (size: 15x192)(date: 180520): 300 (+ 68,=116,-116)
42.0 % (opponent-Elo: 3000) Elo-performance: 2944

Es gibt 20 neue Partien mit kurzen, spektakulären Siegen von Leela aus dem jetzt beendeten Testrun in der "View LC Zero games"-Sektion zum online Anschauen und Nachspielen mit dem pgn-reviewer. Lohnt!

https://www.sp-cc.de
Parent - - By Klaus Meier Date 2018-07-27 10:45
Hi ,
wo lässt sich denn das Programm "LC0 Cuda Net 452"
downloaden ?
Möchte das auch mal gern testen.
Liebe Grüße
K.M.
Parent - - By Lothar Jung Date 2018-07-27 11:20
Hier:
http://lczero.org/networks
Grüße
Lothar
Parent - - By Klaus Meier Date 2018-07-27 17:52
Ah danke !
lässt sich da aucheine engine laden, die auf der üblichen GUI
dann lauffähig ist. Irgendwie stehe ich noch auf dem Schlauch damit.
über 6000 ELO ??
kann das denn sein

LG
K.M.
Parent - - By Michael Scheidl Date 2018-07-29 12:07
Zitat:
über 6000 ELO ??
kann das denn sein


Das muß irgendwie daran liegen, daß Leela gegen Vorversionen von sich selbst getestet wird. Die Version vom 20.2. ist mit null Elo gelistet.

http://lczero.org/?full_elo=1

Dieser Grafik zufolge gab es vor allem zu Anfang sehr große Elofortschritte, aber ungefähr seit Network id 80 (~4.500 Elo) hat sich das abgeflacht.
Parent - - By Klaus Meier Date 2018-08-02 18:06
Also die angeblichen mehr als 6000 ELO von LCZero musste ich doch mal kurz mit Stockfish8 testen.
Leider ist LCZero hoffnungslos unter gegangen.

[Event "Computer Schach Partie"]
[Date "2018.08.02"]
[White "Stockfish_8_x64"]
[Black "LCZero"]
[Result "1-0"]
[ECO "C07"]
[Opening "Französische Verteidigung"]
[Time "17:45:00"]
[Variation "Tarrasch-Variante, Offen, Eliskases-Variante, 1.e4 e6 2.d4 d5 3.Nd2 c5 4.exd5 Qxd5 5.Ngf3 cxd4 6.Bc4 Qd8"]
[TimeControl "0+8"]
[Termination "normal"]
[PlyCount "133"]
[WhiteType "program"]
[BlackType "program"]

1. e4 e6 2. d4 d5 3. Nd2 c5 4. exd5 Qxd5 5. Ngf3 cxd4 6. Bc4 Qd8 7. O-O Nc6
8. Nb3 Nf6 9. Bf4 Bd6 10. Bxd6 Qxd6 11. Nbxd4 Nxd4 12. Qxd4 Qxd4 13. Nxd4
Bd7 14. c3 Ke7 15. Rfe1 Rhc8 16. Bb3 a5 17. Bc2 a4 18. a3 Ra6 19. Nf5+ Kf8
20. Ne3 Rb6 21. Rab1 Ke7 22. Red1 Rd6 23. Rxd6 Kxd6 24. Rd1+ Kc5 25. Ng4
Bc6 26. Ne5 Be8 27. f4 b5 28. g3 Kb6 29. Rd4 h6 30. Bd1 Nd5 31. Kf2 Ne7 32.
Bg4 Kc7 33. h3 Rb8 34. h4 Rb6 35. Be2 Nf5 36. Rb4 Nd6 37. g4 f6 38. Nd3 Bc6
39. Rd4 Nc4 40. Nc5 Bd5 41. f5 Nxb2 42. Nxe6+ Bxe6 43. fxe6 Rxe6 44. Rb4
Nc4 45. Bxc4 bxc4 46. Rxa4 Re4 47. Ra7+ Kd6 48. Rxg7 h5 49. Kf3 f5 50. gxh5
Rxh4 51. Rg6+ Ke5 52. h6 f4 53. a4 Kf5 54. Rc6 Rh3+ 55. Kg2 Rxc3 56. a5
Rc2+ 57. Kf3 Rc3+ 58. Kf2 Rc2+ 59. Ke1 Ra2 60. a6 Ra1+ 61. Kd2 f3 62. h7
Rh1 63. a7 f2 64. a8=Q f1=Q 65. Qa5+ Kg4 66. Rg6+ Kh4 67. h8=Q# 1-0
 
Up Topic Hauptforen / CSS-Forum / LC Zero CUDA erstes Testfazit
1 2 Previous Next  

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill