Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Da wird doch der Hund in der Pfanne verrückt
- - By Florian Wieting Date 2019-03-05 18:06
Unfassbar!

Meine Konfiguration: Intel Core i5 7200U, Windows 10, 12GB DDR4, Nvidia GeForce GTX 950M
Enginematch unter ChessProgram16:
15min+10s, Startstellung Drawkiller small 500 - erste Stellung
weiß: Stockfish 10 64 BMI2 (1 Core)
schwarz: Lc0 v0.21.0-rc1 CUDA 32390 (GPU und 1 Core)
Tablebases: Syzygy 3-4-5 und einige -6

Nach 94.Kb5 entstand folgende Stellung:


Und nun der Hammer: Lc0 opfert nacheinander Dame und Turm, um endlich mit einem Turm im 109.Zug mattzusetzen.

Event:
Ort:
Datum:

Weiss:
Schwarz:

Ergebnis
Board


(Bitte beachtet, dass Ihr die pgn unter "zitieren" kopieren könnt.)

Abgesehen davon, dass die Abwicklung von Zug 63 bis 94 beim Zuschauen auch eine Qual darstellte.
Viele Grüße
Florian

PS. Eigentlich wollte ich mir nur einmal die Drawkiller-Stellungen anschauen.
Parent - - By Clemens Keck Date 2019-03-05 19:20
Ha ! 
Ich hatte schon Gewinnstellung wo Leela (mit Mehr-Turm) 2 Freibauern umwandelte...
Den ersten in einen Läufer
den zweiten in einen Springer

Matt in 5 ...in echten 60 Zügen ausgespielt...alles kein Problem

mich würde mal intressieren ob Alpha Zero auch so schlimm im Endspiel ist, oder wie haben die das gelöst?
C.K.
Parent - - By Tom Paul Date 2019-03-05 19:33
Clemens Keck schrieb:

Ha ! 
Ich hatte schon Gewinnstellung wo Leela (mit Mehr-Turm) 2 Freibauern umwandelte...
Den ersten in einen Läufer
den zweiten in einen Springer

Matt in 5 ...in echten 60 Zügen ausgespielt...alles kein Problem

mich würde mal intressieren ob Alpha Zero auch so schlimm im Endspiel ist, oder wie haben die das gelöst?
C.K.


Das ist doch nichts.
Ich hatte schon Stellungen wo LC0 7 Bauern hatte.
Ihr könnt euch vorstellen wie lange solche Partien dauern...sehr weit über 300 Züge.
Parent - - By Florian Wieting Date 2019-03-05 20:04 Upvotes 1
Komisch, bei mir kommen die sieben Bauern für Lc0 in jeder Partie vor.
Was mache ich falsch?
Parent - - By Tom Paul Date 2019-03-05 23:12
Florian Wieting schrieb:

Komisch, bei mir kommen die sieben Bauern für Lc0 in jeder Partie vor.
Was mache ich falsch?


Du hast sie nur am Anfang der Partie und ich rede vom Ende der Partie.
Parent - - By Florian Wieting Date 2019-03-05 23:52 Upvotes 1
Achsooooooooooooooooooooo!
Parent - By Clemens Keck Date 2019-03-06 17:55
Florian Wieting schrieb:

Achsooooooooooooooooooooo!

   
Parent - - By Olaf Jenkner Date 2019-03-05 19:24 Upvotes 2
Florian Wieting schrieb:

Und nun der Hammer: Lc0 opfert nacheinander Dame und Turm, um endlich mit einem Turm im 109.Zug mattzusetzen.

Das Netz hat schon das Endspiel KTK gelernt und folgerichtig auf Sieg gespielt.
Parent - By Florian Wieting Date 2019-03-05 19:51 Upvotes 1
Danke, Olaf,

das nenne ich mal eine unaufgeregte und nützliche Antwort. (Dieser Satz enthält keine Ironie, sondern ist ernst gemeint.)
Ich weiß einfach viel zu wenig über neuronale Netze.
Das Netz hat KT-K gelernt, weil die Stellung oft genug in den Trainingsgames aufgetaucht ist?
Was bei KDTT-K wohl eher nicht der Fall gewesen sein wird.

Viele Grüße
Florian
Parent - By Tom Paul Date 2019-03-05 19:31
[quote="Florian Wieting"]
Unfassbar!

Meine Konfiguration: Intel Core i5 7200U, Windows 10, 12GB DDR4, Nvidia GeForce GTX 950M
Enginematch unter ChessProgram16:
15min+10s, Startstellung Drawkiller small 500 - erste Stellung
weiß: Stockfish 10 64 BMI2 (1 Core)
schwarz: Lc0 v0.21.0-rc1 CUDA 32390 (GPU und 1 Core)
Tablebases: Syzygy 3-4-5 und einige -6

Nach 94.Kb5 entstand folgende Stellung:


Und nun der Hammer: Lc0 opfert nacheinander Dame und Turm, um endlich mit einem Turm im 109.Zug mattzusetzen.

Event:
Ort:
Datum:

Weiss:
Schwarz:

Ergebnis
Board


(Bitte beachtet, dass Ihr die pgn unter "zitieren" kopieren könnt.)

Abgesehen davon, dass die Abwicklung von Zug 63 bis 94 beim Zuschauen auch eine Qual darstellte.
Viele Grüße
Florian

PS. Eigentlich wollte ich mir nur einmal die Drawkiller-Stellungen anschauen.
[/quote]

Deshalb sollte man LC0 gezielt alle 3-Steiner und später 4 und 5-Steiner Endspielstellungen trainieren lassen.
Parent - - By Ingo Althöfer Date 2019-03-05 21:15 Edited 2019-03-05 21:50 Upvotes 1
Hallo Herr Wieting,

was Sie hier erleben und was viele andere Computerschach-Spezis mit Lc0
schon erlebt haben, ist in der Go-Spielszene seit etwa 2007 gut bekannt.
Dort zeigte es sich aber als das Phänomen, dass Computer-Go-Programme
klare Gebietsvorsprünge fast ganz hergaben, um am Ende knappestmöglich
mit 0,5 Punkten Vorsprung zu gewinnen. Das trieb damals viele Go-Spieler
fast in den Wahnsinn. Es liess sich aber leicht erklären: Die Programme,
die mit MCTS-Suche funktionierten, hatten als Siegkrieterium "Gebietsvorsprung",
aber egal um wieviele Punkte. Ein Sieg mit 0,5 Punkten voraus zählte genauso
viel wie ein Sieg mit 28,5 Punkten.

Lc0 arbeitet auch mit MCTS.
Mattsetzen mit K+T vs K entspricht dem 0,5-Sieg: Den Turm darf man nämlich
nicht mehr opfern, wenn man noch gewinnen will.

Ich selbst hatte im Herbst 2008 sogar abstrakte Untersuchungen zu dem
Phänomen an künstlich einfachen Spielen mit ganz einfachen Regeln gemacht.
Hier ist der Link zu einem Paper:
https://althofer.de/mc-laziness.pdf
Mit "Laziness" ist gemeint, dass das Programm nachlässig spielt, solange
es klar in Vorteil ist; mc steht für Monte-Carlo.

MfG, Ingo Althöfer.

PS. Vertrauen Sie mir, ich bin Doktor
Parent - - By Florian Wieting Date 2019-03-05 22:00
Hallo, Prof. Althöfer,

wie mir gerade einfällt, habe ich ein ähnliches Phänomen zum ersten Mal beim Schachcomputer TurboKing beobachtet. Das Programm stammte von Julio Kaplan und rechnete sehr selektiv.
TurboKing neigte dazu, sobald sich im Endspiel ein Matt abzeichnete, den zuerst gefundenen Mattzug sofort auszuspielen, damit aber über viele Züge beim "Matt in x" hängen blieb, ohne sich dem Ende der Partie zu nähern.
Ich habe nicht mehr in Erinnerung, ob das bis zur 50-Züge-Regel fortgesetzt wurde und ob TurboKing diese Regel kannte und anwendete.

Viele Grüße nach Jena
Florian Wieting
Parent - - By Ingo Althöfer Date 2019-03-05 22:35
Hallo Herr Wieiting,

Florian Wieting schrieb:
wie mir gerade einfällt, habe ich ein ähnliches Phänomen
zum ersten Mal beim Schachcomputer TurboKing beobachtet...

das lag aber (sehr) wahrscheinlich nicht an dem MCTS-Phänomen.
Diese Eigenart, klare Gewinne im Spiel gegen Menschen zu 0,5-Punkt-
Siegen schrumpfen zu lassen, hatten zwischen 2007 und ca 2012 ALLE
Go-Programme auf MCTS-Basis. Gegen andere MCTS-Programme passierte
das fast nie, weil die in Verluststellungen auch "lazy" waren.

Genauso dürfte die Lc0-Macke zwar gegen einen zielstrebigen Alpha-beta-
Gegner wie Stockfish oft vorkommen, nicht aber gegen andere lc0-Versionen.

Ich bin auch überzeugt, dass DepMind mit AlphaZero das Problem gegen Stockfish
auch massiv hatte. Wahrscheinlich haben sie die schlimmsten Partien der Öffent-
lichkeit vorenthalten und bei Testmatches das Abbruchkriterium eher knapp gesetzt:
z.B. künstliche Aufgabe, wenn 6 Halbzüge lang +6  oder besser für eine Partei
angezeigt wurde.

****************************************************
Man stelle sich ein analoges Verhalten für ein autonom fahrendes Auto
vor: Der Vordermann bremst. Das autonome Fahrzeug merkt das,
setzt mit dem eigenen Bremsen aber erst im letztmöglichen Moment
ein und stoppt schliesslich 20 cm hinter der Stoss-Stange des Vorbremsers.
Für das autonome Programm ist das komplett okay. Ein menschlicher
Passagier kriegt aber erhöhten Blutdruck und Schweißausbrüche.

Viele Grüsse vom Thür-Ringer,
Ingo Althöfer.
Parent - By Olaf Jenkner Date 2019-03-05 23:02 Upvotes 2
Autofreaks nennen sowas Fahrspaß...
Parent - - By Roland del Rio Date 2019-03-06 11:46
Hallo Herr Althöfer.
Ich vermute der Begriff wurde bewusst so gewählt, aber diese typische Verhaltensweise von MCTS+NN hat nichts mit Nachlässigkeit/Lazyness zu tun, sondern einzig mit der dem Algorithmus hinterlegten Zielgröße "Maximierung der Gewinnwahrscheinlichkeit". Im vorliegenden Fall könnten die Anzahl der im NN hinterlegten Pattmuster Ursache für die uns befremdliche Entscheidung der Figurenopfer gewesen sein. Zwar auf die Spitze getrieben ist das im Grunde nichts Anderes, als wenn man in Blitzpartien mit genügend Materialvorteil, einen Turm gegen den letzten gegnerischen Springer tauscht. Eine den erbsenzählenen AB-Engines fremde Idee, aber Menschen im Hinblick auf Gewinnmaximierung wohl bekannt Aufgrund der Nähe des Matts im Beispiel hätte ich jedoch auch vermutet, dass bis zum Matt gerechnet wird und NN-Evals keinen Einfluss mehr haben.
Auch bzgl. der Autobremsung könnte gelten: Besser 10mal kurz vor dem Hindernis zum Stehen zu kommen als 9mal weit davor, das 10te Mal aber aufgrund einer nicht beherrschbaren Vollbremsung großen Schaden zu verursachen. Somit wäre die Entscheidung nicht stärker zu Verzögern als nötig vielleicht "unmenschlich" aber besser.
Viele Grüße
Parent - By Stefan Pohl Date 2019-03-06 12:28
Roland del Rio schrieb:

Aufgrund der Nähe des Matts im Beispiel hätte ich jedoch auch vermutet, dass bis zum Matt gerechnet wird und NN-Evals keinen Einfluss mehr haben.


Naja, "Nähe zum Matt" ist bei Leela so eine Sache. Ich habe auch eine GTX 950m, welche ja ziemlich langsam ist. Auf dieser limitierten Hardware hat Leela schon Probleme 3-zügige Matts immer zu finden. Bei Matt in 4 oder mehr wirds dann schon ganz finster, bzw. zur Glückssache. Wirklich 100%-sicher werden nur 2-zügige Matts gefunden.
Parent - - By Stefan Pohl Date 2019-03-06 12:24
Aus deinen Spezifikationen geht leider nicht hervor, ob die Tablebases nur für die GUI oder auch den Engines beim Rechnen zur Verfügung standen. Falls letzteres der Fall war, ist dieses Verhalten vollkommen logisch: Leela hat größte Probleme, Mattsequenzen zu finden. Ergo wird sie in der Suche, wenn noch kein Matt zu sehen ist, dann alternativ das Erreichen einer Tablebase-Stellung anstreben, was ja das nächstbeste ist (bzw. nächsthöchste in der Bewertung). Das bedeutet in dieser Stellung eben, eine der drei Schwerfiguren zu opfern, schlicht damit ein 5-Steiner erreicht wird. Mit der Dame geht das am schnellsten (mit nur einem Zug 94...Db4 (mit den Türmen würde eben etwas länger dauern)) und wird daher zuerst gefunden und gespielt.
Parent - - By Florian Wieting Date 2019-03-06 13:18
Es verhält sich genauso, wie du es erklärst: Die Engines hatten Zugriff auf die Tablebases.
Danke für deine Erläuterung!
Parent - - By Stefan Pohl Date 2019-03-06 20:46
Sorry, ich meinte natürlich 4-Steiner. Ein 5-Steiner war es ja schon.
Parent - - By Florian Wieting Date 2019-03-06 21:46 Edited 2019-03-06 21:49
... der dann aber zu einem 3-Steiner reduziert werden musste, damit Lc0 die Gewinnführung "verstehen" konnte.
Ich neige dazu, dass Olaf Jenkners Erklärung die plausiblere ist.
Aber ein bisschen tappen wir schon im Dunklen, oder?

PS.
Ich werde Lc0 die Stellung KDTT-K morgen mal ohne Tablebases bewerten lassen, vielleicht gibt das etwas Aufschluss.
Parent - By Peter Martan Date 2019-03-06 21:57
Florian Wieting schrieb:

Aber ein bisschen tappen wir schon im Dunklen, oder?

Daher auch der Ausdruck Black Box, Florian.
Up Topic Hauptforen / CSS-Forum / Da wird doch der Hund in der Pfanne verrückt

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill