Stockfish Zero?

By Peter Martan Date 2018-04-04 05:37

Guten Morgen, Frühaufsteher!
Du hast eine Menge guter Fragen, für mich laufen sie alle auf die alte bange solche hinaus nach Wissen oder Rechnen.
Und wird Sirius (wenn's den Algorithmus des schnellen Buchlernens aus großen Partiemengen so gibt, wie ich ihn mir vorstelle) gegen ein AI- Maschine, die so deterministisch spielt wie LCZ derzeit,
http://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=112412#pid112412
, nicht leichtes Spiel haben, ein spezifisches Buch gegen so eine Schachentität zu erstellen, wenn sie eine Weile bekannt ist und ihre Partien zugänglich sind?
Ich geh jetzt wieder schlafen.

By Guenter Stertenbrink Date 2018-04-04 07:43

dem kann man ja leicht mit zufaelligen Abweichungen begegnen.
Braucht aber evtl. mehr Lernpartien.

Ich frage mich wie sich eine Brettvergroesserung or FRC auf die Zahl der noetigen Lernpartien auswirken wuerde

By Peter Martan Date 2018-04-04 08:11

Guenter Stertenbrink schrieb:

dem kann man ja leicht mit zufaelligen Abweichungen begegnen.
Braucht aber evtl. mehr Lernpartien.

Widerspricht das nicht wieder etwas dem reinen Selflearning- Prinzip, wenn sich ein Zufallsgenerator einmischt?
Und was genau lernt man eigentlich aus Zufällen? Wäre es nicht das, sie zu vermeiden bei künftigen Entscheidungen?

By Guenter Stertenbrink Date 2018-04-04 11:28 Edited 2018-04-04 11:33

wenn zwei Zuege etwa gleich gut sind, waehle irgendeinen davon mit Wahrscheinlichkeit 50%

das aendert nix, wir haben ja eh schon Zufaelle mit "Monte Carlo" , wie soll man das auch vermeiden,
wenn nur subjektive Wahrscheinlichkeiten fuer die Qualitaet eines Zuges verfuegbar sind,
die sich im Laufe der Analyse staendig aendern

By Peter Martan Date 2018-04-04 15:10

Guenter Stertenbrink schrieb:

wenn zwei Zuege etwa gleich gut sind, waehle irgendeinen davon mit Wahrscheinlichkeit 50%

Jedes mal?

Wie gleich ist etwa gleich?

Guenter Stertenbrink schrieb:

das aendert nix, wir haben ja eh schon Zufaelle mit "Monte Carlo" , wie soll man das auch vermeiden,
wenn nur subjektive Wahrscheinlichkeiten fuer die Qualitaet eines Zuges verfuegbar sind,
die sich im Laufe der Analyse staendig aendern

Subjektive Wahrscheinlichkeiten klingt mir im Zusammenhang mit einer Maschine etwas wenig mathematisch und wieso habe ich bei Monte Carlo mehr Zufälle als bei begrenzten Rechenhorizonten?

By Guenter Stertenbrink Date 2018-04-05 05:01 Edited 2018-04-05 05:15

LC0 schaetzt in jeder Stellung ab, wie gross ihre Gewinn- und Remis- Wahrscheinlichkeit dort ist
(anhand der gespeicherten Partien gegen sich selbst, also unabhaengig vom Gegner)
Das meinte ich mit subjektiv.
Wenn Zug A zu einem erwarteten score on 0.53 fuehrt und Zug B zu 0.52 dann kann man ohne
grossen Spielstaerkeverlust mit etwa 60% Wahrscheinlichkeit Zug A waehlen und mit 40% Zug B.

LC0 erwartet ja keinen menschlichen Gegner, sondern nur weitere Trainingspartien gegen sich selbst
und daraufhin wird sie optimiert.
Sie geht [noch] nicht der direkten Vorbereitung des Gegners auf ihre Schwaechen aus dem Weg

[so wie ich das verstehe]

----------------------

https://chessprogramming.wikispaces.com/Monte-Carlo%20Tree%20Search

MCTS is based on random playouts,
MCTS is based on randomized explorations of the search space.

Es aendert sich mit jedem update , genauso koennte man irgendeine andere
Datenbank nehmen die ein anderes LC0-aehnliches Programm erzeugt hat , oder einfach LC0 neu starten.
Dann waeren die bevorzugten Eroeffnungen vermutlich voellig anders.
Bei gegebener Partien-Datenbank [oder den daraus berechneten Parametern ?] kann LC0 theoretisch
wohl deterministisch spielen, also bei derselben Bedenkzeit und derselben Stellung immer denselben Zug machen,
aber ich bin nicht sicher. Normale engines mit mehreren Kernen werden ja vom Betrienbssystem unberechenbar
unterbrochen und spielen nicht deterministisch.

By Peter Martan Date 2018-04-05 05:18 Edited 2018-04-05 06:18

Danke, Günter!

Vertreiben wir uns bis dahin, wenn Leela das alles so richtig gelernt wird haben, die Zeit wieder möglichst angenehm. Momentan ist eine Zugfolge, mit der man gegen Build 82 online im slow mode eine Super- Weißperformance (je nachdem, wie oft man's wiederholt

) erspielen kann:

1. e4 e5 2. Nf3 Nc6 3. Bc4 Nf6 4. d4 exd4 5. O-O Nxe4 6. Re1 d5 7. Bxd5 Qxd5 8.
Nc3 Qd8 9. Rxe4+ Be7 10. Nxd4 f5 11. Bh6 fxe4 12. Bxg7 Rf8 13. Qh5+ Rf7 14. Rd1
Bd7 15. Nxc6 bxc6 16. Nxe4 Qc8 17. Qxh7 Bf5 18. Qh8+ Bf8 19. Bxf8 Rxf8 20. Qh5+
Ke7 21. Re1 Qe6 22. Qh4+ Ke8 23. f3 Qg6 24. Nd6+ Kd7 25. Qe7#

Ich bin einfach immer noch kindisch genug, sowas lustig zu finden.
Ich weiß noch, dass ich so, unmittelbar nachdem ich meinen ersten Schachcomputer (Fidelity Chess Challenger) bekommen hatte, meine ersten Freuden darin fand, Eröffnungszüge, von denen ich schon herausgefunden hatte, dass sie beim armen kleinen Fidi immer wieder zum Verlust führten, auswendig zu lernen.

Im Ernst, ich glaube immer noch, dass Deep Mind sehr gut beraten war, Stocki ohne Buch spielen zu lassen.
In diesem Fall war nämlich die Deterministic vermutlich ausgesprochen vorteilhaft, wie man jedenfalls an den 10 veröffentlichen Partien sieht.

Und wie du jetzt, ohne eben doch wieder menschlich aktiv einzugreifen, eine AI- Maschine wie Leela (oder auch A0?) daran hindern würdest, Eröffnungsfallen des Gegners zu umgehen, wenn der mal welche gefunden hätte, die funktionieren, ist mir immer noch nicht klar.

Baust du einfach einen Zufallsgenerator händisch ein(darfst du ja aber beim reinen Selbstlerner auch nicht), musst du ihm ein Prinzip dafür mitgegen, ab wo, wie oft und bis zu welchen Grenzen der Wahrscheinlichkeitsähnlichkeit der zuschlagen soll. Nicht gerade Autotuning für mich, das alles, ich würde da schon wieder irgendwie mehr von human coded intelligence als von AI reden.

Oder du setzt das NN jedesmal in so einem Fall neu auf, nämlich lässt es neu lernen, was und wie auch immer du das machen willst und darfst, ohne der Engine genau die Eröffnung von außen "beizubringen", sie jedenfalls irgendwie spezifisch lernen zu lassen.

Oder du lässt die AI- Engine gleich auch mit Buch spielen.

By Peter Martan Date 2018-04-05 06:36 Edited 2018-04-05 06:38

Peter Martan schrieb:

1. e4 e5 2. Nf3 Nc6 3. Bc4 Nf6 4. d4 exd4 5. O-O Nxe4 6. Re1 d5 7. Bxd5 Qxd5 8.
Nc3 Qd8 9. Rxe4+ Be7 10. Nxd4 f5 11. Bh6 fxe4 12. Bxg7 Rf8 13. Qh5+ Rf7 14. Rd1
Bd7 15. Nxc6 bxc6 16. Nxe4 Qc8 17. Qxh7 Bf5 18. Qh8+ Bf8 19. Bxf8 Rxf8 20. Qh5+
Ke7 21. Re1 Qe6 22. Qh4+ Ke8 23. f3 Qg6 24. Nd6+ Kd7 25. Qe7#

Das mit dem Slow Mode ist eigentlich ohnehin unnötig, wenn man nur möglichst schnell 3000 Celo erspielt will haben, im normalen Modus geht's ab dem 12. Zug ein bisschen anders weiter:

1. e4 e5 2. Nf3 Nc6 3. Bc4 Nf6 4. d4 exd4 5. O-O Nxe4 6. Re1 d5 7. Bxd5 Qxd5 8.
Nc3 Qd8 9. Rxe4+ Be7 10. Nxd4 f5 11. Bh6 fxe4 12. Bxg7 Rg8 13. Qh5+ Kd7 14.
Qd5+ Ke8 15. Qxg8+ Kd7 16. Qd5+ Ke8 17. Qh5+ Kd7 18. Nxc6 bxc6 19. Rd1+ Bd6 20.
Nxe4 Qe7 21. Bf6 Qf8 22. Nc5#

Und überhaupt lohnt es sich wahrscheinlich nicht, weiter als bis zum 11. Zug auswendig zu lernen, weil wenn man sich dort drauf verlassen kann, dass Leela auf die kleine Falle 11.Lh6 (?!) sicher reinfällt, geht der Rest eh freihändig auch weiter.

By Guenter Stertenbrink Date 2018-04-05 11:39

stell ich mir ganz einfach vor, leicht zu programmieren [wenn viele das machen]

ich erinnere irgendein Fritz, eigentlich viel staerker als ich ,
da gewann ich leicht mit d4,Qd3,f4,Nf3,Nd2,Ne5,Qf3,Bd3,g4,Rg1,Rg3 oder so

By Peter Martan Date 2018-04-05 12:45

Guenter Stertenbrink schrieb:

ich erinnere irgendein Fritz, eigentlich viel staerker als ich ,
da gewann ich leicht mit d4,Qd3,f4,Nf3,Nd2,Ne5,Qf3,Bd3,g4,Rg1,Rg3 oder so

Ja, ich gewinne auch jederzeit gegen Stockfish, wenn ich ihm ein Buch schreibe, dass sich auf eine einzelne zwingende Variante beschränkt, die ihn ins sichere Verderben (am besten gleich bis zum Matt) führt und lauter grüne Züge hat, Buchlernen aus und die anderen Einstellungen auch so, dass er immer wieder diese eine Line spielen muss, die ihm das GUI vorschreibt, so wie ich's dem GUI (dem Buch) vorgeschrieben habe.