Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Stockfish Zero?
1 2 Previous Next  
Parent - By Tom Paul Date 2018-03-23 20:36
Dank mir stiftet ein weiteres Vereinsmitglied seine Hardware damit Stockfish Zero besser wird.

Wie viele Leute (aus deinem Verein) hast du dazu gebracht das Projekt zu unterstützen und Hardware zu stiften?
Parent - - By Peter Martan Date 2018-03-20 06:15 Edited 2018-03-20 06:20
Ingo Althöfer schrieb:

Man darf Gian-Carlo Pascutto, dem Kopf des Leela-Zero-Projekts
zu dem Erfolg gratulieren! (Einige kennen ihn auch noch als
Schachprogrammierer von Sjeng.)

Dass sich der lieber der Sache von Go als der von Schach annimmt, spricht mir aber auch irgendwie dagegen, dass Schach dafür als Anwendung gleich gut geeignet ist.
Parent - - By Ingo Althöfer Date 2018-03-20 09:00
Lieber Herr Martan,

Peter Martan schrieb:
Ingo Althöfer schrieb:

Man darf Gian-Carlo Pascutto, dem Kopf des Leela-Zero-Projekts
zu dem Erfolg gratulieren! (Einige kennen ihn auch noch als
Schachprogrammierer von Sjeng.)

Dass sich der lieber der Sache von Go als der von Schach annimmt, spricht mir
aber auch irgendwie dagegen, dass Schach dafür als Anwendung gleich gut geeignet ist.

das muss nicht so sein.

Pascutto lernte das Computer-Go 2007 beim europäischen
Go-Kongress in Amsterdam kennen. Ungefähr gleichzeitig
hatte er Stress mit der ICGA und ihren Computerschach-Aktivitäten.
2008 hatte er dann seine erste Version von Leela publik gemacht
und bei der Computer-Olympiade in Peking damit eine Silber-
und eine Bronnze-Medaille gewonnen.

Ingo Althöfer.
Parent - By Peter Martan Date 2018-03-20 15:22
Ist schon gut, lieber Herr Professor.

Dann würde ich aber, wenn's jetzt LCZero auch gibt, als gestandener Computerschachprogrammierer und Fachmann für selbstlernde Spiele- AI, der endlich den Schachprogrammierern der ICGA  damit auch eins auswischen könnte, sofort am entsprechenden Schach- NN auch mitarbeiten, Sie nicht?
Parent - - By Lothar Jung Date 2018-03-20 12:43 Edited 2018-03-20 12:46
Die letzte LCZero-Version erreicht jetzt fast 1.400 Elo.
Der Spielstil ist recht „unkonventionell“:
Eröffnungsbehandlung  bzw.  -Schwächen z.B.  öfter  H4,
Mangelnde Zentrumsbeherrschung,
Vernachlässigung der Königssicherheit.
Die Entwicklung ist jedoch sehr interessant und vielversprechend.
Lothar Jung
Parent - By Peter Martan Date 2018-03-20 15:27
Danke, Lothar!

Mal von den Celo (Computerschach- Elo) ganz abgesehen, die sich ja wirklich rasant entwickelt haben, bin ich persönlich schon ausgesprochen neugierig, wann man dem Ding irgendwelche Teststellungen, die es nicht im Spiel selbst aufs Brett gebracht hat, vorsetzen wird können.
Parent - By Lothar Jung Date 2018-03-20 17:20
Sorry, später niedriger 1.324 Elo.
Parent - By Lothar Jung Date 2018-03-21 19:39
LCZero Gen. 13 ist jetzt bei 1431 Elo einstuft.
In den Testpartien gegen SF 9 Level 3 spielt LCZero gutes Angriffsschach.
https://www.twitch.tv/y_sensei
Parent - By Ingo Althöfer Date 2018-03-16 16:29
Danke Günter.
Mit  dem Vorspielen solcher Partien
sollte man viele Neulinge für das Schach
gewinnen können.

Nach einigem Hiin und Her war das Mattsetzen mit
zwei Damen am Ende echt souverän.

Ingo Althöfer.
- - By Guenter Stertenbrink Date 2018-03-12 15:10
anstatt der normalen eval , suche ich in meiner Datenbank nach Partie-Stellungen,
die so aehnlich sind wie die zu bewertende und nehme den Durchschnitt
der Resultate daraus.

"so aehnlich" heisst, gleiches Material, gleiche Bauernstruktur,
moeglichst wenige halbwegs vernuenftige Zuege, die die
eine Stellung in die andere ueberfuehren

Und dann alphabeta minimax montecarlo um Varianten durchzurechnen,
also auch in einer normale engine kann so einfach die eval-subroutine
durch diese Datenbank-Aehnlichkeitssuche ersetzt werden.
Ohne neuronales Netz.

Das haette ich jetzt gerne mit Stockfish und der alphazero Datenbank !
Auf 'nem normalen Rechner.

Oder erstmal mit der gen5-Datenbank.

oder dasselbe mit Go ... hmm, welche Go-Stellungen sind aehnlich ?
Parent - By Tom Paul Date 2018-03-18 12:20
http://162.217.248.187/

Wo steht eigentlich im Graphen oder darunter:
Welche Gen Version/Entwicklungsversion da gerade spielt, welche neu ist, welche alt ist, wie viele Partien diese gespielt haben, wie viel diese trainiert haben, mit wie viel Prozent diese bestanden haben oder durchgefallen sind und so weiter?
- By Guenter Stertenbrink Date 2018-03-26 10:57 Edited 2018-03-26 11:02
es geht weiter aufwaerts, die vermeintliche Stagnation ist vorueber

http://lczero.org/

ca.1900 Elo
- - By Guenter Stertenbrink Date 2018-04-03 05:59
ich weiss immer noch nicht, wie LC0 und A0 funktionieren.
Werden die ganzen Test-Partien gespeichert und dann
zum Nachgucken waehrend der eigentlichen Partien
in einer Datenbank bereitgehalten ?

Oder wird das nur benutzt um Parameter (wieviele) zu berechnen ?

Koennen die Testpartien nun auch von anderen engines benutzt werden ?
Houdini-Zero, Komodo-Zero etc. ?
Vermutlich dann mit Hybrid-Funktion , manche Kerne laufen
klassisch und manche neural , plus Eroeffnungsbuch plus
Endspiel Tablebases.

Wird es dann evtl. sogar so eine Art "Modul" geben, sodass man
LC0 in sein eigenes Program integrieren kann ?

Also, wenn LC0 so ca. 10M Partien gespielt hat und 3000 Elo erreicht hat,
in ein paar Wochen/Monaten , werden wir dann etliche weitere zeros
bekommen, die die LC0 Testpartien benutzen koennen ohne selbst neu
testen zu muessen ?
Parent - By Peter Martan Date 2018-04-03 06:25
Mich würde vor allem mal interessieren, ob, ab wann und wie man das Programm auf dem eigenen Rechner weiter lernen lassen wird können, ohne dass es davon wieder dümmer wird.
- - By Guenter Stertenbrink Date 2018-04-04 04:58 Edited 2018-04-04 05:11
koennte man nicht die Wirksamkeit des Trainings erhoehen, indem man die
Stockfish evals der Positionen nimmt anstelle des Partie-Ergebnisses ?
oder beides ?
Um zu vermeiden dass eine Stellung spaeter entschieden wird durch Patzer,
die ihren Ursprung nicht in der aktuellen Stellung haben

-------------------------------
hat es schon jemand geschafft, die Konditionen
der google-groups oder github zu lesen,verstehen und akzeptieren ?

---------------------------------------
in GUI , Turniere spielen : (jemand fragte ?!?)
Sure. I am using the tournament mode in the Arena GUI (Freeware) Version 3.5.1. under WIndows XP pro 64bit.
Arena site: http://www.playwitharena.com/
How-to for creating an engine from LcZero in Arena can be found here:
https://github.com/glinscott/leela-chess/wiki/Running-LCZero-in-a-Chess-GUI
Thanks. I discovered also this instruction and it is working:
https://goo.gl/8eeRft
------------------------------------
Parent - - By Peter Martan Date 2018-04-04 05:37
Guten Morgen, Frühaufsteher!
Du hast eine Menge guter Fragen, für mich laufen sie alle auf die alte bange solche hinaus nach Wissen oder Rechnen.
Und wird Sirius (wenn's den Algorithmus des schnellen Buchlernens aus großen Partiemengen so gibt, wie ich ihn mir vorstelle) gegen ein AI- Maschine, die so deterministisch spielt wie LCZ derzeit,
http://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=112412#pid112412
, nicht leichtes Spiel haben, ein spezifisches Buch gegen so eine Schachentität zu erstellen, wenn sie eine Weile bekannt ist und ihre Partien zugänglich sind?
Ich geh jetzt wieder schlafen.
Parent - - By Guenter Stertenbrink Date 2018-04-04 07:43
dem kann man ja leicht mit zufaelligen Abweichungen begegnen.
Braucht aber evtl. mehr Lernpartien.

Ich frage mich wie sich eine Brettvergroesserung or FRC auf die Zahl der noetigen Lernpartien auswirken wuerde
Parent - - By Peter Martan Date 2018-04-04 08:11
Guenter Stertenbrink schrieb:

dem kann man ja leicht mit zufaelligen Abweichungen begegnen.
Braucht aber evtl. mehr Lernpartien.

Widerspricht das nicht wieder etwas dem reinen Selflearning- Prinzip, wenn sich ein Zufallsgenerator einmischt?
Und was genau lernt man eigentlich aus Zufällen? Wäre es nicht das, sie zu vermeiden bei künftigen Entscheidungen?
Parent - - By Guenter Stertenbrink Date 2018-04-04 11:28 Edited 2018-04-04 11:33
wenn zwei Zuege etwa gleich gut sind, waehle irgendeinen davon mit Wahrscheinlichkeit 50%

das aendert nix, wir haben ja eh schon Zufaelle mit "Monte Carlo" , wie soll man das auch vermeiden,
wenn nur subjektive Wahrscheinlichkeiten fuer die Qualitaet eines Zuges verfuegbar sind,
die sich im Laufe der Analyse staendig aendern
Parent - - By Peter Martan Date 2018-04-04 15:10
Guenter Stertenbrink schrieb:

wenn zwei Zuege etwa gleich gut sind, waehle irgendeinen davon mit Wahrscheinlichkeit 50%

Jedes mal?

Wie gleich ist etwa gleich?
Guenter Stertenbrink schrieb:

das aendert nix, wir haben ja eh schon Zufaelle mit "Monte Carlo" , wie soll man das auch vermeiden,
wenn nur subjektive Wahrscheinlichkeiten fuer die Qualitaet eines Zuges verfuegbar sind,
die sich im Laufe der Analyse staendig aendern

Subjektive Wahrscheinlichkeiten klingt mir im Zusammenhang mit einer Maschine etwas wenig mathematisch und wieso habe ich bei Monte Carlo mehr Zufälle als bei begrenzten Rechenhorizonten?
Parent - - By Guenter Stertenbrink Date 2018-04-05 05:01 Edited 2018-04-05 05:15
LC0 schaetzt in jeder Stellung ab, wie gross ihre Gewinn- und Remis- Wahrscheinlichkeit dort ist
(anhand der gespeicherten Partien gegen sich selbst, also unabhaengig vom Gegner)
Das meinte ich mit subjektiv.
Wenn Zug A zu einem erwarteten score on 0.53 fuehrt und Zug B zu 0.52 dann kann man ohne
grossen Spielstaerkeverlust mit etwa 60% Wahrscheinlichkeit Zug A waehlen und mit 40% Zug B.

LC0 erwartet ja keinen menschlichen Gegner, sondern nur weitere Trainingspartien gegen sich selbst
und daraufhin wird sie optimiert.
Sie geht [noch] nicht der direkten Vorbereitung des Gegners auf ihre Schwaechen aus dem Weg

[so wie ich das verstehe]

----------------------

https://chessprogramming.wikispaces.com/Monte-Carlo%20Tree%20Search

MCTS is based on random playouts,
MCTS is based on randomized explorations of the search space.

Es aendert sich mit jedem update , genauso koennte man irgendeine andere
Datenbank nehmen die ein anderes LC0-aehnliches Programm erzeugt hat , oder einfach LC0 neu starten.
Dann waeren die bevorzugten Eroeffnungen vermutlich voellig anders.
Bei gegebener Partien-Datenbank [oder den daraus berechneten Parametern ?] kann LC0 theoretisch
wohl deterministisch spielen, also bei derselben Bedenkzeit und derselben Stellung immer denselben Zug machen,
aber ich bin nicht sicher. Normale engines mit mehreren Kernen werden ja vom Betrienbssystem unberechenbar
unterbrochen und spielen nicht deterministisch.
Parent - - By Peter Martan Date 2018-04-05 05:18 Edited 2018-04-05 06:18
Danke, Günter!

Vertreiben wir uns bis dahin, wenn Leela das alles so richtig gelernt wird haben, die Zeit wieder möglichst angenehm. Momentan ist eine Zugfolge, mit der man gegen Build 82 online im slow mode eine Super- Weißperformance (je nachdem, wie oft man's wiederholt ) erspielen kann:

1. e4 e5 2. Nf3 Nc6 3. Bc4 Nf6 4. d4 exd4 5. O-O Nxe4 6. Re1 d5 7. Bxd5 Qxd5 8.
Nc3 Qd8 9. Rxe4+ Be7 10. Nxd4 f5 11. Bh6 fxe4 12. Bxg7 Rf8 13. Qh5+ Rf7 14. Rd1
Bd7 15. Nxc6 bxc6 16. Nxe4 Qc8 17. Qxh7 Bf5 18. Qh8+ Bf8 19. Bxf8 Rxf8 20. Qh5+
Ke7 21. Re1 Qe6 22. Qh4+ Ke8 23. f3 Qg6 24. Nd6+ Kd7 25. Qe7#

Ich bin einfach immer noch kindisch genug, sowas lustig zu finden.
Ich weiß noch, dass ich so, unmittelbar nachdem ich meinen ersten Schachcomputer (Fidelity Chess Challenger) bekommen hatte, meine ersten Freuden darin fand, Eröffnungszüge, von denen ich schon herausgefunden hatte, dass sie beim armen kleinen Fidi immer wieder zum Verlust führten, auswendig zu lernen.

Im Ernst, ich glaube immer noch, dass Deep Mind sehr gut beraten war, Stocki ohne Buch spielen zu lassen.
In diesem Fall war nämlich die Deterministic vermutlich ausgesprochen vorteilhaft, wie man jedenfalls an den 10 veröffentlichen Partien sieht.

Und wie du jetzt, ohne eben doch wieder menschlich aktiv einzugreifen, eine AI-  Maschine wie Leela (oder auch A0?) daran hindern würdest, Eröffnungsfallen des Gegners zu umgehen, wenn der mal welche gefunden hätte, die funktionieren, ist mir immer noch nicht klar.

Baust du einfach einen Zufallsgenerator händisch ein(darfst du ja aber beim reinen Selbstlerner auch nicht), musst du ihm ein Prinzip dafür mitgegen, ab wo, wie oft und bis zu welchen Grenzen der Wahrscheinlichkeitsähnlichkeit der zuschlagen soll. Nicht gerade Autotuning für mich, das alles, ich würde da schon wieder irgendwie mehr von human coded intelligence als von AI reden.

Oder du setzt das NN jedesmal in so einem Fall neu auf, nämlich lässt es neu lernen, was und wie auch immer du das machen willst und darfst, ohne der Engine genau die Eröffnung von außen "beizubringen", sie jedenfalls irgendwie spezifisch lernen zu lassen.

Oder du lässt die AI- Engine gleich auch mit Buch spielen.
Parent - By Peter Martan Date 2018-04-05 06:36 Edited 2018-04-05 06:38
Peter Martan schrieb:

1. e4 e5 2. Nf3 Nc6 3. Bc4 Nf6 4. d4 exd4 5. O-O Nxe4 6. Re1 d5 7. Bxd5 Qxd5 8.
Nc3 Qd8 9. Rxe4+ Be7 10. Nxd4 f5 11. Bh6 fxe4 12. Bxg7 Rf8 13. Qh5+ Rf7 14. Rd1
Bd7 15. Nxc6 bxc6 16. Nxe4 Qc8 17. Qxh7 Bf5 18. Qh8+ Bf8 19. Bxf8 Rxf8 20. Qh5+
Ke7 21. Re1 Qe6 22. Qh4+ Ke8 23. f3 Qg6 24. Nd6+ Kd7 25. Qe7#


Das mit dem Slow Mode ist eigentlich ohnehin unnötig, wenn man nur möglichst schnell 3000 Celo erspielt will haben, im normalen Modus geht's ab dem 12. Zug ein bisschen anders weiter:

1. e4 e5 2. Nf3 Nc6 3. Bc4 Nf6 4. d4 exd4 5. O-O Nxe4 6. Re1 d5 7. Bxd5 Qxd5 8.
Nc3 Qd8 9. Rxe4+ Be7 10. Nxd4 f5 11. Bh6 fxe4 12. Bxg7 Rg8 13. Qh5+ Kd7 14.
Qd5+ Ke8 15. Qxg8+ Kd7 16. Qd5+ Ke8 17. Qh5+ Kd7 18. Nxc6 bxc6 19. Rd1+ Bd6 20.
Nxe4 Qe7 21. Bf6 Qf8 22. Nc5#

Und überhaupt lohnt es sich wahrscheinlich nicht, weiter als bis zum 11. Zug auswendig zu lernen, weil wenn man sich dort drauf verlassen kann, dass Leela auf die kleine Falle 11.Lh6 (?!) sicher reinfällt, geht der Rest eh freihändig auch weiter.
Parent - - By Guenter Stertenbrink Date 2018-04-05 11:39
stell ich mir ganz einfach vor, leicht zu programmieren  [wenn viele das machen]

ich erinnere irgendein Fritz, eigentlich viel staerker als ich ,
da gewann ich leicht mit d4,Qd3,f4,Nf3,Nd2,Ne5,Qf3,Bd3,g4,Rg1,Rg3 oder so
Parent - By Peter Martan Date 2018-04-05 12:45
Guenter Stertenbrink schrieb:

ich erinnere irgendein Fritz, eigentlich viel staerker als ich ,
da gewann ich leicht mit d4,Qd3,f4,Nf3,Nd2,Ne5,Qf3,Bd3,g4,Rg1,Rg3 oder so

Ja, ich gewinne auch jederzeit gegen Stockfish, wenn ich ihm ein Buch schreibe, dass sich auf eine einzelne zwingende Variante beschränkt, die ihn ins sichere Verderben (am besten gleich bis zum Matt) führt und lauter grüne Züge hat, Buchlernen aus und die anderen Einstellungen auch so, dass er immer wieder diese eine Line spielen muss, die ihm das GUI vorschreibt, so wie ich's dem GUI (dem Buch) vorgeschrieben habe.
Up Topic Hauptforen / CSS-Forum / Stockfish Zero?
1 2 Previous Next  

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill