Eigenständigkeit von AllieStein

By Benno Hartwig Date 2019-04-28 06:38 Edited 2019-04-28 06:41

Mir ist immer noch unklar, inwieweit Alliestein eine eigenständige Engine ist, inwieweit sie sie aber auf Lc0 beruht.

Diese NN-Engines gewinnen ihre Spielstärke ja durch unzählige Partien (Analyseläufe) im Vorwege, aus der sie die Datenbasis aufbauen, die ihnen zu ihrem starken Spiel verhilft.
Ich hatte es nun so verstanden, dass bei Allie das Framewort, dass dieses Analyse-Rahmenprogramm von Leela genutzt wurde.
Dass dafür aber ein ganz anderer Ansatz der zu analysierenden Daten gewählt wurde, eine andere(weitere) Idee, wie Spielstärke entstehen soll, dass deshalb auch vermutlich eine sehr andere Engine, ein anderes Spiel heraus kommt.
Gab ich das so ungefähr richtig wieder?

Also:
Gleiche Analysetechnik, aber andere Methodik, andere Grundidee, anderer Datensatz und anderes Ergebnis.

Benno

By Lothar Jung Date 2019-04-28 10:57 Edited 2019-04-28 11:09

Hallo Benno!

AllieStein = Allie (Engine) + Leelenstein (Net)

Hier werden einige Deiner Fragen adressiert:

https://github.com/manyoso/allie

https://www.patreon.com/jjosh

Hier eine Übersicht über Third Party Nets:

https://github.com/LeelaChessZero/lc0/wiki/Third-Party-Nets

Eine spannende Entwicklung!

Grüße

Lothar

By Torsten Schoop Date 2019-04-28 12:03

Hallo Benno,

wie Lothar bereits geschrieben hat, besteht AllieStein aus Allie (Engine) + Leelenstein (Net).

In Allie als Engine kann man entsprechende Netze laden, z.B. Lc0 oder Leelenstein. D.h. die Suche wird durch Allie ausgeführt, die Bewertung durch das Netz. Das Hauptziel von Allie ist, die Suche von MCTS auf Alpha-Beta umzustellen, was bei Erfolg spektakulär wäre, denn das hat in Kombination mit einem neuronalem Netz bisher nicht vernünftig funktioniert.

Leelenstein nutzt als Methode für das Lernen supervised learning anhand von Partiensammlungen. Ganz im Gegensatz zu Lc0, denn Lc0 nutzt als Methode für das Lernen reinforcement learning, lernt also dadurch, dass das Programm gegen sich selber spielt.

Gruß
Torsten

By Horst Sikorsky Date 2019-04-28 12:28

Torsten Schoop schrieb:

Leelenstein nutzt als Methode für das Lernen supervised learning anhand von Partiensammlungen

Nachteil: in den Partiesammlungen sind Fehler. = Vorteil LcO

By Peter Martan Date 2019-04-28 12:39

Du meinst aber nicht wirklich, dass in den Selflearning- Partien keine "Fehler" sind, oder?

By Horst Sikorsky Date 2019-04-28 14:56

Peter Martan schrieb:

Du meinst aber nicht wirklich, dass in den Selflearning- Partien keine "Fehler" sind, oder?

die Fehler kann LCO ausmerzen wenn er es kann

wenn

By dkappe Date 2019-04-28 16:18

Torsten Schoop schrieb:

Leelenstein nutzt als Methode für das Lernen supervised learning anhand von Partiensammlungen. Ganz im Gegensatz zu Lc0, denn Lc0 nutzt als Methode für das Lernen reinforcement learning, lernt also dadurch, dass das Programm gegen sich selber spielt.

Leelenstein benutzt beides — SL und RL. Noch dazu die RL Daten von einem 256x40 experiment.

Ich habe ähnliches mit Maddex gemacht, das offizielle Netz von Scorpio. Da kommt man viel schneller mit weniger Daten auf ein starkes Netz.

By Torsten Schoop Date 2019-04-28 17:07

Hallo Dieter,

danke für die Info.

Apropos Maddex und Scorpio. Plant Ihr nach den stillen Updates noch ein offizielles Release einer Version von Scorpio mit Maddex?

Gruß
Torsten

By dkappe Date 2019-04-28 19:47 Edited 2019-04-28 19:57

(Mein Opa war sehr enttäuscht das mein Vater auf so einen altmodischen Namen wie „Dietrich“ gekommen war und hat mich im Sommer in West Berlin immer „Dieter“ genannt. Inzwischen habe ich mich für „Dietrich“ entscheiden.

)

Da müssten ihr euch an den Autor von Scorpio wenden. Ich habe lediglich ein stärkeres Netz geliefert.