Mir ist immer noch unklar, inwieweit Alliestein eine eigenständige Engine ist, inwieweit sie sie aber auf Lc0 beruht.
Diese NN-Engines gewinnen ihre Spielstärke ja durch unzählige Partien (Analyseläufe) im Vorwege, aus der sie die Datenbasis aufbauen, die ihnen zu ihrem starken Spiel verhilft.
Ich hatte es nun so verstanden, dass bei Allie das Framewort, dass dieses Analyse-Rahmenprogramm von Leela genutzt wurde.
Dass dafür aber ein ganz anderer Ansatz der zu analysierenden Daten gewählt wurde, eine andere(weitere) Idee, wie Spielstärke entstehen soll, dass deshalb auch vermutlich eine sehr andere Engine, ein anderes Spiel heraus kommt.
Gab ich das so ungefähr richtig wieder?
Also:
Gleiche Analysetechnik, aber andere Methodik, andere Grundidee, anderer Datensatz und anderes Ergebnis.
Benno
By Lothar Jung
Date 2019-04-28 10:57
Edited 2019-04-28 11:09
Hallo Benno,
wie Lothar bereits geschrieben hat, besteht AllieStein aus Allie (Engine) + Leelenstein (Net).
In Allie als Engine kann man entsprechende Netze laden, z.B. Lc0 oder Leelenstein. D.h. die Suche wird durch Allie ausgeführt, die Bewertung durch das Netz. Das Hauptziel von Allie ist, die Suche von MCTS auf Alpha-Beta umzustellen, was bei Erfolg spektakulär wäre, denn das hat in Kombination mit einem neuronalem Netz bisher nicht vernünftig funktioniert.
Leelenstein nutzt als Methode für das Lernen supervised learning anhand von Partiensammlungen. Ganz im Gegensatz zu Lc0, denn Lc0 nutzt als Methode für das Lernen reinforcement learning, lernt also dadurch, dass das Programm gegen sich selber spielt.
Gruß
Torsten
Torsten Schoop schrieb:
Leelenstein nutzt als Methode für das Lernen supervised learning anhand von Partiensammlungen
Nachteil: in den Partiesammlungen sind Fehler. = Vorteil LcO
Du meinst aber nicht wirklich, dass in den Selflearning- Partien keine "Fehler" sind, oder?
Peter Martan schrieb:
Du meinst aber nicht wirklich, dass in den Selflearning- Partien keine "Fehler" sind, oder?
die Fehler kann LCO ausmerzen wenn er es kann
wenn
Torsten Schoop schrieb:
Leelenstein nutzt als Methode für das Lernen supervised learning anhand von Partiensammlungen. Ganz im Gegensatz zu Lc0, denn Lc0 nutzt als Methode für das Lernen reinforcement learning, lernt also dadurch, dass das Programm gegen sich selber spielt.
Leelenstein benutzt beides — SL und RL. Noch dazu die RL Daten von einem 256x40 experiment.
Ich habe ähnliches mit Maddex gemacht, das offizielle Netz von Scorpio. Da kommt man viel schneller mit weniger Daten auf ein starkes Netz.
Hallo Dieter,
danke für die Info.
Apropos Maddex und Scorpio. Plant Ihr nach den stillen Updates noch ein offizielles Release einer Version von Scorpio mit Maddex?
Gruß
Torsten
By dkappe
Date 2019-04-28 19:47
Edited 2019-04-28 19:57
(Mein Opa war sehr enttäuscht das mein Vater auf so einen altmodischen Namen wie „Dietrich“ gekommen war und hat mich im Sommer in West Berlin immer „Dieter“ genannt. Inzwischen habe ich mich für „Dietrich“ entscheiden.
)
Da müssten ihr euch an den Autor von Scorpio wenden. Ich habe lediglich ein stärkeres Netz geliefert.