Thomas Plaschke schrieb:
Ich habe keinen Einblick in die Programmstruktur von Allie genommen.
Wenn du das kannst, mach das aber doch mal, das würde mir mehr sagen als Vermutungen über die Beurteilung aller möglicher Endstellungen von "ruhigen" Ausgangsstellungen.
Meiner Erfahrung nach kommen Fehlbewertungen von Leela nach wie vor von taktischen Übersehern, die sind meistens keine Frage "ruhiger" Ausgangsstellungen und late moves, sonder eher von einzelnen taktisch relevanten Plies entlang des Suchbaumes. Wenn man sich anschaut, was Leela auf mehreren GPUs (gut, mehr als 2x2080ti hab' ich noch nicht probiert, aber einen Grenzwertnutzen wird's ja da wohl auch geben, ich will ja auch nicht gleich 64 Kerne für die A-B-Suche, aber die Performance in dieser ganz gut bekannten Art der dynamischen Bewertung nimmt von einem auf 2, von 2 auf 4 und von 4 auf 8 schon noch ganz schön zu, nicht?) alles an für A-B-Engines oft erstaunlich einfachen Hot Shots immer noch "übersieht", könnte ich mir einfach vorstellen, dass mehr Kerne, oder wenigstens Threads, von einem allein ausgehend, der A-B-Suche mehr bringen könnten als mehrere GPUs der NN- Abfrage.
Edit: mir dein und mein Posting noch einmal durchlesend, war ich vielleicht wieder mal etwas plakativ. Du wirst mit den ruhigen Stellungen die quiescence search gemeint haben, mag schon sein, die kann sich die NN- Engine zeitweise etwas sparen, drum probieren ja jetzt auch alle möglichen A-B-Engines diese Ruhesuche teilweise durch MCTS- Scores zu ersetzen, ob das sinvoll ist, kann ich nicht beurteilen, aber der Witz, auf den ich hinaus will, ist der: die GPU(s) werden sicher auch noch aufrüstbar sein, die CPU wird dabei aber von Leela kaum genutzt, wenn Allie das kann, und noch dazu durch eine taktisch für mich immer noch effektivere A-B-Suche, dann kostet das ja die GPU kaum Leistung und das Problem wäre nur noch, die beiden Suchbäume miteinander abzugleichen.
Da würde ich, was meine Erfahrung mit Hashlernen von A-B und von Leela angeht, halt auch immer noch weitaus mehr auf A-B als auf NN setzen, klar A-B "lernt" mit dem Hash, NN lernt während des Spiels nix. (Müsste allerdings auch nicht so bleiben.)