dkappe schrieb:
I’m UCT/MCTS werden die besseren Baum teile öfter besucht. Ein Bestandteil der NN Bewertung is „policy,“ ein Vector von Nummern [0,1.0] die Ansagen wie wahrscheinlich es ist das ein bestimmter Zug gewählt wird. Wenn man dann im Baum die policy mit der PV von der AuxEngine nachhilft und P (0.5) dazu addiert, kann das eine bessere Suche ergeben.
Ein Par Überlegungen:
- die pv wird nur angewendet wenn dei Stellung „interessant“ ist. Daher nur wenn sei im Suchbaum mindestens N (100) mal besucht worden ist.
- die AuxEngine hat nur einen Arbeiter der M Halbzüge tief sucht. Wenn die UCT suche 1000 interessante Stellungen pro Sekunde abwirft aber der AuxEngine nur 20 pro Sekunde bearbeiten kann (weil die Suche zu tief ist), ist das weniger nützlich.
- ich habe gefunden das N=50, M=10 und P=0.1 — also öfters weniger tief suchen und leicht nachhelfen — ist besser als N=100, M=15, P=0.5
- Es gibt da viel zu experimentieren
Ich war und bin der Meinung, daß das Ganze Leelafish-Projekt wenig praxistauglich ist, solange die Aux-Engine nur über eine fixe Suchiefe gesteuert werden kann. Denn es ist klar, daß das unsinnig ist, da die Suchtiefen extrem unterscheidlich lange dauern, wenn man eine komplexe Mittelspielstellung mit einer Endspielstellung vegleicht. Die Aux-Engine müßte vielmehr über eine fixe Suchzeit in Millisekunden gesteuert werden. Dann könnte es interessant werden. Der Autor wollte das angeblich auch mal umsetzen, aber das ist Monate her und es ist leider nichts passiert.