Erläuterungen zum Suchalgorithmus

By Wolfram Bernhardt Date 2021-07-10 10:04 Upvotes 1

Hi!

Da möchte ich direkt über einen Punkt sprechen, über den ich neulich gestolpert bin. Es geht um den Ausgangwert für das Maximum des Zugwertes in der aktuellen Suchtiefe. Die Negamax-Suche ist in der Wikipedia wie folgt angegeben:

Code:


 int miniMax(int spieler, int tiefe,
             int alpha, int beta) {
    if (tiefe == 0 or keineZuegeMehr(spieler))
       return bewerten(spieler);
    int maxWert = alpha;
    Zugliste = generiereMoeglicheZuege(spieler);
    for each (Zug in Zugliste) {
       fuehreZugAus(Zug);
       int wert = -miniMax(-spieler, tiefe-1,
                           -beta, -maxWert);
       macheZugRueckgaengig(Zug);
       if (wert > maxWert) {
          maxWert = wert;
          if (tiefe == gewuenschteTiefe)
             gespeicherterZug = Zug;
          if (maxWert >= beta)
             break;
       }
    }
    return maxWert;
 }

Mir geht es um die 5. Zeile: int maxWert = alpha;

In vielen anderen Implementierungsbeispielen wird hier aber dies verwendet: maxWert = -99999 .

Meiner Meinung nach ist das schon ein wichtiger Unterschied und ich frage mich, was richtig ist. Oder ob es egal ist (was ich eher nicht glaube).

Weiß da jemand etwas zu?

Viele Grüße
Wolfram

By Lothar Jung Date 2021-07-10 10:34 Edited 2021-07-10 10:36 Upvotes 1

Hallo Wolfram,

gutes Beispiel für eine MiniMax-Funktion.

An diese Funktion werden 4 Werte übergeben.
Einer davon ist alpha.
Alpha wird an die Variable int maxWert übergeben.
Danach wird die Anzahl der möglichen Züge an die Zugliste übergeben.
Danach wird die Suchschleife ausgeführt.
Die Schleife wird verlassen, wenn der maxWert >= beta ist.
Die Funktion gibt den maxWert zurück.

Die Anzahl der Schleifendurchläufe hängt von der Anzahl der Züge in der Zugliste ab: „for each (Zug in Zugliste)“.

Ich kann nur diese Funktion kommentieren, da mir andere Algorithmen mit maxWert=-99999 nicht vorliegen.

Just my two cents.

Lothar

By Thomas Plaschke Date 2021-07-10 11:04 Upvotes 1

Ich weiß nix!

… halte aber maxwert=alpha auch für verdächtig, weil damit der negierte beta-Wert der tiefe-1 zum Vergleich wert > maxwert genommen wird. Das könnte bessere Züge der aktuellen Suchtiefe ausblenden, glaube ich.

In anderen Veröffentlichungen wird tatsächlich -unendlich zugewiesen (, um sicherzustellen, dass maxwert in der aktuellen Tiefe ermittelt wird(?), wodurch alle Züge der aktuelle Tiefe einbezogen werden).

Viele Grüße
Th. Plaschke

By Lothar Jung Date 2021-07-10 11:52 Upvotes 1

Hier ist ein anderes Beispiel, das auch keinen Maximalwert vorsieht:

function AlphaBeta(node, depth, alpha, beta, maximizingPlayer)
if depth = 0 or node is a terminal node then
return the heuristic value of node
end if
if maximizingPlayer then
v := visits MAXVALUE
for each child of node do
v := max(v, alphabeta(child, depth -1, alpha, beta, FALSE))
alpha := max(alpha, v)
if beta ≤ alpha then
break(beta-cutoff)
end if
end for
return v
else
v := visits MINVALUE
for each child of node do State v := max(v, alphabeta(child, depth -1, alpha,beta, TRUE))
beta := min(beta, v)
if beta ≤ alpha then
break(alpha-cutoff)
end if
end for
return v
end if
end function

By Jörg Oster Date 2021-07-10 12:10 Upvotes 1

maxWert übernimmt hier die Rolle von alpha.
Deshalb wird zu Beginn maxWert der Wert von alpha zugeteilt.
Siehe auch der nachfolgende rekursive Aufruf von miniMax() mit -maxWert anstatt -alpha.

In den meisten Implementierungen ist es aber so, dass man beide Werte getrennt voneinander beibehält.
Dann wird maxWert erstmal auf den schlechtestmöglichen Wert initialisiert (-unendlich).
Wenn der Wert eines Zuges größer als maxWert ist, wird dieser aktualisiert.
Ist der Wert auch größer als alpha, wird auch alpha aktualisiert.

By Lothar Jung Date 2021-07-10 12:25 Upvotes 1

Danke Jörg,

Also beides geht. Fragt sich nur welche Variante schneller ist.

Lothar

By Jörg Oster Date 2021-07-10 12:27 Upvotes 1

Ergänzend dazu, müsst ihr euch darüber im Klaren sein,
dass das ganze ja seinen Ursprung an der Wurzelposition (root position) hat.
Und von da wird die Suche ja mit alpha = -unendlich und beta = unendlich gestartet!

By Wolfram Bernhardt Date 2021-07-10 13:46 Upvotes 1

Hi Jörg!

Klar, an der Wurzelposition startet man mit Maximalwerten.

Ich bin aber weiterhin nicht sicher. Man will in der Praxis schon die Variante, in der man nicht dauernd zwischen minimierendem und maximierendem Spiel unterscheiden wil, also negamax.

Hier gibt es den Algorithmus auch beschrieben und man sieht, dass alpha, beta und der value der aktuellen Stufe als drei getrennte Werte gehalten werden und alpha und value sind nicht dasselbe.

https://en.wikipedia.org/wiki/Negamax#Negamax_with_alpha_beta_pruning

Es könnte aber sein, dass es auch nicht schadet... bisher kommt mir die Initialisierung von value = alpha aber doch irgendwie eigenartig vor...

By Lothar Jung Date 2021-07-10 18:30 Upvotes 1

Hier ein kurzer Beitrag zum AlphaBeta Algorithmus:

https://docplayer.org/28466460-19-algorithmus-der-woche-der-alphabeta-algorithmus-fuer-spielbaumsuche-wie-bringe-ich-meinen-computer-zum-schachspielen.html