Hallo Herr Wieiting,
Florian Wieting schrieb:
wie mir gerade einfällt, habe ich ein ähnliches Phänomen
zum ersten Mal beim Schachcomputer TurboKing beobachtet...
das lag aber (sehr) wahrscheinlich nicht an dem MCTS-Phänomen.
Diese Eigenart, klare Gewinne im Spiel gegen Menschen zu 0,5-Punkt-
Siegen schrumpfen zu lassen, hatten zwischen 2007 und ca 2012 ALLE
Go-Programme auf MCTS-Basis. Gegen andere MCTS-Programme passierte
das fast nie, weil die in Verluststellungen auch "lazy" waren.
Genauso dürfte die Lc0-Macke zwar gegen einen zielstrebigen Alpha-beta-
Gegner wie Stockfish oft vorkommen, nicht aber gegen andere lc0-Versionen.
Ich bin auch überzeugt, dass DepMind mit AlphaZero das Problem gegen Stockfish
auch massiv hatte. Wahrscheinlich haben sie die schlimmsten Partien der Öffent-
lichkeit vorenthalten und bei Testmatches das Abbruchkriterium eher knapp gesetzt:
z.B. künstliche Aufgabe, wenn 6 Halbzüge lang +6 oder besser für eine Partei
angezeigt wurde.
****************************************************
Man stelle sich ein analoges Verhalten für ein autonom fahrendes Auto
vor: Der Vordermann bremst. Das autonome Fahrzeug merkt das,
setzt mit dem eigenen Bremsen aber erst im letztmöglichen Moment
ein und stoppt schliesslich 20 cm hinter der Stoss-Stange des Vorbremsers.
Für das autonome Programm ist das komplett okay. Ein menschlicher
Passagier kriegt aber erhöhten Blutdruck und Schweißausbrüche.
Viele Grüsse vom Thür-Ringer,
Ingo Althöfer.