Hi Benno,
gute Idee, guter Test!
Aber anstatt jetzt gegen Houdini zu wiederholen wäre der Test gegen einen Angstgegner interessanter.
Also gegen Critter, taktisch auch sehr gut und PHQ-1 hatte ja gegen Critter ein schlechteres Ergebnis erzielt.
Wenn Du das machst, nehme die 1.01 damit Vergleichswerte zum SWCR Test vorliegen.
Wahrscheinlich wird dabei herauskommen, wie auch als wenn Du Rybka 4.1 nimmst, das die Werte oberhalb von 110 wieder besser werden - Vermutung -.
Die Einstellungen bei PHQ-2, gerade die 150 führten zu der doppelten Anzahl an schnellen Gewinnpartien, meist gegen schwächere Gegner. Von daher ist die Idee die Schraube so hoch zu drehen gar nicht so übel, ganz im Gegenteil. Wird auch immer klarer, dass je aggressiver desto mehr Punkt bei den Starken in einem Spießroutenlauf mit vielen Schwächeren.
Die Anzahl der Partien bei einem Gegner reicht für Deinen Test wie ich finde.
Wiederholst Du den mit 1-2 anderen Gegner haben wir mehr Anhaltspunkte als gegen Houdini zu wiederholen.
Und ...
Problematisch an den ganzen Settings ist, das ja an drei Schrauben gleichzeitig gedreht wird.
Würde ich das jetzt so testen, würde ich wie Du erstmal einzeln testen (also Aggressiveness einzeln) und dann im Kombination mit "Mobility Middlegame".
Dann wieder 1-2 Durchläufe und dann vielleicht noch zwei weitere in Kombination mit Feigheit.
Das Ergebnis wird gut sein, fraglich wird sein ...
Und wie schaut das bei längeren Bedenkzeiten wieder aus.
Falsch machen können wir nicht, denn wir wissen ... zwischen Standard und PHQ-1 liegen nur 8-10 ELO. Drehen wir nicht deutlich höher wird es nicht mehr oder weniger aber es wird nicht weniger wenn wir etwas heruntergehen

Und wie Dein jetziger Test schon zeigt ... sehr interessant ... drehen wir noch höher ... Aggressiveness auf 200 fällt Deine Kurve zu 150 deutlich. Genau das ist auch meine Vermutung anhand von ein paar Teststellungen. Höher macht nicht viel Sinn, aber niedriger wird auch nicht so viel mehr bringen. Insofern wird Tuning bei SF wahrscheinlich nicht mehr als 30 ELO bringen, denke ich mir mal so ganz frech.
Denke das sind auch die drei Schrauben bei denen sich etwas regt.
Mobility Endgame, meines Erachtens eher passiver um das Rating etwas zu steigern.
Muss nicht getestet werden, da SF in default schon sehr stark im Endspiel ist.
Da reichen ein paar Stellungen aus um zu sehen wie sich dieser Parameter auswirkt.
Gruß
Frank