Ich habe genau das mal testweise mit einem aktuellen Sergio Netz und depth 12 probiert.
Mit dem Ergebnis das das entstandene Netz jedesmal ca. 100 Elo Punkte schwächer als das Original war.
Wahrscheinlich habe ich irgend etwas falsch gemacht, trainiert wurde nur auf die Stellungsbewertung, nicht das Ergebnis, d.h. lambda = 1
Für eta habe ich 0.2, 0.05 und 0.01 ausprobiert, vielleicht waren diese Werte noch zu hoch (?)