Benno Hartwig schrieb:
Benno
(der gar nicht schlecht findet, das Finale bei kürzeren Zeiten zu sehen, vielleicht eine Ahnung davon zu gewinnen, ob sich da für die eine oder andere Engine eine deutlichere Überlegenheit zeigt. 10.5 zu 7.5 führt da im Moment Lc0)
PS:
Ich würde mir nur wünschen wollen, dass die Ergebnisse auch dieser Extra-Events irgendwo präsentiert werden (oder geschieht das irgendwo?).
Da hakt's gerade wieder beim Download, man bekommt nur das vorige Event statt dem Laufenden.
LC0 jetzt schon 3 Punkte bei 22 gespielten Partien voran, was ich an der laufenden Partie und den Farben der Züge am Anfang sehe (da waren die Buchzüge immer andersfärbig bisher) schaut's nach buchlos aus.
Da wäre natürlich die Frage nach den Dubletten der ersten paar Züge schon wieder besonders interessant.
Aber genau genommen ist buchlos sowieso das einzig wirklich Faire, was die Eröffnung angeht, und das einzige, was wirklich so etwas wie "overall playing strength" abbildet, mal davon abgesehen, dass die Eröffnungsstärke halt im Vergleich zur Endspielstärke 3x so stark ins Ergebnis eingeht.
Aber so ist das mit Eng-Eng eben, so lange das die einzige Testmethode bleibt, würde ich jetzt mal die Frage abhaken, ob LC0 oder SF da stärker ist. Buchlos als Basis jeder derartigen Entwicklungskontrolle ist, sage ich mal wieder so, zugunsten von NN gegen A-B gelaufen. Alles andere ist eine Frage der Bücher und vorgegebenen Teststellungen. Und natürlich könnte man jetzt dann erst recht daran gehen, A-B durch NN zu unterstützen im game playing, da würde ich einen echten LeelaFish (also mit SF als Master und Leela als Slave) zum Unterschied zu dem, was jetzt so bezeichnet wird, aber eigentlich FishLeela ist, vorziehen.
In der Analyse ist das alles sowieso wieder ganz etwas anderes, da kommt's ja viel mehr aufs Hashlernen an, aber die Analysestärke interessiert ja kaum jemanden im Vergleich zur "Spielstärke".
Die Frage nach der Entwicklungskontrolle von NN- Engines untereinander ist eine andere, weil man da beim buchlos Testen erst recht die Unterschiede wird schwer als "overall" verkaufen können, wenn anhand der Dubletten dann doch wieder offenkundig würde werden, dass das dominierende Netz einfach die besseren Eröffnungen öfter wählt.
Um die Dubletten im weitesten Sinn (wären ja eigentlich nur welche im wörtlichen, wenn die ganzen Partien gleich wären) darf man sich halt nicht kümmern, wenn's nur um Elo geht, hat Deep Mind bei seinen ersten Versuchen gegen SF ja auch nicht getan. Und im zweiten dann erst recht auf recht raffiniert ausgeklügelte Weise, was die Eröffnungen angeht.
Irgendwie kommt es mir allerdings schon wieder ein bisschen mehr so vor, als wäre die Sache mit der Computerschach- Testerei in den letzten 10 Jahren zu einem täglich grüßenden Murmeltier geworden.
Murmle ich mal wieder so vor mich hin, Murmel, Murmel...