[quote="Ingo Bauer"]
Ich halte fest - du Behauptest ohne Zahlen liefern zu können und sogar ohne einen theoretischen Ansatz warum eine Engine besser werden soll.
[/quote]
Rehi, Ingo!
Folgendes Zahlenmaterial möchte ich beisteuern. Ich habe auf jeweils single core eines 4x2.5 GHz Quad mit jeweils 256 Mb hash eine gute Stunde vier engines an der Grundstellung rechnen lassen:
Analysis by Houdini 1.03 w32 4_CPU:
1.d4 d5 2.Sf3 Sc6 3.Dd3 Sf6 4.Sc3 e6 5.a3 Ld6 6.e4 dxe4 7.Sxe4 0-0 8.Sfg5 g6 9.Sxd6 Dxd6
= (0.10) Tiefe: 6/33 00:00:00 44kN
1.Sc3 d5 2.Sf3 d4 3.Se4 Sf6 4.d3 Sc6 5.g3 e6
= (0.10) Tiefe: 6/33 00:00:00 45kN
1.Sc3 d5 2.Sf3 d4 3.Se4 Sf6 4.d3 Sc6 5.g3 e6
= (0.17 !) Tiefe: 7/33 00:00:00 46kN
= (0.10) Tiefe: 7/33 00:00:00 46kN
= (0.17 !) Tiefe: 8/33 00:00:00 49kN
= (0.10) Tiefe: 8/33 00:00:00 50kN
= (0.12) Tiefe: 9/33 00:00:00 53kN
= (0.10) Tiefe: 10/33 00:00:00 60kN
= (0.10) Tiefe: 11/33 00:00:00 68kN
= (0.09) Tiefe: 12/33 00:00:00 92kN
= (0.09) Tiefe: 13/33 00:00:00 178kN
= (0.06) Tiefe: 14/33 00:00:00 427kN
1.d4 d5 2.Sf3 Sc6 3.Sc3 Sf6 4.Lf4 Sh5 5.Ld2 g6 6.e3 Sf6 7.Ld3 a6
= (0.11) Tiefe: 14/33 00:00:00 448kN
= (0.09) Tiefe: 15/33 00:00:00 682kN
= (0.11) Tiefe: 16/34 00:00:01 1205kN
= (0.09) Tiefe: 17/38 00:00:03 3258kN
= (0.13) Tiefe: 18/39 00:00:08 7682kN
= (0.17) Tiefe: 19/39 00:00:21 18049kN
= (0.14) Tiefe: 20/43 00:00:47 40931kN
= (0.16) Tiefe: 21/45 00:01:26 74327kN
= (0.11) Tiefe: 22/47 00:02:42 142mN
= (0.11) Tiefe: 23/59 00:06:05 324mN
= (0.12) Tiefe: 24/62 00:22:36 1234mN
= (0.11) Tiefe: 25/62 00:47:50 2596mN
Analysis by Zappa Mexico II:
1.d4 Sf6 2.e3 d5 3.Sf3 Se4 4.Lb5+ c6
= (0.08) Tiefe: 10 00:00:00 0kN
= (0.21) Tiefe: 11/26 00:00:00 195kN
= (0.21) Tiefe: 11/27 00:00:03 662kN
= (0.18) Tiefe: 12/33 00:00:11 2580kN
= (0.18) Tiefe: 12/38 00:00:19 4321kN
= (0.22) Tiefe: 13/38 00:00:46 10251kN
= (0.22) Tiefe: 13/38 00:00:52 11712kN
= (0.19) Tiefe: 14/38 00:01:18 17724kN
= (0.19) Tiefe: 14/38 00:01:54 25760kN
= (0.22) Tiefe: 15/49 00:03:39 49599kN
= (0.22) Tiefe: 15/49 00:04:11 56758kN
= (0.20) Tiefe: 16/50 00:06:35 89683kN
= (0.20) Tiefe: 16/50 00:11:18 153mN
= (0.20) Tiefe: 17/52 00:18:07 244mN
= (0.20) Tiefe: 17/52 00:21:39 290mN
= (0.11) Tiefe: 18/55 00:56:28 755mN
Zu diesen ersten beiden:
Ich hab der Übersichtlichkeit und der Relevanz halber in Hinblick auf's Ausspielverhalten nur die Zeilen übriggelassen, bei denen sich der erste Zug ändert und die evals. Nun könnte man sagen, na tut sich doch nach kürzester Zeit ohnehin just gar nix mehr, man könnte aber auch folgendes sagen: Bei Houdini ändert sich die Bewertung in den ersten 20 Minuten von 0.10 auf 0.17 und dann in einer Stunde schrittweise zurück auf 0.11. Bei Zappa geht's innerhalb von 4 Minuten von 0.08 auf 0.22, bleibt dann lang oben und geht in der Stunde wieder auf 0.11 zurück. Das das nix ist, kann man eigentlich nicht sagen, es ist im einen Fall Schwankung um 70%, im anderen Fall fast 300% und jeweils zurück in durchaus sehr unterschiedlichen Zeitverläufen.
Dann zum Vergleich noch Stocki, ich war dem schon immer sehr dankbar für seinen Wankelmut.
Analysis by Stockfish 1.8 JA:
1.Sf3 Sf6 2.Sc3 Sc6 3.d4 d5
= (0.12) Tiefe: 6 00:00:00 1kN
+/= (0.32) Tiefe: 7 00:00:00 2kN
= (0.12) Tiefe: 8 00:00:00 4kN
= (0.16) Tiefe: 9 00:00:00 8kN
1.Sc3 Sf6 2.e4 Sc6 3.Sf3 d5 4.exd5 Sxd5 5.d4
= (0.20) Tiefe: 9 00:00:00 15kN
= (0.24) Tiefe: 10 00:00:00 23kN
= (0.24) Tiefe: 11 00:00:00 37kN
= (0.16 --) Tiefe: 12 00:00:00 75kN
1.e4 Sf6
+/= (0.32 !) Tiefe: 12 00:00:00 109kN
+/= (0.40 !) Tiefe: 12 00:00:00 129kN
+/= (0.52) Tiefe: 12 00:00:00 169kN
+/= (0.48) Tiefe: 13 00:00:00 287kN
+/= (0.44) Tiefe: 14 00:00:00 464kN
+/= (0.36 --) Tiefe: 15 00:00:01 955kN
+/= (0.52 !) Tiefe: 15 00:00:01 1107kN
+/= (0.32) Tiefe: 15 00:00:01 1399kN
+/= (0.48 !) Tiefe: 16 00:00:02 1738kN
+/= (0.52) Tiefe: 16 00:00:02 1914kN
+/= (0.48) Tiefe: 17 00:00:03 2567kN
+/= (0.32 --) Tiefe: 18 00:00:04 3239kN
+/= (0.28) Tiefe: 18 00:00:05 4104kN
+/= (0.52 !) Tiefe: 19 00:00:09 7027kN
+/= (0.40) Tiefe: 19 00:00:11 8157kN
= (0.20) Tiefe: 20 00:00:15 11056kN
+/= (0.36) Tiefe: 21 00:00:27 19592kN
+/= (0.32) Tiefe: 22 00:00:34 24368kN
+/= (0.32) Tiefe: 23 00:00:41 29171kN
= (0.24 --) Tiefe: 24 00:00:57 39936kN
+/= (0.40 !) Tiefe: 24 00:01:15 52501kN
= (0.24) Tiefe: 24 00:01:17 53829kN
+/= (0.32 !) Tiefe: 25 00:01:37 68312kN
+/= (0.32) Tiefe: 25 00:01:45 74086kN
= (0.24) Tiefe: 26 00:02:25 101mN
= (0.24) Tiefe: 27 00:03:26 143mN
+/= (0.32 !) Tiefe: 28 00:05:40 237mN
+/= (0.32) Tiefe: 28 00:06:16 262mN
= (0.24 --) Tiefe: 29 00:08:54 371mN
+/= (0.28) Tiefe: 29 00:11:21 472mN
= (0.20 --) Tiefe: 30 00:21:48 906mN
= (0.24) Tiefe: 30 00:26:48 1114mN
+/= (0.32 !) Tiefe: 31 00:32:55 1363mN
= (0.16 --) Tiefe: 31 00:41:06 1690mN
= (0.08 --) Tiefe: 31 01:21:14 3331mN
Von 0.12 auf 0.52 in Sekunden, dann dort oben gute 10 Minuten lang, 500% fast, in ganz sachten Schritten zurück auf 0.08 in eineinhalb Stunden, na suppi.
Über all das darfst du ruhig noch lachen, Ingo, jetzt kommt's aber:
Analysis by Deep Rybka 4 w32:
1.Sc3 Sc6 2.Sf3 Sf6 3.e3 d6 4.Ld3
= (0.17 !) Tiefe: 6 00:00:00 1kN
= (0.18) Tiefe: 6 00:00:00 1kN
= (0.06) Tiefe: 7 00:00:00 2kN
= (0.16) Tiefe: 8 00:00:00 3kN
= (0.16) Tiefe: 9 00:00:00 6kN
= (0.12) Tiefe: 10 00:00:00 15kN
1.e4 Sc6 2.Sc3 Sf6 3.Sf3 d5 4.e5 Se4 5.Lb5 Lf5 6.0-0
= (0.13) Tiefe: 10 00:00:00 32kN
= (0.15) Tiefe: 11 00:00:01 55kN
= (0.16) Tiefe: 12 00:00:03 121kN
= (0.21) Tiefe: 13 00:00:05 194kN
= (0.17) Tiefe: 14 00:00:07 303kN
= (0.19) Tiefe: 15 00:00:27 1038kN
= (0.19) Tiefe: 16 00:00:39 1560kN
= (0.16) Tiefe: 17 00:00:55 2290kN
= (0.20) Tiefe: 18 00:03:00 7541kN
= (0.19) Tiefe: 19 00:04:35 11634kN
= (0.19) Tiefe: 20 00:09:46 25163kN
= (0.16) Tiefe: 21 00:20:51 53623kN
= (0.14) Tiefe: 22 00:43:16 113mN
1.d4 Sf6 2.c4 e6 3.Sc3 d5 4.Sf3 Le7 5.e3 0-0 6.Ld3 dxc4 7.Lxc4 c5 8.0-0 Sc6 9.dxc5 Lxc5 10.a3
= (0.15) Tiefe: 22 01:13:29 190mN
Dass mir das einzige Programm "für den seriösen Schachspieler", diese Freude macht, vergeß ich ihm nie, nach sage und schreibe 5 Viertelstunden ändert er noch seinen ersten Zug der HV, danke Rübi!
Alles andere kannst du bis dahin als irrelevant für einen Partieverlauf mit Turnierbedenkzeiten betrachten, das auch, aber nicht, wenn du entsprechend lange Bedenkzeiten hast.
Die Grundstellung wird von dir hoffentlich nicht als allzu best move- lastig bewertet, dass sie keinen solchen (best move) hätte, will ich damit absolut nicht sagen.
Aber wenn die Programme an ihr über so lange Zeitverläufe ihre Bewertungen so ändern und so natürlich absolut nicht linear, warum soll dann gerade dein Zeitabschnittsfenster von zwar doppelten aber dennoch nur Sekunden pro Zug verschieden langen Bedenkzeiten das einzig relevante sein, das Spielverhalten und die Zugqualität zu beurteilen und warum musst du von so vielen so ähnlichen Stellungen aus so viele Partien spielen, um das herauszufinden?
Weil das, was die engines ausspielen, nur sehr bedingt mit ihren evals zu tun haben mag, dennoch bewirkt das eine das andere, wenn es darum geht, zwischen Zügen zu wählen, die in der eval nah beinander liegen.
Die evals einzelner Stellungen auch im Partieverlauf zu bewerten sollte spätestens dann interessieren, wenn man mit den Partieergebnissen allein nicht zufrieden ist, zum Beurteilen einer engine.
Mag sein, über viele Züge in vielen Partien gleichen sich die Unterschiede der Bewertungsverläufe und ihre Ausspielrelevanz in der Partie wieder aus, mag sein auch nicht.
Meine Zahlen lassen mich annehmen, es wäre sehr viel Zufall notwendig, um sehr viel Kausalität auszugleichen, die mir dagegen spricht.
Deine Zahlen zeigen mir nur, dass in deinem Beobachtungszeitraum mit deinen Ausgangsstellungen die Partieresultate sehr ähnlich werden, dein Maß im rating system ist mir aber einfach ohnehin (mittlerweile) viel zu ungenau, um mir noch wirklich Aussagekraft über das zu haben, was ich unter Spielstärke verstehe und dass sich auch für dieses dein Maßsystem nichts wesentlich mehr mit sehr viel längeren Bedenkzeiten änderte, hast du sowenig bewiesen wie ich widerlegt.
Hingegen kennen wir den Gegenbeweis, dass ab einer gewissen Untergrenze die Bedenkzeit ausgangsrelevante Zeitnot erzeugt, auch bei heutiger soft- hardware- Kombination immer noch, die Bedenkzeiten können nur einfach schon sehr sehr kurz dafür werden.
Ebensolche Zeitnot kannst du außer durch sehr kurze Partiezeiten auch durch sehr komplexe Ausgangssstellungen erzeugen, warum nicht, dann vergrößerst du einfach wieder das Zeit- Leistungsfenster für das rating, magst du nicht machen, musst du auch nicht. Es wäre aber ein weiterer Weg, kleinere und kleinere Unterschiede im Zeit- Leistungs- Vergleich zwischen den engines genauer darzustellen, auch durch Ausspielen lassen, wenn du das als sichersten Weg gehen musst, um nicht nur Momentaufnahmen an einzelnen Stellungen, sondern auch deren Summationseffekte in Zugserien und Partiefragmenten zu haben. (Solche bleiben es allerdings auch immer, wenn du nicht nur von der Grundstellung aus spielst, Fragmente von ganzen Partien nämlich.)
Drum sag ich schon lang: Stellungstests mit was für Stellungen auch immer (am besten möglichst viele möglichst gut für die jeweilige konkrete Fragestellung ausgesucht) sind unerlässlich als genaueres Meßinstrument um engine- Leistungen zu beurteilen, sie sind nur viel schwerer in ein so ungenaues Maßsystem wie das des 100-engine-ratings einzuordnen und daher wirf mir nicht wieder ungerechtfertigt vor, ich würde Stellungstests gegen engine- engine- aufwiegen, das eine hat mit dem anderen nur bedingt zu tun, es verfolgt verschiedene Zwecke und hat jeweils für sich allein Berechtigung.
Dass du um die humane Bewertung deiner Teststelllungen für das eine und das andere nicht herum kommst, wiederhole ich jetzt zum letzten Mal, wir wissen es ohnehin beide gleichermaßen lang und gut genug. Du machst nur andere Folgerungen daraus als ich und suchst dir deine Teststellungen dahingehend aus, dass sie dir möglichst wenig deine Ergebnisse der Ranglistenmatches beeinflussen, du tust gut daran, ein weiteres unnötiges Mal Respekt dafür und danke für deine exakte Arbeit mit den Ranglisten.
Ich habe andere Fragestellungen an Zeit- Leistungsverhältnisse zwischen engines und erlaube mir daher die Zusammenhänge zwischen den verschiedenen Stellungen und Stellungstypen und den verschiedenen Zeitanforderungen in der Beurteilung der Stellungen durch engines und in der Beurteilung von engines anhand der Stellungen.
Ich hoffe dir damit auch ein für allemal klar gemacht zu haben, dass ich dich nicht in deiner Arbeit belehren will, aber auch meinerseits keinen Wert auf solches durch dich lege, wenn es darüber hinaus geht, mir von dir sagen zu lassen, welche engine, die du testest, wieviel Elo über der anderen liegt, das lass ich mir jederzeit gern durch deine Listen sagen, danke dir neuerlich auch für dieses dein jüngstes Experiment, wenn du mir dafür gönnst, weitere Schlußfolgerungen daraus für mich zu ziehen, als es dich auch nur im Mindesten interessierten könnte.