Moin Thomas,
[quote="Thomas Mayer (Quark)"]
Du hast vollkommen recht, eine Auswertung der Antwortzeit macht keinerlei Sinn. Die meisten Engines ziehen z.B. sofort wenn nur ein legaler Zug zur Verfügung steht, daß muß sicher kein ponderhit sein. Auch Easy-Move ist weit verbreitet und geht oft in 0s. Bei Zeitknappheit wird auch oft in Bruchteilen von Sekunden gezogen. Buchzüge sind ebenfalls nicht zu erkennen.
[/quote]
Das stimmt nur teilweise:
1. Legaler Zug: ja, die meisten Engines ziehen sofort, mit genug Spielen sollte sich das statistisch aber ausgleichen
2. Easy Move: ist ein Problem, kommt aber auch nicht zu oft vor und könnte man teilweise sogar an "Erste Engine zieht, 0s, 0s" erkennen ...
3. Zeitknappheit: Das größte Problem! Eine Datenbank die Spiele in X-Zügen in Y-Minuten enthält ist davon sicherlich besonder betroffen, sehr gutgeht es hingegen bei meinen Incrementspielen. Ich habe dadurch selbst in Endspielen praktisch keine Sofortzüge.
4. Buchzüge: Das hängt von der PGN ab. Bei der Classic sieht das z.B so aus "10. O-O Nf8 11. Rac1 {+0.30/16 15s} Ng6 {+0.28/18 16s (h6)}". Der 10 Zug ist ein Buchzug, der 11. errechnet. Buchzüge haben gar keine Zeit ...
5. Von dir nicht erwähnt: Tbs Züge: Auch da hängt es von der Datenbank ab. Da ich mit "Ettiquette" spiele, habe ich deutlich weniger Spiele die bis zum Matt gehen.
Aber ja,
ein solches Tool wäre nicht perfekt - aber immerhin das beste was wir in dieser Richtung hätten!
[quote="Thomas Mayer (Quark)"]
Eine Auswertung kann also nur erfolgen, wenn der ursprünglich geponderte Zug in irgendeiner Art und Weise aus dem PGN ersichtlich ist. Arena kann m.W. z.B. die Hauptvariante ins PGN aufnehmen, CB speichert glaube ich je nach Einstellung den geponderten Zug wenn der dann gewählte davon abweicht.
[/quote]
Ja, wenn man einen "Nichtpondertreffer" anzeigt ist das mit Sicherheit die beste Lösung!
[quote="Thomas Mayer (Quark)"]
Ponderraten um 60% sind bei ähnlich starken Programmen sagen wir mal im Bereich ab 2500 Elo aufwärts ganz normal,
[/quote]
Mein Bauchgefühl für die Riege um "Deep Fritz 12, Critter 0.70, Kommodo 1.2, Shredder 12, Naum 4.2" geht von weniger als 60% aus und die Spielen alle in einer Liga! Aber genau deswegen finde ich eine ordentliche Auswertung ja interessant. Mal sehen was raus kommt.
[quote="Thomas Mayer (Quark)"]
...
Spielt die gleiche Engine gegen sich selbst sind Ponderhitraten um 85% zu erwarten. Bob Hyatt legt dies in diesem Thread:
http://www.open-chess.org/viewtopic.php?f=5&t=45 dar und erklärt warum das so ist. Er hat zu dem Thema auch größere Testserien erstellt. Ich vermute allerdings, daß bei größeren Tiefen die Prozentrate für einen neuen Zug sinkt, habe dazu allerdings keine Testreihen um dies zu belegen.
[/quote]
Da würde ich nach Bauchgefühl sogar noch höhere Raten als 85% erwarten ... Es gibt nichts langweiligeres als auf Playchess Enginematche zu schauen in denen gleiche Engines gegeneinander antreten! Wenn ich mal da mit Shredder spiele, spiele ich deswegen NIE gegen andere Shredders.
[quote="Thomas Mayer (Quark)"]
P.S.: Eine hohe Ponderhitrate kann ein Indiz für einen Clone sein, ist aber sicher kein hinreichender Beweis. Ingo nannte es mal besonders interessant, wenn man durch andere Parameter eine Persönlichkeit einer Engine schafft die vollkommen anders spielt jedoch ihre Spielstärke erhält. Wäre interessant, was dann mit der Ponderhitrate passiert. Vielleicht sollte man mal Ingo fragen, welche Shredder Persönlichkeiten er für gleichstark und gleichzeitig in ihrer Spielweise für am weitesten entfernt hält. Ausgang vollkommen offen. Hätte man z.B. bei "Shredder" gegen "Shredder" die erwartete Ponderhitrate von ca. 85% und bei "Shredder" gegen "Shredder ganz anders" nur noch 60% aber beidesmal ein ausgeglichenes Resultat, dann wäre quasi belegt, daß schon kleine Bewertungsänderungen es unmöglich machen Clones mithilfe der Ponderhitrate zu enttarnen. (Relativ gesehen an den Möglichkeiten, die man hat, die Bewertung in einer Source zu verändern ohne die Spielstärke stark zu beeinflußen sind die paar Parameter die die meisten Engines zur Personalisierung bieten kleine Änderungen)
[/quote]
Der "Gambit Shredder 12" spielt sicherlich verschieden zu "Normal Shredder 12" - bei praktisch gleicher Spielstärke (+/-10 Elo nach 1000 Spielen gegen andere Gegner). Falls ich so ein Tool hätte würde ich das mal "auswerten".
Gruß
Ingo