Hi Thomas,
natürlich mache ich Fehler!
--
Stefan spielt mit Aufgabefaktor!
Ich habe mit und ohne lange nicht mehr verglichen.
Generell macht das durchschnittlich 15 Züge aus, zumindest ca. ab dem Zeitpunkt als Engines ca. ein Level von 2800 Elo erreichten (danach nicht mehr verglichen).
--
Ja, Stefan hat mehr Partien und mithin eine bessere Datenlage.
Das ist absolut klar, verwende ja ca. das 20fache an Zeit und vermutlich den deutlich schnelleren PC, teste nur auf einem PC. Ich bin aber auch der Meinung das Tendenzen erkennbar sein sollten und völlig ausreichend sind. Es muss nicht alles bis zu der maximalen Grenze ausgetestet werden, weil das keinen Sinn macht. Wenige Engine Updates verändern, Bedingungen verändern und mithin macht die Extrem-Testerei kaum einen Sinn. Es sei denn man stellt sinnvolles mit den Daten fest. Genau das macht Stefan ja und hat sich hierzu auch einiges einfallen lassen.
--
Prof. Hyatt ...
Nein, musst Du mir nicht erzählen.
Seine Meinung war allerdings sehr klar und eindeutig.
Hinsichtlich der Protokoll-Unterschiede war seine Meinung teils gar eindeutig nachvollziehbar. Und nach meinen ganzen Informationen ist tatsächlich das Winboard Protokoll das eigentlich bessere Protokoll.
Sei heute dahingestellt, welches das bessere Protokoll ist. Ich denke für alle Beteiligten ist sicher UCI das einfachere und das ist gut so, Winboard war leider zu kryptisch.
--
Dass die GUI nicht beeinflussen sollte, wirklich rein gar nichts, hat sich meines Erachtens aus unterschiedlichen Gründen geformt, die auch alle nachvollziehbar sind.
z. B. für Martin Blume maßgeblich deswegen, weil wenn die GUI beeinflusst laufen mehr Prozesse im Hintergrund die RAM kosten und unnötig sind.
Auch hatte er keine Lust auf unnötige Diskussionen mit Engine-Programmierern.
Wir hatten auch in Arena Möglichkeiten drin Partien abzubrechen. Teils ungern implementiert wenn ich die Diskussionen noch alle richtig im Kopf habe.
Von Shredder 12 auf Shredder 13 kam da auch etwas bei den Remispartien hinzu.
Grundsätzlich war es früher so, dass Nalimov kam.
Die Umsetzung war zeitaufwendig und eine Fleißarbeit für die Programmierer.
Daraus entstanden dann meist typische Probleme beim Zeitmanagement, beim Pondern und nicht zuletzt auch mit den Endspieldatenbanken selbst.
Sicherlich die Hauptgründe warum so viele Programmierer auch nicht wollten das Partien mittendrin abgebrochen werden. Es gab gar Herren die dann gar böse worden. Wenn etwas abgebrochen wird, entscheidet das immer noch meine Engine. Klar, die Engine kann 3fache forcieren. Was um sich schlägt ist, das Engines 50-Züge Regel vermeiden, wenn denn ein Bauernzug möglich ist.
Fakt ist, dass die meisten Personen, die Partien nachspielen, den Weg zum Sieg auch komplett sehen möchten.
Und heute noch verstecken sich viele Fehler, die zum Ende der Partie auch erst auffällig werden, dass ist heute nicht groß anders als früher.
--
Seeschlangen

Den Begriff habe ich auch noch nie gehört.
Grundsätzlich gibt es immer lange Partien bei Resign = off.
Aber ich kann schauen in welche Statistik auch immer.
Der Züge Durchschnitt liegt bei vielen Engines in einem Turnier bei 86-88 Zügen sehr konstant und das schon seit vielen Jahren, ca. seit die Engines ein Niveau von 2800 Elo erreicht haben.
Wie oben beschrieben kannst Du den drücken mit Resign = on auf ca. 15 Züge weniger.
Cutechess hat ein paar Optionen drin, um diesen vielleicht noch weiter zu drücken (bei den Remis Partien). Dazu hast Du am Ende von Deinem Beitrag selbst etwas geschrieben.
Wenn jetzt aber direkt 14 Engines der TOP-44 einen Züge Durchschnitt von 107 erreichen (picke ich die alle in ein Turnier) stellt sich die Frage warum. Kommt einer mit einer Idee zieht das heute bekanntlich die Schleife.
Entstehen durch:
- Fehler bei der Einschätzung von Endspielen (z. B. bei Booot). Dann will eine Engine kein Remis in klarer Remis Stellung und die Partien enden mit 50-Züge Regel.
- Fehler bei der Mattführung
- Swindle-Mode (scheint um sich zu schlagen).
- versteckter Contempt / nicht funktionierender Contempt
Selbst wenn alle Engines perfekt spielen würden gibt es lange Partien. Und für viele der langen Partien gibt es tatsächlich auch Gründe das die wirklich laufen sollten.
Aber wenn zu viel Unsinniges in den Engines drin ist, um hier und da noch einen Elo rauszuholen, in Zeiten, bei denen fast alle der TOP-50 sich nicht wirklich in Endspielen
beschummeln lassen, macht das heute keinen Sinn mehr. Die Zeit für Contempt Parameter, bei den eine stärkere Engines dann gegen eine schwächere Engines doch
noch Punkte einfahren konnte sind lange vorbei.
Du schreibst es ja selbst ... wie viele der langen Partien enden mit 1:0 oder 0:1.
Sofern ich das richtig überblicke, hat sich bei meinem letzten Turnier eine einzige Engine selten beschummeln lassen.
Das war ein Turnier von 41 der 44 besten verfügbaren Schachprogramme.
Und dafür dann ein so deutlich höheren Zügedurchschnitt?
Man sollte mal an Stromverbrauch für absolut unnützes denken.
Dieses Verhalten entsteht ja auch bei Partien mit Aufgabefaktor, auch hier geht der Zügedurchschnitt hoch.
Nur ist das nicht so krass zu sehen wie in Partien ohne Aufgabefaktor.
--
Was ich nicht verstehe ...
Es legen viele Wert auf genau Ergebnisse, brechen aber Partien ab.
Was bringt Dir eine genaue ErrorBar wenn dadurch die Ergebnisse wieder ungenau werden.
Schon allein, wenn ich an schlechter Läufer Endspiele denke.
Aber sei es drum!
Die Wege des Herrn ...
Was Sinn machen würde, wäre ...
Die Engines spielen die Partien ohne Aufgabefaktor zu Ende.
Hätten wir ein Tool, welches dann Engine Ergebnisse bereinigt wäre das viel effizienter hinsichtlich genauer Ergebnisse, als wenn mutwillig mittendrin abgebrochen wird.
Ich habe dazu einen Vorschlag in TalkChess unterbreitet, denn ein solches "Cleaning-Tool" für PGN-Files gibt es tatsächlich nicht.
Dann könnte man Partien auch viel besser für Stats vorbereiten oder auch für Präsentationen versenden.
Und nochmals zu Deiner Einleitung.
Natürlich mache ich Fehler, aber ich berichte ja immer nur von dokumentierten Daten.
Ich kann etwas feststellen, wenn ich Datenbanken auswerte.
Ob nun jede Auswertung immer sinnvoll ist, sei dahingestellt, aber ich beziehe mich immer auf Datenquellen und keinesfalls auf Wunschdenken.
Bilde mir meine Meinungen also im Computerschach seit eh und je immer aufgrund Fakten anhand ganz normaler Daten. Alles andere wäre auch völliger Quatsch.
Ich wundere mich oft warum das immer gleiche Personen in Frage stellen, die meist selbst noch nie irgendetwas beigetragen haben.
Letztendlich denke ich mir dann ... mein Gott was haben wir für Experten rumflitzen, die vertreiben dann auch noch die letzten Mohikaner.
Viele Grüße und Dir einen guten Rutsch!
Gruß
Frank