Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / LS-Rangliste: PanChess 00.240
- - By Stefan Pohl Date 2012-12-16 15:43
Hallo,

Eine sehr frühe Version von PeterPans eigener Engine (ein Ivanhoe-Mod).

http://ls-ratinglist.beepworld.de/

P.S: Den Test von Ivanhoe B50kB habe ich nach 2500 Partien abgebrochen, weil diese Version über 20 Elo schwächer war, als die gelistete 50kQ (steht unter "aborted")

Grüße an alle - Stefan
Parent - - By Joe Boden Date 2012-12-16 16:30
Es gibt ja bereits eine neuere Version, die ich aber nicht empfehle, da sie deutlich schächer spielt nach meinen Erfahrungen. Also neu ist nicht immer besser.
Parent - By Joe Boden Date 2012-12-16 17:00
Kommando zurück. Hatte die 00.220 im Test. Die 00.230 war bei mir schwächer.
Parent - By Thomas Mayer (Quark) Date 2012-12-16 17:21
[quote="Stefan Pohl"]
Eine sehr frühe Version von PeterPans eigener Engine (ein Ivanhoe-Mod).
[/quote]

Das widerspricht sich doch irgendwie ?! Mod != eigene Engine ?!
Parent - By Joe Boden Date 2012-12-16 18:37
Nicht schlecht, Herr Specht! -23 Elo auf Houdini 3....in einem kurzen Schnelltest

Engine Match

PanChess 00.240 x64 - Houdini 3 Pro x64    14.0  -  16.0    (30: +8, =12, -10)    46.67%    Perf = -23 Elo

( 46.6% TP = -23 Elo 68%->[-85,+20] 95%->[-152,+64] 99.7%->[-233,+111] )

30 games played
Parent - - By Michael Scheidl Date 2012-12-17 03:13
Die Liste glänzt durch enorme Partienzahlen, ausgefeilte kompetente Konditionen sowie durch Offenheit für jedwede Derivate... da meckere ich ungern. Doch von 22 gelisteten Engines sind anscheinend mindestens 16 mehr oder weniger ähnlich bzw. eng verwandt. Wär da nicht eine Auffrischung mit "originären" Engines von Nutzen, etwa solche wie sie bei IPON in den Top-20 stehen? Sowohl kommerzielle Klassiker als auch einige sehr gute Freeware-Engines kämen in Betracht.

Vielleicht würden solche Engines nicht zuletzt zu einer Art Schärfung der Ratings im absoluten Topbereich beitragen, auch wenn sie selber m.o.w. schwächer sind. Oder es ergeben sich interessante Verschiebungen.

Als Konsument und Unbeteiligter habe ich natürlich leicht reden; daß der Aufwand beträchtlich ist, ist klar. Aber ich dachte, vielleicht ist das eine erwähnenswerte Überlegung... Der Attraktivität der LS-Liste würde es bestimmt nicht schaden.
Parent - - By Stefan Pohl Date 2012-12-17 06:45
[quote="Michael Scheidl"]
Die Liste glänzt durch enorme Partienzahlen, ausgefeilte kompetente Konditionen sowie durch Offenheit für jedwede Derivate... da meckere ich ungern. Doch von 22 gelisteten Engines sind anscheinend mindestens 16 mehr oder weniger ähnlich bzw. eng verwandt. Wär da nicht eine Auffrischung mit "originären" Engines von Nutzen, etwa solche wie sie bei IPON in den Top-20 stehen? Sowohl kommerzielle Klassiker als auch einige sehr gute Freeware-Engines kämen in Betracht.

Vielleicht würden solche Engines nicht zuletzt zu einer Art Schärfung der Ratings im absoluten Topbereich beitragen, auch wenn sie selber m.o.w. schwächer sind. Oder es ergeben sich interessante Verschiebungen.

Als Konsument und Unbeteiligter habe ich natürlich leicht reden; daß der Aufwand beträchtlich ist, ist klar. Aber ich dachte, vielleicht ist das eine erwähnenswerte Überlegung... Der Attraktivität der LS-Liste würde es bestimmt nicht schaden.
[/quote]

Hi Michael,

das Problem ist, daß (siehe IPON) eben nach Stockfish/Rybka z.Zt. eine riesige Lücke von über 110 Elo klafft. Da ich auch aussagefähige Einzelvergleiche haben will (was eben keine andere Rangliste bietet), bin ich gezwungen pro Einzelvergleich 1000 Partien zu absolvieren. Daher werden alle Engines (egal wie gut oder schlecht) immer nur gegen die 11 Engines des Top10-tournaments getestet (sonst viel zu hoher Aufwand) - selbst das dauert schon 5 Tage. Würde ich jetzt also schwache Engines reinnehmen (Chiron und darunter), hätte ich
a) verzerrte Ergebnisse, weil die Gegner des Top10-tournaments für diese Engines zu stark sind. Warum das verzerrt, hatte ich schon mehrfach ausgeführt, das kann man anderswo nachlesen.
b) würden diese Engines sowieso nicht zu Testgegnern anderer Engines, da sie es nicht in die Top10 schaffen würden. Also wäre das auch kein "frisches Blut" für andere Tests.

Darüberhinaus finde ich den z.Zt. laufenden "Wettbewerb" des besten Ippo-derivats (bzw. den Kampf um Platz 2, denn Houdini ist wohl in absehbarer Zeit uneinholbar) durchaus interessant... Es sind eben neue Zeiten im Computerschach angebrochen: Früher machte jeder Programmierer alles selbst und maß sich mit den anderen, heute hat man eine evolutionäre Weiter- und Auseinanderentwicklung von einer gemeinsamen, starken Basis (Ippolit 2009 - daher auch immer in meinem Top10-tournament gesetzt). Diese neue Sachlage ist doch durchaus auch interessant, finde ich. Leider hat sich diese neue Situation noch nicht bis in alle Köpfe "herumgesprochen" (was dann ja auch die ganzen (Teil-)Boykotts zur Folge hat). Aber das ist nun wirklich nicht mein Problem. Ich nehme die Situation so an, wie sie ist, anstatt sie durch starres Festhalten an gewohnten Denkschemata zu ignorieren und/oder zu bejammern und zu verdammen. Das hatte wir doch alles schon mal: Brettcomputer -> PC. Fand ich damals lächerlich, finde ich heute wieder lächerlich.

Gruß - Stefan

P.S: Da die neue Stockfish-Entwicklungsversion 121210 nicht besser ist, als 2.3.1 (eher schlechter), breche ich den Test ab und starte nun Critter 1.4a (ist zwar älter, aber man hat mich mehrfach danach gefragt und in der IPON ist Critter 1.4a ja sogar etwas besser als 1.6a (+7 Elo). Mal sehen, ob das auch einem statistisch wirklich sicheren Test über 10000 Partien standhält...)
Parent - By Michael Scheidl Date 2012-12-17 07:02
Danke für die Ausführungen... das von wegen Verzerrung müßte ich nochmal nachlesen; ist mir momentan nicht so bewußt. Eine Remisquote welche die schwächeren Engines zu stark erscheinen läßt, sollte doch bei dieser extrem kurzen Bedenkzeit kein Problem sein? Aber vermutlich meinst Du etwas anderes. Einwand (b) ist relativ einleuchtend, obwohl, zumindest auf die Ratings der 10 oder 11 Top-Engines hätten die schwächeren ja doch Einfluß wenn ich das Konzept richtig verstehe.

Aber egal, wichtig ist man erkennt eine durchschaubare Methodik, und hierbei findet der Fan ja zum Glück eine gute Vielfalt diverser Testkonfigurationen vor.

P.S. Wegen Critter 1.6a/1.4a: Das könnte zum Teil an einem Endspielbug liegen, den Critter 1.6a in manchen Bauernedspielen hat, siehe hierzu http://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=54608  Version 1.4 (32 Bit ohne a) hat im betr. Beispiel aber auch Probleme. Vielleicht ist 1.4a darin besser? Ich hoffe auf ein baldiges Update 1.6b oder höher, sehe aber keine konkreten Anzeichen.
Up Topic Hauptforen / CSS-Forum / LS-Rangliste: PanChess 00.240

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill