Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Die Märchenstunde diverser Listenbetreiber
- - By Frank Quisinsky Date 2011-04-30 12:04
Hallo zusammen,

bin gerade darum gebeten worden meinen News-Ticker Eintrag 188 in das CSS Forum zu stellen.
Da ist wohl einer neugierig auf vielleicht mögliche Diskussionen

OK, gemacht!
So genug Schach für heute!

Wünsche allen ein schönes WE und leckeres Grillfleisch!

Viele Grüße
Frank


188. Die Märchenstunde diverser Listenbetreiber
Trier, 30.04.2011

Zum Thema der letzten 20 Jahre Computerschach im Einzelnen ...

Jeder Listenbetreiber erzählt in den Foren so seine Märchen, und natürlich glaubt jeder ganz fest an die selbst ermittelten Resultate. Ob nun 20 oder 10.000 Partien gespielt wurden, was so auf dem heimischen PC abläuft ist Gesetz. Gerade das Gesetzgebungsverfahren fällt daher so stark unterschiedlich aus, dass im Grunde jeder seine eigenen Paragraphen - kurzer Hand - meist in Absprache mit Frau oder Freundin, sich ins eigene Hirn prägt bzw. andere teilhaben lassen möchte. Hierbei werden mithin also immer wieder Versuche unternommen, die Hirne anderer (Klein- oder Großhirn, egal) dabei zu beeinflussen.

Auch von mir wird oft an ermittelten Resultaten rumgerätselt. Schließlich macht es ja Sinn nachzuvollziehen zu wollen oder auch zu versuchen Rückschlüsse aus gewonnenen Resultaten zu erzielen. Und dabei geht es nicht immer mit reiner Logik zu, denn reine Logik steht oft im Widerspruch zum Erklärungszwang merkwürdig anmutender Ergebnisse. Wenn es denn gar nicht anders geht kommen Kommentare wie ... ja aber vor 100 Jahren hat Prof. xyz oder ein sonst berühmter Mensch der Zeitgeschichte mal festgestellt. Wenn wir aber immer noch auf diese Personen rum reiten würden, hätten wir heute keinen Computer zur Hand, denn die Entwicklung wäre stehen geblieben.

Aber, was fest steht ...
Die Usergemeinde ist wahnsinnig heiß auf die Märchenstunden der Listenbetreiber und genau das wissen die Listenbetreiber natürlich auch. Der gemeine User zieht sich also Infos der Listenbetreiber und kombiniert mit vorhandenen Infos (so soll es sein). Ganz egal was dabei herauskommt, wichtig ist doch nur das es Spaß macht !!

Zu dem Eintrag 171 erreichen mich derzeit die meisten Anfragen. Meine Besucher beschäftigen sich verstärkt auch immer mehr mit der Frage, wie viele Partien sind nun eigentlich notwendig für die Ermittlung von einem vernünftigen Rating. Die Beantwortung dieser Frage steht in Abhängigkeit zum eigenem Anspruch. Und da auch Ansprüche stark unterschiedlich ausfallen, wird die Beantwortung dieser Frage immer fraglich sein, sofern eine zweite Person ins Spiel kommt. Es gibt des weiteren so viele Beeinflussungsfaktoren bei der Ermittlung von Ratings, dass hier und dort aufgrund dessen, auch oft zwischen den Listen Abweichungen ersichtlich werden. Diese Abweichungen fallen aufgrund heutiger hardware-technischen Möglichkeiten aber immer geringer aus. Haben sich die Listenbetreiber noch einst, vor 10 Jahren, um 100 ELO Abweichung gestritten, so sind es heute im maximalen Fall vielleicht 20-30 ELO. Sind es mehr als 30 ELO beginnen regelrechte Kleinkriege, so ganz nach dem Motto "Wer wird wohl den Längsten haben". Dabei stellte doch die künstliche Intelligenz fest und wir als Sklaven (die Listenbetreiber) teilen doch lediglich nur mit. Ja, gerade die Herren der Schöpfung verhalten sich oftmals wie Stiere, möchten die Herde anführen. Das Problem im Internet oder unter den Computerschächlern ist nur ... so viele Herden gibt es gar nicht. Letztendlich müssen wir also mit unseren Erkenntnisse mit und in uns selbst hausieren gehen.

Ein Blick nach oben beantwortet eine der möglichen täglich auftretenden Fragen?
Wie geil, auf dem iPhone wird das Wetter so schön dargestellt. Ich will auch ein iPhone. Tausende von möglichen Infos wird uns IT immer mehr und immer verstärkter zur Verfügung stellen und wir wollen haben, wollen hüpfen! Dabei rufen wir einen so verschwindend geringen Teil an Infos wirklich ab. Die meisten dieser Infos benötigen wir nicht wirklich. Sind Kunigunde, Waldburga und Willibald im Mittelalter auch mit einem iPhone durch die Gegend geritten oder dachten sich unsere Artgenossen eher, schauen wir doch einfach mal nach oben in den Himmel. Der Landwirt weiß, wann es ein Gewitter gibt und wird deswegen nicht direkt nervös zum Händler laufen, in Panik geraten, um ein iPhone zu kaufen.

Und der Beobachter der SWCR kennt die Ratings der Computerschach Engines ohne nervös werden zu müssen. Insofern, kauft Euch ein iPhone damit Ihr auch rund um die Uhr die Ergebnisse der SWCR verfolgen könnt ... Quatsch!

Und in 10 weiteren Jahren streiten wir dann buchstäblich um einen ELO Differenz, bei Engine Ergebnissen, der unterschiedlichsten Ratinglisten. Dabei können wir wahrscheinlich selbst, beim Beobachten von Engine-Engine Matchen, noch nicht mal 200 ELO Differenz zwischen den Engines ausmachen. Ja wenn uns die Ratinglisten hierbei nicht helfen würden, würden wir beim Thema Computerschach wahrscheinlich nur noch große ? sehen. Wichtig ist aber dennoch zu fachsimplen, denn der Mensch weiß trotzdem alles besser auch wenn die Computerschachprogramme uns um Welten überlegen sind.

Der Mensch!
Möchte zugeballert werden mit Informationen, die er so niemals wahrnehmen kann. Ja warum werden die Infos denn überhaupt benötigt, wenn wir das selbst gar nicht so richtig wahrnehmen können? Eine ganz interessante Frage auch im Hinblick dessen, dass nur sehr wenige Menschen auf dieser Erde die Spielstärke von SWCR Engine 30 überhaupt noch erreichen können. Sehr wenige, sehr sehr wenige, ja noch viel weniger als sehr sehr wenige ... schreibt der Amateur-Statistiker jetzt gerade daher.

Zurück zum Aufhänger:
Prof. Dr. Robert Hyatt predigt, dass für die genaue Ermittlung eines Ratings ca. 10.000 Partien notwendig sind. Bob hat offenbar einen sehr hohen Anspruch und will es ganz genau wissen und zwar auf 2-3 Punkte genau, wobei sämtliche Fehlertoleranzen auszuschließen sein sollten. Der Ultra gemeine Anwender X spielt 20 Partien IvanHoe A - IvanHoe B und ist sich sicher, IvanHoe B ist klar stärker und hat eine ELO von X Punkten. Hand aufs Herz, beide haben Recht, der Ultra-Gemeini und Bob. Und daher hat auch jeder Listenbetreiber Recht, denn das was ein Listenbetreiber ermittelt ist zunächst mal Gesetzt da selbst ermittelt. So ganz nach dem Motto ... schaut her ... meine Arbeit steht für die wahrscheinliche Realität und Schei... auf die Beeinflussungsfaktoren.

Wichtig bei der SWCR ist daher, meine Besucher zu informieren, wie denn der von mir begründete Anspruch bei der Ermittlung von Ratings ausschaut! OK, hier und da neige ich ja auch zur Märchenstunde aber ich denke das ist ganz normal wenn ein solches Thema so umfangreich behandelt wird.

Mein Anspruch ist es, ein Rating zu ermitteln, welches im maximalen Fall aller möglichen Fälle nicht um mehr als 20 ELO vom tatsächlich ermittelten Resultat abweicht. Leider war ich bei den bisher getesteten Versionen 3x knapp über diesen eigenen Anspruch. 2x haben sich wahrscheinlich die Resultate mit mehr Partien, eher mit mehr eingesetzten Gegnern korrigiert. In einem Fall bin ich mir noch nicht sicher (eine der 32bit Naum Engines in meiner Liste, mehr Partien werden bei Zeitbedarf folgen).

Was ich glaube festgestellt zu haben ist folgendes:

Ein Rating wird mit mehr Gegnern schneller aussagekräftiger und nicht zwingend _nur_ mit mehr Partien.

Die Aussage:
Mit mehr Partien wird ein Rating besser ist zwar richtig aber heit _nur_ eine von vielen möglichen Aussagen zu der Ermittlung dieses Ratings. Gleichberechtigt müssten wir darunter setzen dass ein Rating auch mit mehr Gegnern aussagekräftiger wird und noch so viele andere Beeinflussungsfaktoren aufzählen. Aber, wir zählen zunächst mal nur herausgepickte Stärken auf, vernachlässigen nur zu gerne die Schwächen.

Beispiel:
Wir erstellen eine Ratingliste mit nur 2 Engines, lassen diese Engines nun 5.000x gegeneinander spielen. Mit sehr komplizierten statistischen Auswertungen komme ich zu dem Ergebnis, dass dieses Rating um ca. 142 ELO vom tatsächlichen Ergebnis abweichen wird, sofern wir dieses Rating zu einer Liste gegenüberstellen, bei dem diese beiden Engines anstatt nur einen Gegner dann 25 Gegner gehabt hätten, aber nach wie vor je 5.000 Partien gespielt haben. Um meinen Anspruch gerecht zu werden benötige ich bei 1.000 Partie pro Engine zwischen 25-27 Gegner. Werden es mehr Gegner wird das Rating kaum noch genauer. Werden es weniger Gegner wird das Rating logischerweise immer ungenauer. Die Schwelle liegt also bei 25-27 Gegnern. Und genau das war das wesentliche Ziel der SWCR, denn diese Statistiken fertige ich vor ca. einem Jahr mit recht simplen Mitteln an.

Wer sich für dieses Thema interessiert kann z. B. einfach die SWCR Datenbank nehmen und 100x die gleichen fast 100.000 Partien in eine Datenbank zusammenkopieren. Also mit Pseudo Ergebnisse arbeiten, um sich über Statisik-Verlaufs-Kurven einen Überblick zu verschaffen.

Eintrag 171 regt nun offenbar einige User an, die Märchenstunde von diversen Ratinglisten Betreibern, hinsichtlich wie viele Partien notwendig sind, zu überprüfen. Aber bitte denkt immer daran, der eigene Anspruch ist ganz maßgeblich bei diesen Betrachtungsweisen.

Leute, leuten wir mit diesem Eintrag das wohlverdiente Wochenende ein. Es gibt auch noch andere Klamotten im täglichen Leben als Ratings von Computerschach Engines. Muss mir jetzt mal den iPhone ansehen ... der Mensch!
Parent - By Frank Quisinsky Date 2011-04-30 12:29
Und schaut ab und an mal bei meinem winzigen SWCR-64 Update-Turnier rein ...
Läuft bald aus ...

http://www.amateurschach.de/ftptrigger/swcr-64.html

Diese Turniere gehen immer soooo schnell zu Ende, so schnell kann ich gar nicht schreiben.

Gell Kurt, können ja nur Blitz-Turniere sein
Zur Erinnerung: Eine Partie dauert durchschnittlich 40 Minuten bei Ponder = On!

Gruß
Frank
Parent - - By Kurt Utzinger Date 2011-04-30 13:09
... jetzt ist auch der liebe Frank unter die Romanschreiber gegangen

Kurt
Parent - By Frank Quisinsky Date 2011-04-30 15:58
Hallo Kurt,

oh ja, Romane habe ich auch schon geschrieben, zumindest einen mal.
Den Text musste ich aber noch ein wenig modifizieren, setze ich aber nicht erneut ins Forum.

Wer denn unbedingt den Text nochmals lesen möchte (HILFE), kann das dann auf meiner Webseite frohen Mutes in Angriff nehmen.

Viele Grüße in die gerechte Schweiz!
Frank
Up Topic Hauptforen / CSS-Forum / Die Märchenstunde diverser Listenbetreiber

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill