Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / automatisierte Spielstärkebestimmung durch Partienanalyse
- - By Benno Hartwig Date 2014-12-11 14:18 Edited 2014-12-11 14:25
Ist eigentlich mal versucht worden, automatisiert die Spielstärke eines Spielers einzuschätzen, indem einige (oder auch recht viele) seiner Partien von einem Programm analysiert werden?

Denkbar wäre ja, dass in jeder Stellung sein Zug und die möglichen anderen Züge bewertet werden.
- War ggf. leicht zu erkennen (wenig Tiefe erforderlich), dass sein Zug ein Fehler war?
- War ggf. eine besondere Rechentiefe erforderlich, um den Zug als machbar zu erkennen?
- Hatte es bessere Züge gegeben, die ggf. sogar leicht oder auch nur schwer zu erkennen waren?
Und mit welcher Häufigkeit treten solche Phänomene auf?
Und wie oft wurde genau der von der Engine bevorzugte Zug gezogen?

Denkbar wäre sowas doch, und das sogar ohne Kenntnis der ELO-Zahl der jeweiligen Gegner.
Zumindest für solche Menschen, denen die Engines sehr deutlich überlegen sind.
Und das sind ja sicher die meisten.

Benno
Parent - - By Thomas P. Date 2014-12-11 17:55
Programme sind dafür zu schwach. Deutliche Überlegenheit reicht nicht, da diese hauptsächlich auf taktischer Stärke fußt. Ein Programm kann demzufolge lediglich die taktische Stärke eines Spielers vernünftig einschätzen. Die eigentliche Spielstärke setzt sich aber zusammen aus taktischen Fähigkeit plus Stellungseinschätzung. Und bei letzterer sind starke Großmeisters den Schachprogrammen nach wie vor überlegen.
Parent - - By GS Date 2014-12-11 19:18
Thomas P. schrieb:

Programme sind dafür zu schwach. Deutliche Überlegenheit reicht nicht, da diese hauptsächlich auf taktischer Stärke fußt. Ein Programm kann demzufolge lediglich die taktische Stärke eines Spielers vernünftig einschätzen. Die eigentliche Spielstärke setzt sich aber zusammen aus taktischen Fähigkeit plus Stellungseinschätzung. Und bei letzterer sind starke Großmeisters den Schachprogrammen nach wie vor überlegen.


Ein Supergrossmeister bis hin zum Weltranglistenersten,
hat nicht mal den Hauch einer Chance gegen ein mittelstarkes
Schachprogramm auf gewöhnlicher Hardware über eine
gewisse Partiendistanz.

Sollten die oben (kursiv) zitierten Sätze stimmen, dann bedeutet
das lediglich, dass das Spiel zu 99.5% eben taktischer Natur ist !
Parent - By Thomas P. Date 2014-12-15 08:22
GS schrieb:


Ein Supergrossmeister bis hin zum Weltranglistenersten,
hat nicht mal den Hauch einer Chance gegen ein mittelstarkes
Schachprogramm auf gewöhnlicher Hardware über eine
gewisse Partiendistanz.

Sie haben eine Chance. Das Dreihirn (starker Mensch + Einsicht in Computervarianten) ist dem Computer alleine immer noch haushoch überlegen ist. Und warum ist das so? Weil ein stark spielender Mensch die Stellungen am Ende des Variantenbaumes viel besser einschätzen kann als der Computer. Wenn du Wettkämpfe verfolgst, dann siehst du zuhauf Twitterkommentare von den Weltbesten (Caruana und Gritschuk machen besonders viele) ala "Traut den hohen Bewertungen der Rechner hier nicht." oder "Die Stellung ist deutlich besser für Weiß, egal was die Computer sagen" und sie haben in der Regel Recht. Ein besonders krasses Beispiel dafür gab es zuletzt in dem Endspiel zwischen Carlsen und Anand, in dem Anand seinen Springer gegeben hat, um Remis zu sichern. Kein Computer hielt das auch nur für ansatzweise gerechtfertigt (zu Unrecht).

Zitat:

Sollten die oben (kursiv) zitierten Sätze stimmen, dann bedeutet
das lediglich, dass das Spiel zu 99.5% eben taktischer Natur ist !

Ja, du hast Recht, das Spiel ist zu einem sehr hohen Anteil taktischer Natur. Aber in einem Spiel zwischen zwei Menschen ist es üblich, dass tieferliegende taktische Finessen von beiden Spielern übersehen werden, weshalb bei Menschen die taktische Stärke einen deutlich kleineren Anteil ausmacht als bei Computern.
Parent - By Benno Hartwig Date 2014-12-11 19:23
Ich denke schon, dass die Programme stark genug sind, eine recht aussagefähige Faktensammlung zu den einzelnen Menschen zu generieren, die eine ganz passende Spielstärkeeinschätzung ermöglich.
Für welche Menschen? Vielleicht für alle unterhalb de mittleren Bundesliaga-Niveaus (aus dem Bauch geschossen).
Es mag sein, dass ich den Super-GMs damit nicht annähernd gerecht werden kann.

Benno
Parent - By Michael Scheidl Date 2014-12-11 20:07
Zitat:
Programme sind dafür zu schwach.

Romantische, aber längst überholte Einschätzung.

Vielleicht gilt sogar: Programme sind dafür zu stark!
Parent - - By Peter Martan Date 2014-12-11 18:17 Edited 2014-12-11 19:10
Und wie willst du das in Elo umrechnen, oder willst du das eh nicht?
Und wären das dann Menschen-Elo oder Celo?
Du könntest natürlich auch anstatt dessen ein engine- Eval-Diffferenzäquivalent einführen.

Und wie willst du die Stärke oder Schwäche des menschlichen Gegners desjenigen, dessen Spielstärke du berechnen willst, einrechnen?
Oder müssten dabei immer beide Gegner eingeschätzt werden und du würdest dann eine engine-Eval-Differenz-Differenz als Spielstärkenmaß einführen?

Entschuldige, mir fehlt offenbar der nötige Ernst für deine nette Idee, ich dachte nur gerade, warum lässt du nicht einfach den Menschen, der wissen will, wie stark er ist, ohne ständig gegen Menschen antreten zu müssen, deren Spielstärke so von ihrer Tagesverfassung abhängig ist, gegen eine engine spielen und rechnest danach dann dein engine-Eval-Differenzäquivalent aus?
Wir könnten dann auch einfach wieder zu der zu Unrecht gleich wieder in Vergessenheit geratenen Idee zurückkehren, es würden nicht nicht nur die ganzen und die halben Punkte zählen, sondern auch die Partielängen, dann müsstest du gar keine komplizierten Zug-um-Zug-Evalvergleiche anstellen.

Edit: doch noch ein Versuch, der Sache ernsthaft näher zu treten:
http://www.talkchess.com/forum/viewtopic.php?topic_view=threads&p=599908&t=54571&sid=d473969a7c11aa98ad11924ee261a8b2
Man kann doch wirklich aus so ziemlich allem eine Wissenschaft machen, wenn man sich nicht einfach damit zufrieden gibt, dass manche Dinge schlicht nichts miteinander zu tun haben, wie z.B. die Schach-Spielstärke von Menschen und die von engines.
Man könnte ja auch z.B. mit einem Auto die Marathon- Distanz abfahren und den Benzinverbrauch mit dem vergleichen, was der Mensch, während er die Strecke läuft, ausschwitzt.
Interessiert aber auch keinen, oder?
Parent - - By Benno Hartwig Date 2014-12-11 19:41

> Und wie willst du das in Elo umrechnen, oder willst du das eh nicht? Und wären das dann Menschen-Elo oder Celo?


Es wäre ein Schätzmechanismus für (menschliche) ELO-Werte.

> Und wie willst du die Stärke oder Schwäche des menschlichen Gegners desjenigen, dessen Spielstärke du berechnen willst, einrechnen?


Ich würde große Mengen bestehender Partien zur Justierung nutzen wollen.
Die Partien werden auf o.a. Kriterien untersucht ("Was wurde an leichtem und Schwierigem übersehen?" "Was wurde toll/wenigstens erkannt?"...), es wird daraus ein rein technischer "Leistungswert" generiert, Anhand der Justierung wird diesen Leistungswerten ein ELO-Wert zugeordnet.
Wenn das erst mal abgeschlossen ist, können ELO-Schätzungen vollautomatisch errechnet werden.

> Und wie willst du die Stärke oder Schwäche des menschlichen Gegners desjenigen, dessen Spielstärke du berechnen willst, einrechnen?


Ganz sicher gar nicht! Das reizt mich ja gerade.
Jede Stellung der Partie ist eine Teststellung. Das Programm errechnet die Chancen, Gefahren, Fallen und generell die Schwierigkeit jeder einzelner dieser Stellungen und beurteilt so viele hundert Mal das tatsächliche Löseverhalten der Menschen in diesen Stellungen. Was der Gegner tut, welche Stärke dieser hat, ist irrelevant.

Benno
Parent - - By Peter Martan Date 2014-12-11 21:08 Edited 2014-12-11 21:55
Benno Hartwig schrieb:

Jede Stellung der Partie ist eine Teststellung. Das Programm errechnet die Chancen, Gefahren, Fallen und generell die Schwierigkeit jeder einzelner dieser Stellungen und beurteilt so viele hundert Mal das tatsächliche Löseverhalten der Menschen in diesen Stellungen. Was der Gegner tut, welche Stärke dieser hat, ist irrelevant.


Du willst die stellungsabhängige Spielstärke von Menschen durch das Austesten der Züge der Menschen gegen Menschen anhand von einzelnen Stellungen, die Menschen gegen Menschen erspielt haben, dadurch bestimmen, dass du die Eval und die Zugsortierung von engines als Maßstab nimmst.
Warum nicht?
Was dabei herauskommt, hängt davon ab, wer gegen wen gespielt hat, (weil dadurch werden die Stellungen bestimmt) welche engine du nimmst, wie lange du sie rechnen lässt und wie sie danach die Alternativzüge gegeneinander quantitativ (zumindest, was die Reihung der Züge angeht) evaluiert.
Mach ruhig, die Werte, die dabei herauskommen, kannst du auch ruhig wieder einmal Elo nennen, weil wenn du Fußballmannschaften einer bestimmten Liga aus ihren Turniererfolgen Elo zuordnest, sind das auch Elo.
Sie haben nur ungefähr gleich viel mit den Elo zu tun, die du da jetzt mit der von dir völlig willkürlich ausgeklügelten Methode misst.

Selbst wenn du viel einfacher die Menschen gegen die engine spielen ließest, und sagen wir, damit ein paar mehr Punkte für die Menschen herausschauten, du zähltest wirklich die Zahl der Züge, die der Mensch gegen die Maschine schafft, positiv bei Remis und Niederlage und negativ bei Gewinn ().
Dagegen, dass diese meine Elo (darf ich das auch mit dieser Formel messen? Und wenn nein, warum nicht?) mit den aus  Mensch gegen Mensch erspielten Elo (bei denen's ja auch drauf ankommt, wer gegen wen überhaupt antreten darf, und die ja somit auch schon kein einheitliches Rating für sich darstellen) einen unmittelbaren direkt proportionalen Zusammenhang hätten, würdest du dich wohl verwahren, dass deine Methode, dass das Spiel Mensch gegen Mensch durch die Maschine beurteilt wird, den gleichen prinzipiellen Meßfehler hätte, das siehst du nicht so?

Und wenn deine Meßtechnik, wie auch immer du sie für deine persönlichen Interessen genau definierst, jedenfalls wieder eine völlig neue, nur dir genau passende Sportart wäre, wieso sollte sie jetzt dann jemanden wie mich, mit zugegeben auch oft krausen Ideen dazu, oder gar einen vergleichsweise konservativen Schachspieler, der schon gesunde Vorbehalte hätte den Elo gegenüber, die ihm verschiedene Schachvereine und -Institutionen als allgemeines Schachspielstärkemaß vorgaukeln wollen, davon überzeugen, dass das mehr mit Schach zu tun hätte, als wenn ich mich in aller Öffentlichkeit zum Eloriesen im Kampf gegen Schwabli mit optimal ausgeklügelter Schwabliunterstützung krönte?
Parent - - By Benno Hartwig Date 2014-12-11 22:51 Edited 2014-12-11 23:02

> anhand von einzelnen Stellungen


Anhand von letztlich einer recht großen Anzahl von Stellungen!

> dass du die Eval und die Zugsortierung von engines als Maßstab nimmst.


Ja, denn ich denke, es hat Aussagekraft, wenn eine gute Engine in einer Stellung den einen Zug mit +0,10 und den anderen mit +2,10 bewertet.
Dass der +2,10-Zug dann tatsächlich doch der schlechtere ist, kommt gar nicht so oft vor!
Und welchen Zug der Mensch wählt, gestattet eine Teileinschätzung.

> wer gegen wen gespielt hat, (weil dadurch werden die Stellungen bestimmt)


ist unwichtig, da die Stellung mit ihren objektiven (und leidlich von der Engine erkannten) Möglichkeiten den Prüfstein darstellt.
Ob ein guter oder ein schwacher Gegner dies herbeiführte, ein Mensch, eine Engine, ein Zufallsgenerator oder ein Stellungskompositereur ist unerheblich.
Die Partien stellen nur den Stellungslieferanten für Positionen, die die Engine hinsichtlich ihrer Möglichkeiten analysiert, über die der Prüfling dann halt ernsthaft nachdachte (je eine Prüfungssituation).

>die Werte, die dabei herauskommen, kannst du auch ruhig wieder einmal Elo nennen


Nö, mache ich nicht, es sind  Schätzwerte für die echten ELO-Werte.
Die Qualität meiner Schätzmethode könnte beurteilt werden, und die Schätzmethode könnte verfeinert werden.

> du zähltest wirklich die Zahl der Züge, die der Mensch gegen die Maschine schafft, positiv bei Remis und Niederlage und negativ bei Gewinn...


Oh, ich befürchte, du hast nicht annähernd verstanden, was ich zu beschreiben versuchte.

> ...den gleichen prinzipiellen Meßfehler hätte, das siehst du nicht so?


Mir geht es überhaupt nicht(!) darum, eine ELO-Bestimmungsmethode zu finden, die besser ist als 'deine'.
Mir geht es darum, eine Methode zu haben, die nach Justierung in der Lage ist, aus gespielten Partien ohne Kenntnis der Gegnerstärke eine leidlich vernünftige Spielstärkeeinschätzung zu liefern.

> wie auch immer du sie für deine persönlichen Interessen genau definierst,


Spieltrieb, Neugierde, Kopfnüsse, Phantasie laufen lassen, Interesse an dem was möglich ist.

Benno
Parent - - By Peter Martan Date 2014-12-12 00:30 Edited 2014-12-12 00:38
Benno Hartwig schrieb:

Mir geht es überhaupt nicht(!) darum, eine ELO-Bestimmungsmethode zu finden, die besser ist als 'deine'.


Das wäre aber wenigstens ein Sport für sich, der sich als solcher versteht, deiner ist einer, den du für dich allein erfindest, du kämpfst gegen ein paar  Gegner, die du dir auch selbst erschaffst: den Irrtum, Kausalzusammenhänge zu berechnen, wo höchstens gemeinsame Spielregeln bestehen, die Illusion, etwas zu messen, was du zuerst selbst als eigene Größe definierst, und den methodischen Fehler, ein Werkzeug zweckzuentfremden, weil du meinst, der Weg sei das Ziel.


Benno Hartwig schrieb:

Mir geht es darum, eine Methode zu haben, die nach Justierung in der Lage ist, aus gespielten Partien ohne Kenntnis der Gegnerstärke eine leidlich vernünftige Spielstärkeeinschätzung zu liefern.


Hast du ja, Benno, wenn du das, was du ermittelst, ein leidlich vernünftige Spielstärke nennst, lieferst du dir unter Garantie selbst den Beweis dafür, dass die ermittelte Spielstärke eine leidlich vernünftige Messung erfahren hat.
Man nennt das auch self fulfilling prophecy.

Ich wollte auch gar nicht daran zweifeln, dass innerhalb deines geschlossenen Systems Eingaben und Auswertung stimmig sein würden, und ich wollte nicht in Konkurrenz zu dieser deiner Idee treten. (Naja, so ganz neu ist sie vielleicht auch nicht, oder? Du würdest das ordentlich reglementieren und statistisch absichern vermutlich, dass nicht so begabte und geübte Spieler das Spiel der Meister mithilfe der engines durchleuchten, ist eigentlich schon ein Sport für sich, seit die engines laufen gelernt haben und die user meinten, die Evals der engines seien ihre eigenen).
Ich habe das mit der Partielänge nur als ein anderes Beispiel angeführt, wäre irgendwie einfacher, auch nicht Schach im herkömmlichen Sinn, hat auch was damit zu tun und kann auch um die Wette betrieben werden, warum also nicht in Elo messen?
Man müsste sich halt nur im Klaren sein, dass es ebenso andere Elo wären wie die im Gummistiefelweitwerfen (gibt's wirklich ).

Benno Hartwig schrieb:

Spieltrieb, Neugierde, Kopfnüsse, Phantasie laufen lassen, Interesse an dem was möglich ist.


Go, Benno, go, wenn du's gut bewirbst und vielleicht noch eine kleine Wissenschaft draus machst, kannst du sicher auch viel Spass gemeinsam mit Anderen daran haben, verzeih mir halt, wenn ich mittlerweile lieber ein bisschen Schach spiele, auch mit den engines und gegen Andere, die auch mit den engines spielen und sich selbst bei dem, was die großen Meister Schach nennen, weniger um Elo kümmern und mehr um das, was es am Brett noch so alles zu entdecken gibt, an Spieltrieb, Neugierde, Kopfnüssen (harten und weichen).

Man kann ganz ohne "allgemeingültige" Messungen dabei noch und noch die Phantasie laufen lassen und Interesse finden an dem, was möglich ist.
Unmöglich ist hingegen für mich, das alles über einen Kamm zu scheren und in ein Ratingsystem zu pressen, ohne dabei der Vielfalt der Sache völlig unbefriedigend Rechnung zu tragen.
Es ist nicht so, dass ich dir deinen Spass nicht gönne, ich hab halt mehr dran, wenn ich mir weniger Sorgen machen muss, dass das irgendwie allgemein anerkannt sein sollte, und wenn mir das auch ein Anliegen ist, dann glaube ich erst recht nicht, dass ich es dadurch erreichen werden, dass ich meine ausrechnen können zu müssen, ob Fischer oder Kasparov besser gespielt haben und um wieviel Elo, und schon gar nicht so, dass ich auch das zu bestimmen noch den engines überlasse, wie das ganze übrige Spiel sowieso auch schon mehr und mehr.
Parent - - By Benno Hartwig Date 2014-12-12 10:55

> du kämpfst gegen ein paar  Gegner, die du dir auch selbst erschaffst


Ich muss mich ja fürchterlich undeutlich ausgedrückt haben!
Ich kämpfe gegen niemanden. Ich baue auch keine neue Spielstärkei-Einschätzung, die besser oder schlechter als z.B. ELO sein könnte.

Ich denke über eine Methode nach, die ELO-Werte (so wie sie existieren) zu schätzen aufgrund von Partien. Ich bewerte (so die Idee) aufgrund der gewählten Züge, die in diversen Positionen mit ihren unterschiedlichen Schwierigkeiten, Chancen und Gefahren gezogen wurden. Also ohne Kenntnis des Spielers und ohne Kenntnis seiner Gegner oder deren ELO-Werte.

Und:
Ja, der Weg ist das Ziel.
Sich darüber gedanken zu machen, macht Spaß.
Ggf. auch sich an einer Realisierung zu versuchen.

Und einen Beweis für irgendwas liefere ich mir überhaupt nicht.
Ich würde eine Schätz-Methode entwerfen.
Und sie würde Ungenauigkeiten enthalten müssen, die sich ggf. verkleiner lassen.
Inwieweit ELO-Werte tatsächlich zur Beschreibung von "Spielstärke" (ein schön undefinierter Begriff) taugt, will ich dabei gar nicht diskutieren.
Und frage mich bitte nicht, wofür die Welt sowas unbedingt braucht.

> verzeih mir halt, wenn ich mittlerweile lieber ein bisschen Schach spiele,


Verzeih ich dir gern, zumal ich ja auch erlebe, dass du dich gern um so Nutzloses wie Computerschach oder die Diskussionen hier im Forum kümmerst.
Du hast ja eben auch längst erkannt, dass es so manches interessante Thema gibt, dass aber natürlich nicht jeden interessieren muss.

Benno
Parent - By Klaus Meier Date 2014-12-15 15:11 Edited 2014-12-15 16:10
Warum so kompliziert ?

Die Idee an sich mag ja sogar (in etwa) funktionieren und eine "Elo" aus einem "QualitätsIndex-Elo Regressionsmodell" wie du es hier beschreibst liefern.

Viel Sinn macht das aber nicht, weil die tatsächliche Elo der Spieler einfach und stimmig schon lange auf den WEB-Seiten der FIDE ablesbar ist. 

Das scheint dir noch nicht bekannt zu sein.
Gnädiger Weise hier bitte schön du kannst dir deine komplizierten Berechnungen sparen, denn es wird vermutlich niemanden nachhaltig intressieren weil
es ist viel einfacher, als du denkst.
 
Gugge mal hier ==> http://ratings.fide.com/
Brauchst du einfach nur den Namen des Spielers eingeben und schon kommt eine Liste mit passenden Spieler-Namen
http://ratings.fide.com/search.phtml?search=Magnus+Carlsen&offset=0&front=1
Klick auf den richtigen Namen und...
==>http://ratings.fide.com/card.phtml?event=1503014

Whooww sooo einfach kann das sein     

Hoffe geholfen zuhaben.
Viele Grüße
K.M.
Parent - By Klaus Meier Date 2014-12-16 06:38
Benno Hartwig schrieb:

Ich muss mich ja fürchterlich undeutlich ausgedrückt haben!
Ich kämpfe gegen niemanden. Ich baue auch keine neue Spielstärkei-Einschätzung, die besser oder schlechter als z.B. ELO sein könnte.

Ich denke über eine Methode nach, die ELO-Werte (so wie sie existieren) zu schätzen aufgrund von Partien. Ich bewerte (so die Idee) aufgrund der gewählten Züge, die in diversen Positionen mit ihren unterschiedlichen Schwierigkeiten, Chancen und Gefahren gezogen wurden. Also ohne Kenntnis des Spielers und ohne Kenntnis seiner Gegner oder deren ELO-Werte.

Und:
Ja, der Weg ist das Ziel.
Sich darüber gedanken zu machen, macht Spaß.
Ggf. auch sich an einer Realisierung zu versuchen.

Und einen Beweis für irgendwas liefere ich mir überhaupt nicht.
Ich würde eine Schätz-Methode entwerfen.
Und sie würde Ungenauigkeiten enthalten müssen, die sich ggf. verkleiner lassen.
Inwieweit ELO-Werte tatsächlich zur Beschreibung von "Spielstärke" (ein schön undefinierter Begriff) taugt, will ich dabei gar nicht diskutieren.
Und frage mich bitte nicht, wofür die Welt sowas unbedingt braucht.

Verzeih ich dir gern, zumal ich ja auch erlebe, dass du dich gern um so Nutzloses wie Computerschach oder die Diskussionen hier im Forum kümmerst.
Du hast ja eben auch längst erkannt, dass es so manches interessante Thema gibt, dass aber natürlich nicht jeden interessieren muss.

Benno


Ach noch was fällt mir dazu ein, auf Chetan`s Schach-Seiten ist da eine Methode beschrieben die genau das leistet, was du hier ansprichst.
Eine Einschätzung der Spielstärke anhand von Positionen aus einem Schachspiel.
http://www.chetan.homepage.t-online.de/schach/s_14_15.html
Eine kurze Beschreibung der Methode ist in dem Textfenster "Eröffnungsniveau" zu lesen.

Wenn dich z.b. eine Spielstärkeeinschätzung gemessen in Elo einer Engine intressiert, dann liesse sich die Methode auf die Positionen in der Eröffnungsphase anwenden, also auf die Eröffnungszüge der Engine
Natürlich muss die Engine dazu OHNE Eröffnungsbuch spielen. Also jeden Zug selbst errechnen. Du kannst dann die von der Engine erspielten Eröffnungszüge und erspielten Positionen mit einer Datenbank vergleichen, die auch Elo Zahlen aus Fide Turnierspielen enthält. In der Eröffnungsphase gibt es genügend Treffer für eine statistische Auswertung. ISt eigentlich ganz simpel.
K.M.
Parent - - By Ralf Mueller Date 2014-12-11 18:49
Ja, eine Studie der Internetplattform "Chess-DB" kommt nach der Analyse von 50.000 Partien zu dem Schluss, dass die Methode, die von Guid/Bratko verwendet wurde, um die Spielstärke ehemaliger Meister zu bestimmen (Messung der durchschnittlichen Abweichung des gespielten Zugs von dem Computerzug unter bestimmten Bedingungen), tatsächlich mit dem Elo-Rating moderner Meister korreliert. Sie benutzen diese Erkenntnis für ihren "Chess Play Quality Index".
Link: http://chess-db.com/public/research/qualityofplay.html

Guid wertete auch 2013 das Kandidatenturnier aus, was mit Punktgleichheit zwischen Kramnik und Carlsen endete. Er ließ dafür Houdini 1.5a für jeden gespielten Zug eine 20-ply-Tiefe errechnen und verglich die gespielten Züge mit den errechneten. Er kam zu der folgenden Reihenfolge: Carlsen, Grischuk, Kramnik, Aronian, Svidler, Ivanchuk, Gelfand, Radjabov. Interessanterweise hatte Grischuk im Turnier knapp unter 50% der Punkte geholt. Er stellte fest, dass Carlsens Spielqualität die bisher beste war, die er bei Top-Level-Schachturnieren mit seiner Methode gemessen hat. Mit der gleichen Methode hat er alle WM-Kämpfe bis zu der Zeit ausgewertet und kam zu dem Schluss, dass Anand und Kramnik in diesen das höchste Spielniveau erreichte, Steinitz das niedrigste (Carlsen war damals noch nicht Weltmeister).
Link: http://en.chessbase.com/post/the-quality-of-play-at-the-candidates-090413
Parent - By Benno Hartwig Date 2014-12-11 20:30

> eine Studie der Internetplattform "Chess-DB" kommt nach der Analyse von 50.000 Partien zu dem Schluss, dass die Methode, die von Guid/Bratko verwendet wurde, um die Spielstärke ehemaliger Meister zu bestimmen (Messung der durchschnittlichen Abweichung des gespielten Zugs von dem Computerzug unter bestimmten Bedingungen), tatsächlich mit dem Elo-Rating moderner Meister korreliert


Der Anfang ist gut, aber ich würde gern wenigstens auch mit eingehen lassen, wie die Korrelation bei verschiedenen Analysetiefen aussieht.
Ggf. gibt ja zusammen(!) die Trefferzahl bei Suchtiefe 6, 12, 16 und 20 noch ein detailliertes Bild.
Erkenntnisse wie "Das schwierig zu Sehende hat er nicht erkannt, aber immerhin das Näherliegende."

Benno
Parent - - By Michael Scheidl Date 2014-12-11 23:24
Zitat:
A negative number q would be rounded to zero.

Wieder so ein komisches methodisches Detail, das bei mir Stirnrunzeln hervorruft. Doch wahrscheinlich mißverstehe ich nur etwas nicht

Immerhin zeigt die der Beschreibung beigefügte Grafik ungeschminkt die Schwächen der Methode auf. Offenbar können Spielstärkeunterschiede im Bereich von ca. 2150...2350 nicht abgebildet werden:



Da gehts mit dem QoP fröhlich rauf und runter. Gute Korrelation sieht anders aus.

Also, die Bemühungen der Analytiker in allen Ehren, aber ich kann nicht umhin skeptisch zu bleiben.
Parent - By Ralf Mueller Date 2014-12-11 23:42
Zitat:
Wieder so ein komisches methodisches Detail, das bei mir Stirnrunzeln hervorruft. Doch wahrscheinlich mißverstehe ich nur etwas nicht


Ich glaube, es geht nur darum, dass die Autoren eine Skala von 0-100 haben wollen. Wer bei jedem Zug durchschnittlich einen um 100 Centipawns schlechteren Zug als den Computerzug wählt, dessen Spielstärke wird einfach auf 0 festgelegt. Könnte man aber natürlich auch noch nach unten öffnen, würde aber unübersichtlicher werden und ist für die untersuchten Partien der Leute nicht relevant.
Up Topic Hauptforen / CSS-Forum / automatisierte Spielstärkebestimmung durch Partienanalyse

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill