Das neue Bewertungssystem von Stefan Pohl

By Clemens Keck Date 2020-01-31 12:09

ich bin froh, das mal jemand was Anderes probiert.
Ob das Andere jetzt gut ist oder gar "richtig" wage ich nicht zu bewerten.
Bin mit meinen eigenen Unsicherheiten schon ausgelastet

C.K.

By Reinhold Stibi Date 2020-01-31 12:42 Edited 2020-01-31 12:44

Das kommt mir so vor wie die Veränderung des Schulsystems , das von der Qualität von Reform zu Reform
eher schlechter wurde als besser, besonders außerhalb von Bayern

By Stefan Pohl Date 2020-01-31 12:20

Reinhold Stibi schrieb:

Stefan Pohl ist mit seinem neuen Bewertungssystem der Zeit voraus.

Bis jetzt liegen die Gewinnpartien von Lc0 gegen Stockfish mit über 20 % gut.

Gegen die weiteren Spitzenengines erheblich darüber und gegen sehr gute und Mittelklasse-Engines
sehr deutlich darüber.

Für den jetzigen Zeitpunkt besteht keinen Grund für eine Umstellung.

Dass Remispartien in seiner jetzigen Bedeutung nicht mehr gewertet werden sollen ist sehr nachteilig
für die Beurteilung einer Engines.

Sehr wichtig finde ich bei Engine Wettkämpften dass jede Engine eine Eröffnung mit Weiß und Schwarz spielt.
Dies kann man bei der Fritz GUI prima einstellen.

Bei der Vielzahl der Eröffnungen kommt es natürlich öfters vor dass eine Engine mit -0,8 aus der Eröffnung kommt.
Dies ist auch teilweise erwünscht, denn dann kann die bessere Engine beweisen, dass sie trotz Eröffnungsnachteil
noch ein Remis erreichen kann.

Mit dem neuen Bewertungssystem von Stefan Pohl fällt dieser ganz wichtiger Gesichtspunkt unterm Tisch und es
kommen dann nicht optimale Bewertungen heraus.

Alles total falsch.
Natürlich werden Remispartien gewertet. Als Sieg für Schwarz.
Natürlich werden alle Eröffnungsvorgaben mit vertauschten Farben wiederholt.
Alle SALC Armageddon Vorgaben sind ein leichter Vorteil für Weiß. Daher kann jede Engine auch hier immer beweisen, daß sie nachteilige Eröffnungen Remis halten kann (wenn sie eben Schwarz spielt). Und das wird dann ja sogar als voller Punkt gewertet.
Zum jetzigen Zeitpunkt bestand sehr wohl die Notwendigkeit zur Umstellung. Aber nur bei meinem Testsetup, wo nur Lc0 gegen SF spielt, also 2 superstarke Engines, die z.Zt. etwa auf Augenhöhe sind. Bei meiner langen Bedenkzeit hatte ich dort, wie schon beschrieben, über 85% Remisen, als ich HERT-Eröffnungen benutzt habe. Und wie auch schon (mehrfach!) ausgeführt, ist das absolutes Gift für jede Unterschiedsmessung und drückt alle Ergebnisse so stark Richtung 50%-50%, daß man das Testen dann auch gleich sein lassen kann.
Das gilt ausdrücklich nicht, wenn gegen viele, auch schwächere, Gegner getestet wird, noch dazu mit kürzeren Bedenkzeit, wie zum Beispiel in Andreas NN-Bulletrangliste. Dort wäre es völlig unötig, um nicht zu sagen idiotisch, mit Armageddon Eröffnungen zu testen.

Das war jetzt übrigens mein letztes Posting hier. Zumindest vorerst. Ich komme mir nämlich langsam vor wie ein Papagei, weil ich immer und immer wieder einfachste Gegebenheiten und Fakten wiederhole und wiederhole und wiederhole... Das wird mir echt zu blöd.
Wenn sich also weiter über meine ach so unpassenden Testbedingungen echauffiert werden soll, viel Spaß. Aber ohne mich.

By Reinhold Stibi Date 2020-01-31 12:51 Upvotes 1

Sei doch nicht so verärgert deswegen.

Gebe ja zu dass ich mich nicht näher mit deinen neuen Testbedingungen auseinandergesetzt habe, weil ich sie nicht notwendig finde

So was ich bisher vernommen habe, ist nach meiner Meinung die bisherige Bewertung, die auch die
meisten Tester anwenden, besser.

Aber es darf auch mal was Neues probiert werden. Ob sich das Neue bewährt wird sich noch herausstellen.

By Lothar Jung Date 2020-01-31 13:20

„ Natürlich werden Remispartien gewertet. Als Sieg für Schwarz.“

Dann müßte ein Sieg für Schwarz noch höher gewertet werden.

By Patrick Götz Date 2020-01-31 14:12

Ein wichtiger Hinweis, allerdings ist es durchaus denkbar dass Schwarzsiege unter den speziellen Testbedingungen gar nicht mehr vorkommen.

By Benno Hartwig Date 2020-02-01 06:30 Upvotes 1

Zuerst:
Dass die Eröffnungen NICHT betont ausgeglichen sind finde ich gut.
Du wirst weniger Remisen haben. Gut.
Vielleicht wirst du damit bei ungefähr gleichstarken Engines sogar eine etwas größere Spreizung haben. Gut.
Vermutlich wirst du bei sehr unterschiedlich starken Engine der schwächere aber auch meht Punkte ermöglichen. Ok.

> Alle SALC Armageddon Vorgaben sind ein leichter Vorteil für Weiß. Daher kann jede Engine auch hier immer beweisen, daß sie nachteilige Eröffnungen Remis halten kann (wenn sie eben Schwarz spielt). Und das wird dann ja sogar als voller Punkt gewertet.

Heißt das: ein Sieg mit schwarz wird nicht höher bewertet, also gar nicht belohnt, gegenüber einem Remis?
Eine Niederlage mit weiß ist auch nicht schlimmer als ein remis?

By Eduard Nemeth Date 2020-01-31 12:21

Die neuen Varianten haben auch den Nachteil dass Weiss kaum das ausspielen kann wozu die Stellungsmuster eigentlich gedacht sind. Was nutzt mir zB. eine Stellung im Damengambit, wo der beste Plan der Minoritätsangriff ist, wenn ich ohne den a Bauern spielen muss? Das ist ein Witz. Da können die Programmierer (bei Lc0 Training) die Engine noch so gut darauf trimmen, was ja für die Praxis sehr gut ist, aber was bringt es wenn in den neuen ENG Matches ganz andere Tugenden gefragt sind?

By Stefan Pohl Date 2020-01-31 12:22

Eduard Nemeth schrieb:

Du weißt aber schon, daß ich nicht mehr Blackmageddon (ohne a-Bauer) benutze, sondern SALC Armageddon Vorgaben, wo nur die lange Rochade für Weiß und die kurze Rochade für Schwarz gesperrt ist, das Material aber gleich ist???
Mann, mann, mann.

Wenn man sich schon über meine Testbedingungen beschwert, sollte man sie wenigstens kennen.

So, ich bin dann raus hier aus diesem "Experten" Forum. Zumindest vorerst. Das hält ja ein vernünftiger Mensch echt nicht mehr aus.

By Lothar Jung Date 2020-01-31 13:22

Ich würde Dich vermissen!

By Reinhold Stibi Date 2020-01-31 13:38

Ich auch trotz, trotz meiner Kritik an bestimmten Vorgaben von Tests.

By Clemens Keck Date 2020-01-31 14:28

für mich ist das ein NoGo, jemanden - namentlich auch noch in der Überschrift - "anzuklagen".
Das ist völlig am Grundgedanken eines Forums vorbei. Zu was soll das führen??

Erst nachdenken, und dann schreiben, das wäre oft ratsam.

Vor allem auch in Hinblick auf die teilweise katastrophalen Überschriften hier.
Es ist ja schon weniger als ein 24 Stunden Rhytmus in dem Lc0 abkackt oder überragt, gleiches übrigens auch für Stockfish.
Contempt =0, jetzt der Heilige Gral? Da hab ich ja was angefangen.
Alle testen falsch, oder wie war das?? Vielleicht doch nicht?
Ach ja, Kiudee ist der Heilige Gral, oder doch nicht?

Ich fände es schön, wenn jeder sein Süppchen kocht und bei sich bleibt.
Dieses öffentliche Anklagen hat hier nichts verloren.

C.K.

By Tom Paul Date 2020-01-31 14:42

Das Forum bietet viele interessante Themen.

Ich finde es z.B. interessant das Contempt 24 am besten für Stockfish war.
Danach haben die Leute -24 vom Contempt abgezogen und sagen das ist das beste für Stockfish.
Aber sofort -25 oder mehr abziehen vom default Contempt (24), ist hier vielen dann zu extrem

By Reinhold Stibi Date 2020-01-31 14:56 Edited 2020-01-31 15:09 Upvotes 1

Hinsichtlich Clemens Keck:

Was soll dieser Superschmarren von dir ?

Wenn ich in einer Überschrift schreibe "Das Stockfish nicht mehr die Nr. 1 sein soll ist voreilig"
eine Anklage sein soll, dann bist du von allen Geistern verlassen.

Ich habe auch schon öfters überlegt, ob ich aus diesem Forum aussteigen soll , bei solchen Kommentaren wie jetzt von dir.

Und wenn jeder sein Süppchen kocht und bei sich bleibt, wie von dir empfohlen, dann können wir dieses Forum hier auflösen.

Dann wurschtelt halt solange weiter bis keiner mehr übrig bleibt.

By Clemens Keck Date 2020-01-31 16:09

Du musst schon die Überschrift dieses Threads richtig lesen Reinhold.
Da steht "Das neu Bewertungssystem von Stefan Pohl"
Mit dem Darauffolgendem Inhalt fand ich das ein NoGo.
Und das ist es immer noch.

C.K.

Reinhold Stibi schrieb:

By Reinhold Stibi Date 2020-01-31 16:39 Upvotes 1

Das ist je noch absurder:

Meine Überschrift dieses Threads: " Das neue Bewertungssystem von Stefan Pohl" soll eine Anklage sein ?

Ich brauche sein neues Bewertungssystem nicht gut finden.

Mir steht das Recht zu anderer Meinung zu sein. Ich brauche in diesem Thread kein einziges Wort zurück nehmen.

Genauso hat Stefan Pohl und Andere das Recht sein neues Bewertungssystem gut zu finden und das Positive daran
darzulegen.