Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / TCEC 21 - Superfinale
1 2 3 Previous Next  
Parent - By Benno Hartwig Date 2021-08-01 20:38 Edited 2021-08-01 20:50

> ...oder 35 Pkt. aus 65 Partien (+10 -5 =50) noch keine Dominanz dar.


Immerhin ist die aktuelle Schätzung:
Die Wahrscheinlichkeit für einen Lc0-Sieg (7,5%) ist weniger als halb so groß wie die Wahrscheinlichkeit für einen SF-Sieg (16,4%).
Ausgesprochen groß ist nur die Wahrscheinlichkeit für ein Remis (76,1%).
Und die Partienanzahl ist klein und die Wahrscheinlichkeit von Fehleinschätzungen darum recht groß.
Ich möchte hier schon von Dominanz sprechen.
Parent - - By Andreas Mader Date 2021-08-03 15:34 Edited 2021-08-03 15:44
Kurt Utzinger schrieb:

Hallo Reinhold
Für mich stellt eine Gewinnquote von momentan gerade 53,85%
oder 35 Pkt. aus 65 Partien (+10 -5 =50) noch keine Dominanz dar.
Mfg
Kurt


Eine Gewinnquote von 53,85% entspricht einer ELO-Differenz von etwas mehr als 23 Punkten. Ein Wert, bei dem in diesem Forum meistens herumgejammert wird, dass man wegen einer solchen Kleinigkeit doch bitte schön keine neue Version herausbringen soll. Am Ende machen dann aber eben auch kleine Werte etwas aus und plötzlich wird aus einer marginalen Größe eine überragende Dominanz.

Schöne Grüße
Andreas
Parent - - By Ingo Althöfer Date 2021-08-03 15:57
Das Elo-System ist für Spiele mit hohen Remisquoten nicht optimal.

Ingo Althöfer.
Parent - - By Andreas Mader Date 2021-08-03 16:44
Ingo Althöfer schrieb:

Das Elo-System ist für Spiele mit hohen Remisquoten nicht optimal.

Ingo Althöfer.


Es würde also beim ELO-System einen Unterschied machen, ob ein Zweikampf +10 -5 =50 oder +35 -30 =0 ausgeht?

Andreas Mader
Parent - - By Ingo Althöfer Date 2021-08-03 17:00
Andreas Mader schrieb:

Ingo Althöfer schrieb:
Das Elo-System ist für Spiele mit hohen Remisquoten nicht optimal.

Es würde also beim ELO-System einen Unterschied machen, ob ein Zweikampf +10 -5 =50 oder +35 -30 =0 ausgeht?

Eben nicht.

Deshalb ist das Elo-System ja für 3-wertige Spiele
mit hohen Remisquoten tendenziell ungeeignet.
Parent - - By Andreas Mader Date 2021-08-03 17:18
Ingo Althöfer schrieb:

Andreas Mader schrieb:

Ingo Althöfer schrieb:
Das Elo-System ist für Spiele mit hohen Remisquoten nicht optimal.

Es würde also beim ELO-System einen Unterschied machen, ob ein Zweikampf +10 -5 =50 oder +35 -30 =0 ausgeht?

Eben nicht.

Deshalb ist das Elo-System ja für 3-wertige Spiele
mit hohen Remisquoten tendenziell ungeeignet.


Warum ist das so?

Rein gefühlsmäßig würde ich annehmen, dass bei einer höheren Remisquote eine sicherere ELO-Zahl bzw. ELO-Differenz herauskommt, weil die Schwankungen geringer sind.
Parent - - By Benno Hartwig Date 2021-08-03 17:36 Edited 2021-08-03 17:38
Aus meiner Sicht ist Folgendes irgendwie unbefriedigend:

Bei einer 10-5-50-Überlegenheit, hat der der Schwächere kaum Chancen "mit etwas Glück" zu gewinnen.
Das nenne ich Dominanz.

Bei einer 35-30-0-Überlegenheit sind die Gewinnchancen des Schwächeren auch gar nicht so schlecht.
Aus meiner Sicht ist das dann deutlich weniger Dominanz.

Und noch extremer:
Bei einer 5-0-60-Überlgenheit hat der Schwächere gar keine Gewinnchance.

Elo-Differenzen machen hier aber keine Unterschiede.
"Optimal" finde ich das auch nicht.
Parent - - By Max Siegfried Date 2021-08-03 18:06
Dann beachten wir ab heute nur noch den Unterschied zwischen Sieg und Niederlage.
+13 -6
Parent - By Benno Hartwig Date 2021-08-03 18:22
Gerecht wird das der Sache aber auch nicht.
Natürlich macht es einen riesigen Unterschied, ob neben 13 Siegen und 6 Niederlagen
- gar keine Remisen auftauchten
- oder deren 100


Ne, so geht es auch nicht.
Parent - By Ingo Althöfer Date 2021-08-03 18:22
Hallo Herr Mader,

Andreas Mader schrieb:
Ingo Althöfer schrieb:

Deshalb ist das Elo-System ja für 3-wertige Spiele mit hohen Remisquoten tendenziell ungeeignet.

Warum ist das so?


Elo war Physiker, und wie die meisten Physiker war er mit
Pi*Daumen-Regeln zufrieden. Sein Rating-System ist für Spiele
erklärt, in denen es nur Sieg und Niederlage gibt, aber keine
Remisen.

Was in seinem Modell fehlt, sind zum BeisPiel Aspekte wie Anzugsvorteil
und unentschiedene Partieausgänge.

Unabhängig davon kann man auch beweisen, dass es gar keine
Ratings für nichttriviale 2-Personen-Spiele geben kann, die
transitiv im starken Sinne sind.


Mit "stark transitiv" meine ich: Wenn man drei Spieler A, B, C hat
und weiss, wie die Gewinnchancen von A gegen B  und die von B
gegen C sind, kann man daraus mithilfe der stark transitiven Ratings 
ausrechnen, wie gross die Gewinnchancen von A gegen C sind.

Zu der Frage habe ich Beispiele durchgerechnet, wo die Spieler
einfache Computer-Programme ohne Gedächtnis und ohne Lernen sind.
Die Menge der Konstellationen A,B,C mit Rating-Transitivität stellte sich
als Nullmenge heraus.

*****************************************
Wenn man gerne nach Sternen greift, könnte man behaupten, die
Nichtexistenz von transitiven Ratingsystemen sei so etwas wie der
Goedelsche Nichtexistenz-Beweis für vollständige Beweis-Systeme.
Elo wird "damals" überhaupt nicht in solch eine Richtung gedacht
haben. Er war halt Physiker und Pragmatiker.

Für die menschliche Schach-Praxis mit überschaubaren Remisquoten
ist das Elo-System sehr gut geeignet.


Erst die jüngste Entwicklung der Spielstärken bei den Schach-Programmen
macht aus der akademischen Frage nach transitiven Ratings etwas, was
für die Schach-Wirklichkeit eine Rolle spielt.

Ingo Althöfer.
Parent - By Stefan Pohl Date 2021-08-05 12:25 Upvotes 2
Ingo Althöfer schrieb:

Andreas Mader schrieb:

Ingo Althöfer schrieb:
Das Elo-System ist für Spiele mit hohen Remisquoten nicht optimal.

Es würde also beim ELO-System einen Unterschied machen, ob ein Zweikampf +10 -5 =50 oder +35 -30 =0 ausgeht?

Eben nicht.

Deshalb ist das Elo-System ja für 3-wertige Spiele
mit hohen Remisquoten tendenziell ungeeignet.


Hallo Herr Prof. Althöfer,

eigentlich schreibe ich hier nicht mehr, für Sie mache ich jedoch mal eine Ausnahme und weise Sie höflich auf meine Website mit meinen AntiDraw Eröffnungen hin.
https://www.sp-cc.de/anti-draw-openings.htm

Der Download beinhaltet nicht nur diverse Eröffnungssets und Bücher, die die Remisquoten drastisch absenken (und dabei zusätzlich die Elo-Abstände spreizen), sondern auch einen Ordner "Armageddon_Tools".
Dieser beinhaltet einfache batch-Tools, die aus den Partien eines Engine-Testruns/Wettkampfes/Turniers vollautomatisch 2-wertige Ergebnisse machen. Die Nutzung empfiehlt sich natürlich nur, wenn man eine meiner AntiDraw-Eröffnungen benutzt, welche Weiß einen deutlichen Vorteil einräumen. Die Tools wandeln dann nämlich alle Remisen in Sieg Schwarz um. Zuzüglich verdoppelt das "Advanced Armageddon"-Tool die (sehr seltenen) echten Schwarzsiege-Partien, sodaß ein Sieg mit Schwarz, Schwarz 2 Punkte einbringt (weil ja eben Weiß am Ende der Eröffnungsvorgabe einen deutlichen Vorteil hatte).
Dies verdoppelt durchschnittlich die Elo-Abstände, wenn man das resultierende Partie-File dann durch ORDO jagt.

Vielleicht ist dies für Sie von Interesse. MfG - S.Pohl (SPCC)
Parent - - By dkappe Date 2021-08-03 21:40
Ich habe das SuFi nicht wirklich mitverfolgt. Gab es noch immer die Eröffnungen mit extremen Bewertungen wie in dem DivP?
Parent - By Lothar Jung Date 2021-08-03 21:56
Ja, und SF kommt damit besser zurecht.
Hallo Dietrich,

Lc0 kann den Eröffnungsvorteil nicht in dem Maße verwirklichen wie SF.

Es gibt aber auch blunders im Endspiel.

Netzauswahl war schwierig. 69722 wäre wohl besser gewesen. Vielleicht wäre der Unterschied von derzeit +6 von SF kleiner gewesen.

Derzeit macht Ceres eine gute Figur. Ist mit seiner reinen MCTC-Suche schneller.

Davon unabhängig braucht Leela ein größeres Netz.

Greetings

Lothar
- By Peter Martan Date 2021-08-03 06:58
Nach 3/4 der Partien (76 von 100) aus SF- Sicht 41,5 : 34,5 in Punkten.

Wins       = 13
Draws      = 57
Losses     = 6
Av.Op. Elo = 3500

Result     : 41.5/76 (+13,=57,-6)
Perf.      : 54.6 %
Margins    :
68 %       : (+  2.8,-  2.8 %) -> [ 51.8, 57.4 %]
95 %       : (+  5.6,-  5.4 %) -> [ 49.2, 60.2 %]
99.7 %     : (+  8.6,-  8.2 %) -> [ 46.4, 63.2 %]

Elo        : 3532
Margins    :
68 %       : (+ 20,- 19) -> [3513,3552]
95 %       : (+ 40,- 38) -> [3494,3572]
99.7 %     : (+ 62,- 57) -> [3475,3594]
- - By Ingo Althöfer Date 2021-08-04 10:16
Hallo in die Runde,

etwas überrascht bin ich, dass es keine Reaktionen auf meine Mitteilung
gibt, dass das Elo-Rating-System "auf Sand gebaut" ist. Ist das allen
im wesentlichen egal oder werde ich als Spinner gesehen?

Praktisch sehe ich aktuell wegen hoher Remisquoten Probleme mit
Elo-Ratings in drei Bereichen:

* TCEC-Superfinale

* Server-Engine-Blitzturniere mit Remisquoten nahe der 100 %.

* Fernschach im menschlichen Spitzenbereich

Ein Ausweg könnte sein, statt der 1-parametrigen Elozahlen
2-parametrige Ratings einzuführen.

Ingo Althöfer.
Parent - - By Jörg Oster Date 2021-08-04 10:30
Etwa sowas wie das pentanomial model in fishtest?
Siehe https://github.com/glinscott/fishtest/wiki/Fishtest-mathematics
Parent - By Ingo Althöfer Date 2021-08-05 08:49
Danke für all die konstruktiven Antworten und Meinungen.
Besonders hat mir der Link von Herrn Oster geholfen, wobei
die grosse Seite zu Match-Statistics

https://www.chessprogramming.org/Match_Statistics

bei chessprogramming.org für mich sehr aufschlussreich war.
Es gibt da also schon eine ganze Menge.

Ingo Althöfer.
Parent - - By Lothar Jung Date 2021-08-04 11:09
Vielleicht könnte man ein Remis für Schwarz etwas aufwerten, für Weiß abwerten.
Entsprechend dem statistischen Vorteil von Weiß.
Auch ein Gewinn mit Schwarz könnte dementsprechend aufgewertet werden.
Parent - By Benno Hartwig Date 2021-08-04 21:45
Sieht erstmal plausibel aus , aber hat es Nutzen???
Läuft das nicht letztlich auf einen statischen Bonus für jede(!!!) gespielte Schwarz-Partie hinaus?
Parent - - By Max Siegfried Date 2021-08-04 12:44
Ingo Althöfer schrieb:

Hallo in die Runde,

etwas überrascht bin ich, dass es keine Reaktionen auf meine Mitteilung
gibt, dass das Elo-Rating-System "auf Sand gebaut" ist. Ist das allen
im wesentlichen egal oder werde ich als Spinner gesehen?

Praktisch sehe ich aktuell wegen hoher Remisquoten Probleme mit
Elo-Ratings in drei Bereichen:

* TCEC-Superfinale

* Server-Engine-Blitzturniere mit Remisquoten nahe der 100 %.

* Fernschach im menschlichen Spitzenbereich

Ein Ausweg könnte sein, statt der 1-parametrigen Elozahlen
2-parametrige Ratings einzuführen.

Ingo Althöfer.


Die Elo Formel ist nicht perfekt.
Für die letzten beiden Punkte, die ich zwar als wichtig ansehe, interessieren sich weniger als 99,99% aller Schachspieler.
Bzgl. TCEC Superfinale: +14 -6 =eine klare Sache
Parent - - By Benno Hartwig Date 2021-08-04 20:32 Upvotes 1

> Für die letzten beiden Punkte, die ich zwar als wichtig ansehe, interessieren sich weniger als 99,99% aller Schachspieler.


Man sollte vielleicht nicht erwarten, dass sich für auch nur irgendetwas tatsächlich 100% aller Schachspieler interessieren.
Parent - By Max Siegfried Date 2021-08-04 22:32
Benno Hartwig schrieb:

Man sollte vielleicht nicht erwarten, dass sich für auch nur irgendetwas tatsächlich 100% aller Schachspieler interessieren.



Es war nur besonders höflich formuliert.
Parent - - By Thomas Plaschke Date 2021-08-04 13:02

> etwas überrascht bin ich, dass es keine Reaktionen auf meine Mitteilung gibt, ...


Naja, eine fundierte Gegenrede kann ich nicht abliefern. Ich hätte nicht mal eine andere Meinung oder Vermutung.

Andererseits würde mich schon interessieren, ob es - mathematisch - möglich oder sinnvoll ist, zwischen Turniererfolgsprognose und Spielstärke zu differenzieren. Könnte dabei für die Spielstärke mehr als eine Reihenfolge herauskommen?

Viele Grüße
Th. Plaschke
Parent - By Ingo Althöfer Date 2021-08-05 08:59
Hallo Herr Plaschke,

Thomas Plaschke schrieb:
Andererseits würde mich schon interessieren, ob es
- mathematisch - möglich oder sinnvoll ist, zwischen Turniererfolgsprognose
und Spielstärke zu differenzieren.

Sinnvoll ist es. Spielstärke bezieht sich ja auf Einzelpartien.
Bei längeren Matches und Akteuren ohne Lernen und ohne
"Memory" wird das stärkere Programm wahrscheinlich gewinnen,
wobei die Siegwahrscheinlichkeit mit der Matchlänge wächst.

Vorbehalt ist aus meiner Sicht, dass es keine stark-transitiven 1-parametrigen
Ratingsysteme geben kann. Anschaulich: Wenn man weiss, wie A gegen B abschneidet
und wie B gegen C abschneidet, kann man aus daraus hergeleiteten Ratings nicht
vorhersagen, wie A gegen C abschneidet.

Also: Sobald echt mehr als zwei programme beteiligt sind,
gibt es keine 1-parametrigen Ratings mit perfekten Vorhersagen.

Ingo Althöfer.
Parent - - By Benno Hartwig Date 2021-08-04 15:45

> etwas überrascht bin ich, dass es keine Reaktionen auf meine Mitteilung gibt, dass das Elo-Rating-System "auf Sand gebaut" ist.


Naja, ich hatte  2021-08-03 17:38 meine Elo--Kritik beigesteuert.

Aber das Elo-System ist etabliert.
Es ist richtig, jetzt möglichst konkret zu beschreiben, was einen stört am Elo-System.
Und sicher wird manches Kopfnicken kommen.
Aber das führt eben noch nicht viel weiter.

Wenn man eine Chance haben möchte, wenigstens mal fundiert diskutiert zu werden, dann muss man wohl versuchen, einen sehr konkreten Alternativentwurf zur Beschreibung der Engine-Qualität zu geben,
mit einer Argumentation, die klarstellt, was daran hinreichend deutlich besser ist, und auch, welche hoffentlich nur kleineren Kröten dafür zu schlucken sind.
Solch einen Gegenentwurf hätte ich tatsächlich leider nicht in der Tasche.
Kennen auch keinen anderen.
Parent - - By Ingo Althöfer Date 2021-08-05 09:08
Hallo Herr Hartwig,

Benno Hartwig schrieb:
Aber das Elo-System ist etabliert.

so wie vor langer Zeit das Weltbild mit der Erde in der Mitte
oder um 1900 die klassische Physik vor Quantenmechanik und
Relativitätstheorie.

Zitat:
Wenn man eine Chance haben möchte, wenigstens mal fundiert
diskutiert zu werden, dann muss man wohl versuchen, einen sehr
konkreten Alternativentwurf zur Beschreibung der Engine-Qualität
zu geben, mit einer Argumentation, die klarstellt, was daran
hinreichend deutlich besser ist, und auch, welche hoffentlich nur
kleineren Kröten dafür zu schlucken sind.

So ist es. Es wird jedenfalls NICHT mit Systemen geben, die die
Stärke mit nur einem Parameter messen.

Zitat:
Solch einen Gegenentwurf hätte ich tatsächlich leider nicht in der Tasche.
Kennen auch keinen anderen.

Als Mathematiker habe ich meine Stärke eher darin, Fehler oder Schwächen
in Vorschlägen zu suchen. Aber ich würde liebend gern über Gegenentwürfe
mitdiskutieren.

Ingo Althöfer.
Parent - By Benno Hartwig Date 2021-08-05 09:55

> So ist es. Es wird jedenfalls NICHT mit Systemen geben, die die Stärke mit nur einem Parameter messen.


Das was dann beschrieben wird, ist dann aus meiner Sicht aber nicht mehr "die Stärke"

Etwas, was ich mit solch einem Begriff verbinde, darf schon gern durch einen Zahlenwert beschrieben werden.
Nur ist dieser nicht unbedingt das, was so manchen eigentlich interessiert.
Parent - - By Horst Sikorsky Date 2021-08-04 16:52 Edited 2021-08-04 16:57
Hallo Herr Althöfer,

die Besten Spieler im ICCF  liegen 300 Elo hinter Carlsen und Co.
für einen Sieg gibt es nur 5 bis 6 Elo. Statt etwa 18

das ist nur ein Punkt von Vielen. Hier meine ich nicht das Fernschach.

Ich glaube nicht das die Partien minderwertig sind.
die Experten müssen sich was einfallen lassen.

Gruß Horst
Parent - By Ingo Althöfer Date 2021-08-05 09:12
Hallo Herr Sikorsky,

Horst Sikorsky schrieb:
die Besten Spieler im ICCF  liegen 300 Elo hinter Carlsen und Co.
für einen Sieg gibt es nur 5 bis 6 Elo. Statt etwa 18

das ist nur ein Punkt von Vielen. Hier meine ich nicht das Fernschach.

Ich glaube nicht das die Partien minderwertig sind.
die Experten müssen sich was einfallen lassen.


da gibt es so viele Baustellen. Eine ist, dass manche Fernschach-Spieler
eine wahre Meisterschaft darin entwickelt haben, Verlustpartien möglichst
lange hinzuziehen, damit der Verlust erst später in ihr Rating eingeht.
Ein "Vorbild" in dieser Hinsicht war Horst Rittner.

Ingo Althöfer.
Parent - - By Max Siegfried Date 2021-08-04 17:50
Wenn die Schachposition auf dem Brett für Stockfish gewonnen ist und dies etwas länger dauert (mehr als 50-Züge Regel), dann benachteiligt dies Stockfish und bevorteilt die schwächere Engine.
Ich denke Stockfish würde von 100 Partien mindestens 10 Partien mehr gewinnen, wenn er auch ein Matt in z.B. 53 oder 68 oder 74 usw. ausspielen dürfte ohne das die 50-Züge Regel die schwächere Engine schützt.
Parent - By Hauke Lutz Date 2021-08-04 23:41
Das wären maximal 100 von 1m Partien...
Parent - - By dkappe Date 2021-08-04 22:12
Ingo Althöfer schrieb:

Hallo in die Runde,

etwas überrascht bin ich, dass es keine Reaktionen auf meine Mitteilung
gibt, dass das Elo-Rating-System "auf Sand gebaut" ist. Ist das allen
im wesentlichen egal oder werde ich als Spinner gesehen?

Praktisch sehe ich aktuell wegen hoher Remisquoten Probleme mit
Elo-Ratings in drei Bereichen:

* TCEC-Superfinale

* Server-Engine-Blitzturniere mit Remisquoten nahe der 100 %.

* Fernschach im menschlichen Spitzenbereich

Ein Ausweg könnte sein, statt der 1-parametrigen Elozahlen
2-parametrige Ratings einzuführen.

Ingo Althöfer.


Der Zweck des Elo Systems ist die relative spielstärke menschlicher Spieler einzuschätzen. Verschiedene „Verbesserungen“ gibt es schon, manche sogar nützlich wie das Glicko System (lichess benutzt glicko 2, https://lichess.org/page/rating-systems). Für super starke Computer wo fast 100% aller Partien remis ausgehen braucht man eine andere Statistische Maschinerie.
Parent - - By Max Siegfried Date 2021-08-05 19:44
TCEC Superfinale nach 92 Partien Stockfish vs LC0
+16 -7
Parent - By Benno Hartwig Date 2021-08-05 20:42 Upvotes 1
...und 69 mal remis.
Parent - - By Frank Brenner Date 2021-08-06 15:03
Meiner Meinung nach ist die Elo Formel viel mehr als nur eine mittelklassige Erfindung eines Physikers aus dem letzen Jahrhundert.

Sie ist elementar und zwar so elementar wie die natürlichen Zahlen und die Addition.  Die Elo Formel ist  - fast so wie die natürlichen Zahlen -  auf jedem Planeten im Universum auf dem intelligentes Leben herrscht bekannt.

Sie basiert auf folgender Beobachtung:

Wenn wir drei Spieler A, B und C haben und A gewinnt im Durchschnitt 3:1 gegen B und B gewinnt 5:1 gegen C, dann wird A 15:1 gegen C gewinnen.

Dieses Prinzip könnte man Multiplikativität der Erwartungswerte nennen und genau das ist die Elo Formel.

Die Multiplikativität impliziert nicht nur die transitivität sondern geht sogar darüber noch hinaus und sagt qualitativ sogar (in unserem Beispiel) ein 15:1 voraus, also viel mehr als nur die
Transitivität.

Das wichtigste aber ist:

Beim Schachspiel trifft Transitivität und sogar die Multiplikativität im Durchschnitt sehr genau für fehlerbehaftete Spieler  zu.
Wir können die Multiplikativität (und die Transitivität) recht genau, mit zufriedenstellender Genauigkeit und Häufigkeit, in der CEGT ELO Tabelle nachrechnen.


Im Konkreten Einzelfall kann es jedoch durchaus drei Spieler geben wo noch gar nicht einmal die Transitivität gegeben ist und erst recht nicht die Multiplikativität
Man kann sich sogar Spiele (ähnlich wie Schach) künstlich ausdenken (konstruieren) bei denen die Transitivität generell die Ausnahme darstellt.

Das heutige Problem beim Schachspiel ist aber:

Ein Stockfish ist bei einer Bedenkzeit von 1 Tag/Zug ausgehend von der Standard Grundstellung selbst mit einer 32 Steiner Datenbank möglicherweise so gut wie nicht mehr zu besiegen.

Wenn die Engines so spielstark sind, daß sie an die Grenze des Schachspiels stoßen, so enden alle Spiele remis und die Elo formel bescheinigt jeder Engine die gleiche Spielstärke.

Ist Stockfish damit genau so gut wie die 32 Steine Datenbank ?

Nein.

Wir alle  sehen in jeder Partie die wir beobachten die schwankenden Bewertungen von Stockfish und wir wissen genau: Stockfish spielt gut, aber lange nicht perfekt.

Jeder von uns kennt Stellungen in denen Stockfish den Gewinn nicht findet, oder einen Verlustzug spielt. Es gibt sogar Stellungen die ein Elo 1600 Spieler löst - nicht aber Stockfish.

Trotzdem spielt Stockfish gut genug um aus der Standard-Grundstellung bei einer sehr langen Bedenkzeit pro Zug nicht mehr zu verlieren.

Wie kommt das ?

Um das Spiel aus der Standard-Grundstellung Remis zu halten ist es nicht notwendig perfektes Datenbankwisssen über alle ca. 10 hoch 43 Positionen zu haben.
Es reicht aus lediglich ca 0.00000000000001% aller Stellungen so einigermassen auf Gewinn/Verlust/Remis unterscheiden zu können um stets das spieletheoretische Ergebnis eines Remis zu erzielen.
All die anderen 99.9999999% der stellungen kommen nie aufs Brett und kommen auch nie im Suchbaum vor, wenn von der Standard-Grundstellung aus mit beiderseitgen Gewinnabsicht gespielt wird.
(Durch kooperatives spiel kann man sicherlich mit hunderten abgesprochenen zügen viele weitere  aufs Brett zaubern und einen beträchtlich größeren Bereich vom Schachspiel abdecken)

Erinnern wir uns an das was Arno Nickel zu den Top Engines auf Top Hardware gesagt hat, ausgehend von der Standard Startstellung beim Schach:
"Generell zeigt sich, dass leichte Stellungsvorteile einer Seite sich mit zunehmender Rechentiefe zu 0.00 verflüchtigen, ohne dass sich die Remismauer objektiv noch einmal durchbrechen lässt"

Das Problem der vielen Remise im Fernschach hat nicht die Elo Formel zu verantworten.

Schuld daran ist das Schachspiel selbst: Es ist einfach nicht kompliziert genug.

Eine Engine wie Stockfish mit sagen wir 3600 ELO reicht aus um mit einer Bedenkzeit von 1Tag/Zug stets das Remis  aus der Standard-Grundstellung zu halten.

1. Wie können wir die Spielstärke von noch stärkeren Engienes als stockfish messen und in Zahlen ausdrücken ?
2. Wie können wir das Schachspiel komplizierter gestalten ?

zu 2.

Regeländerung zb 10x10 Felder oder eine neue Figur werden wohl von nahezu allen Schachspielern abgelehnt.
Andere Regeländerungen werden entweder ebenfalls abgelehnt oder sie bieten kaum das gewünschte Ergebnis.

zu 1.
Wir könnten die Standard-Grundstellung ändern.

Vielleicht gibt es andere Grunstellungen für die 4000 oder 5000 ELO notwendig sind um das Spiel gegen eine 32 Steine Datenbank zuverlässig Remis zu halten ....

Für Menschen sind andere Grundstellungen aber eine Katastrophe:
Großmeister haben ihr ganzes Leben damit verbracht die Eröffnugstheorie und typische Stgellungsbilder im Laufe der Parteie zur Standard-Grundstellung auswenig zu lernen.
Die Spielstärke eines GM beruht auf dessen Eröffnungswissen und Spielekönnen.
Fehlt das Eröffnungswissen so verlieren sie Spielstärke (wie viel genau weiß ich auch nicht: vielleicht nur 30 ELO, vielleicht aber auch 150 oder mehr ELO)

Heutige Engines wie Leela lachen über dieses Problem: Sie können die gesamte Theorie zu einer neuen Grundstellung mit geeigneter Hardware innerhalb weniger Minuten oder Stunden neu berechnen und spielen
anschließend mit ihrer gewohnten Spielstäke als hätte es 100 Jahre nur diese andere Grundstellung gegeben.

Menschen dagegen lehnen andere Grundstellungen (zb Schach960) ab, nicht nur wegen der unbekannten Eröffnungstheorie sondern vor allem auch wegen den im Laufe der Partie unterschiedlichen Stellungsbilder
und Figurengruppierungen, die dann auf das Brett kommen.

Für Engine Tests halte ich aber die Auswahl von anderen  Grundstellungen für eine sehr gute Idee.

Und zwar
(a) Stellungen die aus einer kooperativ ausgewählten Zugseqzenz ausgehend von der Standard-Startstellung ausgehen,
(b) Eine Grundstellung die völlig neu  aus der Menge ALLER 10 hoch 43 Schachstellungen ausgewählt wird
    gefolgt von einer Sequenz aus kooperativ ausgewählten Zügen ausgehend von dieser neuen Grundstellung,.

Vielleicht gibt es bei (b) auch eine Startstellung die einen maximalen ELO Wert von 4000 ELO oder 5000 ELO ermöglicht ?

Dann kann die ELO Formel dank dieser neuen Startstellung noch bis zu einem ElO Wert von knapp 4000 oder 5000 angewendet werden.

Aber selbst eine Engine die in jeder Remisstellung (aus 10 hoch 43 möglichen) das Remis weit überwiegend hält ist trotzdem nicht notwendigerweise perfekt.

Ab diesem Punkt lässt sich die ELO Formel dann überhaupt nicht mehr anwenden, denn hier kommt stets ein Remis heraus.

Wie geht es dann weiter ?

Wir könnten unfähre Startstellungen wählen, also Startstellungen die zb vermutlich für eine Farbe gewonnen sind. Gespielt werden dann jeweils zwei partien.

Die hier entstehenden Scores sind dann aber einfach nur scores, zb 65% (bei 100 Partien).
Dieser Score ist dann eng Verknüpft mit den zugrunde liegenden Startstellungen und deren Grad an Unausgewogenheit. Wenn der Farbvorteil oder die Stellungen  sich ändern dann variieren auch die 65%.
Eine feste Elo Zahl gibt es hier dann nicht mehr, ebensowenig eine feste Prozentzahl.
Parent - - By Ingo Althöfer Date 2021-08-06 16:31
Hallo Herr Brenner,

Frank Brenner schrieb:

Meiner Meinung nach ist die Elo Formel viel mehr als nur eine mittelklassige Erfindung eines Physikers aus dem letzen Jahrhundert.
...
Sie basiert auf folgender Beobachtung:

Wenn wir drei Spieler A, B und C haben und A gewinnt im Durchschnitt 3:1 gegen B und B gewinnt 5:1 gegen C, dann wird A 15:1 gegen C gewinnen.
Dieses Prinzip könnte man Multiplikativität der Erwartungswerte nennen und genau das ist die Elo Formel.


Herr Elo hat die Ratings ja nicht erfunden, sondern an der Formel eines
Vorgängers herumgefeilt.

Das mit der Multiplikativität - von mir starke Transitivität genannt - wird
zwar durch die Elo-Formel suggeriert. Es stimmt aber nicht, und zwar schon
bei ganz einfachen Spielen.


Ingo Althöfer.
Parent - - By Max Siegfried Date 2021-08-06 16:54
Ein Hauptproblem besteht darin dass die Elo Zahl vierstellig ist.
Wäre diese fünfstellig dann würde man deutlich weniger Menschen und Engines auf den gleichen Rängen sehen.
Parent - By Ingo Althöfer Date 2021-08-09 09:18 Upvotes 4
Hallo Herr Siegfried,

Max Siegfried schrieb:
Ein Hauptproblem besteht darin dass die Elo Zahl vierstellig ist...

Es ist nicht böse gemeint, aber für mich hat dieser Satz das
Zeug zum Forumsbrüller des Monats August.

Stimmt es eigentlich, dass Sie früher unter anderem Namen
hier geschrieben haben?  Sie brauchen ihn ja nicht zu nennen...

Ingo Althöfer.
Parent - - By Frank Brenner Date 2021-08-08 03:45 Upvotes 2
Hallo Herr Althöfer,

vielleicht ist die Multiplikativität nicht exakt, sondern nur Näherungsweise eine Eigenschaft die ein Spiel mit großer Güte oder mit geringer Güte haben kann.

Das Fußballspiel ist ein Beispiel das lediglich schwach transitiv ist, aber so gut wie gar nicht multiplikativ.

ich habe nun versucht das Schachspiel etwas zu vereinfachen:

- es gibt immer noch zwei Farben
- weiß beginnt
- jeder Spieler hat in seinem Zug beliebig viele Züge zur Auswahl.
- mit jedem zug vergrößert oder verkleinert sich der Wert der Stellung für den am Zug befindlichen Spieler  um einen bestimmten Betrag.
- Sobald der Wert der Stellung sich für den am Zug befindlichen  Spieler nach seinem Zug einen  Grenzwert (K) erreicht (zb K= 50) , hat der Spieler gewonnen.

Alle Spieler sind fehlerbehaftet und vergrößern den Wert der Stellung durch ihren Zug um einen festen Wert der sich aus der Spielstärke des Spielers ergibt und zusätzlich noch um
einen zufälligen, normalverteilten Zufallswert mit Erwartungswert 0 und Standardabweichung S (z.B S = 30)

Der Wert der Stellung kann also durchaus durch einen Zug auch schlechter werden.

Beispiel: Drei Spieler A,B und C:

A:  3 + N(0,30)
B: 8  + N(0,30)
C: 35 + N(0,30)

Spieler  C ist also der mit Abstand beste Spieler. Er vergrößert den Wert seiner Stellung in jedem Zug um 35 plus N(0,30). 

Eine Simulation mit jeweils 1 Mio Partien ergibt folgende Scores:

A vs B: 398024 : 601976  ->  Faktor 1,51241131188069
B vs C: 96361 : 903639  ->  Faktor 9,37764240719793

Nach der Regel der Multiplikativität müsste für A vs C jetzt der Wert von 1,51241131188069 * 9,37764240719793  = 14,1828524554182  herauskommen

Tatsächlich wird in der Simulation folgender Wert erzielt:

A vs C:  65751: 934249 -> Faktor 14,2088941613055

Es ist also ziemlich genau Multiplikativ

Wenn ich jetzt die Spielstärke der drei Spieler, also 3,8,35,  verändere so bleibt da Ergebnis so einigermaßen Multiplikativ.

Beträgt die Spielstärke 2,5und 11 so ergibt sich

A vs B  Faktor 1,5189361021479
B vs C Faktor 2,30029735679185

A vs C: 3,48080869635352

3.4808 ... ist so ziemlich genau das Produkt von 1,518936.. * 2,3 ... = 3,49400470090652

Bei geringeren Spielstärkeunterschieden ist die Genauigkeit der Multiplikativität größer.

Interessanterweise verschwindet die Multiplikativität wenn die unterschiedlichen Spieler unterschiedliche Fehlerterme bekommen, also zb

A: 3+ N(0,30)
B: 5 + N(0,40)
C: 8 + N(0,30)

A vs B: Faktor 1,22929155343723
B vs c: Faktor 1,36085141745519

A vs C: Faktor 1,99567125503647

rechnerisch müsste bei A vs C lediglich 1,67288315296075 herauskommen
1,67288315296075 =1,22929155343723 *  1,36085141745519

Aber immerhin: Bei gleicher fehlerstreuung der Spieler ist dieses Spiel zwar nicht exakt Multiplikativ aber zumindest mit großer Güte.

Grüße
Frank Brenner
Parent - By Ingo Althöfer Date 2021-08-09 09:12 Upvotes 1
Lieber Herr Brenner,

danke für Ihre ausführliche Antwort und die
Bereitschaft zur Diskussion.

Mit der Antwort habe ich mir Zeit genommen, weil
es nicht nur etwas schnell Hingeschriebenes werden,
sondern Hand und Fuss haben soll.

Frank Brenner schrieb:
vielleicht ist die Multiplikativität nicht exakt,
sondern nur Näherungsweise eine Eigenschaft die ein
Spiel mit großer Güte oder mit geringer Güte haben kann.

So ist es.


Frank Brenner schrieb:
Das Fußballspiel ist ein Beispiel das lediglich schwach
transitiv ist, aber so gut wie gar nicht multiplikativ.

Fussball ist auch als Vergleich zum Schach gar nicht so
schlecht, weil es dort statt Weiss und Schwarz eben
Heim- und Auswärts-Spiele gibt.


Zitat:
ich habe nun versucht das Schachspiel etwas zu vereinfachen:
- es gibt immer noch zwei Farben
- weiß beginnt
- jeder Spieler hat in seinem Zug beliebig viele Züge zur Auswahl.
- mit jedem zug vergrößert oder verkleinert sich der Wert der
  Stellung für den am Zug befindlichen Spieler  um einen bestimmten
  Betrag.
- Sobald der Wert der Stellung sich für den am Zug befindlichen
Spieler nach seinem Zug einen Grenzwert (K) erreicht (zb K= 50),
hat der Spieler gewonnen.

Ja, das ist eines der Standard-Vereinfachungs-Modelle: Man nimmt
das Spiel als "Random Walk" an, wobei die Schritte abwechselnd ein
A- und ein B-Schritt sind. A und B stehen dabei für die Spieler.


Zitat:
Alle Spieler sind fehlerbehaftet und vergrößern den Wert der
Stellung durch ihren Zug um einen festen Wert der sich aus
der Spielstärke des Spielers ergibt und zusätzlich noch um
einen zufälligen, normalverteilten Zufallswert mit Erwartungswert
0 und Standardabweichung S (z.B S = 30)

Der Wert der Stellung kann also durchaus durch einen Zug auch
schlechter werden.

Beispiel: Drei Spieler A,B und C:

A:  3 + N(0,30)
B: 8  + N(0,30)
C: 35 + N(0,30)

Spieler  C ist also der mit Abstand beste Spieler. Er vergrößert
den Wert seiner Stellung in jedem Zug um 35 plus N(0,30).

Vereinfachte Modelle sind immer hilfreich.
Aber Schach ist natürlich nicht so uniform wie dieses Random-Ralk-
Spiel: Es gibt Schach-Stellungen, wo ein Spieler massive Fehler
begehen kann, und andere ruhige Stellungen, wo es nur um Kleinig-
keiten geht.

Aktienkurs-Modellierungen arbeiten auch oft mit Random Walks.
Dort werden aber immer auch "Levy-Sprünge" zugelassen, um
grosse Momentan-Änderungen zu modellieren.

Zitat:
Eine Simulation mit jeweils 1 Mio Partien ergibt folgende Scores:

A vs B: 398024 : 601976  ->  Faktor 1,51241131188069
B vs C: 96361 : 903639  ->  Faktor 9,37764240719793

Nach der Regel der Multiplikativität müsste für A vs C jetzt
der Wert von 1,51241131188069 * 9,37764240719793  = 14,1828524554182 
herauskommen

Tatsächlich wird in der Simulation folgender Wert erzielt:
A vs C:  65751: 934249 -> Faktor 14,2088941613055

Vorhersagefaktor und beobachteter Faktor bei A vs. C liegen
also nahe beieinander.
Frage an der Stelle: Wie handhaben Sie es mit den Startspielern,
etwa immer abwechselnd?

Ihr Modell-Spiel ist immer noch so kompliziert, dass Sie die
Siegwahrscheinlichkeiten mit Monte-Carlo-Simulationen
annähern müssen, statt sie exakt ausrechnen zu können.

Bei meinen Untersuchungen bin ich zu noch viel viel kleineren
Spielen übergegangen, wo ich die exakten Chancen der Spieler
ausrechnen konnte.


Zitat:
Es ist also ziemlich genau Multiplikativ

"ziemlich genau" ist eine Umschreibung für "nicht genau",
was es wahrscheinlich ehrlicher beschreibt.

Zitat:
Wenn ich jetzt die Spielstärke der drei Spieler, also 3,8,35, 
verändere so bleibt da Ergebnis so einigermaßen Multiplikativ.

Beträgt die Spielstärke 2,5 und 11 so ergibt sich

A vs B  Faktor 1,5189361021479
B vs C Faktor 2,30029735679185

A vs C: 3,48080869635352

3.4808 ... ist so ziemlich genau das Produkt von
1,518936.. * 2,3 ... = 3,49400470090652

Waren das auch wieder je 1 Million partien?


Zitat:
Bei geringeren Spielstärkeunterschieden ist die Genauigkeit
der Multiplikativität größer.

Zustimmung.


Zitat:
Interessanterweise verschwindet die Multiplikativität wenn
die unterschiedlichen Spieler unterschiedliche Fehlerterme
bekommen, also zb

A: 3+ N(0,30)
B: 5 + N(0,40)
C: 8 + N(0,30)

A vs B: Faktor 1,22929155343723
B vs c: Faktor 1,36085141745519

A vs C: Faktor 1,99567125503647

rechnerisch müsste bei A vs C lediglich 1,67288315296075 herauskommen
1,67288315296075 =1,22929155343723 *  1,36085141745519

Sehr gut beobachtet. Und so etwas könnte auch bei der Modellierung
von Schachspielern Sinn machen. Arkadij Naiditsch würde ich z.B.
einen grossen Rauschwert geben, und Matthias Blübaum einen kleinen.

Und die Abweichung von der Multiplikativität ist in Ihrem
Beispiel ja wirklich massiv.

Eine Frage kommt mir direkt in den Sinn:
Wie gross kann die Abweichung von der Multiplikativität werden,
wenn man 6 parameter freigibt:
2 <= S_A < S_B < S_C <= 10
und
N_A, N_B, N_C zwischen 20 und 50 ?

Wenn ich raten müsste, würde ich an Settings mit N_A = N_C = 20
und N_B = 50 denken, oder umgekehrt, also extreme Rauschparameter.
Und vielleicht S_A = 2, S_C = 10 und S_B genau auf "multiplikativer Mitte".


Zitat:
Aber immerhin: Bei gleicher fehlerstreuung der Spieler ist
dieses Spiel zwar nicht exakt Multiplikativ aber zumindest
mit großer Güte.

Ich würde mich über eine Fortsetzung des fruchtbaren
Austausches freuen. Gerne auch zunächst als Email-Wechsel:
ingo.althoeferELOuni-jena.de
Das kann von mir aus gerne auch der Anfang einer gemeinsamen
Untersuchung werden, wo am Ende ein gemeinsames paper steht.

Ingo Althöfer.
Parent - - By Andreas Mader Date 2021-08-08 19:38
Die Ratingzahlen waren nie unter der Annahme erstellt, dass es im Schach Transitivität gibt. Bei Menschen gibt es Tagesform, Angstgegner und viele andere nicht kalkulierbare Dinge, trotzdem hat sich genau dieses Wertungssystem durchgesetzt. Bei Schachprogrammen gibt es so etwas nicht, die spielen immer gleich stark, und wenn sie Fehler machen, dann beruhen die auf den selben Algorithmen, die auch für "geniale" Züge verantwortlich sind. Es liegt daher nahe, davon auszugehen, dass ein Schachprogramm eine mehr oder weniger konstante ELO-Zahl hat, der man durch viele Partien auch relativ nahe kommen kann.
Parent - - By Benno Hartwig Date 2021-08-08 21:21 Edited 2021-08-08 21:28

> Die Ratingzahlen waren nie unter der Annahme erstellt, dass es im Schach Transitivität gibt


Das hatte ich immer anders vermutet.

Elo hatte sich eine Formel ausgedacht, die den Zusammenhang zwischen Elo-Differenz und Quote darstellt.
Eine Quote q  führt dann zu Elo-Differenz E
Wenn nun A gegen B in vielen Partien diese Quote q erspielt und B gegen C auch, dann wäre die Elo-Differenz zwischen A und B und B und C jeweils  E, die Differenz zwischen A und C also E+E.
Die von Elo angegebene Formel beschreibt dann die bei Elo-Differenz E+E zu erwartende Quote von A gegen C.
Aber ob diese zu erwartende Quote im Mittel (bei sehr viele Partien, sehr vielen Gegnern mit dieser Quote q) wirklich so ist, oder ob sie nicht sehr systematisch(!) daneben liegt, ist in meinen Augen offen.

Arpad Elo hatte Menschenpartien vor Augen, also vergleichsweise wenige (also Quoten mit nur sehr ungefährer Aussagekraft)  und Spieler mit sehr schwankenden Spielstärken.
Für diesen Zweck mag in Elos Augen die Transitivität ausreichend gut bestätigt zu sein.
Ob sie heute nicht beißend daneben liegt, wenn zigtausende(!!!) Partien sehr konstanter Spieler gespielt werden, und dies dann mit sehr großen Erwartungen an die Genauigkeit, ist mir ausgesprochen unklar.

Aber:
Zu denken, dass Elo in diesem Sinne nicht  an Transitivität dachte, halte ich für falsch.
Im Gegenteil, ich denke: Er machte die Formel so, wie er es tat, weil  ihm die Transitivität gerade damit ausreichend gut erfüllt schien.
Parent - - By Andreas Mader Date 2021-08-08 22:58
Da es für eine bestimmte ELO-Differenz immer nur eine bestimmte Wahrscheinlichkeit für einen bestimmten Spielausgang gibt, gibt es auch für die Transitivität immer nur eine bestimmte Wahrscheinlichkeit. Eigentlich genauso wie im Computerschach, nur dass da die Spielstärke der Programme stabiler ist.
Parent - - By Benno Hartwig Date 2021-08-09 07:03 Edited 2021-08-09 07:06
Ok, aber die Elo-Formel schätzt implizit Erwartungswerte für die Quote A vs. C, wenn die Quoten A vs. B und B vs. C bekannt sind.
Und ob diese geschätzten Erwartungswerte leidlich passen oder nicht doch systematisch(!) daneben liegen, kann nur ein Abgleich mit der Realität leidlich bestätigen oder auch widerlegen.

Und:
Vielleicht haut das ja auch bei Menschen leidlich hin, bei Schachcomputern aber nicht.
Vielleicht haut es bei AB-Engines hin, bei KI-Engines aber nicht.
Vielleicht haut es bei schwächeren Engines hin oder kurzen Zeiten, und vielleicht weit schlechter bei Spitzenengines, Superhardware und langen Zeiten.
und...

Ich denke, Arpad Elo sah die von ihm implizit beschriebene Transitivität ausreichend gut durch die Realität bestätigt,
und dies vielleicht aber auch nur, weil aufgrund der geringen Partienzahl die zu erwartenden Abweichungen sowieso ja sehr groß waren
und weil die Teilnehmer sowieso deutlich schwankende oder sich entwickelnde Spielstärken mitbrachten, was zu noch mal deutlich größeren Abweichungen führen wird.

Dass Arpad Elo zufrieden war, wenn dieser Transitivität seines Systems in der Praxis nur sehr ungefähr entsprochen wurde, ist daher verständliche.
Wenn wird heute Engines (sehr konstante Spielstärke) in tausende oder zehntausende von Partien schicken und dann mit Fehlerquoten von sehr wenigen Elo hantieren möchten, dann kann sich ein systematisch vorhandener Fehler wohl doch äußerst störend auswirken.
Und es macht für den Elo-Wert eines Prüflings vielleicht dann doch einen riesigen Unterschied, ob ich beispielsweise besonders viel gegen Schwächere, Gleichstarke oder Stärkere spiele.
Parent - - By Andreas Mader Date 2021-08-09 12:49
Selbstverständlich macht es einen Unterschied, wie stark die Gegner sind, gegen die man spielt. Je größer der Spielstärke-Unterschied, desto ungenauer wird die Standort-Bestimmung ausfallen und desto "schwammiger" werden die Wahrscheinlichkeiten. Deshalb verstehe ich auch nach wie vor nicht, warum viele Remis in einem Engine-Wettkampf schlecht sind, wenn es um die Berechnung der ELO-Zahl geht, meiner Meinung nach ist das Gegenteil der Fall.

Aber ich stimme überein, dass das ELO-System nicht der Weisheit letzter Schluss sein muss. Beim konkreten Match Stockfish gegen LC0 kommt dazu, dass Eröffnungen vorgegeben wurden, was das Ergebnis noch zusätzlich verfälschen kann, denn da habe ich Züge gesehen, die in einer "normalen ernsthaften" Partie kaum einmal vorkommen werden. Bis jemand mit einem besseren Vorschlag kommt, bleibt es für mich aber trotzdem das Wertungssystem meines Vertrauens.
Parent - - By Benno Hartwig Date 2021-08-09 15:02

>  Je größer der Spielstärke-Unterschied, desto ungenauer wird die Standort-Bestimmung ausfallen und desto "schwammiger" werden die Wahrscheinlichkeiten.


"schwamminger" und eventuell eben auch systematisch "verstimmt".

> Beim konkreten Match Stockfish gegen LC0 kommt dazu, dass Eröffnungen vorgegeben wurden...


Ja, Elo-Differenzen sollte man auf diesem Wege nicht zu ermitteln versuchen.
Ich finde dieses Vorgehen aber trotzdem gut, wenn es darum geht
a) zu ermitteln, wer der Stärkere ist (und nicht: um wieviel Elo er stärker ist)
b) viele interessante "feurige" Partien zu gewinnen.
Parent - By Andreas Mader Date 2021-08-09 18:37
Benno Hartwig schrieb:

"schwamminger" und eventuell eben auch systematisch "verstimmt".


Klar ist das systematisch "verstimmt" wenn ich im Blitzschach 0:100 gegen Stockfish verliere und niemand sagen kann, ob ich jetzt 1.500 oder 2.500 ELO schlechter bin.  
- - By Benno Hartwig Date 2021-08-06 07:13 Edited 2021-08-06 07:16
94 Partien sind es jetzt, dicht vor dem Ende des Finales
52 Punkte hat SF, hat den Sieg also sicher (und sicher hat dies auch seit geraumer Zeit keiner mehr anders für möglich gehalten).
+17 =70 -7

Aber eine Quote von ca. 55% finde ich auch sehr, sehr beachtlich!
Und dies ganz besonders im remis-trächtigen Spitzen-Engine-Schach und bei reichlich Ressourcen (Zeit und Hardwarepower).
Doch, diese Überlegenheit ist deutlich größer, als ich es erwartet hatte.
Parent - - By Max Siegfried Date 2021-08-06 08:35
Benno Hartwig schrieb:

94 Partien sind es jetzt, dicht vor dem Ende des Finales
52 Punkte hat SF, hat den Sieg also sicher (und sicher hat dies auch seit geraumer Zeit keiner mehr anders für möglich gehalten).
+17 =70 -7

Aber eine Quote von ca. 55% finde ich auch sehr, sehr beachtlich!
Und dies ganz besonders im remis-trächtigen Spitzen-Engine-Schach und bei reichlich Ressourcen (Zeit und Hardwarepower).
Doch, diese Überlegenheit ist deutlich größer, als ich es erwartet hatte.


2 Vorgabestellungen waren aber von Anfang gewonnen bzw. nicht unbedingt die beste Wahl und beide Engines haben hier gewonnen.
Sobald man diese streicht, erhält man +15 -5 und dies bedeutet das Stockfish 3x so oft gewinnt wie er verliert. Das nennt man auch massive Dominanz / Überlegenheit.
Es bedeutet aber auch das Stockfish 5 Vorgabestellungen verloren hat, welche LC0 nicht verloren hat und da sollten sich die Entwickler die Mühe einer professionellen Analyse machen um Stockfish weiter zu optimieren.
Parent - By Max Siegfried Date 2021-08-06 18:35
+19 -7
bzw. +17 -5
Up Topic Hauptforen / CSS-Forum / TCEC 21 - Superfinale
1 2 3 Previous Next  

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill