Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Wie hängen Remishäufigkeit und Spielstärke zusammen?
- - By Dieter Brandhorst Date 2022-02-15 19:48 Upvotes 3
Jedem ist eigentlich klar, je höher die Spielstärke der Kontrahenten beim Schachspiel ist, umso häufiger wird Remis gespielt. Das gilt für Menschen wie für Engines. Doch wie sehen die Daten dazu aus und welche Zusammenhänge kann man daraus schließen? Zumindest für Menschen habe ich die Daten  mit der Chessbase-Mega-Database 2022 und dem Chessbase Statistik -Tool auswerten können.

Hier die Ergebnisse in einer Tabelle:

Elorange    n       w+      r       s+      w%      r%      s%      w_score s_score w+/s+   Elomw
600-699     241     126     13      102     52.28%  5.39%   42.32%  55.0%   45.0%   1.24    634
700-799     1022    460     141     421     45.01%  13.80%  41.19%  51.9%   48.1%   1.09    754
800-899     1441    682     185     570     47.33%  12.84%  39.56%  53.7%   46.0%   1.20    837
900-999     1256    542     209     504     43.15%  16.64%  40.13%  51.5%   48.4%   1.08    950
1000-1099   7063    3343    922     2789    47.33%  13.05%  39.49%  53.9%   46.0%   1.20    1029
1100-1199   3778    1563    751     1426    41.37%  19.88%  37.74%  51.3%   47.7%   1.10    1148
1200-1299   5762    2391    1243    2118    41.50%  21.57%  36.76%  52.3%   47.5%   1.13    1249
1300-1399   7529    3089    1769    2653    41.03%  23.50%  35.24%  52.8%   47.0%   1.16    1350
1400-1499   11460   4563    2831    4036    39.82%  24.70%  35.22%  52.2%   47.6%   1.13    1450
1500-1599   18903   7407    5071    6390    39.18%  26.83%  33.80%  52.6%   47.2%   1.16    1547
1600-1699   25823   9733    7551    8508    37.69%  29.24%  32.95%  52.3%   47.6%   1.14    1648
1700-1799   39248   15064   11569   12573   38.38%  29.48%  32.03%  53.1%   46.8%   1.20    1749
1800-1899   56208   20880   17856   17414   37.15%  31.77%  30.98%  53.0%   46.9%   1.20    1847
1900-1999   74284   26337   25546   22049   35.45%  34.39%  29.68%  52.6%   46.9%   1.19    1950
2000-2099   114127  40676   40494   32911   35.64%  35.48%  28.84%  53.4%   46.6%   1.24    2050
2100-2199   142898  49775   53668   39398   34.83%  37.56%  27.57%  53.6%   46.3%   1.26    2150
2200-2299   173304  59386   68196   45648   34.27%  39.35%  26.34%  53.9%   46.0%   1.30    2248
2300-2399   156761  49457   70926   36386   31.55%  45.24%  23.21%  54.2%   45.8%   1.36    2348
2400-2499   159285  46048   81809   31395   28.91%  51.36%  19.71%  54.6%   45.4%   1.47    2446
2500-2599   89193   22997   51839   14338   25.78%  58.12%  16.08%  54.8%   45.1%   1.60    2544
2600-2699   30878   7787    18616   4473    25.22%  60.29%  14.49%  55.4%   44.6%   1.74    2641
2700-2799   8570    2012    5515    1043    23.48%  64.35%  12.17%  55.7%   44.3%   1.93    2743
2800-2899   180     34      127     19      18.89%  70.56%  10.56%  54.2%   45.8%   1.79    2821


Der Effekt Spielstärke und Remishäufigkeit tritt deutlich hervor. Bei einem Eloschnitt der Kontrahenten von 634 in der ersten Zeile,
wird nur zu 5,39% remis gespielt der Rest, Siege oder Niederlagen. Kein Wunder, wenn man solche Partien nachspielt sieht man wie dort der Zufall regiert. Mit zunehmender Spielstärke bis zu den SuperGMs und einem Eloschnitt von 2821, nimmt die Remishäufigkeit dann auf 70,56% aller gespielten Partien zu. Wenn man das jetzt einmal auf die Elostärke der besten Engines (3500-3600) hoch extrapoliert, sind die von uns allen beobachteten Remishäufigkeiten auf den Schachservern von geschätzten 95-99% kein Wunder. Könnten Menschen diese Spielstärke erreichen, würden sie auf diesem Niveau sicherlich auch überwiegend remis spielen.  Interessant ist aber, dass der Score für Weiß(ca. 55%) und für Schwarz (ca. 45%) für alle Spielstärken in etwa gleich bleibt und nur die Remishäufigkeit zunimmt. Was man weiterhin beobachten kann, ist eine Zunahme der Weißsiege bei zunehmender Spielstärke. Die Quote w/s-Siege war bei Elo (600-699), 1,24 und bei Elo>2800, 1,79. Das spricht m.E. klar für den Anzugsvorteil von Weiß und eher gegen eine 100%-ige Remisquote bei perfekter Spielweise. Wie seht ihr das?
Parent - By Reinhold Stibi Date 2022-02-15 20:53 Upvotes 1
Sehr gut dargelegt !

Schach ist mit Stockfish nnue so gut wie ausgereift.

Mit normalen Eröffnungen fast zu 98%, bei ausgeglichener Hardware, remis.

Gewonnen wird hauptsächlich gegen schwächere Engines wie Stockfish.
Überspielung durch sehr starke Hardware gegen wesentlich Schwächere.
Gegen Neulinge die ihre Engines nicht richtig eingestellt haben wie z.B. MoveOverhead.
Wenn jemand mit Engines experimentiert.

Deshalb wird ja bei TCEC mit Vorgabeeröffnungen gespielt. Dadurch kann man eine Engine
noch optimal testen ob sie einen Eröffnungsvorteil nutzt oder nicht.

Es ist ja klar, je länger die Bedenkzeit, je schneller die Hardware, je stärker die Engines beidseitig
desto mehr wird remis gespielt. 
Deshalb sind Blitzpartien mit 5 Min. oder noch kürzer vollkommen ausreichend wegen der enormen
Rechentiefe der Engines schon bei 1 Sek. pro Zug.
Parent - - By Benno Hartwig Date 2022-02-15 20:57
Die Remishäufigkeit hängt sicherlich auch von der Elo-Differenz der Kontrahenten in der einzelnen Partie ab.
Waren diese Differenzen in den diversen Klassen denn ungefähr gleich groß?
Parent - - By Dieter Brandhorst Date 2022-02-15 21:24 Upvotes 1
Hallo,

die Suchkriterien waren so eingestellt, das beide Kontrahenten eine Elozahl innerhalb der Klassengrenzen hatten. Der maximale Eloabstand zwischen ihnen betrug also 99 Punkte. Der Elo-Abstand zwischen den Kontrahenten war in allen Klassen im Mittel ungefähr gleich groß.

Dieter Brandhorst
Parent - - By Reinhold Stibi Date 2022-02-15 21:56
Je schwächer die Gegner auf beiden Seiten sind desto mehr Fehler werden gemacht und es ist
dann mehr oder weniger Glücksache wehr gewinnt bzw. wer den letzten Fehler macht.
Wenn aber zwei starke Gegner miteinander spielen kommen natürlich viel weniger Fehler vor und
deshalb viel weniger Gewinnpartien.
Wenn zwei Spitzenspieler gegeneinander spielen ist die Remisquote sehr hoch.
Gegen die Spitzenengines haben die allerbesten menschlichen Spieler keine Chance weil da der
Durchblick fehlt. Kein Mensch kann 30 Züge und mehr zuverlässig berechnen sondern höchstens nur erahnen.
Oft haben ja auch beide Spitzenspieler am Brett keinen Durchblick bei manchen Stellungen und bringen
dann nur remis zustande; die Engines sehen aber oft die kleinsten Schwächen, bauen diese dann weiter zu
ihrem Vorteil aus und gewinnen.
Parent - - By Benno Hartwig Date 2022-02-15 22:06

> Je schwächer die Gegner auf beiden Seiten sind desto mehr Fehler werden gemacht und es ist dann mehr oder weniger Glücksache wehr gewinnt bzw. wer den letzten Fehler macht.


Hmm, ich denke eher:
Bei Begegnungen auf jedem Niveau gibt es 3 Wahrscheinlichkeiten
P(A-gewinnt), P(remis) und P(B gewinnt)
Und die Wahrscheinlichkeiten der Partieausgänge richten sich in elementarer Weise genau danach, unabhängig davon, auf welchem Niveau das stattfindet.

Nur dass auf hohem Niveau diese Wahrscheinlichkeiten ggf. so aussehen:
0,08 - 0,90 - 0,02      (meiner Meinung nach eine signifikante Überlegenheit von A)
während es auf niedrigerem Niveau ggf. so aussieht
0,38 - 0,30 - 0.32      (das würde ich dann als nur leicht überlegen bezeichnen)
Elo gibt dafür dann aber dieselbe Differenz an.

Aber vielleicht wolltest du auch genau dies mit deinen Worten beschreiben?
Parent - By Frank Quisinsky Date 2022-02-15 22:35 Edited 2022-02-15 22:46
Hi Benno,

Beim Comuterschach ist es doch sehr einfach.
Wo werden die Fehler gemacht bzw. in welcher Partiephase werden die Fehler gemacht.

Da jedes Programm gleich spielt ist das sehr einfach festzustellen.
Das ist beim Menschenschach leider nicht der Fall.

Ist genau wie mit der Elo-Formel selbst.
Ultimativ anwendbar ist die nicht!

Engine A - Engine B, spielen 10.000 Partien.
Wir haben ein sehr genaues Ergebnis dieser beiden Engines im direkten Vergleich.

Ultimativer wird es:
Engine A spielt die 10.000 Partien gegen möglich viele unterschiedlich spielende Kontrahenten.
Je mehr es sind desto ultimativer ist das Gesamtergebnis anwendbar.

Und selbst wenn die 10.000 Partien gegen 20 Gegner erzeugt werden.
Tausche ich die 20 Gegner gegen 20 andere aus, schaut die Sache teils wieder anders aus.

Teils gehen die Ergebnisse trotz 10.000 krass auseinander!

Trotz dessen ja jeweils 10.000 Partien vorliegen sind die Formeln zur Berechnung zwar korrekt aber das was wir daraus sehen oder erkennen möchten ist etwas anderes!
Haben sehr viele ein echtes Problem damit. Erzeugen eine Elo zu Bedingung x und meinen diese Elo wäre auf alles andere anwendbar.

Ein Shit ist das Ergebnis für sich allein betrachtet um auf das gewünschte "Ultimative" zu kommen.

Im Computerschach sind die 3 Wahrscheinlichkeiten zu simple!
Aus den Wahrscheinlichkeiten ist nichts abzulesen was interessant sein könnte.
Wir wissen zu jeder Engine nicht mehr oder weniger als eine blanke Elo.
Keinerlei Hinweise wie diese sich zusammensetzt.

Wie im täglichen Leben:
Warum ist Person A böse auf Person B.
Warum ist Gladbach oft erfolgreich gegen München im Fussball.
Verschiedene Stärken prallen aufeinander und gehen für eine Seite überraschender Weise positiver als erwartet aus.

Müssen die 3 Wahrscheinlichkeiten, um mehr herauszufinden, also ein bissel ärgern und mehr draus basteln.
Gibt ferner ganz andere Möglichkeiten als mit diesen 3 simplen Wahrscheinlichkeiten zu arbeiten.

Im täglichen Leben ist das einfach:
Wir fragen Person B einfach.

Beim Computerschach müssen wir uns schon ein wenig anstrengen, weil die Engines wollen ja nicht mit uns quatschen.
Wäre besser wenn die es könnten (wird auch irgendwann kommen).

Schaut der Programmierer blöd wenn nach einen Compile die Engine plötzlich sagt:
Sag mal willst Du mich verarschen?
Soll ich schon wieder unnötig Punkte verlieren weil mir Wissen zum Läuferpaar fehlt.

Viele Grüße
Frank
Parent - - By Frank Quisinsky Date 2022-02-15 21:44
Hallo Dieter,

sehr schön!

Aber die Komponente "Zugzahl bis zur Entscheidung" fehlt.
Wirklich extrem wichtig.

Spielstärke bei Menschen und Computerprogrammen kann nicht genau verglichen werden, da die Spielstärke der Computerprogramme bei weniger Figuren auf dem Brett im Verhältnis zu Menschen deutlicher zunimmt. So entstehen sowohl bei den Menschen als auch bei den Programmen unterschiedliche Spieleigenschafften, die Spielstile geschimpft werden könnten. Der Mix aus besonderen Stärken und Schwächen.

Vergleichen wir also nach Zügen, so stellen wir fest, das viele Programme im Endspiel durchaus auf einem Level liegen obwohl die Gesamtspielstärke unterschiedlich hoch ist.

Von hinten- nach vorne betrachtet wird es stets mit mehr Figuren auf dem Brett interessanter.

Anders:
Nehmen wir die TOP-10 der Engines.
Schieben die Partien mit weniger Figuren auf dem Brett (bei vorher ausgeglichenen Stellungen) in die Kategorie Endspiel und betrachten die Remisquoten bei Anzahl der Züge bis zur Entscheidung. Extrem deutlich seltener werden Partien noch entschieden. Können wir auch nach den Eröffnungszügen tun bei sehr vielen Figuren auf dem Brett ... vergleichen und sehen die Remisquoten sind sehr hoch.

Letztendlich interessant sind die Partien von Zugnummer ca. 50 - 90. Entscheiden sich Partien vor Zugnummer 50 sind das meist Blunder. Viele Engines in den TOP-50 sind sehr anfällig für solche Fehler bei vielen Figuren auf dem Brett (Rybka ist das beste Beispiel).

Alles andere könnte man für Statistiken zu diesem Thema wegschneiden.
Selbst bei Engines, die bei 3300 Elo im Durchschnitt liegen, ist die Remisquote nun 80% (Partieentscheidungen die sich zwischen Zugnummer 50 - 90 gebildet haben).
Spielstärke entwickelt sich also auf dem heutigen Niveau rückwärts betrachtet mit immer mehr Figuren auf dem Brett. Bei wenig Figuren auf dem Brett sind wir im Grunde genommen durch!

Zum Beispiel eine Stärke von Wasp (viele Figuren auf dem Brett).
Mache hierzu gerne immer wieder Statistiken, weil Wasp bei vielen Figuren stärker spielt als bei weniger Figuren (Gesamtspielstärke ins Verhältnis gesetzt). Im Computerschach eher eine seltene Konstellation, nicht beim "Menschenschach". Würde Wasp mit derzeit 3200 Elo Wettkämpfe spielen gegen Engines mit ca. 3300 Elo, wir diese Wettkämpfe nach Zugnummer 75 abbrechen würden, würden wir denken Wasp hätte auch 3300 Elo, weil die Ergebnisse zu fast allen Engines, die dort stehen, gleich sind. Wenige Ausnahmen wie z. B. Revenge. Revenge erzeugt Spielstärke im Verhältnis zu anderen Engines die bei 3350 Elo liegen z. B. nach Zügezahl gesehen eher. Also vergleichbar wie Wasp auf höherem Niveau der Gesamtspielstärke.

Wenn also alle Engines grundsätzlich alles gleich machen würden, steigen dadurch natürlich auch die Remisquoten an.
Das dürfen wir beim Computerschach bei aller Liebe nicht vergessen!!

Interessant ist für mich ist eher die Frage:
Zügedurchschnitt der 1:0 Partien !!
Daraus läßt sich mehr ablesen.

Je stärker eine Engine desto geringer sollte der Zügedurchschnitt der 1:0 Partien sein.
Dem ist auch so wenn ich auf die Statistiken aller Engines schaue aber es gibt Engines die passen sich dem nicht an.
Kovisito erzeugt aufgrund der extrem hohen Spielstärke z. B. einen zu hohen Zügedurchschnitt bei 1:0 Partien.
Wasp z. B. einen viel zu niedrigeren Zügedurchschnitt bei den 1:0 Partien.

Bei den ganzen Betrachtungen zu den Remisquoten sollte also immer der Zügedurchschnitt beachtet werden.
Das macht die Sache komplizierter aber auch wesentlich interessanter.

Wäre also Wasp auf dem Level von Koivisto und würde einfach nur die Stärke halten wäre die Remisquote niedriger als statistisch zu erwaren wäre.
Warum: Die Engines sind zu verschieden!

Würde Koivisto nun bei ca. gleicher Spielstärke mit Berserk verglichen ...
Es würde Remise hageln ... die Engines sind sich sehr gleich und genau in diesem Fall steigt auch der Zügedurchschnitt an.

Viele Grüße
Frank
Parent - - By Frank Quisinsky Date 2022-02-15 21:56 Edited 2022-02-15 22:14
Also ich betrachte anders:

Nehmen wir an:
"User xyz der Wahnsinn" läßt 1000x Dragon by Komodo gegen Stockfish spielen.
Dann 1000x Dragon by Komodo gegen Lc0 ...
Und folglich 1000x Stockfish gegen Lc0 ...
Also die TOP-3 gegeinander!

Interessiert mich die Remisquote doch nicht mehr.
Spielstärke zu hoch!

Mich interessiert dann nur noch folgendes:

Wie hoch ist der erzeugte Zügedruchschnitt bei den jeweiligen Matches!
Wie hoch ist der Zügedurchschnitt der erzeugten 1:0 Partien!
Wie hoch ist der Zügedurchschnitt in den drei Partiephasen.
Und wie hoch ist der Zügedurchschnitt der 1:0 Partien zu den drei Partiephasen.

Zügedurchschnitt ist ab einer gewissen Spielstärke interessanter als "Remisquote".
Viel mehr ist zu erkennen!

Das Problem ist nur ...
Werden die Partien durch Aufgabefaktor abgebrochen, machen wir uns das Leben im Computerschach wieder selbst schwerer.
Wir erzeugen etwas, bei dem solche Statistiken schwieriger anwendbar sind und bleiben so unwissend wie wir es vorher schon waren.

Schlussfolgerung wäre:
Wir nehmen die maximal mögliche menschliche Spielstärke von ca. 2900 Elo.
Bringen die stärksten Engines auf genau dieses Niveau und simulieren den Spielstil der stärksten Menschen.
Das reizt enorm!!!!

Remisquote wäre in diesem Fall bei ca. 60%
Mein Thema ... Wasp ist auf der DGT-Pi genau dort angekommen und aufgrund menschlicher Statistiken zum Thema Spielstile bei geringer Remisquoten macht es Sinn genau das zu tun.
Der ideale Schachcomputer was born ... fun pur.
Königsangriffsdramen spielen sich ab, niedrige Remisquoten für 2900 Elo.

Das ist genau das wo ich die Zukunft im Computerschach sehe!
Wir spielen mit der Spielstärke und erzeugen genau das was wir alle am liebsten sehen möchten!

Es macht mehr Sinn dann folgendes zu tun:

Die TOP-3 haben die Begrenzung 2900 Elo.
Nun, wie aggressiv im Verhältnis zu Menschen gehen die Programme vor. Wir haben plötzlich mehr Möglichkeiten zu simulieren vielleicht mit KI zu beeinflussen.

Und plötzlich hätten wir 60 Programme die ja schon bei 2900 Elo stehen!!
Solche Turniere, solche Programme mit Spielstärkebegrenzung sind dann deutlich interessanter als Eng-Eng Turniere wo verschiedene Engines bei 3500 Elo stehen.
Zusehen macht mehr Spaß und das Thema Remisquote ist keines mehr.


Der Mensch ist nicht dem Computer unterlegen nur weil er eine niedrigere Spielstärke hat.
Der Mensch ist dem Computer überlegen wenn er die höhere Spielstärke der Computer für seine Zwecke entsprechend ausnutzt.


Offenbar sind wir da aber noch nicht angekommen!
Werden wir aber ... dauert nicht mehr lange bis es Klick macht.
Parent - - By Reinhold Stibi Date 2022-02-15 23:23
Hallo Frank,
von Dir: Der Mensch ist dem Computer überlegen wenn er die höhere Spielstärke der Computer für seine Zwecke entsprechend ausnutzt.

Nein Frank, der Mensch ist dazu geistig gar nicht in der Lage; da ist sogar jeder Schachweltmeister überfordert.

Grüße
Reinhold
Parent - By Frank Quisinsky Date 2022-02-16 06:17
Hi Reinhold,

meinte das sinnbildlich!

Wir wären der künstlichen Intelligenz eher überlegen, wenn wir dazu im Stande wären die Erkenntnisse zu unserem Gunsten zu nutzen bzw. umzusetzen.
Das findet derzeit nicht gebührend genug statt. Sehe darin aber Wege Computerschach interessanter zu gestalten.

Viele Grüße
Frank
Parent - - By Dieter Brandhorst Date 2022-02-15 23:59
Zitat:
Der Mensch ist nicht dem Computer unterlegen nur weil er eine niedrigere Spielstärke hat.
Der Mensch ist dem Computer überlegen wenn er die höhere Spielstärke der Computer für seine Zwecke entsprechend ausnutzt.


Hallo Frank,

da bin ich ganz deiner Meinung. Ich trete im Gewichtheben ja auch nicht gegen einen Baukran an, sondern nutze ihn bei Bedarf für mich und in meinem Sinne.

Zitat:
Mich interessiert dann nur noch folgendes:

Wie hoch ist der erzeugte Zügedruchschnitt bei den jeweiligen Matches!
Wie hoch ist der Zügedurchschnitt der erzeugten 1:0 Partien!
Wie hoch ist der Zügedurchschnitt in den drei Partiephasen.
Und wie hoch ist der Zügedurchschnitt der 1:0 Partien zu den drei Partiephasen.

Zügedurchschnitt ist ab einer gewissen Spielstärke interessanter als "Remisquote".
Viel mehr ist zu erkennen!


Das was den Zügedurchschnitt und die Bewertung der Spielstärke betrifft, stimme ich dir insbesondere bei den Engines auf hohem Niveau zu. Wenn ich dich richtig verstanden habe, bedeutet das ja nichts anderes, als die Spielstärke primär nach den Mittelspielfähigkeiten mit möglichst vielen Figuren auf dem Brett zu beurteilen. Dem stimme ich zu, denn das ist sicherlich die komplexeste Spielphase und wenn man Engines auf hohem Niveau vergleichen will, ist das ein guter Weg. Bei Menschen sieht das etwas anders aus. Als Mensch findet man wesentlich mehr "gleichstarke" Gegner mit den unterschiedlichsten Spielfähigkeiten und das noch in unterschiedlichen Tagesformen. Da sollte die Erfolgsquote (Elozahl) im Mittel noch ein ausreichendes bis gutes Maß für die Spielstärke sein.
Obwohl, sehr interessant und noch wenig bekannt ist für die Beurteilung menschlicher Spielstärke das Tool centipawn-Analyse in Chessbase 16. Man kann in kurzer Zeit viele Partien eines Spielers analysieren indem zu jedem(!) ausgeführten Zug des Spielers die Differenz zur Eval der Engine, also zB Stockfish, gebildet und festgehalten wird. Bei 30 Partien hat man so schnell mal 1000 Züge beurteilt und erhält anschl. als Ergebnis eine mittlere Abweichung von Centipawns im Vergleich zur Bewertung der Engine. Habe so mal die Spielstärke aller Weltmeister aus ihren WM-Matches verglichen. Da kann man auch mal Steinitz mit Carlsen vergleichen usw. Übrigens hat Carlsen mit durchnittlich 0,11 Cp die geringste Abweichung aller WM von Stockfish. Ein Hinweis, das er wirklich der beste Schachspieler aller Zeiten ist. Gäbe es die ultimative (fast) fehlerfreie Engine, könnte man das im Computerschach auch so für die Bewertung der anderen Engines betreiben. 

Viele Grüße

Dieter
Parent - By Reinhold Stibi Date 2022-02-16 00:13 Edited 2022-02-16 00:29
Der Vergleich mit dem Baukran passt überhaupt nicht. Baukran ist körperlich, Schach ist geistig.

Wie soll denn der Mensch die höhere Spielstärke der Computer denn für seine Zwecke nutzen, wenn er dazu geistig
nicht in der Lage ist; das geht nur im geringen Ausmaß.

Tatsache ist, dass der Mensch mit Schach überfordert ist und niemals ca. 3000 Elo erreichen wird, geschweige
denn 3500 Elo wie die heutigen Spitzenprogramme.

Der Satz: Der Mensch ist dem Computer überlegen wenn er die höhere Spielstärke der Computer für seine Zwecke entsprechend ausnutzt
               ist reines Wunschdenken und hat mit der Realität nichts zu tun.

Gerade im Schach, wird der Mensch durch die Computerschachprogramme seine Unvollkommenheit vorgeführt.
Parent - - By Walter Eigenmann Date 2022-02-16 00:26
Dieter Brandhorst schrieb:
Habe so mal die Spielstärke aller Weltmeister aus ihren WM-Matches verglichen. [..] Übrigens hat Carlsen mit durchnittlich 0,11 Cp die geringste Abweichung aller WM von Stockfish.
Interessant (auch wenn noch Detail-Fragen zu klären wären; Z.B. ob auch die theoretischen Eröffnungszüge in die "Statistik" eingehen? Oder ob diese Centipawn-Berechnungen forward oder backward gewonnen wurden?).

Wie sieht denn deine diesbezügliche Rangliste der Weltmeister aus?

Gruss: Walter

.
Parent - - By Frank Quisinsky Date 2022-02-16 10:15
Habe das selbst seinerzeit mit Partien der besten 100 Spieler untereinander gemacht. Dann 30 ausgewählt und durch analysieren lassen. Züge 25 bis 50 der Partien. Die schlechtesten 10 und besten 5 Partie Ergebnisse wegfallen lassen. Also nur 25 Züge Mal 15 Partien für die Betrachtung genommen. Die Analysen machte ich mit Slow, Stockfish, Wasp und Pedone. Revenge gab es da noch nicht.

Sehr subjektiv, weil ich natürlich nicht wusste wirklich die besten Partien erwischt zu haben. Habe mich da an Meinungen aus Schachbücher orientiert.

Bei mir war So auf Platz 1. Aber nur sehr knapp vor Carlsen und der auch nur sehr knapp vor Kasparow und Ivantchuk. Im Grunde waren die 4 fast gleich auf. Der Abstand zu Platz 5 war dann größer.

Werde das Mal wiederholen mit den besten Angreifern wie Shirov, Christiansen, Larsen etc.

Interessantes Thema.
Parent - - By Walter Eigenmann Date 2022-02-16 11:43
Ja, finde ich auch.
Denn obwohl Mensch und Computer ja völlig konträre "Denkansätze" haben, sind solche Schnittmengen - wie z.B. die Frage, welcher Grossmeister besonders affin ist mit welcher Engine? - aufschlussreich und auch amüsant.

Ein Test-Set, um das zu eruieren, müsste m.E. allerdings einige Basics enthalten:

- Mind. 50 Gewinn-/Verlust-/Remis-Partien des betr. GM gegen gleichwertige Gegner

- Es ist eine möglichst grosse Human-Play-Datenbank (mit Classic-Turnier-BZ) heranzuziehen; ausgewertet werden dann nur die Partiezüge ab der Neuerung des betr. GM. Damit die "tatsächliche Denkleistung" des Spielers in die Auswertung einfliesst.

- Die Analyse durch die betr. Engine müsste forward geschehen (um wenigstens annähernd die Partie-Situation zu simulieren).

- Keine Eröffnungsbücher während der Engine-Analyse (wohl aber 5-7-men-Endgames)

- Pro getesteter Zug eine Engine-BZ von mind. einer halben Minute auf durchschnittlicher Hardware

Das Ganze hat ja quasi einen historischen Background: Weltmeister Capablanca nannten seine damaligen Kontrahenten "Die Schachmaschine", ob seiner hohen Präzision und seiner makellosen Technik (im Gegensatz zur genialen Kreativität seines ewigen Rivalen Aljechin).

Später kam dann das Gegensatz-Paar Botwinnik (der "Wissenschaftlicher") vs Tal (der "Magier") in die Arena.

Und heute? Wahrscheinlich könnte man Carlsen als den Capablanca des 21. Jh. titulieren. (Vor allem seine Endspiel-Behandlung ist jetzt schon legendär).

Im Computerschach kann man nostalgisch werden und an den wunderbaren "Chessmaster" erinnern, mit seinen vielen "Personality's"...

Gruss: Walter

.
Parent - By Frank Quisinsky Date 2022-02-16 11:54
Walter, wir sprechen die gleiche Sprache. Sehr gute Ansätze von Dir.

Das Problem ist immer das stille Kämmerlein. Viele gute Ansätze aber wir vergolden wichtige Zeit, weil dann doch wieder zu viel für die Tonne ist.

80% der Statistik Arbeiten waren bei mir nicht gut. Oder ich bin mir unsicher. Nun, eine einfache Lösung ist nur das zu machen was gut zu sein scheint. Sich mehr erfreuen an dem was Spass macht. Dieses Hobby ist zu umfangreich mit den Möglichkeiten die wir haben.

Hast eine sehr informative Webseite, Glückwunsch. Finde da oft etwas wenn ich suche. Klüger durch Schach Hinweise von der gelesen, Sehr gut was Du geschrieben hast. Wollte die Tage etwas nachlesen und suchte nach Meinungen Anderer.
Parent - - By Dieter Brandhorst Date 2022-02-16 20:27 Upvotes 1
Hallo Walter,

natürlich ist mir die Unvollkommenheit des Zentibauerntests bewusst, aber auch Elozahlen, Stellungstests etc. haben ihre Haken und Ösen. Meine Devise ist immer , das eine schließt das andere ja nicht aus, sondern im Idealfall ergänzen sich die unterschiedlichen Herangehensweisen.
Die Zentibauernanalyse misst, wie schon erwähnt, zu jedem Zug einer Partie die Abweichung der Bewertung zum besten gefundenen Enginezug in der Einheit Zentibauern.  Aus allen untersuchten Zügen eines Spielers wird die mittlere Abweichung zum besten Enginezug gebildet. Es ist eine backward-Analyse incl. aller Eröffnungszüge.
Hier nun die Rangliste alter und neuer Weltmeister, die ich so mal spaßeshalber erzeugt habe. Ausgewertet wurden nur Partien aus Zweikämpfen zwischen Herausforderern und amtierenden Weltmeistern. Die PCA-WM-Kämpfe sind nicht enthalten und auch nicht die WMs in Turnierform von 1948 und 2007.

Engine: Stockfish 290122,hash 4096Mb, AMD Threadripper 1950X (16cores,32 threads), 4 GHZ
Bedenkzeit: 1s/Zug, TB 6-Steiner

Nr  WM oder Herausforderer  Zentibauerndifferenz    Anmerkung
1   Carlsen                 13                      WM seit 2013
2   Karjakin                13 
3   Caruana                 15 
4   Anand                   21                      WM 2007-2013
5   Kramnik                 23                      WM 2000/2006–2007
6   Leko                    24 
7   Gelfand                 25 
8   Nepomniachtchi          26 
9   Petrosian               26                      WM 1963-1969
10  Fischer                 26                      WM 1972-1975
11  Kasparov                26                      WM  1985-1993/2000
12  Topalov                 27 
13  Karpov                  27                      WM 1975-1985
14  Capablanca Jose Raul    28                      WM 1921-1927
15  Schlechter Carl         29 
16  Alekhine Alexander      29                      WM 1927-1935,1937-1946
17  Tal                     30                      WM 1960-1961
18  Smyslov                 31                      WM 1957-1958
19  Bronstein               33 
20  Botvinnik               33                      WM1948-1957,1958-1950,1961-1963
21  Spassky                 34                      WM 1969-1972
22  Short                   35 
23  Lasker Emanuel          38                      WM 1894-1921
24  Euwe Max                42                      WM 1935-1937
25  Janowski                44 
26  Steinitz William        46                      WM 1886-1894
27  Bogoljubow Efim         50 
28  Marshall Frank James    55 
29  Gunsberg Isidor         58 
30  Zukertort               62 
31  Tarrasch Siegbert       63 
32  Chigorin Mikhail        67 


Der Reiz bestand bei mir darin, einmal die Spielstärke alter und neuer Weltmeister annähernd zu vergleichen, indem man ihre Züge zu einer
Superengine in Relation setzt. Außerdem kann man davon ausgehen, das in einem WM-Kampf jeder der Spieler optimal motiviert und vorbereitet ist.

VG Dieter
Parent - - By Walter Eigenmann Date 2022-02-16 23:36 Upvotes 1
Eine durchaus interessante Liste - besten Dank für die Arbeit damit.

(Botwinnik so weit hinten hätte ich jetzt allerdings nicht erwartet...

Bei anderen Partien und anderen Engines und anderer BZ käme wohl eine komplett andere Rangierung heraus - aber was soll's!
Eine amüsante Spielerei mit Unterhaltungswert

PS: Die neuesten drei Fritzen haben ein verwandtes Feature:
Lässt man eine Partie "vollanalysieren", wird zum Schluss eine Gesamt-Auswertung der Übereinstimmung aller Züge
beider Gegner mit der Engine ausgewiesen - ein sog. "Gewichteter Fehlerwert".



Carlsen hat hier fast immer einen deutlich tieferen als seine jeweiligen Gegner - also volle Übereinstimmung mit deinem Platz Eins

Gruss: Walter

.
Parent - By Dieter Brandhorst Date 2022-02-17 12:38
Zitat:
Bei anderen Partien und anderen Engines und anderer BZ käme wohl eine komplett andere Rangierung heraus - aber was soll's


Ja, genau diese Frage stellt sich. Ich werde die Liste jedenfalls noch einmal unter den gleichen Bedingungen mit Lc0 und Dragon 2.6 erstellen. Mal sehen ob und welche nennenswerten Unterschiede (evtl. gehts dann ja mit Botwinnik noch bergauf ) sich ergeben werden.

VG Dieter
Parent - - By Frank Quisinsky Date 2022-02-16 06:29 Edited 2022-02-16 06:50
Hallo Dieter,

genau, im Menschenschach schaut es anderes aus.
Sehe das auch so!

Aber im Computerschach hätten wir alle Möglichkeiten uns auszutoben.

Die Centipawn Analyse von Chessbase habe ich mir nicht angesehen.
In Chessbase sind oft gute Ideen drin bei der es aber an der Umsetzung hapert (taktische Analyse als Beispiel).
Oftmals so halb gewollt aber nicht gekonnt. Der Grund warum ich in dieser Richtung gar nicht mehr genau hinschaue.
Bastle mir da lieber meine eigenen Statistiken zusammen! Die taktische Analyse wurde auch schon öfters geändert, mal mehr oder weniger besser.

Nun gut, muss mir das wirklich mal anschauen!

Habe ich übrigens auch schon gemacht.
Spielstärke der Weltmeister verglichen, habe auch einige "Nicht-Weltmeister hinzugenommen".
Also die 16 und 32 bekannte sehr starke Spieler aus der Historie hinzugeholt.

Genau zu dem Punkt "Mittelspiel".
Weil im Endspiel ist es wie mit den Engines.
Die Weltmeister waren da alle besser zu ihrer Zeit (vielleicht nicht unbedingt Tal oder Euwe).
Vielleicht der Hauptgrund warum sie Weltmeister waren. Kasparow und Carlsen sind wirklich Ausnahmen.
Die spielen / spielten alles auf einem sehr hohen Niveau.

Problematisch hier ist immer die wirklich besten Partien der Weltmeister herauszupicken.
Fast unmöglich. Selbst in Schachbüchern sind nicht unbedingt die besten Partien der Weltmeister vereint zu finden.

Bei Iwantschuk war es einfacher für mich weil mein Lieblingsspieler, daher lag Iwantschuk auch sehr hoch bei meiner Betrachtung.
Das NEW IN CHESS Buch über Ivantschuk macht es einfach, hier finden sich meines Erachtens wirklich viele seiner besten Partien.
GM Marin könnte es, wenn ich an sein Buch "Old Wine in New Bottles" denke. Der könnte die besten 25 Partien der besten Schachspieler
zusammentragen. GM Marin ist der Wahnsinn ... seine Schachbücher sind sagenhaft gut.

1. So
2. Carlsen
3. Kasparow
4. Ivantschuk
5. Capablanca (für mich sehr überraschend)

Waren die TOP-5!

Fischer z. B. war weit weg von den TOP-20.
Bronstein oder Keres waren sehr weit oben, müsste das mal raussuchen.
Auch Tal lag sehr gut im Rennen!!
Nach Capablanca folgen viele der Weltmeister mit fast gleicher Spielstärke: Aljechin, Karpow z. B. waren fast gleich auf und auch unter den TOP-10.

Viele Grüße
Frank

So und Carlsen würde ich gerne bei einem WM-Match sehen.
Ivantschuk gegen Kaspraow hätte ich seinerzeit gerne gesehen aber auch nur wenn Ivantschuk in Hochform war (das war bei ihm immer so eine Sache, er spielte nicht konstant stark genug).
Für mich dennoch der genialste Spieler aller Zeiten!!
Parent - By Max Siegfried Date 2022-02-16 12:49
Wartet mal ab bis die 8-Steiner Syzygy Tablebases erscheinen.
Das dauert bestimmt nicht mehr lange.
Ausreichend große SSDs gibt auch. Man muss nur mehrere davon kaufen. Wobei sich auch da die Kapazität und die Geschwindigkeit verdoppeln wird (16 TB pro SSD).
Die Remisquote dürfte nochmals deutlich ansteigen.
Parent - By Dieter Brandhorst Date 2022-02-16 20:46
Hallo Frank,
Zitat:
Aber im Computerschach hätten wir alle Möglichkeiten uns auszutoben.

Wir sind ja dabei.
Zitat:
Problematisch hier ist immer die wirklich besten Partien der Weltmeister herauszupicken.
Fast unmöglich. Selbst in Schachbüchern sind nicht unbedingt die besten Partien der Weltmeister vereint zu finden.


Deshalb habe ich ja die WM-Kämpfe zum Vergleich genommen. Alle Spieler haben sich optimal vorbereitet und geben alles um den Titel zu erhalten.
Zitat:
Fischer z. B. war weit weg von den TOP-20.
Bronstein oder Keres waren sehr weit oben, müsste das mal raussuchen.
Auch Tal lag sehr gut im Rennen!!
Nach Capablanca folgen viele der Weltmeister mit fast gleicher Spielstärke: Aljechin, Karpow z. B. waren fast gleich auf und auch unter den TOP-10.Fischer z. B. war weit weg von den TOP-20.
Bronstein oder Keres waren sehr weit oben, müsste das mal raussuchen.
Auch Tal lag sehr gut im Rennen!!
Nach Capablanca folgen viele der Weltmeister mit fast gleicher Spielstärke: Aljechin, Karpow z. B. waren fast gleich auf und auch unter den TOP-10.

Sieht in meiner "Zentibauernliste" recht ähnlich aus (s.o. Antwort an Walter Eigenmann).

VG Dieter
Parent - - By Stefan Kleinert Date 2022-02-16 13:16
Frank Quisinsky schrieb:

Also ich betrachte anders:

Nehmen wir an:
"User xyz der Wahnsinn" läßt 1000x Dragon by Komodo gegen Stockfish spielen.
Dann 1000x Dragon by Komodo gegen Lc0 ...
Und folglich 1000x Stockfish gegen Lc0 ...
Also die TOP-3 gegeinander!

Interessiert mich die Remisquote doch nicht mehr.
Spielstärke zu hoch!

Mich interessiert dann nur noch folgendes:

Wie hoch ist der erzeugte Zügedruchschnitt bei den jeweiligen Matches!
Wie hoch ist der Zügedurchschnitt der erzeugten 1:0 Partien!
Wie hoch ist der Zügedurchschnitt in den drei Partiephasen.
Und wie hoch ist der Zügedurchschnitt der 1:0 Partien zu den drei Partiephasen.

Zügedurchschnitt ist ab einer gewissen Spielstärke interessanter als "Remisquote".
Viel mehr ist zu erkennen!

Das Problem ist nur ...
Werden die Partien durch Aufgabefaktor abgebrochen, machen wir uns das Leben im Computerschach wieder selbst schwerer.
Wir erzeugen etwas, bei dem solche Statistiken schwieriger anwendbar sind und bleiben so unwissend wie wir es vorher schon waren.

Schlussfolgerung wäre:
Wir nehmen die maximal mögliche menschliche Spielstärke von ca. 2900 Elo.
Bringen die stärksten Engines auf genau dieses Niveau und simulieren den Spielstil der stärksten Menschen.
Das reizt enorm!!!!

Remisquote wäre in diesem Fall bei ca. 60%
Mein Thema ... Wasp ist auf der DGT-Pi genau dort angekommen und aufgrund menschlicher Statistiken zum Thema Spielstile bei geringer Remisquoten macht es Sinn genau das zu tun.
Der ideale Schachcomputer was born ... fun pur.
Königsangriffsdramen spielen sich ab, niedrige Remisquoten für 2900 Elo.

Das ist genau das wo ich die Zukunft im Computerschach sehe!
Wir spielen mit der Spielstärke und erzeugen genau das was wir alle am liebsten sehen möchten!

Es macht mehr Sinn dann folgendes zu tun:

Die TOP-3 haben die Begrenzung 2900 Elo.
Nun, wie aggressiv im Verhältnis zu Menschen gehen die Programme vor. Wir haben plötzlich mehr Möglichkeiten zu simulieren vielleicht mit KI zu beeinflussen.

Und plötzlich hätten wir 60 Programme die ja schon bei 2900 Elo stehen!!
Solche Turniere, solche Programme mit Spielstärkebegrenzung sind dann deutlich interessanter als Eng-Eng Turniere wo verschiedene Engines bei 3500 Elo stehen.
Zusehen macht mehr Spaß und das Thema Remisquote ist keines mehr.


Der Mensch ist nicht dem Computer unterlegen nur weil er eine niedrigere Spielstärke hat.
Der Mensch ist dem Computer überlegen wenn er die höhere Spielstärke der Computer für seine Zwecke entsprechend ausnutzt.


Offenbar sind wir da aber noch nicht angekommen!
Werden wir aber ... dauert nicht mehr lange bis es Klick macht.


Wie kann denn ein Mensch dem Computer überlegen sein, wenn dieser nicht mehr verliert?  Beim letzten Freestyle Turnier wurden nur Partien durch das Eingreifen des Menschen verloren !
Parent - - By Frank Quisinsky Date 2022-02-16 21:00
Hi Stefan,

wie gesagt, war sinnbildlich gemeint.
Ganz sicher werden wir Erkenntnisse, die durch KI kommen, mit den Jahren viel besser nutzen und umsetzen als heute.
Gelingt das verbleibt für den Computer der Status "Sklave".

Interessante Ansätze was noch alles möglich ist gibt es reichlich!
Bin da wirklich sehr auf _unsere_ Entwickler gespannt.

Viele Grüße
Frank

PS: Aber die Erkenntnisse durch das letzte Frystyle Turnier sind gut.
Genau das animiert Leistungen zu verbessern, wie auch immer das überhaupt möglich sein soll.
Parent - - By Lothar Jung Date 2022-02-16 21:19
Hallo Frank,

Du erinnerst dich bestimmt an die Schach Scene in dem Film „Odyssey 2001“ mit dem Computer HAL (right Shift IBM).
Ein raspi oder weniger mit Sprachausgabe mit dem Vorlesen der Analyse würde das bringen und noch mehr.

Wir sind jetzt weiter, viel viel weiter.

Auch Lc0 ist erst der Anfang.
4 Stunden Rechenzeit bei Google, um die erste Version zu veröffentlichen.
Dann noch Shogi und Go.

Normale Intelligenz Grüße

Lothar
Up Topic Hauptforen / CSS-Forum / Wie hängen Remishäufigkeit und Spielstärke zusammen?

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill