Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Die TOP-20 sind unglaublich stark geworden ...
- - By Frank Quisinsky Date 2021-11-22 19:35 Edited 2021-11-22 19:39
Hallo zusammen,

wenn man davon ausgeht, dass sicherlich auch bald ein Booot mit einer NN um die Ecke kommt.
Ein rofChade NN spielt in meinem Turnier (erste NN Version) und auch andere Programmierer derzeit sehr fleißig sind ...
passiert folgendes:

Wenn Shredder 13 bei 3125 Elo liegt werden sehr bald nur noch Programme in den TOP-20 sein, die über 3200 Elo liegen.

Für John Stanback (Wasp) ist es unglaublich schwierig geworden überhaupt den Anschluss zu halten.
Beim letzten FCP Turnier noch auf Platz 21 mit ca. 3070 Elo. Nun zwar ein Kampf um Platz 17 mit ca. 3150 Elo oder mehr (CEGT Ergebnisse lassen aufhorchen)
aber im Grunde bildet sich so langsam eine Zwei-Klassengesellschaft der TOP-41. Die Programme, die in der Spielstärke mit weit über 3200 davon
rasen und andere, die zwar auch mit 3100 Elo unglaublich stark sind aber in einer Kreuztabelle aller dann doch schwach aussehen (was natürlich nicht der Fall ist).

Wasp klettert und klettert, langsam aber betändig und hält den wundschönen Spielstil trotz so starker Konkurrenz.
Das freut mich sehr!

Schrieb es schon in einem anderen Thread.
Der Durchschnitt der TOP-41 ist in den letzten 10,5 Monaten um sehr wahrscheinlich über 80 Elo angestiegen.
Wahrscheinlich eher 90 Elo (benötige selbst mehr Partien für eine genauere Aussage).

Nun startet morgen die Weltmeisterschaft.
Natürlich werde ich die Partien nachspielen und natürlich ist Menschenschach für mich nach wie vor ultra spannend.

Auch wenn hier 32 Matches gleichzeitig laufen, bei dem 41 Engines im Durchschnitt 300 Elo stärker sind als Magnus Carlsen.

Schaue ich in die laufenden Matches, bin ich beim Computerschach sehr oft total überfordert.
Gerade wenn ich sehe was beim Übergang zum Endspiel abgeht.

Das bin ich aber auch wenn ich Partien von Magnus nachspiele.

Wie einfach doch die TOP-Programme kleine Vorteile zu riesigen Angriffen ausbauen.
Das sieht alles so einfach aus aber so viele Züge die ich nie und nimmer auf den Plan gehabt hätte.

Beim Menschenschach ist ja immer die Hoffnung da, dass auch ein Super-GM den besten Zug übersieht.

Macht einfach Spaß die aktuellen Entwicklungen im Computerschach zu verfolgen!
Und nach wie vor Spaß den Großmeistern zu folgen!

Spannende Tage rund um die WM und nach wie vor auch im Computerschach!!

Viele Grüße
Frank
Parent - - By Andreas Mader Date 2021-11-22 20:26
Die Engines mit Magnus Carlsen zu vergleichen geht in dieser Form nicht. Die ELO-Bewertung von Carlsen basiert ausschließlich auf Partien in Turnier-Länge, während bei den Engines hauptsächlich eine Bullet-Partie nach der anderen rausgeschossen wird und ich mich nicht erinnern kann, wann ich auf einer offiziellen Seite zuletzt eine Engine-Partie mit 40/120 und 20/60 gesehen habe. Ich verstehe eh nicht, warum Partien mit vernünftiger Bedenkzeit wie derzeit auf TCEC zusammen mit allen anderen gewertet werden und dann großes Erstaunen darüber herrscht, dass sie sich nicht vollkommen an die durch ELO streng vorgegebene Reihenfolge halten.

Ich behaupte mal, dass Engines mit etwa 3 Minuten pro Zug Bedenkzeit anders spielen als mit 1 Sekunde.
Parent - - By Frank Quisinsky Date 2021-11-22 20:42 Edited 2021-11-22 20:48
Hi Andreas,

Elos fallen im Computerschach bei längeren Bedenkzeiten im Vergleich zum Menschenschach.

Lasse derzeit selbst mit 40 in 20 spielen (darauf beruhen meine Aussagen eigentlich, also auf mittlere Bedenkzeiten).
Da dauert eine Partie ca. 1:20 Stunden ohne Aufgabefaktor mit 5-Steinern und nur einen Core (4.4Ghz).
Durchschnitt Partielänge ca. 88 Züge.

Können aber auch die Spielstärken der Menschen im Blitz etc. mit Turnier vergleichen.
Sehen dann, dass die Unterschiede nicht sehr groß sind.

Deine Behauptung kann ich nachvollziehen und schließe mich dem an.

Mache viele Auswertungen zu einer riesigen Datenbank, die ich von Menschen-Comp Partien habe.
Werde da ständig versorgt mit interessanten neuen Partien (von sehr starken Spielern die mich dann wieder befragen wo welche Programme realistisch einzustufen sind),
kann die Datenbank (pflege ich seit mehr als 30 Jahren) leider nicht veröffentlichen.

Also, die 300 Elo mehr beziehen sich auf mittlere Bedenkzeiten.
Auch die Menschenpartien, die ich habe, sind meist Schnellschachpartien oder maximal eine Stunde pro Partie.
Die 3+2 Partien habe ich noch nicht mal drin in der Datenbank.

Mit der Einschätzung bin ich mir sehr sicher, auch wenn ich selbst immer sehr kritisch bin und das kaum glauben kann.

Was wir früher unnötiger Weise nach oben gepuscht haben (wahrscheinlich aus kommerziellen Zwecken, viel zu hohe Elo-Einschätzungen) puschen wir heute eher herab, weil
uns selbst der Glaube fehlt. Wirklich realistisch war immer Günther Niggemann, auch in seinen CSS Berichten.

SSDF - 200 war ca. Niggemann's Einschätzung.
Ein schönes Beispiel der Bericht vom Saitek Blitz in der CSS oder auch überraschende Einschätzungen zu starken Novag Geräten.
Zunächst konnte ich das auch nicht glauben aber tatsächlich traf er fast immer den Nagel auf dem Kopf.

Aber auch Millennium hat kürzlich den Nagel getroffen.
Der kleine Genius mit 48Mhz wird realistisch eingeschätzt und darauf beruhend fast realistisch auch der größere Genius oder der TheKing Performance.

Sehr schwierig sich als Mensch vorzustellen, dass im Computerschach die TOP-41 im Durchschnitt 300 Elo stärker sind als der Weltmeister.
Wir können das nicht orten, weil der Weltmeister eh schon deutlich über unseren Horizont liegt.

Ein Großmeister sagte mir mal ...
Du kannst gefühlsmäßig eine Spielstärke in Elo nur selbst richtig einschätzen, wenn diese nicht ca. 300 Elo über Deine eigene liegt.
Und selbst dafür benötigst man sehr viel Gefühl und eine Mindestspielstärke von sicherlich 1900 Elo.

Spielstärke ...
Ist und bleibt schwierig!
Gerade wenn es um die des Menschen und um die der künstlichen Intelligenz geht!!

Viele Grüße
Frank
Parent - By Frank Quisinsky Date 2021-11-22 20:59 Edited 2021-11-22 21:07
Kleiner Tipp für die Interessierten.

GM Partien mit einer Engine max. 300 Elo höher bewerten lassen.
Fritz hat das mit der taktischen Analyse eine schöne Möglichkeit (zwar auch nichts 100%iges aber gut genug).

Gibt andere Möglichkeiten!

Selbst analysiere ich z. B. gerne Partien aus Schachbüchern.
Natürlich nicht mit Stockfish alleine, sondern mit Wasp in Kombination mit 3 anderen Engines (Human-Like-Style-Eingines).

Wasp 4.50 schätze ich nach diesen Analysen auch ca. 200 Elo stärker ein, als durchschnittlich die TOP-10 in der Welt.
Bei einem 5.0Ghz Core.

Interessant wird es dann, wenn z. B. ein Human-Like-Style Programm ca. bei 2800 Elo liegend mitläuft (Spark 1.0 z. B.)
ein Programm mit 3000 Elo und z. B. Stockfish der bei mittleren Bedenkzeiten ca. bei 3480 Elo liegt.
Wie gesagt, vier Programme unterschiedlicher Spielstärken mit Stärken im frühen Mittelspiel nehmen.

Nur so gelingt es mir, während der Analyse, selbst ein Gefühl für Spielstärke zu bekommen!

Und wenn man sich anschaut, was die Menschen auf höchsten Level übersehen ... wenn es "nur" nach Spark 1.0 geht (liegt bei ca. 2750)
ist das schon unglaublich ... bei meist nur sehr wenigen Zügen die Spark nicht auf der Rechnung hat und die besten Spieler der Welt
spielen aber dann auch von Wasp angezeigt werden und wenn Wasp die nicht sieht spätens die nächste Etage an TOP-Engines.

Wichtig sind wirklich Programme mit guter Königssicherheit und sehr guter Eröffnungsbehandlung, die zu dem aggressiv sind.
Sonst machen solche Analysen und Vergleiche überhaupt keinen Sinn. Geht es dann ins Endspiel sollte man die Analysen einfach
sein lassen, zu viele Fehler bei den Menschen.

Macht Spaß so zu analysieren!!
Parent - - By Benno Hartwig Date 2021-11-22 20:54 Edited 2021-11-22 20:57

> Die ELO-Bewertung von Carlsen basiert ausschließlich auf Partien in Turnier-Länge, während bei den Engines hauptsächlich eine Bullet-Partie nach der anderen rausgeschossen wird...


Ich habe den Eindruck, dass die relativen Engine-Spielstärke-Reihenfolgen schon recht gut korrelieren mit denen bei längeren Zeiten.
Dass man Blitz-Ergebnisse daher mutig zu Schätzungen bei längeren Zeiten macht, finde ich sehr ok.
Bei langen Zeiten wird im Wesentlichen nur etwas dichter zusammengerückt.

Aber ernstzunehmende Partien Mensch-Computer sind so rar und zum Großteil aus so lange her, dass der Abgleich hier sehr problematisch ist. Zumal er oft mit Engines erfolgte, die den heutigen Top-Programmen um doch mehrere hundert Elo unterlegen sind. Darum halte ich den Vergleich von Menschen- und Engine-Elowerten für problematisch. Das darf man allenfalls über einen seeehr breiten Daumen machen.
Parent - By Frank Quisinsky Date 2021-11-22 21:19 Edited 2021-11-22 21:55
Wobei bei den frühen Schachcomputer-Mensch Matches vieles überbewertet wurde.
Das war seinerzeit zu fantastisch, was der Schachcomputer schon konnte. Menschen sahen das mit zu viel Erfurcht.
Spielten zu Zeiten der Aegon Turnieren meist noch kein Anti-Computer-Schach, spielten weniger auf Angriff und das war schon fatal.

Selbst Schachcomputer mit "nur" 2.000 Elo nutzen gandenlos Fehler aus, die dann kaum noch zu kompensieren sind (wenn Schachcomputer benutzt werden die nicht so drastisch im Endspiel abfallen).
Selbst starke IMs hatten da schon Probleme!

Genius machte das früher schon sehr gut mit dem vorhandenen Endspielwissen.
Konnte so Vorteile wirklich oft über die Zeit bringen.

Dennoch, zu Zeiten der AEGON Turniere wurden die Schachcomputer deutlich zu hoch eingeschätzt.
Das relativierte sich allerdings mit den Jahren danach.

Tja, schon zu Rybka Zeiten schrieben viele in diesem Forum, dass die sagenhafte Spielstärke so schnell kein zweites Programm erreicht.
Dabei ist Rybka so anfällig für Köngisangriffe wie keine andere TOP-50 Engine. Heute wissen wird das und früher dümpelten "wir alle" dahingehend im Dunkeln.
3000 Elo war schon zu stark um richtig einschätzen.

Geht aus FCP Turnier Statistiken eindeutig hervor.
Doch, gibt noch 2 andere Engines in den TOP-50 die auch sehr anfällig für Königsangriff,e bei vielen Figuren auf dem Brett, sind.

Rybka liegt gerade noch so in den TOP-50 mit ca. 3.000 realistischen Elo.
Da ist ein aktueller Stockfish bei mittleren Bedenkezeiten schon ca. 450-500 Elo (1-Core-Vergleich) drüber.

Und die GMs schauten ehrfürchtig auf Rybka und hatten massive Probleme zu halten.

Spielstärke, zum unglaublichen Thema geworden!!

Nur mal Rybka als Beispiel hinsichtlich gut bekannten Meinungen von stärksten Großmeistern.
Da redet heute natürlich niemand mehr drüber!

Up Topic Hauptforen / CSS-Forum / Die TOP-20 sind unglaublich stark geworden ...

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill