Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / S21 - Swiss 2
1 2 Previous Next  
Parent - By Frank Quisinsky Date 2021-12-04 20:38 Edited 2021-12-04 20:42
Anderes Beispiel:

Das FEOBOS 2 Projekt steht an.
Nur diesemal 4 Züge nach ECO Code Bildung anstatt 3 Züge nach ECO-Code Bildung für ECO Codes die sich zu schnell bilden.
Die Basis sollte also von 41614 Stellungen auf ca. 100.000 Stellungen angehoben werden.

Lasse ich 10 Engines die Postionen mit 16 Cores durchrechnen oder mit einem Core und hoher Bedenkzeit.

Nehme ich 16 Cores hagelt es Bewertungen die niemand nachvollziehen kann, zumal ich die Zeit auch stark runter drehen muss.
Es werden durch das Teamwork der Engines, Stellungen automatisiert ausgesondert, die im Grunde gut und spielbar sind.

Einfacher wäre es ...
5 Minuten Bedenkzeit pro Position und ein Jahr lang einfach mal auf 16 Cores, 16 Engines die Postionen mit 5 Minuten pro Position durchrechnen lassen.
Kann gleichzeitig laufen, bzw. wird habe ich nach einem Jahr die kompletten Analysen! Zu irgend etwas muss der Ryzen 9 5950 ja auch vernünftig eingesetzt werden.

525.600.00 Minuten hat das Jahr : 5 = 105.120 Stellungen könnten 16 Engines bei einem Core und 5-Minuten analysieren.

Das bildet eine um Klassen hochwertige Gesamtanalyse als mehrere Cores pro Engine einzusetzen, weil wirklich zu 99,9% alles was in den Millionen von Excel Formeln steht reproduzierbar ist.
Kommt wieder Jon Dart um die Ecke und erzählt die Vorgabe ist schlecht. Setze ich die 10 Engine Analysen dagegen ist Ruhe im Karton.



Gruß
Frank

Und egal was ich mache ...
Mit mehreren Cores wäre das alles Zeitverschwendung, Ressourcenverschwendung etc.
Ob nun so etwas, Engine Turniere oder sonst was. Je mehr unsichere Beeinflussungsfaktoren desto schlechter wird ein Gesamtergebnis.

Und bei 16 Engines auf 16 Cores werden in der Gesamtheit deutlich mehr Stellungen analysiert als wenn bei weniger Zeit durch Mehrprozessornutzung Ressourcen verpuffen!
Parent - - By Andreas Mader Date 2021-12-04 23:01 Edited 2021-12-04 23:04 Upvotes 3
Frank Quisinsky schrieb:

statistische Aussetzer


Was soll das sein, ein "statistischer Aussetzer"? Statistik hat etwas mit Wahrscheinlichkeiten zu tun und nichts mit Aussetzern. Selbst wenn etwas ziemlich unwahrscheinlich ist, kann es passieren. Das ist dann kein Aussetzer, sondern Zufall. Oder die Statistik ist falsch, auf der das alles beruht.

Ich habe das Gefühl, dass jedes Ergebnis bemängelt wird, das nicht exakt den theoretischen Vorhersagen bzw. den höchsten Wahrscheinlichkeiten entspricht. Ist das nicht so, muss irgendein Fehler passiert sein, ein Bug aufgetreten sein oder irgendjemand muss Mist gebaut haben. Nein, eben nicht. Zufälle passieren. Auch im Computerschach. Schon alleine wie eine Hashtabelle gefüllt ist kann zu einem anderen Zug und damit zu einem anderen Ergebnis führen.

Ob man das TCEC-Turnier gut findet oder nicht ist reine Geschmackssache. Ich schaue gerne rein, weil da mit vernünftigen Bedenkzeiten gearbeitet wird und ich bis auf die r-Mobility so ziemlich alles durchschaue. Und wenn nicht gibt es eine überaus ausführliche Seite mit allen Regeln, die diese Turniere sehr transparent machen. Das muss man natürlich nicht mögen, das kann man aber mögen. Ich persönlich finde es gut und schaue nicht über Twitch rein, sondern über den Direktlink. Die Werbung dort habe ich bis jetzt nicht einmal bemerkt, so wenig stört mich die. Ein bisschen runterscrollen und sie ist vollkommen weg.

Schöne Grüße
Andreas
Parent - - By Frank Quisinsky Date 2021-12-04 23:21
Hallo Andreas,

was ist "R-Mobility"!
Macht mich neugierig.

War schon Ewigkeiten nicht mehr auf der TCEC Seite bzw. überprüfe nur ob der Link zu TCEC auf meiner Webseite funktioniert.
Linke also dorthin, weil ich weiß das TCEC viele Fans hat.

Ob ich das nachvollziehen kann oder nicht spielt dabei keine Rolle wenn andere Spaß daran haben.

Nun, ich bin sehr pingelig was Turniere und Durchführung angeht.
War das im Grunde immer schon, auch wenn mir selbst immer wieder Fehler passieren.

Alles muss reproduziertbar sein, die eigene Vorgabe schon allein um selbst durchzublicken.
Wenn ich Züge in Analysen nicht nachvollziehen kann, entwertet das sofort und direkt Partien, die ich für statistische Zwecke einsetze.
Da habe ich sehr strenge Vorgaben was z. B. in meine Sammlung aufgenommen wird oder was eher nicht.

Habe mir einige TCEC Partien natürlich angesehen.
Finde das schon die Eröffnungsvorgaben unlogisch sind, und viele entscheidende Züge konnte ich nicht reproduzieren.
Nehme ich solche Sachen in meine Sammlung auf wird die Qualität dieser nicht höher.

Wenn ich jetzt den Ausführungen von einem Schachfreund glauben schenke (und ich habe keinen Grund anzunehmen das er nicht genau testet, er macht das auch schon seit mehr als 20 Jahren) dann kommt er zu dem Ergebnis, dass ca. 20 der besten 30 Schachprogramme auch mit Ponder und mit 32 Cores (er testet mit einer 32-Core Maschine) absolute TOP-Leistungen abliefern. Er kann reproduzieren in ca. 95% der Fälle. Er liegt mir schon über 2 Jahre auf der Pelle, ich sollte umdenken und mich mehr damit beschäftigen. Hat mir eine ganze DVD mit Daten und Analysen zur Verfügung gestellt. Ich muss ehrlich zugestehen, dass ich es bislang aufgrund diverser Umstände im letzten Jahr nicht geschafft habe mir mehr als 10% dieser Arbeit anzusehen.

Vielleicht werde ich auch einfach alt ...
Ob nun die Webseite im alten Layout oder die Testerei, die auf Einstellungen beruht die sich bislang immer bewährt haben.

Möchte das gar nicht ausschließen und vielleicht bin ich bei TCEC einfach zu kritisch.

Dir auch einen schönen Abend!
Frank

R-Mobility!
Hätte ich mehr Zeit und würde nicht selbst versuchen in meiner Freizeit etwas zu produzieren wäre mir das sicherlich nicht entgangen!
Aber Schach ist zu spannend, gibt ja nicht nur Computerschach.
Parent - By Lothar Jung Date 2021-12-05 07:57
Hier ist die Erklärung von R-Mobility:

https://wiki.chessdom.org/R-Mobility

Lothar
Parent - - By Andreas Matthies Date 2021-12-05 08:28
Hallo Frank.

Zu dem von Lothar verlinkten Wiki-Artikel kann ich eigentlich nur ergänzen, dass es sich da um eine "fixe Idee" des Admins Aloril handelt, die sich nicht durchsetzen wird.
Es begann mal als Rätsel "Was haben diese Positionen gemeinsam", in dem Aloril viele Positionen mit völlig unterschiedlichem Erscheinungsbild aufgeführt hatte, und die Lösung hatte dann natürlich mit der r-Mobility zu tun: Gleich groß oder aufsteigend in 0.5er Schritten, ich weiß es nicht mehr genau bzw. habe ich mich nie im Detail damit beschäftigt und so geht es wohl auch fast allen anderen. Dass Aloril die r-Mobility als Tiebreak-Kriterium eingeführt hat, hat jedenfalls meines Wissens nicht dazu geführt, dass irgendeine Engine sich darum kümmert und auf eine möglichst gute r-Mobility hinarbeitet.

Grüße, Andreas
Parent - - By Frank Quisinsky Date 2021-12-05 09:27 Edited 2021-12-05 09:48
Code:
2. Statistiken... das ist wohl eher eine spezielle Leidenschaft von dir und für den normalen Computerschachfreund weniger wichtig. Ein kurzes Beispiel dazu: Du legst in deinen Statistiken ja u.a. großen Wert auf Engines, die kurze Partien spielen, weil du daraus einen attraktiven und interessanten Spielstil abliest. Ich habe vor einiger Zeit in meiner Engine einen für die Spielstärke komplett unbedeutenden Patch eingebaut (hat mit mate distance pruning zu tun), der die durchschnittliche Partielänge in meinen Testspielen auch um ich glaube um ca. acht Züge verkürzt hat. Am "Spielstil" (was auch immer das ist) in der entscheidenden Phase der Partie hat der Patch aber rein gar nichts verändert.


Mal weg von meiner Faselei hin zu etwas was ich im Eifer des Gefechtes überlesen habe ...

Das ist interessant für mich ...
Ergebnisse FCP Tourney-2020, FCP Tourney-2021 und das laufende Turnier ...

Code:

08. RubiChess 2.2 NN x64            :  3308.93    480    65.5   177   275    28   314.5   57.3   20.23  3182.90  20.34     85.7
07. RubiChess 1.9 NN BMI2 x64       :  3193.50  2.000    63.4   764  1007   229  1267,5   50.4   10.73  3088.56  10.66     85.1
15. RubiChess 1.7.3 x64             :  3092.23  2.000    57.5   611  1077   312  1149,5   53.9   10.19  3035.36  10.47     88.2


In Anbetracht, dass die durchschnittliche Spielstärke von Turnier zu Turnier deutlich nach oben geht - gerade beim laufenden Turnier der Zügedurchschnitt auch deutlich gestiegen ist - bei der erreichten Spielstärke ein TOP-Wert.
Also, 85.7% bei einem durchschnittlichen Zügedurchschnitt (ohne Aufgabefaktor) von 88.965% und das bei einer der Spielstärke entsprechend absolut normalen Anzahl von Remispartien ... SUPER!!

Ich finde der Zügedurchschnitt hat sehr viel mit Attraktivität zu tun.
Spielen Engines ohne Aufgabefaktor keine unnötigen Züge, gehen den direkten Weg zur Entscheidung, wirkt das für mich wie ausgereift. Oder wie ein fertiges Produkt bei dem abschließend mit Feintuning im Detail verbessert wurde. Gehe davon aus, dass sich viele auch die Partien ansehen bis zum Ende. Dann genervt sind, wenn unnötig rumgeeiert wird, Zeit verschwendet wird.

Aber weist Du was dann wieder nervt beim Zusehen ...
Wenn Du nochmal etwas im Detail verbessern möchtest ... wage mich mal aus dem Fenster, nutze die Gunst der Stunde!

Schaue Dir mal als Beispiel die schöne Partie von Rubi gegen Zahak an.
Runde 13, Partie 12 unter Live-Games:

https://www.amateurschach.de/main/_replay-zone.htm

Positiv zunächst ... Anzeige bei Matt korrekt, M6, M5 ... ich finde das muss einfach stimmen!
Da haben so einige Programme Problemchen mit.

Negativ ...
M6 und 27 Sekunden bis zum Zug
M5 und 29 Sekunden bis zum Zug
M4 und 26 Sekunden bis zum Zug
M3 und 29 Sekunden bis zum Zug
M2 und 56 Sekunden bis zum Zug
M1 und 33 Sekunden bis zum Zug

3.5 Minuten Rechnenzeit verschenkt!

Bei 2.000 Partien und wahrscheinlich ca. 750 Gewinnpartien macht das schon bei 4 Minuten (im Durchschnitt) = 3.000 Minuten / 60 = 50 Stunden aus.
In dieser Zeit könnten 38 Partien bei 1:20 pro Partie gespielt werden.

Bei Remis-Zugfolgen noch viel krasser ...

Wenn die Mattführung klar ist, dann sollten die Züge sofort, innerhalb von 1-3 Sekunden bis zum Matt ausgespielt werden.

Ein Programmierer schrieb mir mal ...
Habe etwas eingebaut für Dich Frank ...

Beispiel:
Verschiedene Wege für ein Matt in 9!

Immer der spektakulärste Weg ...
Also z. B. 4 Möglichkeiten für Matt in 9
In einer Möglichkeit steckt eine Unterverwandlung ... dann wird stets die Matt in 9 Variante mit der Unterverwandlung gewählt.

Oder z. B. 4 Möglichkeiten für Matt in 9
In einer setzt ein Bauer Matt ... dann wird diese Variante gewählt.

Er hat da gar Regeln ausgearbeitet, um immer alles so spektakulär wie möglich aussehen zu lassen.

Also, wenn 50 Züge Regel klar ist ... gibt es keinen Grund mehr das die Engine noch Zeit verschwendet. Die Züge sollten nicht nur sondern müssen direkt ausspielt werden.
Gleiche Vorgehensweise bei Remis durch 3-fache Stellungswiederholung!

Wenn das von einer Engine beherrscht wird freut sich der Betrachter der Partien der Live zuschaut.
Und irgendwie wirkt die Engine "sehr liebevoll im Detail optimiert" ... wirkt wie ein fertiges Produkt.

Das alles hat mit Attraktivität zu tun und mithin wirkt das auch positiv beim Spielstil, auch wenn etwas weit hergeholt (rundet eher einen schönen Spielstil ab).

Wäre vielleicht etwas was Du sicherlich noch verbessern könntest.
Muss nicht immer nur Elo+ sein!

Wobei nochmals ...
RubiChess spielt die Spielphasen sehr ausgeglichen und zeigt nicht wirklich Schwächen die grob ins Auge fallen.
Da steckt sicherlich schon sehr viel Optimierungsarbeit drin.

Auch wenn Du sehr schön schreibst und auch erklärst (freut sich der Leser) kenne ich Dich ja nicht.
Möchte da auch nicht anecken weil dafür besteht ja kein Grund, freue mich ja über Rubi.

Bei vielen Programmierern muss ich im Eifer des Gefechtes immer ein wenig vorsichtig sein.
Bei anderen kann ich richtig nerven, auch krass und die sind mir nicht böse.

Bin da oft nicht feinfühlig genug.

Viele Grüße
Frank

Und gerade weil fast jeder mit Aufgabefaktor spielen lässt und nach meinem Wissen auch fast jeder der Programmierer.
Da funktionieren gut und gerne 20-30% meiner internen Statistiken nicht mehr.
Partie ist zu Ende mit Matt oder Remisregel und alles was damit zu tun hat zeichnet ein fertiges Programm aus (denke ich mir immer).
Parent - - By Frank Quisinsky Date 2021-12-05 10:09 Edited 2021-12-05 10:23
Ach so ...
Gunst der Stunde nutzen ...

Thema: Wünsche äußern!

Während der Gandalf Entwicklung hatte Steen mir mal einen netten Wunsch erfüllt aber er machte das nicht mit einem UCI-Parameter sondern fummelte "Programmierer konform" in den Sourcen rum.

Na ja, was die Programmierer so machen, halt!



Also ...
Wenn im Spiel gegen Königsseite mehrere gute Züge möglich sind, die Stellung also als schon sehr leicht gewinnträchtig abgewogen wird ...
Mindestens noch 22 Figuren vorhanden sind ...

ein Leichtfiguren / Schwerfiguren Zug höher bewertet wird als ein Bauernvorstoss ...
Verwerfe zu Gusten des Bauernvorstosses, wenn die Bewertung nicht um mehr als 0.x zurückgeht ... z. B. 0.25 - 0.40 Bauerneinheiten.

Spekulatives Spiel auf sich öffnende Linien produziert Bauernopfer für den Angriff.
Macht Sinn wenn eine Engine sich wohl fühlt.

Optimal wäre es wenn eine solche Funktion mittels "UCI Parameter" Spekulativ einstellbar wäre.

Könnte man austesten mittels komplizierten Eröffnungsstellungen die stärkere Programme gegen schwächere Programme öfters schnell zum Matt bringen.
Durch messen "Züge-Durchschnitt bei den Gewinnpartien".

Noch besser wäre es dann ...
Wenn RubiChess selbst so intelligent wäre und während der Eröffnungsphase beurteilen könnte, ob die Züge des Gegners eine höhere Spielstärke vermuten lassen ... bleibt die Option automatisiert aus. Spekulativ bei vorteilhafter Stellung automatisiert an wenn Gegenzüge vermuten lassen, dass die Spielstärke niedriger ist.

Stellt RubiChess fest ...
Moment mal, die Züge des Gegners scheinen nach eigener Bewertung richtig gut zu sein, geht RubiChess in den Defensiv Mode und versucht durch Abtausch bei keinen zurückhängenden Bauern einfach auf Remis zu spielen.

So wäre der UCI-Parameter nicht notwendig.

Ich müsste mal in älteren E-Mails schauen von Steen schauen.
Aber ich habe auch nicht richtig verstanden, was er seinerzeit mit der doppelten Bewertungsfunktion im frühen Mittelspiel meinte.
Mein Englisch war ja noch schlechter als heute und er vermutete eher was ich wollte und probierte das eine oder andere.

Fest steht ...
Seinerzeit spielte Gandalf herzerfrischend nachdem er da so einiges verändert hatte.
Version 4.32f ... bei 4.32h ging der Schuss nach hinten los.

Gandalf spielte sich in die Herzen viele Computerschachfreunde und war ein wirklich besonderes Programm.



Viele Grüße
Frank

Rubi spielt ja schon aggressiv aber die Steigerung ist ultra-aggressiv.
Laut gedacht!
Parent - - By Andreas Matthies Date 2021-12-05 10:55 Edited 2021-12-05 11:02
Hallo nochmal.

Wenn du auf Bauernvorstöße und interessante Umwandlungen abfährst: Rubi hatte da gerade gestern beim TCEC ein passendes Spiel für dich: https://tcec-chess.com/#div=sw2&game=429&season=21
Damit wird diese Diskussion dann auch wieder etwas mehr on-topic.
Im Programmcode werde ich in die Richtung "Spielstil" nichts ändern, dazu bin ich zu sehr Computer- und zuwenig Schach-Spezialist.

Grüße, Andreas
Parent - - By Chess Player Date 2021-12-05 11:04
Eine pgn zu posten ist zu schwierig?
Parent - - By Andreas Matthies Date 2021-12-05 11:17
Chess Player schrieb:

Eine pgn zu posten ist zu schwierig?


Nein. Aber redundant.
Parent - By Chess Player Date 2021-12-05 11:28
Andreas Matthies schrieb:

Chess Player schrieb:

Eine pgn zu posten ist zu schwierig?


Nein. Aber redundant.

Eine gewisse Redundanz erhöht die Wahrscheinlichkeit erkannt zu werden.
Parent - By Frank Quisinsky Date 2021-12-05 20:12
Hallo Andreas,

ich bin dahingehend so was von reizüberflutet.
Da trägst Du einen gehörigen Anteil bei.

Habe letzte Woche mein ultrabook präpariert.
Da läuft ein aktueller i7 mit 3.2Ghz.

Die vielen kurzen Gewinnpartien vom aktuiellen Turnier sind drauf.
Slow, Wasp, Rubi, Revenge und Arasan sind installiert und überprüfen sich gegenseitig bei den entscheidenden Zügen.

Ein Wahnsinn was dabei herauskommt wenn direkt 5 Angreifer die Partien aufs Korn nehmen.
Das ist so geiles Material und die Analysen mit Vergleichen zu Kommentaren von GMs zu den Varianten (aus Schachbüchern) sind hochinteressant.
Material für 10 neue Schachbücher und viel Statistik Zeug.

Ja, total off-topic im TCEC Chat.

Im Grunde muss ich mich gar entschuldigen für die Messages von mir im diesem Thread.
Wird mir schon niemand die Rübe abreißen, hatte bislang immer Glück.



Viele Grüße
Frank

Die werden alle fünf bei FEOBOS am Start sein!
Parent - - By Andreas Matthies Date 2021-12-05 10:14
Hallo Frank.

Du nervst mich nicht, aber ich hoffe, du verstehst, dass ich nicht so ausführlich schreibe wie du. Ich glaube, niemand kann das

Meine knappe Antwort zu deinem Wunsch: Ja!
Beim unnötigen Ausreizen der Bedenkzeit in Positionen, in denen das Ergebnis feststeht, hast du vollkommen Recht. Das sieht nicht schön aus und verschwendet Ressourcen.
Zumindest bei Mattpositionen. Bei vermeindlichen Remis-Positionen wäre ich sehr vorsichtig, an der Bedenkzeit zu sparen. Häufig genug verhakt sich eine Engine in einer 0.00 Bewertung, um dann ganz böse wachgerüttelt zu werden. Ausnahme wären da nur Züge, die direkt zum Remis durch Wiederholung, 50-Züge oder Materialmangel führen.

Ich werde da bei Gelegenheit mal beigehen.

Grüße, Andreas
Parent - By Frank Quisinsky Date 2021-12-05 10:43
Hallo,

schreibe immer zu viel.
Vielleicht ein Ausläufer von "nicht mehr gut hören", Leute die dahingehend Probleme haben lieben es zu lesen oder mehr als gebührend zu schreiben.
Wobei ich ja nicht jeden Tag in Schreiblaune bin.

Muss an den Daten der Runde 13 arbeiten, die Elo-Liste fehlt noch.
Die editiere ich von Hand, das dauert immer ...

Prima, so kleine Optimierungen anstatt Elo+ ist auch reinzvoll.



Go Rubi go ...

Viele Grüße und vielen Dank!
Frank
Parent - By Andreas Mader Date 2021-12-05 12:18
Andreas Matthies schrieb:

Hallo Frank.

Zu dem von Lothar verlinkten Wiki-Artikel kann ich eigentlich nur ergänzen, dass es sich da um eine "fixe Idee" des Admins Aloril handelt, die sich nicht durchsetzen wird.
Es begann mal als Rätsel "Was haben diese Positionen gemeinsam", in dem Aloril viele Positionen mit völlig unterschiedlichem Erscheinungsbild aufgeführt hatte, und die Lösung hatte dann natürlich mit der r-Mobility zu tun: Gleich groß oder aufsteigend in 0.5er Schritten, ich weiß es nicht mehr genau bzw. habe ich mich nie im Detail damit beschäftigt und so geht es wohl auch fast allen anderen. Dass Aloril die r-Mobility als Tiebreak-Kriterium eingeführt hat, hat jedenfalls meines Wissens nicht dazu geführt, dass irgendeine Engine sich darum kümmert und auf eine möglichst gute r-Mobility hinarbeitet.

Grüße, Andreas


Danke, das war die Information, die mir gefehlt hat.

Was R-Mobility an sich ist habe ich schon verstanden, nur was diesen Wert dazu befähigt, eine Reihenfolge zwischen Teilnehmern mit gleicher Punktezahl in einem Turnier zu erzeugen, das ging über meinen Horizont. "Fixe Idee" ist eine vollkommen einleuchtende und ausreichende Erklärung.

Schöne Grüße
Andreas
Parent - By Jörg Oster Date 2021-12-05 15:30
Andreas Matthies schrieb:

Hallo Frank.

Zu dem von Lothar verlinkten Wiki-Artikel kann ich eigentlich nur ergänzen, dass es sich da um eine "fixe Idee" des Admins Aloril handelt, die sich nicht durchsetzen wird.
Es begann mal als Rätsel "Was haben diese Positionen gemeinsam", in dem Aloril viele Positionen mit völlig unterschiedlichem Erscheinungsbild aufgeführt hatte, und die Lösung hatte dann natürlich mit der r-Mobility zu tun: Gleich groß oder aufsteigend in 0.5er Schritten, ich weiß es nicht mehr genau bzw. habe ich mich nie im Detail damit beschäftigt und so geht es wohl auch fast allen anderen. Dass Aloril die r-Mobility als Tiebreak-Kriterium eingeführt hat, hat jedenfalls meines Wissens nicht dazu geführt, dass irgendeine Engine sich darum kümmert und auf eine möglichst gute r-Mobility hinarbeitet.

Grüße, Andreas


Hallo Andreas,

ich weiß nicht so recht.
Ich habe die Idee mal prinzipiell in meinem Mattlöser Matefish zur Zugsortierung implementiert.
Die Anzahl der berechneten Positionen bei meinen 15 Bench-Stellungen reduziert sich dabei nochmal erheblich!

Vorher:
===========================
Total time (ms) : 4700
Nodes searched  : 5708557
Nodes/second    : 1214586

Mit r-Mobility:
===========================
Total time (ms) : 6746
Nodes searched  : 1633458
Nodes/second    : 242137


Leider bricht dadurch die Knotenleistung ein und die Gesamtlösezeit erhöht sich! 
Trotzdem ein interessantes Experiment.

Gruß, Jörg.
Parent - - By Chess Player Date 2021-12-05 10:37
Frank Quisinsky schrieb:

...

In Runde 1 vom FCP Tourney-2022 verlor Ethereal von den 40 Partien ... sage und schreibe 7!
Zitat:
FCP Tourney-2022, was ist das?


...

Insofern was ist TCEC?
Zitat:
Das erste Turnier hatte ich mir mal angesehen... Habe auch keinen Link dazu...

Bleibe dabei ... nichts mit dem ich wirklich irgend etwas anfangen kann.
Zitat:
FEOBOS etc... kenne ich auch nicht und interessiert mich auch nicht wirklich. Genau so wenig wie Killer Eröffnungs Datenbanken.

...
Parent - - By Frank Quisinsky Date 2021-12-05 10:47
Hallo,

macht doch nichts!

Ich schaue mir auch nicht alles an nur weil es das gibt.
Die Zeit hat niemand!

Nehme mir täglich vor die Schachnews wieder zu lesen.
ChessBase macht sich da sehr viel Mühe.

Aber dann schlage ich doch lieber ein älteres Schachbuch auf.

Die Möglichkeiten sind heute sehr vielschichtig und es gibt zahlreiche Bemühungen die richtig begeistern.

Langweilig wird uns bei diesem Hobby nicht!!

Dir viel Spaß mit was immer Du im Computerschach machst!

Gruß
Frank
Parent - - By Chess Player Date 2021-12-05 10:51
Was mich interessiert, ist die schachliche Wahrheit in den Schachstellungen zu ermitteln und zu erkennen ob meine persönliche Einschätzung mit der Engine übereinstimmt.
Parent - By Frank Quisinsky Date 2021-12-05 11:05
Hallo,

na ja!
Das ist schwierig geworden.

Begeisterung und Enttäuschung halten sich die Waage.
Aber eher weil die schachlichen Fähigkeiten bei den hohen Spielstärken nicht mehr ausreichen.

Auch wenn ich diesen GM für diese Aussage nie mochte aber tatsächlich hat er Recht??
Liegt die Spielstärke ca. 300 Elo über der eigenen ist eine persönliche Gefühlseinschätzung kaum möglich.
Maximal dann, wenn die eigene Spielstärke mindestens bei 1900 - 2200 Elo liegt.

Wenn ich mir Engine-Engine Partien ansehe und sehe z. B. wie die Nummer 41 in der Welt zermalmt wird von den darüber liegenden ist meine Meinung zu dieser Engine zunächst auch nicht so gut.

Blenden wir die TOP-40 aus und setzen die Engine in einem Feld mit den darunterliegenden 40!
Plötzlich ist die Nummer 41 die Nummer 1 und Du wirst begeistert sein ... es spielt aber die gleiche Engine!!

Thema Rybka ...als alle begeistert waren und sich kaum noch halten konnten vor Begeisterung, auch die GMs.
Rybka die Nummer 1 war und die tatsächlen 3000 Elo als unglaublich eingestuft wurden.
Heute ist Rybka ca. die Nummer 44.

Soweit zum Thema: Persönliche Einschätzung im Computerschach.

Mit Statistik geht schon sehr viel aber mich begeistern auch Programme die 2400 Elo haben, weil die liegen 300 Elo über die max. Spielstärke die ich mal hatte.

CT-800 macht Spaß!
Musst mal dagegen selbst spielen!!

Und selbst die alten Schachcomputer begeistern mich.

Wir bewegen uns heute auf einem Niveau weit weg von gut und böse.

Viele Grüße
Frank
Parent - By Chess Player Date 2021-12-05 10:53
Frank Quisinsky schrieb:

...

Nehme mir täglich vor die Schachnews wieder zu lesen.
ChessBase macht sich da sehr viel Mühe.
Zitat:
stimmt

Aber dann schlage ich doch lieber ein älteres Schachbuch auf.
Zitat:
sehr gut

Die Möglichkeiten sind heute sehr vielschichtig und es gibt zahlreiche Bemühungen die richtig begeistern.

Langweilig wird uns bei diesem Hobby nicht!!
Zitat:
richtig

Dir viel Spaß mit was immer Du im Computerschach machst!

Gruß
Frank
- - By Benno Hartwig Date 2021-11-30 00:04
In Partie 356 hatte Bagatur mit weiß seinen Gegner Vajolet schon so wunderbar und durchaus mit Mühe und Geduld an die Wand gepresst,
Vajolet sah sich schließlich mit bis zu 988.54 im Nachteil,
und dann fand Bagatur aber doch die gewinnbringende Abwicklung nicht.
Ärgerlich für den Underdog.
Parent - - By Chess Player Date 2021-11-30 10:21
pgn erhältlich?
Parent - By Benno Hartwig Date 2021-11-30 11:25
Code:
[Event "TCEC Season 21 - Swiss 2"]
[Site "https://tcec-chess.com"]
[Date "2021.11.30"]
[Round "9.4"]
[White "Bagatur 2.2e"]
[Black "Vajolet2 2.9.0-TCEC-S19"]
[Result "1/2-1/2"]
[Annotator "archive"]

1. c4 Nf6 2. Nc3 g6 3. Nf3 Bg7 4. d4 O-O 5. e4 d6 6. Be2 c5 7. O-O Bg4 8. d5 e6 9. h3 Bxf3 10. Bxf3 exd5 11. exd5 Nfd7 12. Ne4 Ne5 13. Be2 Re8 14. Re1 Na6 15. Qb3 h6 16. Bd2 Rb8 17. Bf1 f5 18. Nc3 Nc7 19. a4 Kh7 20. Ne2 Qf6 21. Nf4 b6 22. Rad1 Re7 23. a5 Qf7 24. Qc2 Rbe8 25. axb6 axb6 26. Ra1 Bf6 27. Qb3 Rb8 28. Be2 Rb7 29. Bc3 Nd7 30. Bf1 Bxc3 31. Qxc3 Ne5 32. b4 Rb8 33. Reb1 Rf8 34. bxc5 bxc5 35. Rb6 Rd8 36. h4 Qg7 37. Re1 Qf7 38. Re3 Qg7 39. Qc2 h5 40. g3 Qf6 41. Qb2 Rg7 42. Qd2 Nd7 43. Rb7 Ne5 44. Reb3 Re7 45. Qb2 Rdd7 46. Nh3 Kg7 47. Ng5 Ng4 48. Qd2 Qd4 49. Qxd4+ cxd4 50. R7b6 Kf6 51. Nf3 Re4 52. Bd3 Re8 53. Nxd4 Re1+ 54. Kg2 Rd1 55. Nf3 Ra1 56. Be2 Na6 57. Ng5 Nc5 58. R3b5 Kg7 59. Ne6+ Nxe6 60. dxe6 Re7 61. Rxd6 Kf6 62. c5 Ra2 63. Kf1 Ra1+ 64. Bd1 Rxe6 65. Rd2 Ne5 66. Kg2 Nc4 67. Rd4 Re4 68. Rd3 Re1 69. Rb4 Rc1 70. Rd8 Ke7 71. Rd4 Na5 72. Ba4 Rxc5 73. Rd7+ Kf6 74. Rd6+ Re6 75. Rxe6+ Kxe6 76. Be8 Kf6 77. Rb6+ Ke7 78. Bxg6 f4 79. gxf4 Nc4 80. Ra6 Nd6 81. Kg3 Rd5 82. Kf3 Rb5 83. Ra3 Kf6 84. Bd3 Rd5 85. Ke3 Nf5+ 86. Bxf5 Rxf5 87. Kf3 Rc5 88. Re3 Rc7 89. Re5 Rh7 90. Ke4 Rh8 91. f5 Rc8 92. Kf4 Kf7 93. f3 Rc1 94. Re6 Rh1 95. Kg5 Rg1+ 96. Kxh5 Rg3 97. f4 Rg8 98. Rg6 Rb8 99. Kg5 Rb1 100. h5 Rg1+ 101. Kh4 Rh1+ 102. Kg4 Rg1+ 103. Kf3 Rf1+ 104. Ke3 Rh1 105. h6 Rh3+ 106. Ke4 Rh2 107. Rd6 Rh1 108. Rc6 Re1+ 109. Kf3 Rf1+ 110. Kg3 Rh1 111. h7 Kg7 112. Rc2 Rg1+ 113. Rg2 Rb1 114. Rh2 Kh8 115. Rh5 Rg1+ 116. Kf3 Re1 117. Rh6 Rf1+ 118. Ke4 Ra1 119. Rh4 Ra4+ 120. Kf3 Ra1 121. Kg4 Rg1+ 122. Kf3 Ra1 123. Ke3 Ra3+ 124. Kd4 Ra1 125. Rh5 Ra7 126. Ke4 Rb7 127. Ke5 Re7+ 128. Kd5 Ra7 129. Rh4 Ra5+ 130. Ke6 Ra6+ 131. Ke7 Ra7+ 132. Kd6 Ra6+ 133. Ke5 Ra7 134. Rh2 Re7+ 135. Kd5 Ra7 136. Ke6 Ra6+ 137. Kd7 Ra7+ 138. Ke8 Ra8+ 139. Kd7 Ra7+ 140. Kd6 Ra5 141. Rh5 Ra7 142. Rh1 Rf7 143. Ke5 Re7+ 144. Kd4 Rd7+ 145. Ke4 Rb7 146. Rh2 Rb4+ 147. Kf3 Rb7 148. Rh6 Rb1 149. Rh3 Rb7 150. Rh5 Rb1 151. Ke3 Re1+ 152. Kd4 Re7 153. Rh6 Rb7 154. Rh4 Rb4+ 155. Ke5 Rb5+ 156. Kf6 Rb6+ 157. Kg5 Rb2 158. Rh5 Rg2+ 159. Kh6 Rg6+ 160. fxg6
*


Bei TCEC bekommt man PGN übrigens so:
1) entsprechend Partie z.B. über "Zeitplan" auswählen
2) mit rechts irgendwo auf das Brett klicken --> es erscheint ein Fenster
3) auf PGN klicken, dann hat man PGN in der Zwischenablage und kann damit verfahren, wie man will.
- - By Benno Hartwig Date 2021-12-02 10:56
Die besten Engines haben jetzt noch jeweils 5 Partien zu spielen
und punktgleich liegen an der Spitze Lc0, Dragon und Stockfish (jeweils 10.5 aus 17)

Na, da könnte es knapp werden, dass SF wirklich noch ein mehr-halber-Punkt gelingt, um unangefochten die "1" zu werden.
Und dass die Feinwertung SF noch nach oben spülen kann, ist wohl eher unwahrscheinlich.

Vielleicht bekommen wir hier tatsächlich mal ein Stockfish-hat-nicht-gewonnen-Event.
Sooo häufig sind die ja nicht.
Parent - By Max Siegfried Date 2021-12-02 12:56
Benno Hartwig schrieb:

Die besten Engines haben jetzt noch jeweils 5 Partien zu spielen
und punktgleich liegen an der Spitze Lc0, Dragon und Stockfish (jeweils 10.5 aus 17)

Na, da könnte es knapp werden, dass SF wirklich noch ein mehr-halber-Punkt gelingt, um unangefochten die "1" zu werden.
Und dass die Feinwertung SF noch nach oben spülen kann, ist wohl eher unwahrscheinlich.

Vielleicht bekommen wir hier tatsächlich mal ein Stockfish-hat-nicht-gewonnen-Event.
Sooo häufig sind die ja nicht.



Das Ergebnis hängt ganz von den jeweiligen Gegnern und den Stellungen an.
Parent - - By Peter Martan Date 2021-12-03 07:53 Edited 2021-12-03 08:37
Mich interessiert vor allem, ob die Plätze unterhalb der ersten 3 nach den letzten Runden doch noch ein bisschen mehr mit der Spielstärke der Engines korrellieren werden, wie man sie aus Ranglisten kennt.

https://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=149645#pid149645

Dass soviel Differenzierung an der SB- Wertung hängt, macht die Sache schon auch Zufalls- abhängiger beim Schweizer System als bei anderen Turnieren, finde ich. Ist es anfangs entscheidend, wer gegen wen drankommt, wird mit gleicher Punktzahl vieler Engines dann irgendwann wieder mehr self fulfilling prophecy daraus, dass die Reihung, wie sie nach einer Weile besteht, zementiert wird. Dafür wirken sich einzelne Partien mit ganzen Punkten immer noch krass aus, wie der eine Verlustpunkt von Revenge gegen komodo, weil beide jetzt dann auch dieser neuen Reihung entsprechend weiterspielen.

Wenn innerhalb gleicher Punktzahl die höher gereihten mehr SB- Punkte für ihre Matchpunkte bekommen, und die Gegner innerhalb der Reihung mehr beisammen bleiben im Aufeinandertreffen, schaukeln sie sich durch SB weiter oben mehr hoch und hängen die unteren mehr ab an Feinwertung bei gleicher Punktzahl. Die zusätzlich zu unterscheiden, ist SB- Aufgabe, in jeder gegen jeden- Turnieren ist das aber auch weniger quantitativ (oder jedenfalls anders qualitativ) System- immanent.

Dass diese 3 Engines oben Punkte- gleich sind, macht weniger aus, finde ich, dass die praktisch gleich stark sind, weiß man ohnehin, spielt also keine echte Rolle, wenn sie mal in der einen und mal in der anderen Reihenfolge mit gleicher Punktezahl einlaufen. Aber dass so viele andere auch nur von so wenigen "echten" Punkten getrennt werden, das spricht schon nach wie vor stark für zu wenig Partien bei so vielen Engines.

Das alles schon einmal so ähnlich erwähnt hat
Parent - - By Andreas Mader Date 2021-12-03 10:34 Edited 2021-12-03 11:08
Irgendwie scheint mit dem Computerschach auch der Sinn von Turnieren verloren gegangen zu sein. Sicherlich werden die hauptsächlich deshalb gespielt, um einen Gewinner zu küren, aber ein weiteres Ziel ist es, schöne und interessante Partien zu sehen. Dass dabei aufgrund der Zufallsschwankungen nicht zwangsläufig der Teilnehmer mit der höchsten ELO-Wertung gewinnt, ist vollkommen klar und es wäre auch der tatsächliche Tod des Schachs, wenn es so wäre. Aber in Zeiten, in denen ein Turnier schon alleine deshalb als "sportlich wertlos" bezeichnet wird, weil die Endreihung nicht exakt die ELO-Reihenfolge abbildet, ist das nicht verwunderlich. Wahrscheinlich wäre dann auch die derzeit laufende WM sportlich wertlos, sollte der Herausforderer gewinnen, der doch viel weniger ELO-Punkte hat als der amtierende Weltmeister.

Bei Turnieren nach dem Schweizer System werden die ersten Partien nach der ELO-Wertung arrangiert, also dem Fetisch eines jeden echten Computerschächlers. Das ist eine Art Setzliste wie im Tennis. Dadurch ist es wahrscheinlich, dass die besser platzierten Engines die erste Runde gewinnen und die natürliche Hackordnung nicht gestört wird. Das selbe sollte dann auch in Runde 2 passieren, wenn die SB-Wertung noch nicht derart viel Differenzierung bringt. Dann hat sich bereits die Spreu ein wenig vom Weizen getrennt und die SB-Wertung macht genau das, was sie soll: Sie reiht anhand der Turnier-Performance der Gegner. Gewinne ich gegen jemanden, der ein sehr gutes Turnier spielt, ist meine SB-Wertung höher. Gewinne ich gegen jemanden, der am Ende herumdümpelt, ist meine SB-Wertung niedriger. So gesehen ist der größte Feind der SB-Wertung ein negativer Ausreißer, der alles verliert und die SB-Wertung aller seiner Gegner, die das Pech hatten, gegen ihn anzutreten, in den Keller zieht. Die SB-Wertung ist übrigens ausschließlich dazu da, um Teilnehmer mit gleicher Punktzahl zu reihen. Die SB-Wertung von Teilnehmern mit unterschiedlicher Punktzahl zu vergleichen ist absoluter Unsinn.

In der Mitte eines Turniers nach Schweizer System wird immer relativ viel Zufall herrschen, während an der Spitze und am Ende meistens die Teilnehmer stehen, die es auch irgendwie verdienen. Aber es ist auch nicht das Ziel eines solchen Turniers, die Reihenfolge exakt abzubilden.

Schöne Grüße
Andreas
Parent - By Chess Player Date 2021-12-03 10:45
+1
Parent - - By Peter Martan Date 2021-12-03 13:01 Edited 2021-12-03 13:53
+2
Ich finde das auch deshalb gut, weil ich ja überhaupt nichts Gegenteiliges in meinen vielen lichtvollen Postings in der Sache schrieb. Und dass man ausgerechnet mir, wenn man ein bisschen was von dem sehr Vielen, was ich bei derlei und anderen Gelegenheiten zum Thema Elo und Celo schon geschrieben hab, keinen Elo- Fetischismus vorwerfen wird, davon gehe ich aus.
Das einzige, was ich sonst noch zu diesem Turnier bemerkte und es auf Aufforderung halt nochmal mache: es sind zu wenige Partien für zuviele Engines, um eine Reihung zu erhalten, die nicht mehr Zufall als Spielstärke abbildet, aber auch das kann man natürlich sehr verschieden bewerten, je nachdem, welche Engine einem mehr oder weniger unter oder über Wert geschlagen scheint. Dass SF, LC0 und Dragon die ersten 3 Plätze einnehmen, wenn man sie lang genug spielen lässt, bestätigt den Zusammenhang zwischen Ranglisten (die's halt auch gibt, ich bitte mir den Vergleich nachzusehen, wenn's das war, womit ich aneckte) und Turnieren irgendwie doch auch, ob da jetzt SF als Nr. 1 oder 3 durchs Ziel geht, sollte vielleicht sogar auch bei anderen Gelegenheiten weniger wichtig genommen werden, sinngemäß das schrieb ich zuletzt auch, nur um die Übereinstimmungen in den Vor- und Nachpostings nochmals zu betonen.

Und das mit den Reihungen und den Turnieren, das ist halt (auch das kennt man als stehenden Satz von mir mittlerweile recht gut) überhaupt mehr und mehr eine ziemliche Geschmackssache, aber wenn ich keine Reihung, sondern nur das Produzieren von schönen (unter dem Aufwand von mehr oder weniger vielen langweiligen) Partien haben will, stellt sich die Frage nach der Bezeichnung Turnier halt irgendwie, aber wir können es ja auch nennen, wie wir wollen, um nur ja niemanden zu kränken. Ansonsten könnten wir ja auch bei der laufenden WM, um bei deinem Vergleich zu bleiben, nach ein paar schönen Partien sagen, ja, ok, jetzt hören wir wieder auf, bevor sich jemand weh tut oder im Publikum sich wer ärgert, es sollen ja auch nicht zu viele Partien werden, siehe bei TCEC mit 44 Teilnehmern müssen ja auch 11 Doppelrunden und 484 games reichen, nach 22 Partien der WM Gegner müsste also wirklich auch spätestens Schluss sein, egal, wer gerade vorne ist.

Das mit dem einzelnen Gewinner ist gerade bei so schönen Turnieren wie einer WM ja auch wirklich nachrangig, auch diesbezüglich zu mehr Freude am Spiel ohne die nervige Überbewertung des Wettbewerbscharakters, regt an
Parent - - By Chess Player Date 2021-12-03 13:35
Es gibt statistische Aussagen darüber wie viele Runden mindestens gespielt werden müssen um die Rangfolge der ersten x Spieler sinnvoll zu erhalten. Es geht dabei "NUR" um die vorderen Plätze!
Parent - - By Benno Hartwig Date 2021-12-03 14:38
Prinzipielle Zustimmung.
Ich denke aber, dass die hintersten Plätze mit einer vergleichbaren Sinnhaftigkeit erspielt werden. Vielleicht braucht man die ja auch mal.
Parent - - By Chess Player Date 2021-12-04 12:31
Das geht prinzipiell nicht mit einem Schweizer System!
Parent - - By Benno Hartwig Date 2021-12-04 21:52 Edited 2021-12-04 22:19

> Das geht prinzipiell nicht mit einem Schweizer System!


Mein Eindruck beim Betrachten früherer derartiger Ergebnisse ist ein anderer.
Oben wird ganz anständig sortiert, und ganz unten auch.
Und TCEC zeigt dies in diesem Moment ja auch bereits.
(und eigentlich verwundert mich das auch nicht, dass gerade im Schweizer System die Auswirkungen von Sieg und Niederlage sehr symmetrisch sind)

Wikipedia schreibt dazu übrigens:
"Das Schweizer System liefert akkurate Resultate in den oberen Rängen (Platz 1, Platz 2), ebenso in den untersten (letzter, vorletzter). Die Rangordnung im Mittelfeld ist jedoch stark zufallsabhängig."
(Hervorhebung von mir)
Parent - By Peter Martan Date 2021-12-04 22:42 Edited 2021-12-04 23:12
Genau, und jetzt wäre dann nur noch näher zu beschreiben, wie viele unter den "obersten" und unter den "untersten" zu verstehen wären, weil nur der 1. und 2. und der letzte und der vorletzte, wie du aus Wiki zitierst, wäre bei einem 44 Teilnehmer- Feld halt schon etwas mager an Ausbeute, wenn der Rest reiner Zufall wäre.

Ich würde stark vermuten, das hängt davon ab, wieviele es insgesamt sind, wie groß die Unterschiede zwischen den Teilnehmern, wie unbalanciert die Eröffnungsstellungen und wieviele Partien. (Das alles übrigens genau so wie bei jedem anderen Turnier, ob Schweizer oder nicht, die einzig relevante Frage war für mich die ganze Zeit, ob man sich durch dieses System bei dieser Menge an Engines wirklich so viele Partien sparen kann, wie halt offenbar gehofft wurde oder wird zu welchem Ergebnis, das ja mit small sample allein auch noch nicht unbedingt hinlänglich quantitativ und qualitativ beschrieben ist, Turnier heißt's halt jedenfalls, drum könnte man meinen, ein Teil des Unterhaltungswertes solle sich doch auch irgendwie aus einer Reihung der Engines unter dem 2. und über dem vorletzten Platz ergeben. Und wenn der Zieleinlauf von den beiden ersten und den beiden letzten dann auch noch reiner Zufall ist..., lassen wir diese defätistischen Betrachtungsweisen lieber gleich wieder ).

Jetzt lass ich auch endlich überhaupt die substanzlosen Diskussionen, denen sowieso jede quantitative Grundlage fehlt, aber dann wirklich sein, weil ich ohnehin auch schon mehrmals dazu gesagt habe, dass es mir höchstens um den Grad an Zufälligkeit des Ergebnisses geht, nicht um irgendwelche Reproduzierbarkeit und Vergleichbarkeit mit anderen Matches, gar für Ranglisten gedachten, und ich weiß, dass  dieses hier nur Partien produzieren soll mit Unterhaltunsgwert.
Aber auch dabei gebe ich noch ein letztes Mal zu bedenken, dass jeder Wert, auch der Unterhaltungswert, ein bisschen in Relation gesetzt werden sollte zu dem Hardware- Zeit- Manpower- Aufwand, der da getrieben wird.

Übrigens aber auch das noch, ausreichend Unterhaltungswert, weil's ja nicht meine Hardware- Zeit und Eigenarbeit ist, die's kostet, hat's für mich allemal, nur um auch noch einmal den Eindruck zu vermeiden, ich würde mich hier dauernd über irgendwas beklagen.
Hätte ich nicht immer wieder mal reingeschaut nach interessanten Partien, die's auch zu finden gab, hätte ich dazu gar nichts zu vermelden gehabt, weil's mich dann ja einfach nicht interessiert hätte, gibt gern abschließend auch noch unumwunden zu
Parent - By Chess Player Date 2021-12-05 10:14
Danke für die Klarstellung. Das es so ist ist aber nicht gewollt bei der Entwicklung des Schweizer Systems sondern nur eine ungewollte Nebenerscheinung.
Parent - - By Frank Quisinsky Date 2021-12-04 07:46 Edited 2021-12-04 07:50
Hallo Andreas,

die SB-Wertung hat noch einen besonders guten Nutzen.

Teilnehmer im Feld mit niedriger Platzierung aber höherer SB-Wertung ...
Hier ist es oft abzusehen, dass mit mehr Partien sich die Platzierung ändert.

Beispiel:
Nicht NN Engine Xiphos punktet gegen NN-Engines deutlich schlechter als der tatsächliche Rang vermuten läßt.

Wasp hat nach über 500 Partien 4 Punkte Rückstand auf Xiphos aber eine höhere SB-Wertung.
Insofern die Aussage ... Wasp 5.00 kämpft um Platz 17 in der Welt gegen Xiphos!
Eine Engine die vor 10 Monaten noch auf Platz 8 stand.

https://www.amateurschach.de/fling/fcp-tourney-2022.html

Oder beim Kampf um Platz 3:
Fire hat eine deutlich höhere SB Wertung als Slow.
Auch wenn Slow um Platz 3 kämpft wird es schon absehbar sein das Fire Platz 3 halten wird.

Tatsächlich werden bei einem Engine Turnier mit wenigen Runden nur dann die Besten immer oben stehen, wenn gewährleistet ist das die Elo sich um mindestens 40 abhebt.
Ein Turnier nach Schweizer System soll ja einen Gewinner feststellen. Da Stockfish ca. 30 Elo stärker ist als Komodo kann auch Komodo erster werden. Da die anderen hinter Komodo
80-100 Elo schwächer sind kann ausgeschlossen werden, dass z. B. ein SlowChess oder Fire das Turnier gewinnen.

Würden also 10 der TOP-40 Engines nur 40 Elo auseinander liegen kann jeder Platz 1 bei einem doppelrundigen Turnier, mit 40 Partien pro Runde, also 80 Partien bei Jeder gegen Jeden belegen.
Für diese Aussage muss man auch kein Magier sein, weil es einfach immer das Gleiche ist.

Gruß
Frank
Parent - - By Klaus Wlotzka Date 2021-12-04 10:44
Frank Quisinsky schrieb:


die SB-Wertung hat noch einen besonders guten Nutzen.

Teilnehmer im Feld mit niedriger Platzierung aber höherer SB-Wertung ...
Hier ist es oft abzusehen, dass mit mehr Partien sich die Platzierung ändert.

Beispiel:
Nicht NN Engine Xiphos punktet gegen NN-Engines deutlich schlechter als der tatsächliche Rang vermuten läßt.

Wasp hat nach über 500 Partien 4 Punkte Rückstand auf Xiphos aber eine höhere SB-Wertung.
Insofern die Aussage ... Wasp 5.00 kämpft um Platz 17 in der Welt gegen Xiphos!
Eine Engine die vor 10 Monaten noch auf Platz 8 stand.


Hallo Frank,

die Beobachtungen, die Du gemacht hast, haben eine ganz einfache Erklärung.

Ich habe mich im Zuge der Excel-Turnieraufbereitung und formeltechnischen Integration der S-B-Wertung in diese FCP-Statistiken, mit der S-B-Wertung beschäftigt. Grundsätzlich werden bei der S-B-Wertung die Engines, welche gegen starke Engines besser punkten, höher bewertet.

Insbesondere bei einem Rundenturnier wie das FCP-Tourney, bei dem jeder gegen jeden spielt, zeigt eine niedrigere S-B-Wertung, dass die betreffende Engine in der aktuellen, noch laufenden Runde noch gar nicht gegen die wirklichen Top-Engines gespielt hat. Die bisher erzielte S-B-Wertung wurde also gegen mehr schwächere Engines erspielt. Gegen die schwächeren Gegner kann man zwangsläufig seine S-B-Wertung nur schwer merklich verbessern, da diese selber zu wenig Punkte erzielen.

Ein Beispiel:
Engine A weist eine höhere S-B-Wertung als Engine B auf weil diese Engine gegen die Top 5 einen Score von 2 aus 5 erzielt hat.
Engine B weist eine niedrigere S-B-Wertung auf, weil diese Engine zwei mal gegen die Top 5 gespielt hat und dabei 0,5 aus 2 erzielt hat.

Das heißt, Engine B muss im weiteren Verlauf noch 3x gegen die Top 5 antreten und hat also mehr Partien gegen die schwächere Gegnerschaft gespielt als Engine A. Die Wahrscheinlichkeit, dass Engine A zum Ende der Runde vor Engine B landet ist aufgrund des guten Resultates gegen die Top 5 relativ hoch. Ganz anders als bei einem Turnier nach dem Schweizer System wissen wir ja beim Rundenturnier wie das FCP-Tourney, dass die Engine B aus unserem Beispiel zwangsläufig noch gegen das starke Teilnehmerfeld spielen muss.

Von daher sind Deine Beobachtungen logisch zu erklären. Die S-B-Wertung eignet sich demzufolge bei einer noch nicht abgeschlossenen Runde eines Rundenturniers, um eine gewisse Tendenz abzulesen.

Viele Grüße

Klaus
Parent - - By Klaus Wlotzka Date 2021-12-04 11:18
Hallo Frank,

nachfolgend noch ein anschauiliches Beispiel zum Thema der S-B-Wertung aus dem laufenden FCP-Tourney.

Nach der abgeschlossenen 12. Runde zeigt sich folgendes Bild:



Die Engine "Xiphos 0,6" liegt mit einem Punktevorsprung von 4,0 Punkten vor der auf Platz 18 platzierten Engine "Weiss 2.0".

Trotz des noch guten Punktvorsprungs weist "Weiss 2.0" eine bessere S-B-Wertung auf. Dies kann nur daran liegen, dass "Weiss 2.0" in den ersten 12 Runden gegen die starke Gegnerschaft besser gepunktet hat. Tatsächlich lässt sich dies aus den bisherigen Ergebnissen auch so ablesen.



Ich wage daher die Prognose, dass sich am Ende des Turniers "Weiss 2.0" vor "Xiphos 0.6" platzieren wird.

Das setzt allerdings voraus, dass sich dieser Trend fortsetzt und "Weiss 2.0" auch noch gegen die schwächere  Gegnerschaft entsprechend punktet.

Warten wir es ab.

Viele Grüße

Klaus
Parent - By Frank Quisinsky Date 2021-12-04 11:28
Hi Klaus,

ja, Weiss ist nicht zu unterschätzen.
Eine brandgefährliche Engine, die in der Lage ist in der Eröffnung Vorteile zu erspielen gegen deutlich Stärker!!

Auch Minic überrascht ...

Das wird ein packender Vierkampf um Platz 17.
Xiphos vs. Wasp vs. Weiss and vs. Minic.

Minic hat so rein statistisch gesehen die schlechtesten Karten.

Parent - By Frank Quisinsky Date 2021-12-04 12:16
Code:
40 Moves in 20 min  2021

                                   1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
1   Stockfish 151121 NN x64        *       ½ ½ 1 1 ½ ½ 1 ½ 1 ½ ½ ½ 1 1 ½ 1 ½ 1 1 1 ½ 1 1 1 1   ½   1 1 1 ½ ½ ½   1 1  26.5/34
2   Dragon 2.5.1 by Komodo NN AVX    * ½ ½ 1   1 ½ ½ ½ 1 ½ ½ ½   1 1 1   1 1 ½ 1 1 1 1   ½   1 1 ½   1 1 1 1   ½ 1 1  26.0/32
3   Ethereal 13.25 NN PEXT x64       ½ * ½ ½   ½ ½ 1 1   ½ 1 ½   1 ½ ½   1 1 ½ ½ 1 1 1   1 1 0 1 1 1 1 1 1 ½   1 ½ 1  25.5/33
4   Fire 8 NN MC.3 x64               ½ ½ * ½   ½ 1 ½ ½   ½ ½ ½ ½ 1 ½ ½   1 ½ ½ 1 1 ½ ½ 1 1 1 1   ½ 1 1 ½ ½ 1   1 ½ 1  24.0/34  372.75
5   Berserk 7 NN PEXT x64          ½ 0 ½ ½ * ½ ½ ½ ½ ½ 1 ½   ½ ½ ½   1 0 ½ ½ 1 1 1 1   ½   1 ½ ½ 1 1 1 1 1   ½ 1 1 1  24.0/35  369.50
6   SlowChess Blitz 2.8 NN AVX2 x  ½       ½ * ½ ½ ½ 1 ½ ½ ½ ½ ½ ½ 1 ½ ½ ½ 1 1 ½   ½ 1 ½ 1 1 ½ 1 1 1   1   1 1   1 1  24.0/33  367.00
7   Koivisto 7.5 NN AVX2 x64       0 0 ½ ½ ½ ½ *   ½   ½   1   ½ 1 1   1 ½   1 ½ ½ 1 1 1 ½ 1 ½ 1 ½ ½ ½ 1 1 1 1 1 1    23.5/33
8   RubiChess 2.2 NN x64           0 ½ ½ 0 ½ ½   *   0 ½ ½ 1 ½ ½ ½ 1 1 ½ 1 1 1 ½   1 1 1 1 ½ ½ ½ 1 ½       1 1 1   1  22.5/33
9   Igel 3.0.10 NN BMI2 x64        ½ ½ 0 ½ ½ ½ ½   *   1   ½   1 0 ½ ½ ½ ½   ½ 1 ½ 1 ½ ½ 1 1 1   1 0 ½ 1 1 1 1 1 ½    21.5/33
10  Revenge 1.0 NN x64             ½ ½ 0 ½ ½ 0   1   * 0 ½ ½ ½ ½   1 ½ 1 ½ ½ ½     ½ 1 1 ½ ½ 1 1 ½ 1 ½   ½ ½ ½ 1   1  20.0/33  310.25
11  Seer 2.4.0 NN AVX2 x64         0 0     0 ½ ½ ½ 0 1 * 1 ½ ½ ½ ½ ½ 1 1 1 ½ ½ 1   ½ 1 ½ ½ ½ 1 ½ ½ ½       1 1 ½   1  20.0/33  306.50
12  Nemorino 6.09 NN x64           ½ ½ ½ ½ ½ ½   ½   ½ 0 * ½ ½ ½   ½   ½   0 1   ½ ½ ½ ½ ½ 1 ½ 1 1 1 ½ ½ 1 1 1 0 1    19.5/33  306.75
13  Arasan 23.0.1 NN AVX2 x64      0 ½ 0 ½   ½ 0 0 ½ ½ ½ ½ * 1 ½ 1   ½ ½ ½ 1   1 1 ½ ½ ½   ½ ½ 1 ½ ½ ½ ½ ½   ½ ½ 1 1  19.5/35  297.50
14  rofChade 2.310 NN x64          ½ ½ ½ ½ ½ ½   ½   ½ ½ ½ 0 * ½   ½ ½ ½ 1 ½ 1 ½   ½ ½ 1 1 ½ ½ ½ ½ 1 ½     ½ ½ 1   ½  19.0/33  307.25
15  Wasp 5.00 NN AVX2 x64          ½     ½ ½ ½ ½ ½ 0 ½ ½ ½ ½ ½ * ½ ½ ½ ½ ½ ½   ½ ½   ½ 1 1 ½   1   ½ 1 ½ ½ ½ 1   ½ 1  19.0/33  299.25
16  Laser 1.7 BMI2 x64             ½ 0 0 0 ½ ½ 0 ½ 1   ½   0   ½ * 0   ½     0 ½ ½ 1 1 1 1 1 ½ ½ ½ ½ 1 1 1 1 1 ½ ½    18.5/33
17  Booot 6.5 POPCNT x64           0 0 ½ ½   0 0 0 ½ 0 ½ ½   ½ ½ 1 * 0 ½ 1 ½ 0 1 ½ ½   ½     ½ ½ 1 1 0 1 1 ½ 1 1 1 ½  18.0/35
18  Minic 3.17 NN x64              0 0 ½ ½ 0 ½   0 ½ ½ 0   ½ ½ ½   1 * ½     ½   ½ ½ ½ 1 0 0 ½ ½ 1 1 1 ½ ½ ½ ½ ½ 1    16.0/33
19  Shredder 13 POPCNT x64         ½       1 ½ 0 ½ ½ 0 0 ½ ½ ½ ½ ½ ½ ½ * ½ ½ ½ ½   1 0 0 ½ ½ ½ ½ ½ ½       ½ ½ ½ ½ ½  15.0/33  244.25
20  Marvin 5.2.0 NN AVX2 x64       0 0 0 0 ½ ½ ½ 0 ½ ½ 0   ½ 0 ½   0   ½ *   ½   ½ ½ ½ ½ ½ 1 ½ ½ 0 ½ 1 1 ½ 1 ½ ½ 1    15.0/34  222.00
21  Orion 0.8 NN FMA x64           ½ 0 0 ½ ½ 0   0   ½ ½ 1 0 ½ ½   ½   ½   * ½   0 0 ½ ½ ½ ½ 1 ½ ½ ½ ½   1 1 ½ ½   ½  14.5/32  224.50
22  Clover 2.4 x64                 0 ½ ½ ½ 0 0 0 0 ½ ½ ½ 0   0   1 1 ½ ½ ½ ½ * ½ ½ ½   ½     ½ 0 ½   0 1 ½ 0 1 ½ ½ 1  14.5/34  224.00
23  Lc0 0.28.0 NN CPU-dnnl         0 0 ½ 0 0 ½ ½ ½ 0   0   0 ½ ½ ½ 0   ½     ½ * 1 ½ ½ ½ 1 0 1 0 ½ ½ ½ 0 ½ ½ 1 1 1    14.5/34  215.75
24  Fritz 18 (Ginkgo) x64          0 0 0 0 0   ½   ½     ½ 0   ½ ½ ½ ½   ½ 1 ½ 0 * 1 ½ ½ 0 1 ½   1 ½ ½ 1 0 ½ ½ 1 0 ½  14.5/33  209.50
25  DanaSah 9.0 NN AVX2 x64        ½ 0 0 ½ 0 ½ 0 0 0 ½ ½ ½ ½ ½   0 ½ ½ 0 ½ 1 ½ ½ 0 *         1 ½ ½   ½ 0 ½ 1 ½ 1 ½ ½  14.0/34  215.00
26  Xiphos 0.6 BMI2 x64            0 0 0 ½   0 0 0 ½ 0 0 ½ ½ ½ ½ 0   ½ 1 ½ ½   ½ ½   * 1 ½ ½ ½ 1   ½ 1 0 ½   0 1 ½ ½  14.0/34  205.00
27  Zahak 8.6 AMD x64              0     0 ½ ½ 0 0 ½ 0 ½ ½ ½ 0 0 0 ½ 0 1 ½ ½ ½ ½ ½   0 * ½ ½   0   ½ ½ ½ 1 1 ½   1 1  14.0/34  203.75
28  Andscacs 0.95.123 x64          0 ½ 0 0   0 ½ 0 0 ½ ½ ½   0 0 0   1 ½ ½ ½   0 1   ½ ½ * ½ ½ ½ ½ ½ 1 ½ ½   ½ ½ 1 ½  14.0/34  202.75
29  Winter 0.9 BMI2 x64            0   0 0 0 0 0 ½ 0 ½ ½ 0 ½ ½ ½ 0   1 ½ 0 ½   1 0   ½ ½ ½ *   ½   ½ ½ 1 ½   1   1 1  13.5/32
30  Defenchess 2.3 dev BMI2 x64      0 1 0 ½ ½ ½ ½ 0 0 0 ½ ½ ½   ½ ½ ½ ½ ½ 0 ½ 0 ½ 0 ½   ½   * ½ ½   ½ ½ 0 ½   ½ ½ ½  13.0/34  216.75
31  Schooner 2.2 XB SSE x64        ½ 0 0   ½ 0 0 ½   0 ½ 0 0 ½ 0 ½ ½ ½ ½ ½ ½ 1 1   ½ 0 1 ½ ½ ½ * 0 ½       ½ ½ ½   ½  13.0/33  201.75
32  Dark Toga 1.1 NN AVX2 x64        ½ 0 ½ 0 0 ½ 0 0 ½ ½ 0 ½ ½   ½ 0 0 ½ 1 ½ ½ ½ 0 ½     ½   ½ 1 *   0 1 ½ 0 0 ½ ½ 1  13.0/34  199.25
33  Weiss 2.0 PEXT x64             0   0 0 0 0 ½ ½ 1 0 ½ 0 ½ 0 ½ ½ 0 0 ½ ½ ½   ½ ½   ½ ½ ½ ½   ½   * ½ ½ ½   1   ½ ½  12.5/33  192.00
34  Fizbo 2.0 BMI2 x64             0 0 0 0 0   ½   ½ ½   ½ ½ ½ 0 0 1 0   0 ½ 1 ½ ½ ½ 0 ½ 0 ½ ½   1 ½ * ½ ½ ½   ½ 0 ½  12.5/34  189.75
35  GullChess 3.0 Sy BMI2 x64      0 0 0 ½ 0 0 0   0     ½ ½   ½ 0 0 ½   0   0 1 0 1 1 ½ ½ 0 ½   0 ½ ½ * 1 ½ ½ ½ 1 1  12.5/33  170.50
36  Combusken 1.4.0 AMD x64        ½ 0 0 ½ 0   0   0 ½   0 ½   ½ 0 0 ½   ½ 0 ½ ½ 1 ½ ½ 0 ½ ½ 1   ½ ½ ½ 0 * ½   0 1 ½  12.0/33  178.00
37  Chiron 5 x64                   ½ 0 ½ 0   0 0 0 0 ½ 0 0   ½ ½ 0 ½ ½ ½ 0 0 1 ½ ½ 0   0     ½ ½ 1   ½ ½ ½ * 0 ½ 1 1  12.0/34  175.50
38  Stash 31.16 x64                ½       ½ 0 0 0 0 ½ 0 0 ½ ½ 0 0 0 ½ ½ ½ ½ 0 0 ½ ½ 1 ½ ½ 0   ½ 1 0   ½   1 *   ½ 0  11.0/33  169.50
39  Demolito 2021-07-09 x64          ½ 0 0 0   0 0 0 0 ½ 1 ½ 0   ½ 0 ½ ½ ½ ½ ½ 0 0 0 0   ½   ½ ½ ½   ½ ½ 1 ½   * 0 1  11.0/33  163.50
40  Halogen 10 NN PEXT x64         0 0 ½ ½ 0 0 0   ½     0 0   ½ ½ 0 0 ½ 0   ½ 0 1 ½ ½ 0 0 0 ½   ½ ½ 1 0 0 0 ½ 1 *     9.5/33
41  Nirvanachess 2.5 POPCNT x64    0 0 0 0 0 0   0   0 0   0 ½ 0   ½   ½   ½ 0   ½ ½ ½ 0 ½ 0 ½ ½ 0 ½ ½ 0 ½ 0 1 0   *   7.5/32



Schaue mal ...
Weiss spielt eine sehr schlechte Runde, xiphos spielt keine gute Runde und Wasp macht wieder die Remisen gegen deutlich stärker im Endspiel.

Noch 2 Boliden in der laufenden Runde 13 ... und noch einige "Schwächere" ... das kann bis Platz 10 hochgehen mit sehr viel Glück.
Bei 40 Runden 7-8 Plätze über der tatsächlichen Stärke.

Auch Ethereal ist im Kampf um den Rundensieg noch nicht aus dem Rennen.
Trotz einer unglaublichen Niederlage gegen Defenchess ... die Partie musst Du Dir mal anschauen!

Gruß
Frank

Soweit zu Turnieren nach wenigen Partien!
Würde mich arg wundern wenn Ethereal überhaupt eine Runde gewinnen kann.
Aber nun gut, wenn das nun passiert ... in wahrscheinlich 1 von 200 Fällen möglich.
Parent - By Frank Quisinsky Date 2021-12-04 11:24 Edited 2021-12-04 11:31
Hi Klaus,

nur bei den Runden mit so vielen Partien ändert sich wenig während einer laufenden Runde.

Hier die Ergebnisse der abgeschlossenen Runde 01-12 von 50.

Code:

     Name                            Games     Win     Draw     Lose       Pts         S-B         %

Stockfish 151121 NN x64            :   480  :  319+  :  161=  :    0-  :   399.5  :  91151.25  :  83.23%
Dragon 2.5.1 by Komodo NN AVX2 x64 :   480  :  303+  :  174=  :    3-  :   390.0  :  88479.00  :  81.25%
Fire 8 NN MC.3 x64                 :   480  :  235+  :  235=  :   10-  :   352.5  :  79442.75  :  73.44%
SlowChess Blitz 2.8 NN AVX2 x64    :   480  :  234+  :  234=  :   12-  :   351.0  :  78648.00  :  73.13%
Koivisto 7.5 NN AVX2 x64           :   480  :  232+  :  232=  :   16-  :   348.0  :  77910.00  :  72.50%
Ethereal 13.25 NN PEXT x64         :   480  :  219+  :  236=  :   25-  :   337.0  :  74970.75  :  70.21%
Berserk 7 NN PEXT x64              :   480  :  200+  :  259=  :   21-  :   329.5  :  73922.75  :  68.65%
RubiChess 2.2 NN x64               :   480  :  177+  :  275=  :   28-  :   314.5  :  69777.25  :  65.52%
Revenge 1.0 NN x64                 :   480  :  165+  :  284=  :   31-  :   307.0  :  68674.00  :  63.96%
Seer 2.4.0 NN AVX2 x64             :   480  :  163+  :  269=  :   48-  :   297.5  :  65556.00  :  61.98%
Igel 3.0.10 NN BMI2 x64            :   480  :  157+  :  278=  :   45-  :   296.0  :  65874.75  :  61.67%
Nemorino 6.09 NN x64               :   480  :  159+  :  259=  :   62-  :   288.5  :  63092.50  :  60.10%
rofChade 2.310 NN x64              :   480  :  152+  :  269=  :   59-  :   286.5  :  62352.00  :  59.69%
Arasan 23.0.1 NN AVX2 x64          :   480  :  131+  :  274=  :   75-  :   268.0  :  58414.50  :  55.83%
Lc0 0.28.0 NN CPU-dnnl             :   480  :  132+  :  271=  :   77-  :   267.5  :  59094.75  :  55.73%
Booot 6.5 POPCNT x64               :   480  :  114+  :  280=  :   86-  :   254.0  :  55511.00  :  52.92%
Xiphos 0.6 BMI2 x64                :   480  :   90+  :  285=  :  105-  :   232.5  :  49903.25  :  48.44%
Weiss 2.0 PEXT x64                 :   480  :   92+  :  273=  :  115-  :   228.5  :  49919.50  :  47.60%
Minic 3.17 NN x64                  :   480  :   87+  :  276=  :  117-  :   225.0  :  48668.75  :  46.88%
Wasp 5.00 NN AVX2 x64              :   480  :   77+  :  293=  :  110-  :   223.5  :  48799.50  :  46.56%
Schooner 2.2 XB SSE x64            :   480  :   83+  :  271=  :  126-  :   218.5  :  46433.50  :  45.52%
Zahak 8.6 AMD x64                  :   480  :   91+  :  246=  :  143-  :   214.0  :  45758.75  :  44.58%
Defenchess 2.3 dev BMI2 x64        :   480  :   72+  :  278=  :  130-  :   211.0  :  45630.00  :  43.96%
Fritz 18 (Ginkgo) x64              :   480  :   78+  :  260=  :  142-  :   208.0  :  43813.00  :  43.33%
Shredder 13 POPCNT x64             :   480  :   75+  :  259=  :  146-  :   204.5  :  44275.00  :  42.60%
Clover 2.4 x64                     :   480  :   61+  :  277=  :  142-  :   199.5  :  43017.25  :  41.56%
Chiron 5 x64                       :   480  :   68+  :  260=  :  152-  :   198.0  :  42531.75  :  41.25%
Laser 1.7 BMI2 x64                 :   480  :   71+  :  251=  :  158-  :   196.5  :  41986.25  :  40.94%
Marvin 5.2.0 NN AVX2 x64           :   480  :   63+  :  260=  :  157-  :   193.0  :  41604.25  :  40.21%
DanaSah 9.0 NN AVX2 x64            :   480  :   59+  :  267=  :  154-  :   192.5  :  41869.75  :  40.10%
Fizbo 2.0 BMI2 x64                 :   480  :   63+  :  251=  :  166-  :   188.5  :  41375.00  :  39.27%
Andscacs 0.95.123 x64              :   480  :   62+  :  252=  :  166-  :   188.0  :  40120.75  :  39.17%
Winter 0.9 BMI2 x64                :   480  :   61+  :  232=  :  187-  :   177.0  :  38606.75  :  36.88%
Halogen 10 NN PEXT x64             :   480  :   46+  :  256=  :  178-  :   174.0  :  37582.75  :  36.25%
Dark Toga 1.1 NN AVX2 x64          :   480  :   62+  :  221=  :  197-  :   172.5  :  37397.50  :  35.94%
Orion 0.8 NN FMA x64               :   480  :   43+  :  247=  :  190-  :   166.5  :  36346.75  :  34.69%
GullChess 3.0 Sy BMI2 x64          :   480  :   50+  :  228=  :  202-  :   164.0  :  35003.25  :  34.17%
Stash 31.16 x64                    :   480  :   40+  :  235=  :  205-  :   157.5  :  33272.50  :  32.81%
Nirvanachess 2.5 POPCNT x64        :   480  :   29+  :  226=  :  225-  :   142.0  :  30662.75  :  29.58%
Combusken 1.4.0 AMD x64            :   480  :   44+  :  196=  :  240-  :   142.0  :  29905.75  :  29.58%
Demolito 2021-07-09 x64            :   480  :   35+  :  202=  :  243-  :   136.0  :  28554.50  :  28.33%


Xiphos:
232.5  :  49903.25

Wasp:
223.5  :  48799.50

Bei 9 Punkten weniger nur knapp bei der SB dahinter.

Dann wie Du schreibst ...
Wasp punktet gegen die Stärkeren deutlich besser als Xiphos (sieht man ja auch an den Einzelergebnisse in der Turniertabelle).

Wie schaut es während der Runde 13 aus ...

Xiphos:
245.0 / 512   56217.25

Wasp:
242.5 / 513   56744.50

Vorsprung ist krass gefallen von 9 auf 2.5-3.5 Punkte.
Wasp hat eine deutlich höhere SB Wertung, fällt jetzt natürlich besser ins Auge.

Persönlich schaue ich bei den laufenden Turniere und weniger Partien (bis ca. 1.000 pro Engine) eher auf die SB Wertung als auf die Punkte.
In Regel pendelt es sich in 98% der Fälle ein, Engines mit der höheren SB stehen auch in den Tabellen dann vorne.

Insofern ist SB wirklich ein netter kleiner Ansatzpunkt für einen schnellen Blick über eine Tabelle!!

Übrigens ...
CEGT ... da liegt Wasp hinter xiphos aber xiphos hatte mehr ältere Engines als Gegner und gegen die stärkeren Programme erreicht Wasp deutlich öfters Remis.
Insofern bin ich mir zu 98% sicher das Wasp während des Turniers an xiphos leicht vorbeiziehen kann, es sei denn xiphos beginnt gegen die Stärkeren besser zu punkten
oder Wasp gegen die Stärkeren schwächer zu punkten. Aber das kann man schon fast nach 500 gespielten Partien bei "Jeder gegen Jeden" ausblenden.
Parent - - By Benno Hartwig Date 2021-12-03 14:26 Edited 2021-12-03 14:34

> Ist es anfangs entscheidend, wer gegen wen drankommt,...


...und was er daraus macht!

Sicher, man kann dann gegen Stärkere und Schwächere kommen.
Und man sollte versuchen, etwas aus der Chance gegen den Schwächeren zu machen. Gelingt es, steht man anschließend besser da.
Gelingt es nicht, dann ist nicht unvernünftig, dass man dann deshalb etwas schlechter dasteht.
Finde ich.

Ja, die mittleren Bereiche im Schweizer System werden ausgespielt, und es gibt durchaus auch plausible Gründe, diese Reihenfolge so zu definieren.
Aber besonders viel Aussagekraft sollte sicherlich niemand dieser erspielten Reihenfolge beimessen.

PS:
Seinerzeit hatte ich mal die Logik des Schweizer Systems programmiert und ihm ein Teilnehmerfeld (Die Zahlen von 1 bis 100 beispielsweise) geboten, dann eine Anzahl Runden gespielt, wobei ich konsequent die kleinere Zahl automatisch gewinnen ließ. Ich wollte sehen, wie gut die Sortierung dadurch gelingt.
Und ich erinnere mich noch, dass da da in der Mitte stets schon noch einiges an Verschiebungen war, aber wirklich schlecht sah die gebildete Reihenfolge eigentlich auch nicht aus. Bei so wenigen Partien, muss man bedenken!
Parent - By Andreas Mader Date 2021-12-03 14:45
Benno Hartwig schrieb:


> Ist es anfangs entscheidend, wer gegen wen drankommt,...


...und was er daraus macht!

Sicher, man kann dann gegen Stärkere und Schwächere kommen.


Am Anfang beim konkreten TCEC-Turnier eben nicht, weil die ELO-Wertung von Schachprogrammen relativ stabil ist. Die erste Runde erfolgt nicht durch eine rein zufällige Auslosung. Normalerweise wird anhand des ELO-Ratings eine Reihenfolge von 1 bis 44 (Anzahl der Teilnehmer) erstellt und in der ersten Runde spielt jeweils einer aus der oberen Hälfte gegen einen aus der unteren Hälfte. Bei einer normalen Paarungsweise spielt Nummer 1 gegen 23, 2 gegen 24 usw. bis 22 gegen 44. Es gibt auch andere Methoden, aber ich habe nicht nachgesehen, ob die von TCEC verwendet wurden. Sollte jeder aus der oberen Hälfte gewinnen spielt in Runde 2 1 gegen 12, 2 gegen 13 usw. Es wird darauf geachtet, dass die gleich starken zu Beginn nach Möglichkeit nicht gegeneinander spielen, um große Verzerrungen zu verhindern. Das kann natürlich nicht zu hundert Prozent klappen, aber gerade bei Schachprogrammen funktioniert das recht gut.

Noch dazu gibt es bei einer Doppelrunde kein Problem mit der Häufigkeit von Schwarz und Weiß und gegen wen man welche Farbe hat, was für gewöhnlich einer der größten Fallstricke beim Schweizer System ist.
- - By Benno Hartwig Date 2021-12-04 06:48
Oh, nach hier jetzt jeweils 19 Partien hat sich Dragon gegenüber Lc0 und SF einen echten mehr-halben-Punkt gegen Slowchess geholt und führt jetzt also in Punkten das Feld an.
Und dabei spielte Dragon hier mit schwarz, und nach der Eröffnung hatten beide Engines hingegen weiß mit mindestens einem dreiviertel Bauern im Vorteil gesehen! 
Parent - By Peter Martan Date 2021-12-08 12:33
Dragon konnte diesen Vorsprung sogar noch ausbauen und hat das Turnier mit einem ganzen Punkt Vorsprung auf die punktegleichen SF und LC0 gewonnen.
Gratuliere herzlich, gratuliert herzlich
Up Topic Hauptforen / CSS-Forum / S21 - Swiss 2
1 2 Previous Next  

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill