S21 - Swiss 2

By Frank Quisinsky Date 2021-12-04 23:21

Hallo Andreas,

was ist "R-Mobility"!
Macht mich neugierig.

War schon Ewigkeiten nicht mehr auf der TCEC Seite bzw. überprüfe nur ob der Link zu TCEC auf meiner Webseite funktioniert.
Linke also dorthin, weil ich weiß das TCEC viele Fans hat.

Ob ich das nachvollziehen kann oder nicht spielt dabei keine Rolle wenn andere Spaß daran haben.

Nun, ich bin sehr pingelig was Turniere und Durchführung angeht.
War das im Grunde immer schon, auch wenn mir selbst immer wieder Fehler passieren.

Alles muss reproduziertbar sein, die eigene Vorgabe schon allein um selbst durchzublicken.
Wenn ich Züge in Analysen nicht nachvollziehen kann, entwertet das sofort und direkt Partien, die ich für statistische Zwecke einsetze.
Da habe ich sehr strenge Vorgaben was z. B. in meine Sammlung aufgenommen wird oder was eher nicht.

Habe mir einige TCEC Partien natürlich angesehen.
Finde das schon die Eröffnungsvorgaben unlogisch sind, und viele entscheidende Züge konnte ich nicht reproduzieren.
Nehme ich solche Sachen in meine Sammlung auf wird die Qualität dieser nicht höher.

Wenn ich jetzt den Ausführungen von einem Schachfreund glauben schenke (und ich habe keinen Grund anzunehmen das er nicht genau testet, er macht das auch schon seit mehr als 20 Jahren) dann kommt er zu dem Ergebnis, dass ca. 20 der besten 30 Schachprogramme auch mit Ponder und mit 32 Cores (er testet mit einer 32-Core Maschine) absolute TOP-Leistungen abliefern. Er kann reproduzieren in ca. 95% der Fälle. Er liegt mir schon über 2 Jahre auf der Pelle, ich sollte umdenken und mich mehr damit beschäftigen. Hat mir eine ganze DVD mit Daten und Analysen zur Verfügung gestellt. Ich muss ehrlich zugestehen, dass ich es bislang aufgrund diverser Umstände im letzten Jahr nicht geschafft habe mir mehr als 10% dieser Arbeit anzusehen.

Vielleicht werde ich auch einfach alt ...
Ob nun die Webseite im alten Layout oder die Testerei, die auf Einstellungen beruht die sich bislang immer bewährt haben.

Möchte das gar nicht ausschließen und vielleicht bin ich bei TCEC einfach zu kritisch.

Dir auch einen schönen Abend!
Frank

R-Mobility!
Hätte ich mehr Zeit und würde nicht selbst versuchen in meiner Freizeit etwas zu produzieren wäre mir das sicherlich nicht entgangen!
Aber Schach ist zu spannend, gibt ja nicht nur Computerschach.

By Lothar Jung Date 2021-12-05 07:57

Hier ist die Erklärung von R-Mobility:

https://wiki.chessdom.org/R-Mobility

Lothar

By Andreas Matthies Date 2021-12-05 08:28

Hallo Frank.

Zu dem von Lothar verlinkten Wiki-Artikel kann ich eigentlich nur ergänzen, dass es sich da um eine "fixe Idee" des Admins Aloril handelt, die sich nicht durchsetzen wird.
Es begann mal als Rätsel "Was haben diese Positionen gemeinsam", in dem Aloril viele Positionen mit völlig unterschiedlichem Erscheinungsbild aufgeführt hatte, und die Lösung hatte dann natürlich mit der r-Mobility zu tun: Gleich groß oder aufsteigend in 0.5er Schritten, ich weiß es nicht mehr genau bzw. habe ich mich nie im Detail damit beschäftigt und so geht es wohl auch fast allen anderen. Dass Aloril die r-Mobility als Tiebreak-Kriterium eingeführt hat, hat jedenfalls meines Wissens nicht dazu geführt, dass irgendeine Engine sich darum kümmert und auf eine möglichst gute r-Mobility hinarbeitet.

Grüße, Andreas

By Frank Quisinsky Date 2021-12-05 09:27 Edited 2021-12-05 09:48

Code:

2. Statistiken... das ist wohl eher eine spezielle Leidenschaft von dir und für den normalen Computerschachfreund weniger wichtig. Ein kurzes Beispiel dazu: Du legst in deinen Statistiken ja u.a. großen Wert auf Engines, die kurze Partien spielen, weil du daraus einen attraktiven und interessanten Spielstil abliest. Ich habe vor einiger Zeit in meiner Engine einen für die Spielstärke komplett unbedeutenden Patch eingebaut (hat mit mate distance pruning zu tun), der die durchschnittliche Partielänge in meinen Testspielen auch um ich glaube um ca. acht Züge verkürzt hat. Am "Spielstil" (was auch immer das ist) in der entscheidenden Phase der Partie hat der Patch aber rein gar nichts verändert.

Mal weg von meiner Faselei hin zu etwas was ich im Eifer des Gefechtes überlesen habe ...

Das ist interessant für mich ...
Ergebnisse FCP Tourney-2020, FCP Tourney-2021 und das laufende Turnier ...

Code:


08. RubiChess 2.2 NN x64            :  3308.93    480    65.5   177   275    28   314.5   57.3   20.23  3182.90  20.34     85.7
07. RubiChess 1.9 NN BMI2 x64       :  3193.50  2.000    63.4   764  1007   229  1267,5   50.4   10.73  3088.56  10.66     85.1
15. RubiChess 1.7.3 x64             :  3092.23  2.000    57.5   611  1077   312  1149,5   53.9   10.19  3035.36  10.47     88.2

In Anbetracht, dass die durchschnittliche Spielstärke von Turnier zu Turnier deutlich nach oben geht - gerade beim laufenden Turnier der Zügedurchschnitt auch deutlich gestiegen ist - bei der erreichten Spielstärke ein TOP-Wert.
Also, 85.7% bei einem durchschnittlichen Zügedurchschnitt (ohne Aufgabefaktor) von 88.965% und das bei einer der Spielstärke entsprechend absolut normalen Anzahl von Remispartien ... SUPER!!

Ich finde der Zügedurchschnitt hat sehr viel mit Attraktivität zu tun.
Spielen Engines ohne Aufgabefaktor keine unnötigen Züge, gehen den direkten Weg zur Entscheidung, wirkt das für mich wie ausgereift. Oder wie ein fertiges Produkt bei dem abschließend mit Feintuning im Detail verbessert wurde. Gehe davon aus, dass sich viele auch die Partien ansehen bis zum Ende. Dann genervt sind, wenn unnötig rumgeeiert wird, Zeit verschwendet wird.

Aber weist Du was dann wieder nervt beim Zusehen ...
Wenn Du nochmal etwas im Detail verbessern möchtest ... wage mich mal aus dem Fenster, nutze die Gunst der Stunde!

Schaue Dir mal als Beispiel die schöne Partie von Rubi gegen Zahak an.
Runde 13, Partie 12 unter Live-Games:

https://www.amateurschach.de/main/_replay-zone.htm

Positiv zunächst ... Anzeige bei Matt korrekt, M6, M5 ... ich finde das muss einfach stimmen!
Da haben so einige Programme Problemchen mit.

Negativ ...
M6 und 27 Sekunden bis zum Zug
M5 und 29 Sekunden bis zum Zug
M4 und 26 Sekunden bis zum Zug
M3 und 29 Sekunden bis zum Zug
M2 und 56 Sekunden bis zum Zug
M1 und 33 Sekunden bis zum Zug

3.5 Minuten Rechnenzeit verschenkt!

Bei 2.000 Partien und wahrscheinlich ca. 750 Gewinnpartien macht das schon bei 4 Minuten (im Durchschnitt) = 3.000 Minuten / 60 = 50 Stunden aus.
In dieser Zeit könnten 38 Partien bei 1:20 pro Partie gespielt werden.

Bei Remis-Zugfolgen noch viel krasser ...

Wenn die Mattführung klar ist, dann sollten die Züge sofort, innerhalb von 1-3 Sekunden bis zum Matt ausgespielt werden.

Ein Programmierer schrieb mir mal ...
Habe etwas eingebaut für Dich Frank ...

Beispiel:
Verschiedene Wege für ein Matt in 9!

Immer der spektakulärste Weg ...
Also z. B. 4 Möglichkeiten für Matt in 9
In einer Möglichkeit steckt eine Unterverwandlung ... dann wird stets die Matt in 9 Variante mit der Unterverwandlung gewählt.

Oder z. B. 4 Möglichkeiten für Matt in 9
In einer setzt ein Bauer Matt ... dann wird diese Variante gewählt.

Er hat da gar Regeln ausgearbeitet, um immer alles so spektakulär wie möglich aussehen zu lassen.

Also, wenn 50 Züge Regel klar ist ... gibt es keinen Grund mehr das die Engine noch Zeit verschwendet. Die Züge sollten nicht nur sondern müssen direkt ausspielt werden.
Gleiche Vorgehensweise bei Remis durch 3-fache Stellungswiederholung!

Wenn das von einer Engine beherrscht wird freut sich der Betrachter der Partien der Live zuschaut.
Und irgendwie wirkt die Engine "sehr liebevoll im Detail optimiert" ... wirkt wie ein fertiges Produkt.

Das alles hat mit Attraktivität zu tun und mithin wirkt das auch positiv beim Spielstil, auch wenn etwas weit hergeholt (rundet eher einen schönen Spielstil ab).

Wäre vielleicht etwas was Du sicherlich noch verbessern könntest.
Muss nicht immer nur Elo+ sein!

Wobei nochmals ...
RubiChess spielt die Spielphasen sehr ausgeglichen und zeigt nicht wirklich Schwächen die grob ins Auge fallen.
Da steckt sicherlich schon sehr viel Optimierungsarbeit drin.

Auch wenn Du sehr schön schreibst und auch erklärst (freut sich der Leser) kenne ich Dich ja nicht.
Möchte da auch nicht anecken weil dafür besteht ja kein Grund, freue mich ja über Rubi.

Bei vielen Programmierern muss ich im Eifer des Gefechtes immer ein wenig vorsichtig sein.
Bei anderen kann ich richtig nerven, auch krass und die sind mir nicht böse.

Bin da oft nicht feinfühlig genug.

Viele Grüße
Frank

Und gerade weil fast jeder mit Aufgabefaktor spielen lässt und nach meinem Wissen auch fast jeder der Programmierer.
Da funktionieren gut und gerne 20-30% meiner internen Statistiken nicht mehr.
Partie ist zu Ende mit Matt oder Remisregel und alles was damit zu tun hat zeichnet ein fertiges Programm aus (denke ich mir immer).

By Frank Quisinsky Date 2021-12-05 10:09 Edited 2021-12-05 10:23

Ach so ...
Gunst der Stunde nutzen ...

Thema: Wünsche äußern!

Während der Gandalf Entwicklung hatte Steen mir mal einen netten Wunsch erfüllt aber er machte das nicht mit einem UCI-Parameter sondern fummelte "Programmierer konform" in den Sourcen rum.

Na ja, was die Programmierer so machen, halt!

Also ...
Wenn im Spiel gegen Königsseite mehrere gute Züge möglich sind, die Stellung also als schon sehr leicht gewinnträchtig abgewogen wird ...
Mindestens noch 22 Figuren vorhanden sind ...

ein Leichtfiguren / Schwerfiguren Zug höher bewertet wird als ein Bauernvorstoss ...
Verwerfe zu Gusten des Bauernvorstosses, wenn die Bewertung nicht um mehr als 0.x zurückgeht ... z. B. 0.25 - 0.40 Bauerneinheiten.

Spekulatives Spiel auf sich öffnende Linien produziert Bauernopfer für den Angriff.
Macht Sinn wenn eine Engine sich wohl fühlt.

Optimal wäre es wenn eine solche Funktion mittels "UCI Parameter" Spekulativ einstellbar wäre.

Könnte man austesten mittels komplizierten Eröffnungsstellungen die stärkere Programme gegen schwächere Programme öfters schnell zum Matt bringen.
Durch messen "Züge-Durchschnitt bei den Gewinnpartien".

Noch besser wäre es dann ...
Wenn RubiChess selbst so intelligent wäre und während der Eröffnungsphase beurteilen könnte, ob die Züge des Gegners eine höhere Spielstärke vermuten lassen ... bleibt die Option automatisiert aus. Spekulativ bei vorteilhafter Stellung automatisiert an wenn Gegenzüge vermuten lassen, dass die Spielstärke niedriger ist.

Stellt RubiChess fest ...
Moment mal, die Züge des Gegners scheinen nach eigener Bewertung richtig gut zu sein, geht RubiChess in den Defensiv Mode und versucht durch Abtausch bei keinen zurückhängenden Bauern einfach auf Remis zu spielen.

So wäre der UCI-Parameter nicht notwendig.

Ich müsste mal in älteren E-Mails schauen von Steen schauen.
Aber ich habe auch nicht richtig verstanden, was er seinerzeit mit der doppelten Bewertungsfunktion im frühen Mittelspiel meinte.
Mein Englisch war ja noch schlechter als heute und er vermutete eher was ich wollte und probierte das eine oder andere.

Fest steht ...
Seinerzeit spielte Gandalf herzerfrischend nachdem er da so einiges verändert hatte.
Version 4.32f ... bei 4.32h ging der Schuss nach hinten los.

Gandalf spielte sich in die Herzen viele Computerschachfreunde und war ein wirklich besonderes Programm.

Viele Grüße
Frank

Rubi spielt ja schon aggressiv aber die Steigerung ist ultra-aggressiv.
Laut gedacht!

By Andreas Matthies Date 2021-12-05 10:55 Edited 2021-12-05 11:02

Hallo nochmal.

Wenn du auf Bauernvorstöße und interessante Umwandlungen abfährst: Rubi hatte da gerade gestern beim TCEC ein passendes Spiel für dich: https://tcec-chess.com/#div=sw2&game=429&season=21
Damit wird diese Diskussion dann auch wieder etwas mehr on-topic.
Im Programmcode werde ich in die Richtung "Spielstil" nichts ändern, dazu bin ich zu sehr Computer- und zuwenig Schach-Spezialist.

Grüße, Andreas

By Chess Player Date 2021-12-05 11:04

Eine pgn zu posten ist zu schwierig?

By Andreas Matthies Date 2021-12-05 11:17

Chess Player schrieb:

Eine pgn zu posten ist zu schwierig?

Nein. Aber redundant.

By Chess Player Date 2021-12-05 11:28

Andreas Matthies schrieb:

Chess Player schrieb:

Eine pgn zu posten ist zu schwierig?

Nein. Aber redundant.

Eine gewisse Redundanz erhöht die Wahrscheinlichkeit erkannt zu werden.

By Frank Quisinsky Date 2021-12-05 20:12

Hallo Andreas,

ich bin dahingehend so was von reizüberflutet.
Da trägst Du einen gehörigen Anteil bei.

Habe letzte Woche mein ultrabook präpariert.
Da läuft ein aktueller i7 mit 3.2Ghz.

Die vielen kurzen Gewinnpartien vom aktuiellen Turnier sind drauf.
Slow, Wasp, Rubi, Revenge und Arasan sind installiert und überprüfen sich gegenseitig bei den entscheidenden Zügen.

Ein Wahnsinn was dabei herauskommt wenn direkt 5 Angreifer die Partien aufs Korn nehmen.
Das ist so geiles Material und die Analysen mit Vergleichen zu Kommentaren von GMs zu den Varianten (aus Schachbüchern) sind hochinteressant.
Material für 10 neue Schachbücher und viel Statistik Zeug.

Ja, total off-topic im TCEC Chat.

Im Grunde muss ich mich gar entschuldigen für die Messages von mir im diesem Thread.
Wird mir schon niemand die Rübe abreißen, hatte bislang immer Glück.

Viele Grüße
Frank

Die werden alle fünf bei FEOBOS am Start sein!

By Andreas Matthies Date 2021-12-05 10:14

Hallo Frank.

Du nervst mich nicht, aber ich hoffe, du verstehst, dass ich nicht so ausführlich schreibe wie du. Ich glaube, niemand kann das

Meine knappe Antwort zu deinem Wunsch: Ja!
Beim unnötigen Ausreizen der Bedenkzeit in Positionen, in denen das Ergebnis feststeht, hast du vollkommen Recht. Das sieht nicht schön aus und verschwendet Ressourcen.
Zumindest bei Mattpositionen. Bei vermeindlichen Remis-Positionen wäre ich sehr vorsichtig, an der Bedenkzeit zu sparen. Häufig genug verhakt sich eine Engine in einer 0.00 Bewertung, um dann ganz böse wachgerüttelt zu werden. Ausnahme wären da nur Züge, die direkt zum Remis durch Wiederholung, 50-Züge oder Materialmangel führen.

Ich werde da bei Gelegenheit mal beigehen.

Grüße, Andreas

By Frank Quisinsky Date 2021-12-05 10:43

Hallo,

schreibe immer zu viel.
Vielleicht ein Ausläufer von "nicht mehr gut hören", Leute die dahingehend Probleme haben lieben es zu lesen oder mehr als gebührend zu schreiben.
Wobei ich ja nicht jeden Tag in Schreiblaune bin.

Muss an den Daten der Runde 13 arbeiten, die Elo-Liste fehlt noch.
Die editiere ich von Hand, das dauert immer ...

Prima, so kleine Optimierungen anstatt Elo+ ist auch reinzvoll.

Go Rubi go ...

Viele Grüße und vielen Dank!
Frank

By Andreas Mader Date 2021-12-05 12:18

Andreas Matthies schrieb:

Danke, das war die Information, die mir gefehlt hat.

Was R-Mobility an sich ist habe ich schon verstanden, nur was diesen Wert dazu befähigt, eine Reihenfolge zwischen Teilnehmern mit gleicher Punktezahl in einem Turnier zu erzeugen, das ging über meinen Horizont. "Fixe Idee" ist eine vollkommen einleuchtende und ausreichende Erklärung.

Schöne Grüße
Andreas

By Jörg Oster Date 2021-12-05 15:30

Andreas Matthies schrieb:

Hallo Andreas,

ich weiß nicht so recht.
Ich habe die Idee mal prinzipiell in meinem Mattlöser Matefish zur Zugsortierung implementiert.
Die Anzahl der berechneten Positionen bei meinen 15 Bench-Stellungen reduziert sich dabei nochmal erheblich!

Vorher:
===========================
Total time (ms) : 4700
Nodes searched  : 5708557
Nodes/second    : 1214586

Mit r-Mobility:
===========================
Total time (ms) : 6746
Nodes searched  : 1633458
Nodes/second    : 242137

Leider bricht dadurch die Knotenleistung ein und die Gesamtlösezeit erhöht sich!

Trotzdem ein interessantes Experiment.

Gruß, Jörg.

By Max Siegfried Date 2021-12-02 12:56

Benno Hartwig schrieb:

Die besten Engines haben jetzt noch jeweils 5 Partien zu spielen
und punktgleich liegen an der Spitze Lc0, Dragon und Stockfish (jeweils 10.5 aus 17)

Na, da könnte es knapp werden, dass SF wirklich noch ein mehr-halber-Punkt gelingt, um unangefochten die "1" zu werden.
Und dass die Feinwertung SF noch nach oben spülen kann, ist wohl eher unwahrscheinlich.

Vielleicht bekommen wir hier tatsächlich mal ein Stockfish-hat-nicht-gewonnen-Event.
Sooo häufig sind die ja nicht.

Das Ergebnis hängt ganz von den jeweiligen Gegnern und den Stellungen an.

By Peter Martan Date 2021-12-03 07:53 Edited 2021-12-03 08:37

Mich interessiert vor allem, ob die Plätze unterhalb der ersten 3 nach den letzten Runden doch noch ein bisschen mehr mit der Spielstärke der Engines korrellieren werden, wie man sie aus Ranglisten kennt.

https://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=149645#pid149645

Dass soviel Differenzierung an der SB- Wertung hängt, macht die Sache schon auch Zufalls- abhängiger beim Schweizer System als bei anderen Turnieren, finde ich. Ist es anfangs entscheidend, wer gegen wen drankommt, wird mit gleicher Punktzahl vieler Engines dann irgendwann wieder mehr self fulfilling prophecy daraus, dass die Reihung, wie sie nach einer Weile besteht, zementiert wird. Dafür wirken sich einzelne Partien mit ganzen Punkten immer noch krass aus, wie der eine Verlustpunkt von Revenge gegen komodo, weil beide jetzt dann auch dieser neuen Reihung entsprechend weiterspielen.

Wenn innerhalb gleicher Punktzahl die höher gereihten mehr SB- Punkte für ihre Matchpunkte bekommen, und die Gegner innerhalb der Reihung mehr beisammen bleiben im Aufeinandertreffen, schaukeln sie sich durch SB weiter oben mehr hoch und hängen die unteren mehr ab an Feinwertung bei gleicher Punktzahl. Die zusätzlich zu unterscheiden, ist SB- Aufgabe, in jeder gegen jeden- Turnieren ist das aber auch weniger quantitativ (oder jedenfalls anders qualitativ) System- immanent.

Dass diese 3 Engines oben Punkte- gleich sind, macht weniger aus, finde ich, dass die praktisch gleich stark sind, weiß man ohnehin, spielt also keine echte Rolle, wenn sie mal in der einen und mal in der anderen Reihenfolge mit gleicher Punktezahl einlaufen. Aber dass so viele andere auch nur von so wenigen "echten" Punkten getrennt werden, das spricht schon nach wie vor stark für zu wenig Partien bei so vielen Engines.

Das alles schon einmal so ähnlich erwähnt hat

By Andreas Mader Date 2021-12-03 10:34 Edited 2021-12-03 11:08

Irgendwie scheint mit dem Computerschach auch der Sinn von Turnieren verloren gegangen zu sein. Sicherlich werden die hauptsächlich deshalb gespielt, um einen Gewinner zu küren, aber ein weiteres Ziel ist es, schöne und interessante Partien zu sehen. Dass dabei aufgrund der Zufallsschwankungen nicht zwangsläufig der Teilnehmer mit der höchsten ELO-Wertung gewinnt, ist vollkommen klar und es wäre auch der tatsächliche Tod des Schachs, wenn es so wäre. Aber in Zeiten, in denen ein Turnier schon alleine deshalb als "sportlich wertlos" bezeichnet wird, weil die Endreihung nicht exakt die ELO-Reihenfolge abbildet, ist das nicht verwunderlich. Wahrscheinlich wäre dann auch die derzeit laufende WM sportlich wertlos, sollte der Herausforderer gewinnen, der doch viel weniger ELO-Punkte hat als der amtierende Weltmeister.

Bei Turnieren nach dem Schweizer System werden die ersten Partien nach der ELO-Wertung arrangiert, also dem Fetisch eines jeden echten Computerschächlers. Das ist eine Art Setzliste wie im Tennis. Dadurch ist es wahrscheinlich, dass die besser platzierten Engines die erste Runde gewinnen und die natürliche Hackordnung nicht gestört wird. Das selbe sollte dann auch in Runde 2 passieren, wenn die SB-Wertung noch nicht derart viel Differenzierung bringt. Dann hat sich bereits die Spreu ein wenig vom Weizen getrennt und die SB-Wertung macht genau das, was sie soll: Sie reiht anhand der Turnier-Performance der Gegner. Gewinne ich gegen jemanden, der ein sehr gutes Turnier spielt, ist meine SB-Wertung höher. Gewinne ich gegen jemanden, der am Ende herumdümpelt, ist meine SB-Wertung niedriger. So gesehen ist der größte Feind der SB-Wertung ein negativer Ausreißer, der alles verliert und die SB-Wertung aller seiner Gegner, die das Pech hatten, gegen ihn anzutreten, in den Keller zieht. Die SB-Wertung ist übrigens ausschließlich dazu da, um Teilnehmer mit gleicher Punktzahl zu reihen. Die SB-Wertung von Teilnehmern mit unterschiedlicher Punktzahl zu vergleichen ist absoluter Unsinn.

In der Mitte eines Turniers nach Schweizer System wird immer relativ viel Zufall herrschen, während an der Spitze und am Ende meistens die Teilnehmer stehen, die es auch irgendwie verdienen. Aber es ist auch nicht das Ziel eines solchen Turniers, die Reihenfolge exakt abzubilden.

Schöne Grüße
Andreas

By Chess Player Date 2021-12-03 10:45

By Peter Martan Date 2021-12-03 13:01 Edited 2021-12-03 13:53

Ich finde das auch deshalb gut, weil ich ja überhaupt nichts Gegenteiliges in meinen vielen lichtvollen Postings in der Sache schrieb. Und dass man ausgerechnet mir, wenn man ein bisschen was von dem sehr Vielen, was ich bei derlei und anderen Gelegenheiten zum Thema Elo und Celo schon geschrieben hab, keinen Elo- Fetischismus vorwerfen wird, davon gehe ich aus.
Das einzige, was ich sonst noch zu diesem Turnier bemerkte und es auf Aufforderung halt nochmal mache: es sind zu wenige Partien für zuviele Engines, um eine Reihung zu erhalten, die nicht mehr Zufall als Spielstärke abbildet, aber auch das kann man natürlich sehr verschieden bewerten, je nachdem, welche Engine einem mehr oder weniger unter oder über Wert geschlagen scheint. Dass SF, LC0 und Dragon die ersten 3 Plätze einnehmen, wenn man sie lang genug spielen lässt, bestätigt den Zusammenhang zwischen Ranglisten (die's halt auch gibt, ich bitte mir den Vergleich nachzusehen, wenn's das war, womit ich aneckte) und Turnieren irgendwie doch auch, ob da jetzt SF als Nr. 1 oder 3 durchs Ziel geht, sollte vielleicht sogar auch bei anderen Gelegenheiten weniger wichtig genommen werden, sinngemäß das schrieb ich zuletzt auch, nur um die Übereinstimmungen in den Vor- und Nachpostings nochmals zu betonen.

Und das mit den Reihungen und den Turnieren, das ist halt (auch das kennt man als stehenden Satz von mir mittlerweile recht gut) überhaupt mehr und mehr eine ziemliche Geschmackssache, aber wenn ich keine Reihung, sondern nur das Produzieren von schönen (unter dem Aufwand von mehr oder weniger vielen langweiligen) Partien haben will, stellt sich die Frage nach der Bezeichnung Turnier halt irgendwie, aber wir können es ja auch nennen, wie wir wollen, um nur ja niemanden zu kränken. Ansonsten könnten wir ja auch bei der laufenden WM, um bei deinem Vergleich zu bleiben, nach ein paar schönen Partien sagen, ja, ok, jetzt hören wir wieder auf, bevor sich jemand weh tut oder im Publikum sich wer ärgert, es sollen ja auch nicht zu viele Partien werden, siehe bei TCEC mit 44 Teilnehmern müssen ja auch 11 Doppelrunden und 484 games reichen, nach 22 Partien der WM Gegner müsste also wirklich auch spätestens Schluss sein, egal, wer gerade vorne ist.

Das mit dem einzelnen Gewinner ist gerade bei so schönen Turnieren wie einer WM ja auch wirklich nachrangig, auch diesbezüglich zu mehr Freude am Spiel ohne die nervige Überbewertung des Wettbewerbscharakters, regt an

By Chess Player Date 2021-12-03 13:35

Es gibt statistische Aussagen darüber wie viele Runden mindestens gespielt werden müssen um die Rangfolge der ersten x Spieler sinnvoll zu erhalten. Es geht dabei "NUR" um die vorderen Plätze!

By Benno Hartwig Date 2021-12-03 14:38

Prinzipielle Zustimmung.
Ich denke aber, dass die hintersten Plätze mit einer vergleichbaren Sinnhaftigkeit erspielt werden. Vielleicht braucht man die ja auch mal.

By Chess Player Date 2021-12-04 12:31

Das geht prinzipiell nicht mit einem Schweizer System!

By Benno Hartwig Date 2021-12-04 21:52 Edited 2021-12-04 22:19

> Das geht prinzipiell nicht mit einem Schweizer System!

Mein Eindruck beim Betrachten früherer derartiger Ergebnisse ist ein anderer.
Oben wird ganz anständig sortiert, und ganz unten auch.
Und TCEC zeigt dies in diesem Moment ja auch bereits.
(und eigentlich verwundert mich das auch nicht, dass gerade im Schweizer System die Auswirkungen von Sieg und Niederlage sehr symmetrisch sind)

Wikipedia schreibt dazu übrigens:
"Das Schweizer System liefert akkurate Resultate in den oberen Rängen (Platz 1, Platz 2), ebenso in den untersten (letzter, vorletzter). Die Rangordnung im Mittelfeld ist jedoch stark zufallsabhängig."
(Hervorhebung von mir)

By Peter Martan Date 2021-12-04 22:42 Edited 2021-12-04 23:12

Genau, und jetzt wäre dann nur noch näher zu beschreiben, wie viele unter den "obersten" und unter den "untersten" zu verstehen wären, weil nur der 1. und 2. und der letzte und der vorletzte, wie du aus Wiki zitierst, wäre bei einem 44 Teilnehmer- Feld halt schon etwas mager an Ausbeute, wenn der Rest reiner Zufall wäre.

Ich würde stark vermuten, das hängt davon ab, wieviele es insgesamt sind, wie groß die Unterschiede zwischen den Teilnehmern, wie unbalanciert die Eröffnungsstellungen und wieviele Partien. (Das alles übrigens genau so wie bei jedem anderen Turnier, ob Schweizer oder nicht, die einzig relevante Frage war für mich die ganze Zeit, ob man sich durch dieses System bei dieser Menge an Engines wirklich so viele Partien sparen kann, wie halt offenbar gehofft wurde oder wird zu welchem Ergebnis, das ja mit small sample allein auch noch nicht unbedingt hinlänglich quantitativ und qualitativ beschrieben ist, Turnier heißt's halt jedenfalls, drum könnte man meinen, ein Teil des Unterhaltungswertes solle sich doch auch irgendwie aus einer Reihung der Engines unter dem 2. und über dem vorletzten Platz ergeben. Und wenn der Zieleinlauf von den beiden ersten und den beiden letzten dann auch noch reiner Zufall ist..., lassen wir diese defätistischen Betrachtungsweisen lieber gleich wieder

).

Jetzt lass ich auch endlich überhaupt die substanzlosen Diskussionen, denen sowieso jede quantitative Grundlage fehlt, aber dann wirklich sein, weil ich ohnehin auch schon mehrmals dazu gesagt habe, dass es mir höchstens um den Grad an Zufälligkeit des Ergebnisses geht, nicht um irgendwelche Reproduzierbarkeit und Vergleichbarkeit mit anderen Matches, gar für Ranglisten gedachten, und ich weiß, dass dieses hier nur Partien produzieren soll mit Unterhaltunsgwert.
Aber auch dabei gebe ich noch ein letztes Mal zu bedenken, dass jeder Wert, auch der Unterhaltungswert, ein bisschen in Relation gesetzt werden sollte zu dem Hardware- Zeit- Manpower- Aufwand, der da getrieben wird.

Übrigens aber auch das noch, ausreichend Unterhaltungswert, weil's ja nicht meine Hardware- Zeit und Eigenarbeit ist, die's kostet, hat's für mich allemal, nur um auch noch einmal den Eindruck zu vermeiden, ich würde mich hier dauernd über irgendwas beklagen.
Hätte ich nicht immer wieder mal reingeschaut nach interessanten Partien, die's auch zu finden gab, hätte ich dazu gar nichts zu vermelden gehabt, weil's mich dann ja einfach nicht interessiert hätte, gibt gern abschließend auch noch unumwunden zu

By Chess Player Date 2021-12-05 10:14

Danke für die Klarstellung. Das es so ist ist aber nicht gewollt bei der Entwicklung des Schweizer Systems sondern nur eine ungewollte Nebenerscheinung.

By Frank Quisinsky Date 2021-12-04 07:46 Edited 2021-12-04 07:50

Hallo Andreas,

die SB-Wertung hat noch einen besonders guten Nutzen.

Teilnehmer im Feld mit niedriger Platzierung aber höherer SB-Wertung ...
Hier ist es oft abzusehen, dass mit mehr Partien sich die Platzierung ändert.

Beispiel:
Nicht NN Engine Xiphos punktet gegen NN-Engines deutlich schlechter als der tatsächliche Rang vermuten läßt.

Wasp hat nach über 500 Partien 4 Punkte Rückstand auf Xiphos aber eine höhere SB-Wertung.
Insofern die Aussage ... Wasp 5.00 kämpft um Platz 17 in der Welt gegen Xiphos!
Eine Engine die vor 10 Monaten noch auf Platz 8 stand.

https://www.amateurschach.de/fling/fcp-tourney-2022.html

Oder beim Kampf um Platz 3:
Fire hat eine deutlich höhere SB Wertung als Slow.
Auch wenn Slow um Platz 3 kämpft wird es schon absehbar sein das Fire Platz 3 halten wird.

Tatsächlich werden bei einem Engine Turnier mit wenigen Runden nur dann die Besten immer oben stehen, wenn gewährleistet ist das die Elo sich um mindestens 40 abhebt.
Ein Turnier nach Schweizer System soll ja einen Gewinner feststellen. Da Stockfish ca. 30 Elo stärker ist als Komodo kann auch Komodo erster werden. Da die anderen hinter Komodo
80-100 Elo schwächer sind kann ausgeschlossen werden, dass z. B. ein SlowChess oder Fire das Turnier gewinnen.

Würden also 10 der TOP-40 Engines nur 40 Elo auseinander liegen kann jeder Platz 1 bei einem doppelrundigen Turnier, mit 40 Partien pro Runde, also 80 Partien bei Jeder gegen Jeden belegen.
Für diese Aussage muss man auch kein Magier sein, weil es einfach immer das Gleiche ist.

Gruß
Frank

By Klaus Wlotzka Date 2021-12-04 10:44

Frank Quisinsky schrieb:

die SB-Wertung hat noch einen besonders guten Nutzen.

Teilnehmer im Feld mit niedriger Platzierung aber höherer SB-Wertung ...
Hier ist es oft abzusehen, dass mit mehr Partien sich die Platzierung ändert.

Beispiel:
Nicht NN Engine Xiphos punktet gegen NN-Engines deutlich schlechter als der tatsächliche Rang vermuten läßt.

Wasp hat nach über 500 Partien 4 Punkte Rückstand auf Xiphos aber eine höhere SB-Wertung.
Insofern die Aussage ... Wasp 5.00 kämpft um Platz 17 in der Welt gegen Xiphos!
Eine Engine die vor 10 Monaten noch auf Platz 8 stand.

Hallo Frank,

die Beobachtungen, die Du gemacht hast, haben eine ganz einfache Erklärung.

Ich habe mich im Zuge der Excel-Turnieraufbereitung und formeltechnischen Integration der S-B-Wertung in diese FCP-Statistiken, mit der S-B-Wertung beschäftigt. Grundsätzlich werden bei der S-B-Wertung die Engines, welche gegen starke Engines besser punkten, höher bewertet.

Insbesondere bei einem Rundenturnier wie das FCP-Tourney, bei dem jeder gegen jeden spielt, zeigt eine niedrigere S-B-Wertung, dass die betreffende Engine in der aktuellen, noch laufenden Runde noch gar nicht gegen die wirklichen Top-Engines gespielt hat. Die bisher erzielte S-B-Wertung wurde also gegen mehr schwächere Engines erspielt. Gegen die schwächeren Gegner kann man zwangsläufig seine S-B-Wertung nur schwer merklich verbessern, da diese selber zu wenig Punkte erzielen.

Ein Beispiel:
Engine A weist eine höhere S-B-Wertung als Engine B auf weil diese Engine gegen die Top 5 einen Score von 2 aus 5 erzielt hat.
Engine B weist eine niedrigere S-B-Wertung auf, weil diese Engine zwei mal gegen die Top 5 gespielt hat und dabei 0,5 aus 2 erzielt hat.

Das heißt, Engine B muss im weiteren Verlauf noch 3x gegen die Top 5 antreten und hat also mehr Partien gegen die schwächere Gegnerschaft gespielt als Engine A. Die Wahrscheinlichkeit, dass Engine A zum Ende der Runde vor Engine B landet ist aufgrund des guten Resultates gegen die Top 5 relativ hoch. Ganz anders als bei einem Turnier nach dem Schweizer System wissen wir ja beim Rundenturnier wie das FCP-Tourney, dass die Engine B aus unserem Beispiel zwangsläufig noch gegen das starke Teilnehmerfeld spielen muss.

Von daher sind Deine Beobachtungen logisch zu erklären. Die S-B-Wertung eignet sich demzufolge bei einer noch nicht abgeschlossenen Runde eines Rundenturniers, um eine gewisse Tendenz abzulesen.

Viele Grüße

Klaus

By Klaus Wlotzka Date 2021-12-04 11:18

Hallo Frank,

nachfolgend noch ein anschauiliches Beispiel zum Thema der S-B-Wertung aus dem laufenden FCP-Tourney.

Nach der abgeschlossenen 12. Runde zeigt sich folgendes Bild:

Die Engine "Xiphos 0,6" liegt mit einem Punktevorsprung von 4,0 Punkten vor der auf Platz 18 platzierten Engine "Weiss 2.0".

Trotz des noch guten Punktvorsprungs weist "Weiss 2.0" eine bessere S-B-Wertung auf. Dies kann nur daran liegen, dass "Weiss 2.0" in den ersten 12 Runden gegen die starke Gegnerschaft besser gepunktet hat. Tatsächlich lässt sich dies aus den bisherigen Ergebnissen auch so ablesen.

Ich wage daher die Prognose, dass sich am Ende des Turniers "Weiss 2.0" vor "Xiphos 0.6" platzieren wird.

Das setzt allerdings voraus, dass sich dieser Trend fortsetzt und "Weiss 2.0" auch noch gegen die schwächere Gegnerschaft entsprechend punktet.

Warten wir es ab.

Viele Grüße

Klaus

By Frank Quisinsky Date 2021-12-04 11:28

Hi Klaus,

ja, Weiss ist nicht zu unterschätzen.
Eine brandgefährliche Engine, die in der Lage ist in der Eröffnung Vorteile zu erspielen gegen deutlich Stärker!!

Auch Minic überrascht ...

Das wird ein packender Vierkampf um Platz 17.
Xiphos vs. Wasp vs. Weiss and vs. Minic.

Minic hat so rein statistisch gesehen die schlechtesten Karten.

By Frank Quisinsky Date 2021-12-04 12:16

Code:

40 Moves in 20 min  2021

                                   1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 
1   Stockfish 151121 NN x64        *       ½ ½ 1 1 ½ ½ 1 ½ 1 ½ ½ ½ 1 1 ½ 1 ½ 1 1 1 ½ 1 1 1 1   ½   1 1 1 ½ ½ ½   1 1  26.5/34
2   Dragon 2.5.1 by Komodo NN AVX    * ½ ½ 1   1 ½ ½ ½ 1 ½ ½ ½   1 1 1   1 1 ½ 1 1 1 1   ½   1 1 ½   1 1 1 1   ½ 1 1  26.0/32
3   Ethereal 13.25 NN PEXT x64       ½ * ½ ½   ½ ½ 1 1   ½ 1 ½   1 ½ ½   1 1 ½ ½ 1 1 1   1 1 0 1 1 1 1 1 1 ½   1 ½ 1  25.5/33
4   Fire 8 NN MC.3 x64               ½ ½ * ½   ½ 1 ½ ½   ½ ½ ½ ½ 1 ½ ½   1 ½ ½ 1 1 ½ ½ 1 1 1 1   ½ 1 1 ½ ½ 1   1 ½ 1  24.0/34  372.75
5   Berserk 7 NN PEXT x64          ½ 0 ½ ½ * ½ ½ ½ ½ ½ 1 ½   ½ ½ ½   1 0 ½ ½ 1 1 1 1   ½   1 ½ ½ 1 1 1 1 1   ½ 1 1 1  24.0/35  369.50
6   SlowChess Blitz 2.8 NN AVX2 x  ½       ½ * ½ ½ ½ 1 ½ ½ ½ ½ ½ ½ 1 ½ ½ ½ 1 1 ½   ½ 1 ½ 1 1 ½ 1 1 1   1   1 1   1 1  24.0/33  367.00
7   Koivisto 7.5 NN AVX2 x64       0 0 ½ ½ ½ ½ *   ½   ½   1   ½ 1 1   1 ½   1 ½ ½ 1 1 1 ½ 1 ½ 1 ½ ½ ½ 1 1 1 1 1 1    23.5/33
8   RubiChess 2.2 NN x64           0 ½ ½ 0 ½ ½   *   0 ½ ½ 1 ½ ½ ½ 1 1 ½ 1 1 1 ½   1 1 1 1 ½ ½ ½ 1 ½       1 1 1   1  22.5/33
9   Igel 3.0.10 NN BMI2 x64        ½ ½ 0 ½ ½ ½ ½   *   1   ½   1 0 ½ ½ ½ ½   ½ 1 ½ 1 ½ ½ 1 1 1   1 0 ½ 1 1 1 1 1 ½    21.5/33
10  Revenge 1.0 NN x64             ½ ½ 0 ½ ½ 0   1   * 0 ½ ½ ½ ½   1 ½ 1 ½ ½ ½     ½ 1 1 ½ ½ 1 1 ½ 1 ½   ½ ½ ½ 1   1  20.0/33  310.25
11  Seer 2.4.0 NN AVX2 x64         0 0     0 ½ ½ ½ 0 1 * 1 ½ ½ ½ ½ ½ 1 1 1 ½ ½ 1   ½ 1 ½ ½ ½ 1 ½ ½ ½       1 1 ½   1  20.0/33  306.50
12  Nemorino 6.09 NN x64           ½ ½ ½ ½ ½ ½   ½   ½ 0 * ½ ½ ½   ½   ½   0 1   ½ ½ ½ ½ ½ 1 ½ 1 1 1 ½ ½ 1 1 1 0 1    19.5/33  306.75
13  Arasan 23.0.1 NN AVX2 x64      0 ½ 0 ½   ½ 0 0 ½ ½ ½ ½ * 1 ½ 1   ½ ½ ½ 1   1 1 ½ ½ ½   ½ ½ 1 ½ ½ ½ ½ ½   ½ ½ 1 1  19.5/35  297.50
14  rofChade 2.310 NN x64          ½ ½ ½ ½ ½ ½   ½   ½ ½ ½ 0 * ½   ½ ½ ½ 1 ½ 1 ½   ½ ½ 1 1 ½ ½ ½ ½ 1 ½     ½ ½ 1   ½  19.0/33  307.25
15  Wasp 5.00 NN AVX2 x64          ½     ½ ½ ½ ½ ½ 0 ½ ½ ½ ½ ½ * ½ ½ ½ ½ ½ ½   ½ ½   ½ 1 1 ½   1   ½ 1 ½ ½ ½ 1   ½ 1  19.0/33  299.25
16  Laser 1.7 BMI2 x64             ½ 0 0 0 ½ ½ 0 ½ 1   ½   0   ½ * 0   ½     0 ½ ½ 1 1 1 1 1 ½ ½ ½ ½ 1 1 1 1 1 ½ ½    18.5/33
17  Booot 6.5 POPCNT x64           0 0 ½ ½   0 0 0 ½ 0 ½ ½   ½ ½ 1 * 0 ½ 1 ½ 0 1 ½ ½   ½     ½ ½ 1 1 0 1 1 ½ 1 1 1 ½  18.0/35
18  Minic 3.17 NN x64              0 0 ½ ½ 0 ½   0 ½ ½ 0   ½ ½ ½   1 * ½     ½   ½ ½ ½ 1 0 0 ½ ½ 1 1 1 ½ ½ ½ ½ ½ 1    16.0/33
19  Shredder 13 POPCNT x64         ½       1 ½ 0 ½ ½ 0 0 ½ ½ ½ ½ ½ ½ ½ * ½ ½ ½ ½   1 0 0 ½ ½ ½ ½ ½ ½       ½ ½ ½ ½ ½  15.0/33  244.25
20  Marvin 5.2.0 NN AVX2 x64       0 0 0 0 ½ ½ ½ 0 ½ ½ 0   ½ 0 ½   0   ½ *   ½   ½ ½ ½ ½ ½ 1 ½ ½ 0 ½ 1 1 ½ 1 ½ ½ 1    15.0/34  222.00
21  Orion 0.8 NN FMA x64           ½ 0 0 ½ ½ 0   0   ½ ½ 1 0 ½ ½   ½   ½   * ½   0 0 ½ ½ ½ ½ 1 ½ ½ ½ ½   1 1 ½ ½   ½  14.5/32  224.50
22  Clover 2.4 x64                 0 ½ ½ ½ 0 0 0 0 ½ ½ ½ 0   0   1 1 ½ ½ ½ ½ * ½ ½ ½   ½     ½ 0 ½   0 1 ½ 0 1 ½ ½ 1  14.5/34  224.00
23  Lc0 0.28.0 NN CPU-dnnl         0 0 ½ 0 0 ½ ½ ½ 0   0   0 ½ ½ ½ 0   ½     ½ * 1 ½ ½ ½ 1 0 1 0 ½ ½ ½ 0 ½ ½ 1 1 1    14.5/34  215.75
24  Fritz 18 (Ginkgo) x64          0 0 0 0 0   ½   ½     ½ 0   ½ ½ ½ ½   ½ 1 ½ 0 * 1 ½ ½ 0 1 ½   1 ½ ½ 1 0 ½ ½ 1 0 ½  14.5/33  209.50
25  DanaSah 9.0 NN AVX2 x64        ½ 0 0 ½ 0 ½ 0 0 0 ½ ½ ½ ½ ½   0 ½ ½ 0 ½ 1 ½ ½ 0 *         1 ½ ½   ½ 0 ½ 1 ½ 1 ½ ½  14.0/34  215.00
26  Xiphos 0.6 BMI2 x64            0 0 0 ½   0 0 0 ½ 0 0 ½ ½ ½ ½ 0   ½ 1 ½ ½   ½ ½   * 1 ½ ½ ½ 1   ½ 1 0 ½   0 1 ½ ½  14.0/34  205.00
27  Zahak 8.6 AMD x64              0     0 ½ ½ 0 0 ½ 0 ½ ½ ½ 0 0 0 ½ 0 1 ½ ½ ½ ½ ½   0 * ½ ½   0   ½ ½ ½ 1 1 ½   1 1  14.0/34  203.75
28  Andscacs 0.95.123 x64          0 ½ 0 0   0 ½ 0 0 ½ ½ ½   0 0 0   1 ½ ½ ½   0 1   ½ ½ * ½ ½ ½ ½ ½ 1 ½ ½   ½ ½ 1 ½  14.0/34  202.75
29  Winter 0.9 BMI2 x64            0   0 0 0 0 0 ½ 0 ½ ½ 0 ½ ½ ½ 0   1 ½ 0 ½   1 0   ½ ½ ½ *   ½   ½ ½ 1 ½   1   1 1  13.5/32
30  Defenchess 2.3 dev BMI2 x64      0 1 0 ½ ½ ½ ½ 0 0 0 ½ ½ ½   ½ ½ ½ ½ ½ 0 ½ 0 ½ 0 ½   ½   * ½ ½   ½ ½ 0 ½   ½ ½ ½  13.0/34  216.75
31  Schooner 2.2 XB SSE x64        ½ 0 0   ½ 0 0 ½   0 ½ 0 0 ½ 0 ½ ½ ½ ½ ½ ½ 1 1   ½ 0 1 ½ ½ ½ * 0 ½       ½ ½ ½   ½  13.0/33  201.75
32  Dark Toga 1.1 NN AVX2 x64        ½ 0 ½ 0 0 ½ 0 0 ½ ½ 0 ½ ½   ½ 0 0 ½ 1 ½ ½ ½ 0 ½     ½   ½ 1 *   0 1 ½ 0 0 ½ ½ 1  13.0/34  199.25
33  Weiss 2.0 PEXT x64             0   0 0 0 0 ½ ½ 1 0 ½ 0 ½ 0 ½ ½ 0 0 ½ ½ ½   ½ ½   ½ ½ ½ ½   ½   * ½ ½ ½   1   ½ ½  12.5/33  192.00
34  Fizbo 2.0 BMI2 x64             0 0 0 0 0   ½   ½ ½   ½ ½ ½ 0 0 1 0   0 ½ 1 ½ ½ ½ 0 ½ 0 ½ ½   1 ½ * ½ ½ ½   ½ 0 ½  12.5/34  189.75
35  GullChess 3.0 Sy BMI2 x64      0 0 0 ½ 0 0 0   0     ½ ½   ½ 0 0 ½   0   0 1 0 1 1 ½ ½ 0 ½   0 ½ ½ * 1 ½ ½ ½ 1 1  12.5/33  170.50
36  Combusken 1.4.0 AMD x64        ½ 0 0 ½ 0   0   0 ½   0 ½   ½ 0 0 ½   ½ 0 ½ ½ 1 ½ ½ 0 ½ ½ 1   ½ ½ ½ 0 * ½   0 1 ½  12.0/33  178.00
37  Chiron 5 x64                   ½ 0 ½ 0   0 0 0 0 ½ 0 0   ½ ½ 0 ½ ½ ½ 0 0 1 ½ ½ 0   0     ½ ½ 1   ½ ½ ½ * 0 ½ 1 1  12.0/34  175.50
38  Stash 31.16 x64                ½       ½ 0 0 0 0 ½ 0 0 ½ ½ 0 0 0 ½ ½ ½ ½ 0 0 ½ ½ 1 ½ ½ 0   ½ 1 0   ½   1 *   ½ 0  11.0/33  169.50
39  Demolito 2021-07-09 x64          ½ 0 0 0   0 0 0 0 ½ 1 ½ 0   ½ 0 ½ ½ ½ ½ ½ 0 0 0 0   ½   ½ ½ ½   ½ ½ 1 ½   * 0 1  11.0/33  163.50
40  Halogen 10 NN PEXT x64         0 0 ½ ½ 0 0 0   ½     0 0   ½ ½ 0 0 ½ 0   ½ 0 1 ½ ½ 0 0 0 ½   ½ ½ 1 0 0 0 ½ 1 *     9.5/33
41  Nirvanachess 2.5 POPCNT x64    0 0 0 0 0 0   0   0 0   0 ½ 0   ½   ½   ½ 0   ½ ½ ½ 0 ½ 0 ½ ½ 0 ½ ½ 0 ½ 0 1 0   *   7.5/32

Schaue mal ...
Weiss spielt eine sehr schlechte Runde, xiphos spielt keine gute Runde und Wasp macht wieder die Remisen gegen deutlich stärker im Endspiel.

Noch 2 Boliden in der laufenden Runde 13 ... und noch einige "Schwächere" ... das kann bis Platz 10 hochgehen mit sehr viel Glück.
Bei 40 Runden 7-8 Plätze über der tatsächlichen Stärke.

Auch Ethereal ist im Kampf um den Rundensieg noch nicht aus dem Rennen.
Trotz einer unglaublichen Niederlage gegen Defenchess ... die Partie musst Du Dir mal anschauen!

Gruß
Frank

Soweit zu Turnieren nach wenigen Partien!
Würde mich arg wundern wenn Ethereal überhaupt eine Runde gewinnen kann.
Aber nun gut, wenn das nun passiert ... in wahrscheinlich 1 von 200 Fällen möglich.

By Frank Quisinsky Date 2021-12-04 11:24 Edited 2021-12-04 11:31

Hi Klaus,

nur bei den Runden mit so vielen Partien ändert sich wenig während einer laufenden Runde.

Hier die Ergebnisse der abgeschlossenen Runde 01-12 von 50.

Code:


     Name                            Games     Win     Draw     Lose       Pts         S-B         %

Stockfish 151121 NN x64            :   480  :  319+  :  161=  :    0-  :   399.5  :  91151.25  :  83.23%
Dragon 2.5.1 by Komodo NN AVX2 x64 :   480  :  303+  :  174=  :    3-  :   390.0  :  88479.00  :  81.25%
Fire 8 NN MC.3 x64                 :   480  :  235+  :  235=  :   10-  :   352.5  :  79442.75  :  73.44%
SlowChess Blitz 2.8 NN AVX2 x64    :   480  :  234+  :  234=  :   12-  :   351.0  :  78648.00  :  73.13%
Koivisto 7.5 NN AVX2 x64           :   480  :  232+  :  232=  :   16-  :   348.0  :  77910.00  :  72.50%
Ethereal 13.25 NN PEXT x64         :   480  :  219+  :  236=  :   25-  :   337.0  :  74970.75  :  70.21%
Berserk 7 NN PEXT x64              :   480  :  200+  :  259=  :   21-  :   329.5  :  73922.75  :  68.65%
RubiChess 2.2 NN x64               :   480  :  177+  :  275=  :   28-  :   314.5  :  69777.25  :  65.52%
Revenge 1.0 NN x64                 :   480  :  165+  :  284=  :   31-  :   307.0  :  68674.00  :  63.96%
Seer 2.4.0 NN AVX2 x64             :   480  :  163+  :  269=  :   48-  :   297.5  :  65556.00  :  61.98%
Igel 3.0.10 NN BMI2 x64            :   480  :  157+  :  278=  :   45-  :   296.0  :  65874.75  :  61.67%
Nemorino 6.09 NN x64               :   480  :  159+  :  259=  :   62-  :   288.5  :  63092.50  :  60.10%
rofChade 2.310 NN x64              :   480  :  152+  :  269=  :   59-  :   286.5  :  62352.00  :  59.69%
Arasan 23.0.1 NN AVX2 x64          :   480  :  131+  :  274=  :   75-  :   268.0  :  58414.50  :  55.83%
Lc0 0.28.0 NN CPU-dnnl             :   480  :  132+  :  271=  :   77-  :   267.5  :  59094.75  :  55.73%
Booot 6.5 POPCNT x64               :   480  :  114+  :  280=  :   86-  :   254.0  :  55511.00  :  52.92%
Xiphos 0.6 BMI2 x64                :   480  :   90+  :  285=  :  105-  :   232.5  :  49903.25  :  48.44%
Weiss 2.0 PEXT x64                 :   480  :   92+  :  273=  :  115-  :   228.5  :  49919.50  :  47.60%
Minic 3.17 NN x64                  :   480  :   87+  :  276=  :  117-  :   225.0  :  48668.75  :  46.88%
Wasp 5.00 NN AVX2 x64              :   480  :   77+  :  293=  :  110-  :   223.5  :  48799.50  :  46.56%
Schooner 2.2 XB SSE x64            :   480  :   83+  :  271=  :  126-  :   218.5  :  46433.50  :  45.52%
Zahak 8.6 AMD x64                  :   480  :   91+  :  246=  :  143-  :   214.0  :  45758.75  :  44.58%
Defenchess 2.3 dev BMI2 x64        :   480  :   72+  :  278=  :  130-  :   211.0  :  45630.00  :  43.96%
Fritz 18 (Ginkgo) x64              :   480  :   78+  :  260=  :  142-  :   208.0  :  43813.00  :  43.33%
Shredder 13 POPCNT x64             :   480  :   75+  :  259=  :  146-  :   204.5  :  44275.00  :  42.60%
Clover 2.4 x64                     :   480  :   61+  :  277=  :  142-  :   199.5  :  43017.25  :  41.56%
Chiron 5 x64                       :   480  :   68+  :  260=  :  152-  :   198.0  :  42531.75  :  41.25%
Laser 1.7 BMI2 x64                 :   480  :   71+  :  251=  :  158-  :   196.5  :  41986.25  :  40.94%
Marvin 5.2.0 NN AVX2 x64           :   480  :   63+  :  260=  :  157-  :   193.0  :  41604.25  :  40.21%
DanaSah 9.0 NN AVX2 x64            :   480  :   59+  :  267=  :  154-  :   192.5  :  41869.75  :  40.10%
Fizbo 2.0 BMI2 x64                 :   480  :   63+  :  251=  :  166-  :   188.5  :  41375.00  :  39.27%
Andscacs 0.95.123 x64              :   480  :   62+  :  252=  :  166-  :   188.0  :  40120.75  :  39.17%
Winter 0.9 BMI2 x64                :   480  :   61+  :  232=  :  187-  :   177.0  :  38606.75  :  36.88%
Halogen 10 NN PEXT x64             :   480  :   46+  :  256=  :  178-  :   174.0  :  37582.75  :  36.25%
Dark Toga 1.1 NN AVX2 x64          :   480  :   62+  :  221=  :  197-  :   172.5  :  37397.50  :  35.94%
Orion 0.8 NN FMA x64               :   480  :   43+  :  247=  :  190-  :   166.5  :  36346.75  :  34.69%
GullChess 3.0 Sy BMI2 x64          :   480  :   50+  :  228=  :  202-  :   164.0  :  35003.25  :  34.17%
Stash 31.16 x64                    :   480  :   40+  :  235=  :  205-  :   157.5  :  33272.50  :  32.81%
Nirvanachess 2.5 POPCNT x64        :   480  :   29+  :  226=  :  225-  :   142.0  :  30662.75  :  29.58%
Combusken 1.4.0 AMD x64            :   480  :   44+  :  196=  :  240-  :   142.0  :  29905.75  :  29.58%
Demolito 2021-07-09 x64            :   480  :   35+  :  202=  :  243-  :   136.0  :  28554.50  :  28.33%

Xiphos:
232.5 : 49903.25

Wasp:
223.5 : 48799.50

Bei 9 Punkten weniger nur knapp bei der SB dahinter.

Dann wie Du schreibst ...
Wasp punktet gegen die Stärkeren deutlich besser als Xiphos (sieht man ja auch an den Einzelergebnisse in der Turniertabelle).

Wie schaut es während der Runde 13 aus ...

Xiphos:
245.0 / 512 56217.25

Wasp:
242.5 / 513 56744.50

Vorsprung ist krass gefallen von 9 auf 2.5-3.5 Punkte.
Wasp hat eine deutlich höhere SB Wertung, fällt jetzt natürlich besser ins Auge.

Persönlich schaue ich bei den laufenden Turniere und weniger Partien (bis ca. 1.000 pro Engine) eher auf die SB Wertung als auf die Punkte.
In Regel pendelt es sich in 98% der Fälle ein, Engines mit der höheren SB stehen auch in den Tabellen dann vorne.

Insofern ist SB wirklich ein netter kleiner Ansatzpunkt für einen schnellen Blick über eine Tabelle!!

Übrigens ...
CEGT ... da liegt Wasp hinter xiphos aber xiphos hatte mehr ältere Engines als Gegner und gegen die stärkeren Programme erreicht Wasp deutlich öfters Remis.
Insofern bin ich mir zu 98% sicher das Wasp während des Turniers an xiphos leicht vorbeiziehen kann, es sei denn xiphos beginnt gegen die Stärkeren besser zu punkten
oder Wasp gegen die Stärkeren schwächer zu punkten. Aber das kann man schon fast nach 500 gespielten Partien bei "Jeder gegen Jeden" ausblenden.

By Benno Hartwig Date 2021-12-03 14:26 Edited 2021-12-03 14:34

> Ist es anfangs entscheidend, wer gegen wen drankommt,...

...und was er daraus macht!

Sicher, man kann dann gegen Stärkere und Schwächere kommen.
Und man sollte versuchen, etwas aus der Chance gegen den Schwächeren zu machen. Gelingt es, steht man anschließend besser da.
Gelingt es nicht, dann ist nicht unvernünftig, dass man dann deshalb etwas schlechter dasteht.
Finde ich.

Ja, die mittleren Bereiche im Schweizer System werden ausgespielt, und es gibt durchaus auch plausible Gründe, diese Reihenfolge so zu definieren.
Aber besonders viel Aussagekraft sollte sicherlich niemand dieser erspielten Reihenfolge beimessen.

PS:
Seinerzeit hatte ich mal die Logik des Schweizer Systems programmiert und ihm ein Teilnehmerfeld (Die Zahlen von 1 bis 100 beispielsweise) geboten, dann eine Anzahl Runden gespielt, wobei ich konsequent die kleinere Zahl automatisch gewinnen ließ. Ich wollte sehen, wie gut die Sortierung dadurch gelingt.
Und ich erinnere mich noch, dass da da in der Mitte stets schon noch einiges an Verschiebungen war, aber wirklich schlecht sah die gebildete Reihenfolge eigentlich auch nicht aus. Bei so wenigen Partien, muss man bedenken!

By Andreas Mader Date 2021-12-03 14:45

Benno Hartwig schrieb:

> Ist es anfangs entscheidend, wer gegen wen drankommt,...

...und was er daraus macht!

Sicher, man kann dann gegen Stärkere und Schwächere kommen.

Am Anfang beim konkreten TCEC-Turnier eben nicht, weil die ELO-Wertung von Schachprogrammen relativ stabil ist. Die erste Runde erfolgt nicht durch eine rein zufällige Auslosung. Normalerweise wird anhand des ELO-Ratings eine Reihenfolge von 1 bis 44 (Anzahl der Teilnehmer) erstellt und in der ersten Runde spielt jeweils einer aus der oberen Hälfte gegen einen aus der unteren Hälfte. Bei einer normalen Paarungsweise spielt Nummer 1 gegen 23, 2 gegen 24 usw. bis 22 gegen 44. Es gibt auch andere Methoden, aber ich habe nicht nachgesehen, ob die von TCEC verwendet wurden. Sollte jeder aus der oberen Hälfte gewinnen spielt in Runde 2 1 gegen 12, 2 gegen 13 usw. Es wird darauf geachtet, dass die gleich starken zu Beginn nach Möglichkeit nicht gegeneinander spielen, um große Verzerrungen zu verhindern. Das kann natürlich nicht zu hundert Prozent klappen, aber gerade bei Schachprogrammen funktioniert das recht gut.

Noch dazu gibt es bei einer Doppelrunde kein Problem mit der Häufigkeit von Schwarz und Weiß und gegen wen man welche Farbe hat, was für gewöhnlich einer der größten Fallstricke beim Schweizer System ist.