Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / FCP-Tourney-2024-MA ... Partie in 66 Minuten + 6 Sekunden wurde gestartet.
- - By Frank Quisinsky Date 2023-12-28 01:24 Edited 2023-12-28 02:04
Hallo zusammen,

nach langer Vorbereitungszeit, während das vorherige Turnier noch lief, wurde das neue MA-Turnier gestartet.
MA steht für Move-Average.

Ein Ziel ist es den Zügedurchschnitt wieder auf übliches Niveau von ca. 86-87 zu bringen (Partien ohne Aufgabefaktor).
Ein anderes die Remisquote zu drücken.

Genau um 20:00 Uhr im Osten von Gutweiler wurde das neue Turnier gestartet.
Obwohl ob Osten oder Westen ... hier wohnen ja nur ein paar Leute.
Egal ...

Es läuft und alles schaut gut aus.
Wird richtig spannend!

Alle relevanten Informationen finden sich auf einer Seite:
https://www.amateurschach.de/fling/index.html

Insofern erspare ich mir eine größere Ankündigung für mein Wohnzimmer-Event (Ausdruck geklaut von Michael Scheidl).

Viele Grüße
Frank

Das Turnier des Teufels ...
66 Minuten pro Partie + 6 Sekunden mit 6-Steinern Syzygy und einem 6-Züge tiefen Buch ... FCP Turnier Nummer 6 ... da muss es jetzt einfach mit dem Teufel zugehen.
Die Engines werden sich gegenseitig in die Hölle schicken und Hakkapeliitta gibt sich wieder die Ehre im Kreise von Fizbo und DanSah und ein paar anderen Engeln aus der frühen Vergangenheit.
Letzte HCE von Stockfish, Hiarcs und Dragon mit Personality Aggressiv, von Wasp spielt eine starke dev und die bewährte letzte Release Version.
Shredder versucht wieder zu zertrümmern und Chiron muss natürlich auch mitmischen. Superstar vom FCP-Turnier 2020 ist auch dabei ... das war Booot 6.4. Xiphos läßt sich das Spektakel
natürlich auch nicht entgehen und nahm Laser mit ins Schlepptau, hier passieren Dinger. Die HCEs werden den NN Engines die Hose ausziehen ... na ja, zumindet werden die Ihre Muskeln
spielen lassen. Der Mann aus Andorra bzw. seine Engine ist auch am Start und im Winter darf Winter natürlich nicht fehlen. Daher spielt auch Midnight mit. Nein, Nein ... die haben einen guten
Zügedurchschnitt. Auch von Altair ist etwas im Überflug derzeit auf Platz 5.

Oder so ... Ankündigung um 01:27, da ist man nicht mehr so fit.

44 Engines am Start bei 3280 Elo-Durchschnitt ... 70 geringer als bei den TOP-41.
Zu toppen gilt es 70,5% Remisquote vom letzten Turnier und einen Zügedurchschnitt von 95,2
Sollte doch bei den Granaten kein Problem sein, also jetzt mit BruteForce!?
Parent - - By Frank Quisinsky Date 2023-12-28 01:59
Ein paar der HCE Engines haben nach gespielten 2 Partien noch leichte Anlaufschwierigkeiten gegen die NNs ...
Meine ja nur!
Parent - - By Frank Quisinsky Date 2024-01-02 11:37 Edited 2024-01-02 12:13
Hallo zusammen,

die erste Runde neigt sich dem Ende.
Updates mache ich nur 1x und zwar heute.
Dann ist die Zeitkapsel eingetütet (alles bis Ende 2023 ist drin).
2 Updates werden folgen, evtl. drei.

Eine neue Seer 2.8.0 Version und Andscacs 0.95. Ich hatte bei Andscacs völlig vergessen, dass die Release Version den deutlich besseren Zügedurchschnitt hat. Eigentlich wollte ich auch die Version ins Turnier nehmen und dann war doch die 0.95.123 hineingeflutscht.

Äußerst interessant finde ich folgendes:

Es sind ca. 225 Elo verloren gegegangen, verschwunden, weg. Vielleicht vergraben?
Wir sollten das auf einem Besprechungszimmer auf Oak-Island besprechen?!

Haben Vorfahren von Arpad Emrick Elo schon an der ErrorBar gearbeitet und hatten schon die Templer geheime Pergament Rollen dazu auf Oak-Island vergraben?
Irgend was wo drauf steht 225 Elo weniger als gedacht mit einer Erklärung in goldener Schrift.
Und woher hatte die Familie Elo eigentlich die Informationen für die Elo-Berechnung?
Haben Außerirdische da etwas zugesteckt?
Anhänger der Präastronautik glauben, dass der Ursprung der Engine-Testerei außerdirdische Wurzeln haben könnte!
Was hat Thorsten Czub damit zu tun?
Weiß er mehr als wir alle und war er es nicht, der mal Außerirdische ins Gespräch gebracht hatte.

Also, wenn Neural-Network wirklich 300 Elo ausmacht und ein Dragon 3.3 ca. und max. 25 Elo von Stockfish 16 weg liegt, sollte der letzte Stockfish ohne NN (bevor die erste Neural-Network Version verfügbar wurde) 275 Elo schlechter als Dragon 3.3 sein. Zur Zeit sind es 50 Elo bei längeren Bedenkzeiten. Auch ein Punkt der spannend bei diesem Turnier werden wird. Wie so viele andere Dinge. Uralochka zieht gegen die schwächeren im Turnier über die Dörfer, gewinnt zwar nicht gegen wahrscheinlich stärker aber verliert auch nicht. War aber auch nicht anders zu erwarten. Das bedeutet ein hervorragendes Resultat in der ersten Runde. Wasp 6.50 scheint stärker zu sein als die derzeitigen dev Versionen. Auch das zeichnete sich bei dem vorherigen Turnier schon ab. Das ist übel denn im Blitz schaut es völlig anders aus. Werden Blitzresultate von höherer Gewalt beeinflusst? Wer macht das? Wer gibt uns ständig Rätsel auf? Beruht unser Glauben auf Illusionen, auf Träume auf eine nicht sichtbare Fata Morgana im dritten Raum? Wissen unsere Frauen mehr als wir und verraten es uns nicht.

Wir müssen reden und vor allem sollten wir ein Meeting auf Oak-Island organisieren (bringt Eure Schippen und den Elo-Detektor mit) um die Geheimnisse des Computerschachs endlich zu lüften oder so ...

Viele Grüße
Frank

Oder hatte Nostradamos irgend eine geheime Botschaft für uns?
Wir sollten seine Aufzeichnungen nochmals prüfen.
Und was hat das alles mit dem Züge Durchschnitt zu tun?
Napoleon ... Multithreading mit einem Netzwerk von schwarzen Löchern?
Parent - - By Frank Quisinsky Date 2024-01-02 17:19
Hallo zusammen,

die beiden Updates laufen.
Zeitkapsel ist geschlossen (von den aktuellen Engines sind alle Updates bis Ende des Jahres integriert).
Bis auf Booot und Stockfish, hier spielen ältere Versionen.
Von Devre spielt Version 4.0 weil ich bei längeren Bedenkzeiten eine deutlich höhere Spielstärke vermute.

Ich habe mir gerade kurz die Remisquote und den Zügedurchschnitt nach Runde 1 angesehen.
Remisquote liegt 2-3% höher als erwartet bei 61.1%.
Der Zügedurchschnitt liegt 1-2 Züge höher als erwartet bei 88.
Allerdings werden zwischen Runde 08 und 12 drei Engines herausgenommen, die den höchsten Zügedurchschnitt produzieren.
Also, nach Runde 08, 10 und 12 passiert noch etwas beim Teilnehmerfeld.
So das 41 Engines im Turnier verbleiben.

Rechne nach wie vor mit einem Zügedurchschnitt von 86-87 und mithin ist jetzt alles im grünen Bereich.
Das Wunschergebnis von 85, wie bei der SWCR Ratingliste, die nach 160.000 Partien ohne Aufgabefaktor und höherer Bedenkzeit 2012 endete, werde ich nicht erreichen können.

Noch ein Hinweis:
Ich lasse immer 2 Runden spielen bevor ich die Tabellen auf 0 setze.
Von Runde zu Runde breche ich jeweils kurz ab um die Daten im ZIP File aufzumöbeln bzw. einzupicken.
Das hat mit der Replay-Zone zu tun, sonst sammeln sich zu viele Partien und die Ladezeiten dauern zu lange.
Ferner macht es mehr Spaß zeitgleich zur Replay-Zone die Turniertabelle zu beobachten.

Die gesammelten Ergebnisse aller Runden finden sich später im *.zip file.
Hierzu setze ich später auch einen Link in die Replay-Zone.

Hier nochmals der Link zur Replay-Zone:
https://www.amateurschach.de/fling/index.html

Viele Grüße
Frank
Parent - - By Frank Quisinsky Date 2024-01-03 04:57
Hallo zusammen,

auf folgender Seite können die Ergebnisse vom Turnier eingesehen werden.
https://www.amateurschach.de/main/_ma.htm (neu erstellt)

Der Link findet sich auch in der Replay-Zone:
https://www.amateurschach.de/fling/index.html

Sicherlich ist die Replay-Zone die beste Startseite.
Von dort kann einfach navigiert werden.

So, alles erledigt.
Das Turnier kann laufen ...
Die Ergebnisse der ersten Runde folgen in Kürze!

Viele Grüße
Frank
Parent - - By Frank Quisinsky Date 2024-01-03 10:52
Hallo,

Ergebnis Runde 1:
1. Dragon, 2. Seer, 3. RubiChess ... 44. Fizbo.

Also, der neue Seer 2.8.0 hat sehr oft kurzen Prozess mit den schwächeren Engines gemacht.
Hinsichtlich Aggressivität scheint Seer eine Moralprädigt vom Chef höchstpersönlich erhalten zu haben.

Am 09.01.2024 endet die zweite Runde.
Bis dahin haben die sich alle wieder die Rübe eingeschlagen (in der Regel haben die sich aber lieb, Remisquote lage bei knapp über 60%), erholen sich kurz weiter gehts.
Wie bei "50 erste Dates"

Habe heute Morgen allen wegen dem Züge-Durchschnitt noch mal energisch ins Gewissen geredet??
Vielleicht hat die Ansprache etwas genützt?
In der Regel sind die Engines aber alle sehr stur.

Euch noch einen schönen Tag!

Gruß
Frank
Parent - - By Frank Quisinsky Date 2024-01-06 19:12
Habe heute aufwendig einen Fehler korrigiert.
Wenn ich von Runde zu Runde spielen lasse produzierte die Shredder GUI dann für die Partien der ersten Runde folgendes ...

Runde 1, Runde 2, Runde 3

Richtig wäre:
Runde 1.1, Runde 1.2 ...

Liegt nicht an Shredder GUI, sondern wie ich das Turnier konfiguriert habe.

Der Fehler in den *.pgn Download Daten wurde gefunden und korrigiert.
Parent - - By Frank Quisinsky Date 2024-01-09 09:02
Hallo zusammen,

50 erste Dates ...
Es ist angerichtet zum zweiten Date.

Ergebnisse Runde 02:
1. Dragon, 2. CSTal, 3. RubiChess ... 44. Andscacs

Links stehen ja oben!

Viele Grüße
Frank
Parent - - By Frank Quisinsky Date 2024-01-09 09:44 Edited 2024-01-09 09:57
Code:

6. Booot 6.4                      (9+,   47=,   30-)  37.8%

          CATEGORIES   MOVE_AVE    GAMES    TOTAL  GAME_RATE
           all games         80       86
           white won         70        6
           black won         70        3
          white draw         72       29
          black draw         82       18
          white loss         87        8
          black loss         90       22
            all wins         70        9       86      10.5%
           all draws         76       47       86      54.7%
           all loses         89       30       86      34.9%


Code:

8. Booot 7.2 NN                   (70+,   479=,   91-)  48.4%

          CATEGORIES   MOVE_AVE    GAMES    TOTAL  GAME_RATE
           all games        107      640
           white won         85       56
           black won         86       14
          white draw        118      250
          black draw        106      229
          white loss         95       14
          black loss         91       77
            all wins         85       70      640      10.9%
           all draws        113      479      640      74.8%
           all loses         91       91      640      14.2%


Zwar noch nicht genug Partien aber es wird jetzt schon klar.
Wirklich schade das der schöne Spielstil bei Booot 7.2 NN im Vergleich zu den Vorversionen mit klassischer Eval weg ist.
Auch Booot war ein Versucher für den hohen Zügedurchschnitt.

Ich bin aber auch wieder gemein heute früh!

Booot 6.4 wäre auch ein Anwärter auf einem vordereren Platz beim EAS Rating von Stefan Pohl.
Glaube Stefan hatte die Version nie getestet, schrieb ich ihm seinerzeit mal aber da gab es das EAS Tool auch noch nicht.

Die Engine war der absolute Superstar beim FCP-Tourney-2020 und spielt daher mit.

Eine Remispartie bei Booot 7.2 NN dauert also sage und schreibe im Durchschnitt 37 Züge länger als bei dieser wirklich super
geilen Version 6.4 mit klassischer Eval. Ferner gehört auch Booot 6.4 zu den Angreifern wie Velvet, Wasp, Revenge ... sieht man
schon nach nur wenigen Partien beim laufenden Turnier.

Aber das meine ich mit kontraproduktiv. Wenn Endspiele falsch eingeschätzt werden weil syzygy fehlen und dann auch noch
50 Züge-Regel immer wieder erneut und kurz vorher vermieden wird, wahrscheinlich gar mit vorhandenen Contempt der nicht einstellbar ist (sieht man
bei ausgeglichenen Stellungen). Das beißt sich und die Partien enden nicht.

Egal, Booot 6.4 ist das Paradebeispiel dafür wie eine wirklich gute Zügestatistik aussehen sollte.
So gute Zügestatistiken produzieren aber auch einige andere Programme!!

War auch ein Grund warum Booot im FEOBOS Engine-Team 2017 mit analysierte, auch wenn seinerzeit nicht unter den TOP-10.
Die Engine hatte immer schon einen herausragenden Spielstil und dann kam NN.
Parent - - By Frank Quisinsky Date 2024-01-14 23:21
Hallo zusammen,

50 erste Dates ...
Nun sind die Ergebnisse von Date 3 (Runde 3) online.

Stockfish 200731 dev (Version mit klassischer Evel bevor die erste NN kam) hat nun nach 3 Runden insgesamt 5 der 129 Partien verloren und liegt nach wie vor keine 100 Elo hinter Dragon 3.3 NN.
Vergleiche ich mit den Ergebnissen aus 40 Züge in 20 Minuten war Dragon 3.3 NN 5 Elo for Stockfish 16 NN. Daraus kann man einen logische Schlussfolgerung ziehen ...

Seit dem 31.07.2020 betrug trotz Neural-Network der SF Vorteil bis Version 16 keine 100 Elo.
Dabei lese ich doch so oft Zahlen von 150 - 400 Elo.
Weil man einfach zu viel auf die ganzen verfügbaren Blitzlisten schaut.

Und mithin ist klar, je mehr Zeit desto mehr schmiltzt der Neural-Network Vorteil dahin.
Hatte es ja hier schon angekündigt: Wenn Stockfish 17 NN verfügbar ist, lasse ich die Engine einen Test-Run gegen die 44 Engines im Turnier mit 66+6 spielen.
Vielleicht sind es dann bei Stockfish 17 120 Elo oder vielleicht 130 Elo ... keine Ahnung.

Wasp hat übrigens als einzige Engine Stockfish in Runde 3 geschlagen.
Na ja, dennoch ... die Wasp 6.50 NN Version ist bei längeren Bedenkzeiten ziemlich stark und die 6.63 NN dev, die im Blitz 20-40 Elo stärker ist, zieht einfach nicht vorbei. Das war schon bei dem 40 in 20 Turnier der Fall nach über 600 Partien.

Also, wer verfolgen möchte ...
Der beste Startpunkt ist meine Replay-Zone, von dort kann alles abgerufen werden.
Mal auf die Resultatsseite springen, da finden sich die ganzen Rundenergebnisse, Ratings etc..

Aber hier nochmals die Links (alles ohne Werbung, versteckte Stats etc., sehe selbst nicht wie viele die Seite besuchen, interessiert mich auch nicht mehr sonderlich).

Replay-Zone:
https://www.amateurschach.de/fling/index.html

Resulte (Runde für Runde) im Überblick:
https://www.amateurschach.de/main/_ma.htm

Es ist angerichtet zum Date 4 zwischen den 44 Teilnehmern!



Gruß
Frank
Parent - By Frank Quisinsky Date 2024-01-15 11:52 Edited 2024-01-15 11:55
Interessant könnte folgendes werden.

Gestern habe ich für Runde 4 die Turnier-Elo wieder auf SlowChess Blitz 2.9 NN Referenz-Wert 3380 angehoben!
Nun schauen die Elo-Zahlen im Vergleich zu dem Vorturnier bei 40 in 20 wieder normaler und vor allem logischer aus.

Auffällig ist dabei folgendes:
Alle Programme, die im Grunde in der Lage sind mehr Partien schnell zu gewinnen legen bei längeren Bedenkzeiten zu.
Sowohl Booot 6.4 als HCE, als auch Wasp, Revenge und vor allem Uralochka und leicht auch zu erkennen bei
Velvet.

Bei Booot 6.4 gar fast 50 Elo und bei Wasp gar um die 30 Elo.
Das kann alles noch ein wenig Zufall sein (Anzahl der Partien) aber bestätigt meine jahrelangen Eindrücke zu Engines,
die in der Lage sind schnell zu gewinnen.

Auch bei Langzeitanalysen wird es meist erkennbar. Die Engines finden mit mehr Zeit einfach überproportinal mehr.
Nun analysiere ich meist nur Stellungen aus Königsangriffen bei vielen Figuren auf dem Brett aber genau hier
wirds deutlich. Die Angreifer kommen meist mit sehr viel interessanteren Analysen daher als Engines die weiter
oben in den Ratinglisten stehen.

Müsste man ein wenig beim Turnier beobachten.
Man sieht es im Grunde schön an Uralochka wenn man die Turnierleistung mit Ratinglisten und kürzeren Bedenkzeiten vergleicht.

Dieses Turnier wird mir viele neue Erkenntnisse geben, nicht nur das der Neural-Network Vorsprung rapide mit mehr Zeit dahinschmilzt.
Das Problem ist nur ... ich muss dieses Turnier sehr lange laufen lassen um besseres statistisches Material zu erzeugen.
Unabhängig davon wird sehr hochwertiges Partiematerial erzeugt und das eignet sich natürlich auch wieder für viele Zwecke.
Up Topic Hauptforen / CSS-Forum / FCP-Tourney-2024-MA ... Partie in 66 Minuten + 6 Sekunden wurde gestartet.

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill