Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / CEGT-40/4: Caissa 0.7NN
- - By Wolfgang Battig Date 2022-07-15 16:22
https://cegt.forumieren.com/t1770-testing-caissa-0-7nn-x64-1cpu

Nun mit "eigenem" Netz, nicht mehr von Stockfish wie bei früheren Versionen
Parent - - By Frank Quisinsky Date 2022-07-15 17:17 Edited 2022-07-15 18:16
Hallo zusammen,

ich liebe dieses Beispiel!!

Viele behaupten, dass durch ein gleiches Netz ja auch der Spielstil einer Engine beeinflusst wird.
Und gerade einige bekannte Programmierer neigen dazu Müll in die Weltgeschichte ... und genau diese Herren, egal.

Der Spielstil ist das Salz in der Suppe, natürlich nicht ein NN file!
Wäre es anders, könnten wir uns die Beschäftigung mit x Programmen schenken.
In dem Fall reicht es das Spielstärkste zu nehmen.

Stockfish und Caissa ...
Unterschiedlicher könnte ein Spielstil kaum sein ...

Von allen getesteten Programmen der TOP-41 beim FCP Tourney-KI unterschieden sich diese beiden Programme, trotz gleichen Netzes, ca. so sehr, wie
ein VW Käfer von einem 30-Tonner Volvo (hinsichtlich Gewicht), oder von einem Formel 1 Rennwagen zu einer Ente (hinsichtlich Geschwindigkeit).

Ein paar Beispiele gefällig?
Der Zügedurchschnitt der Gewinnpartien ist bei Caissa 0.5 NNSf ohne Aufgabefaktor um 23 höher. Wir vergleichen hier z. B. eine Engine unter den TOP-5 (Stockfish)
mit einer Engine auf den letzten Platz (Caissa) der von mir getesteten 56 Programme beim eingestellten FCP Tourney-KI.

JEDE PARTIE DAUERT OHNE AUFGABEFAKTOR durchschnittlich 23 ZÜGE LÄNGER !!!
Version 0.5

Und trotz 230 Elo mehr (Caissa v0.4 auf v0.5) waren es 21 Züge bei der Version 0.4.
Das Gesicht hat sich bei Caissa v0.4 auf v0.5 also keinesfalls verändert und das hat nichts aber auch gar nichts mit der Verwendung vom gleichen Netz zu tun.

Das wirkt sich auf 80% aller Partiephasen aus!

- Caissa produziert kaum schnelle Gewinnpartien ... wie als wenn plötzlich jemand einen Goldschatz findet. Stockfish Fans haben schon so viel Gold gefunden, die wissen nicht mehr wohin mit dem Zeug.

- auch der Zügedurchschnitt aller Partien (nicht wie dargestellt der Gewinnpartien) ist deutlich höher.
- die Kurve zu Stärken und Schwächen zu den Partiephasen "frühes Mittelspiel, Mittelspiel und Übergang zum Endspiel" können kaum unterschiedlicher sein.
- wie die Spielstärke von Caissa 0.5NNSf ... bedeutet gar immer noch ca. Platz 20 in Ratinglisten ... bei erstaunlich vielen schnellen Verlustpartien. Seit ca. 10 Jahren habe ich keine Verlustpartie von Stockfish unter 50 Züge bis zum Matt mehr gesehen. Anzahl der eigenen Partien bei Stockfish ist im fünfstelligen Bereich.

Einzig was durch die Verwendung vom Stockfish Netz auffällig sein könnte ...

Caissa hat ein sehr starkes spätes Endspiel, diese Stärke wäre max. vergleichbar zu Stockfish.
Caissa liegt hier ca. 8 Plätze höher, im Vergleich zu einem Ratinglistenplatz bei dem es "nur" um Elo pur geht.
Caissa 0.5 NNSf wäre also hier ca. auf Platz 10 in der Welt.

- von Version Caissa 0.4 NNSf auf Caissa 0.5 NNSf gab es trotz gleichem Neural Network file folgenden Zugewinn:
  3268 v0.5 zu 3039 v0.4

Tja, das sind solche Geschichten!
Bekannte Programmierer versuchen offenbar krampfhaft für eine andere Legendenbildung zu sorgen.
Frage mich dann immer ... wissen die überhaupt was da programmiert wird oder werden da einfach nur rumliegende Sourcen zusammengepuzzelt und automatisiert abgetestet?

"Legendenbildung" ist gerade Computerschächlern ja nicht unbekannt!
Erzählerei und knallharte Statistik ...

Soweit zum Thema:
Angleichung des Spielstils von Programmen bei Verwendung von einem gleichen Netz!

Da ich fast alle Programme mit einem Stockfish Netz getestet hatte bzw. derzeit teste, die unter den TOP-41 lagen bzw. liegen könnte, könnte ich das Thema beliebig fortführen.
Caissa ist allerdings das schönste aller erdenklichen Fallkonstellationen.

Wer testet weiß einfach mehr, muss natürlich auch genau hinschauen!
Zugegeben schwierig bei Programmen wie Caissa 0.5 NNSf, die 400 Elo über Magnus Carlsen liegen.
Geht nur noch mit Statistik und insofern sind auch die Programmierer entschuldigt die sicherlich nicht die Zeit haben viele aufwendigen Statistiken zu erzeugen.

Wäre es anders würden die Schachprogramme wie Götter spielen ... mit Aphrodite durchbrennen.
OK ein paar haben es ja auf Aphrodite abgesehen.
Die spielen mit dem Feuer ...



Viele Grüße
Frank

Das war das Wort zum Freitag ...
Freitag = Freyja / Fraja, der Göttin der Liebe und der Ehre ... die Herrin oder nortisch Göttin der Fruchtbarkeit ... des Spielstils bei Engines.
Freia und Aphrodite = Zickenalarm.

Oder Frank ... Franko ... Volksstamm der Franken ... bedeutet tapfer und frei.
Parent - By Frank Quisinsky Date 2022-07-15 17:24
Man kann sich etwas erzählen lassen oder einfach selbst testen!
Das ist die Botschaft!

Hinsichtlich Spielstil:
Caissa 0.5 NNSf war so ziemlich das langweiligste Programm, welches ich in den letzten Jahren getestet hatte.

Aus meiner Sichtweise weil ...
Ich liebe Angriffsschach

Aus der Sicht eines Users, für den Endspiele das Höchste (wäre z. B. der Programmierer der Ktulu) ...
Würde die Beurteilung dann wieder ganz anders ausschauen.

Ist doch klar!
Up Topic Hauptforen / CSS-Forum / CEGT-40/4: Caissa 0.7NN

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill