Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / PlentyChess nun auf Stockfish-Niveau?
1 2 Previous Next  
- - By Walter Eigenmann Date 2025-10-10 09:59
.

Ist PlentyChess neu tatsächlich mind. auf Stockfish-Niveau?

Siehe hier:



Oder ist das einerseits der schwachen CCRL-Hardware (inkl. kurze Bedenkzeit) und v.a. dem Umstand geschuldet,
dass PlentyChess ja grundsätzlich auf Blitzschach getrimmt wurde?
Lange Bedenkzeiten und starke Hardware bei z.B. TCEC ergeben ein anderes Bild.
So oder so: Wieder mal ein Beweis dafür, dass auch sog. "objektive" Ranglisten stark differieren können...
Und immerhin: CCRL ist die international meistzitierte und -konsultierte Engine-Rangliste.

Gruss: Walter

.
Parent - By Tommy Tulpe Date 2025-10-10 11:17
Zu PlentyChess kann ich nichts beitragen - ich kenne die Engine nicht.

Was mich aber ziemlich wundert an dem wiedergegebenen Auszug aus der CCRL Liste ist, dass der Abstand zwischen Stockfish und Dragon 3.3 nur 19 Punkte betragen soll. Zwar führe ich keine Engine-Engine-Wettkämpfe durch, aber bei Fernschachanalysen liegt Dragon 3.3 ein ganzes Stückchen hinter Stockfish 17.1.

Vielleicht teste ich Plenty Chess demnächst mal.
Parent - - By Peter Martan Date 2025-10-10 12:05 Edited 2025-10-10 12:12
PlentyChess hat in der Liste, die du zitierst, noch eine error bar von +-20 (sind ja auch erst 508 Partien, die die Engine gespielt hat) und die Stockfish- Version ist noch die 17.1, da ist also zwischen dem Alter der einen (von PlentyChess) und der anderen (SF) Version auch noch ein kleiner zeitlicher Unterschied, der macht deshalb mehr aus, als es die Elo vermuten ließen, weil PlentyChess erstmal die Partiezahl erreichen muss, die SF17.1 schon hat (2006 sind auch nicht gar so viele, aber schauen wir weiter, wenn Plenty wenigstens 1000 hat, dann ist die error bar aber sicher immer noch um einiges höher als der Abstand).
Ich bin in dem Thread, in dem das hier vorkommt,

https://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=176675#pid176675

, der Frage auch etwas weiter nachgegangen, und wenn du nach einem Niveau fragst, kommt's natürlich darauf an, wie weit du das steckst, um von einem gemeinsamen zu reden.

Am meisten Partien zwischen den obersten der Ranglisten hat wohl die SPCC- list, und da fehlt schon noch ein Stück zu SF dev., bzw. zu 17.1, die Celo (nennt Stefan daher selbst so) sind etwas gespreizt relativ zu den Eröffnungsstellungen der CCRL, aber worauf es ja ankommt, ist das Verhältnis von Abstand zu error bar.

https://www.sp-cc.de/

     Program                     Celo    +    - Games    Score   Av.Op. Draws

   1 Stockfish 251005 a512     : 3857    4    4 15000    66.9%   3730   48.4%
   2 Stockfish 17.1 250330     : 3854    4    4 15000    66.6%   3730   48.6%
   3 Torch 4 a512              : 3808    4    4 15000    60.2%   3733   49.8%
   4 Obsidian 250706 a512      : 3786    4    4 15000    57.0%   3735   49.8%
   5 Reckless 0.8.0 a512       : 3776    4    4 15000    55.6%   3735   49.6%
   6 PlentyChess 7.0.0 a512    : 3776    4    4 15000    55.6%   3735   49.4%
Parent - - By Walter Eigenmann Date 2025-10-10 13:34
Peter Martan schrieb:
PlentyChess hat in der Liste, die du zitierst, noch eine error bar von +-20 (sind ja auch erst 508 Partien, die die Engine gespielt hat)

Ich vermute, die Error Bar spielt hier eine untergeordnete Rolle, bedeutsamer ist wohl das CCRL-Setting:  Schnelle Bedenkzeiten (40/15) auf langsamer Hardware (Intel i7-4770k).
Denn beides spielt PlentyChess-7 in die Hände, weil dessen NNUE-Netze via spezifisches Training ("Bullet-Trainer") auf Rapid-Chess & Blitz konditioniert wurden
(siehe auch das entspr. GitHub-Repository von Yoshie2000: https://github.com/Yoshie2000/PlentyChess )

Überhaupt weist die CCRL noch weitere Besonderheiten auf (unabhängig von der Anzahl Partien):



- Bloss drei "Elo" Differenz zwischen SF 16 und SF17  ??
- Zwischen Torch 1 und Torch 4 praktisch Stillstand ??

Interessant wäre, einige weitere gängige Ranglisten im Hinblick auf solche Ungereimtheiten zu untersuchen -
oder überhaupt eine vergleichende Gegenüberstellung dieser Rankings zu recherchieren.
Die Abweichungen dürften teils massiv sein, je nach Setting. Wobei sie EINE Gemeinsamkeit haben
(mal von EAS-Ranglisten o.a. Exotischem abgesehen):  Stockfish ist fast immer zuoberst...
Jedenfalls: Darf man den gängigen Ranglisten überhaupt noch trauen, oder soll man gleich auf Stellungstests umschalten?  (Provo-Modus aus

.
Parent - By Peter Martan Date 2025-10-10 14:02 Edited 2025-10-10 14:29
Walter Eigenmann schrieb:

Jedenfalls: Darf man den gängigen Ranglisten überhaupt noch trauen, oder soll man gleich auf Stellungstests umschalten?  (Provo-Modus aus

Nein, bleiben wir ruhig noch ein bisschen in diesem Modus, Ranglisten auf der Basis von engine- engine- game playing sind ja auch nur ausgespielte Stellungstests

https://talkchess.com/viewtopic.php?p=983827#p983827

Drum heißen die SPCC- Ranglisten-Werte eben Celo statt Elo, genau so gut wie man bei denen von Spreizung der Abstände durch die UHOs reden kann, könnte bei CCRL halt von Quetschung durch Eröffnungs(test)stellungen mit weniger Vorteil einer Farbe reden

Aber die error bars sind schon auch genau deshalb als Zusatz- Kriterium notwendig, weil die ja ihrerseits auch davon abhängen, wieviele der 2 draws drawn game pairs durch 2 wins drawn ersetzt werden, was mal ganz abgesehen von der Übertragbarkeit der Ergebnisse, die damit ja zunächst mal noch gar nichts zu tun hat (siehe Stellungstests), die Mindestanforderung an die head to head LOS ausmacht. Eine solche (likelyhood of superiority) bekommst du zwischen SF dev und PlentyChess schon mit weniger als 500 Partien, wenn du nur die 2 Engines gegeneinander spielen lässt, umso kürzer die Hardware- TC, umso schneller sind nicht nur die 500 Partien rum, sondern umso größer wird der Abstand relativ zur error bar auch automatisch. Aber die Übertragbarkeit dieses eines Matches hält sich zu der zu eines anderen Matches anderer Hardware- TC, eines anderen Teilnehmerfeldes und anderer Eröffnungs(test)stellungen eben wieder in eigenen Grenzen, ebenso wie zwischen verschiedenen Arten von anderen Stellungstests, ausgespielt oder nicht.
Parent - - By Jörg Oster Date 2025-10-10 16:11 Upvotes 1
Hallo Walter,

der Bullet-Trainer ist nur der Name des Tools und hat keinerlei Bezug zur verwendeten Zeitkontrolle oder Suchtiefe o. ä. der verwendeten Trainingsdaten.
Der Name bezieht sich wahrscheinlich viel mehr auf die Geschwindigkeit des Tools ... (Spekulation meinerseits)

Ich vermag auch nicht nachzuvollziehen, wie man ein NNUE auf bestimmte Zeitkontrollen konditionieren könnte.
Entweder liefert das NNUE aufgrund des Trainings gute Bewertungen ab, oder eben nicht so gute. That's it.

Jörg.
Parent - - By Walter Eigenmann Date 2025-10-10 16:33
.

Wenn ich aber die betr. Dokus richtig interpretiere, hat PlentyChess-7 "Selbst-Destillations-Techniken für einen Teil des Trainings" verwendet, wobei vorwiegend Milliarden von Bullet-Partien als Trainingsbibliothek" verwendet wurden (das Plenty-NNUE sei mit fast 5 Milliarden selbstproduzierten Partien generiert worden )
Das würde erklären, warum Plenty v.a. im frühen Mittelspiel sehr aggressiv nach baldigen Entscheidungen sucht, was natürlich in einem Time-Setting von kurzen Bedenkzeiten von 10-20 sec./Zug (wie im CCRL, zumal mit so schwacher Hardware) vorteilhaft ist.
Übrigens eine Beobachtung, die jeder mit Plenty-Chess-Turnieren selber dokumentieren kann; mir selber ist das schon mehrfach aufgefallen bei Analysen.
(Vielleicht lässt ja einer hier mal ein 2+1-Turnier (mit ein paar Tausend Games) oder so vom Stapel mit Plenty vs. 4-5 Top's und berichtet darüber?)

Gruss: Walter

.
Parent - - By Peter Martan Date 2025-10-10 18:04 Edited 2025-10-10 18:07
Walter Eigenmann schrieb:

was natürlich in einem Time-Setting von kurzen Bedenkzeiten von 10-20 sec./Zug (wie im CCRL, zumal mit so schwacher Hardware) vorteilhaft ist.

Du findest 10-20"/Zug kurz? Wie willst du denn auf die Art zu den entsprechend großen Zahlen kommen, vor allem solchen, die du zum NNUE- Training brauchst?
Und auf welche TC ist SF deiner Meinung nach optimiert und mit was für Trainings- und Testpartien wird der entwickelt?
Zitat:

(Vielleicht lässt ja einer hier mal ein 2+1-Turnier (mit ein paar Tausend Games) oder so vom Stapel mit Plenty vs. 4-5 Top's und berichtet darüber?)

So ein Turnier hast du auf der SPCC- site ("nur" die stärksten 16 auf der ersten site, 3'+1" single thread auf einem 16core-Ryzen9, 15000 Partien pro Engine). Wenn du einen Abstand zwischen SF und PlentyChess für eine bestimmte Hardware- TC schnell sehen willst, genügt dazu ein einzelnes head to head match und ja, natürlich wird der Unterschied umso schneller umso deutlicher, je kleiner du die Hardware- TC nimmst, sowohl an direktem performance- Vergleich, als auch relativ zur error bar.

Hier z.B mit 3'+1" single thread (3.5GHz), UHO 2024 900-990cp 6mvs (dieses Match hat mit 30 concurrencies gerade mal 2.5h gedauert:

Score of Stockfish17.1 vs PlentyChess7.0: 172 - 77 - 251 [0.595]
Elo difference: 66.8 +/- 21.5, LOS: 100.0 %, DrawRatio: 50.2 %
500 of 500 games finished.

In der SPCC- list sind's 78 Celo mit einer error bar von 4, so what.
Parent - - By Andreas Mader Date 2025-10-10 18:26 Upvotes 1
Peter Martan schrieb:

Du findest 10-20"/Zug kurz? Wie willst du denn auf die Art zu den entsprechend großen Zahlen kommen, vor allem solchen, die du zum NNUE- Training brauchst?


Was nützen einem viele Daten, wenn sie eine schlechtere Qualität haben? Ich persönlich habe lieber gute Daten, auch wenn es weniger sind.

Wobei ich 10-20" pro Zug in Zeiten wie diesen eh sehr großzügig finde, wenn ich da an Engine-Partien denke, die Zugzeiten im Zehntelsekunden-Bereich haben.
Parent - By Peter Martan Date 2025-10-10 18:47 Upvotes 1
Andreas Mader schrieb:

Was nützen einem viele Daten, wenn sie eine schlechtere Qualität haben?

Statitische Relevanz, statistisch gesehen nützen dir wenige Daten, wenn sie für sich gute Qualität haben, aber in Summe von small sample size sind, just gar nichts, weil du dann nicht einmal weißt, was von dem, was rauskommt, purer Zufall ist.
Wie schon mehrfach erwähnt, hat das mit der Übertragbarkeit, der Transitivität der Ergebnisse,  zunächst mal noch gar nichts zu tun, etwas, was vor allem auch bei Stellungstests immer wieder gern tunlichst übersehen wird. Sowohl von den einen, die sie machen, als auch von den anderen, die dagegen wettern. Ich wiederhole daher auch, weil's hier wieder so besonders gut passt, gerne noch einmal, dass eng-eng-games zu Testzwecken auch nur ausgespielte Stellungstests sind. Und die Hardware- TC ist halt nur einer der Faktoren, die die Transitivität von allen Arten von (Stellungs- und anderen) Tests limitieren, neben den (Eröffnungs-) Teststellungen sind's mittlerweile ja auch ganz stark die teilnehmenden Engines, seit es so eine Unmenge von sehr starken gibt, die einander noch dazu nicht nur in der performance sondern auch im Code und in den neuronalen Netzen immer mehr ähneln. Wieviele und welche du mitspielen lässt und im Mix mit wie vielen und welchen schwächeren, das macht erst recht jedes Ergebnis ein für sich allein stehendes.
Haltet mich, ich ufere wieder aus
Parent - - By Walter Eigenmann Date 2025-10-11 13:20
Andreas Mader schrieb:

Peter Martan schrieb:

Du findest 10-20"/Zug kurz? Wie willst du denn auf die Art zu den entsprechend großen Zahlen kommen, vor allem solchen, die du zum NNUE- Training brauchst?


Was nützen einem viele Daten, wenn sie eine schlechtere Qualität haben? Ich persönlich habe lieber gute Daten, auch wenn es weniger sind.

Wobei ich 10-20" pro Zug in Zeiten wie diesen eh sehr großzügig finde, wenn ich da an Engine-Partien denke, die Zugzeiten im Zehntelsekunden-Bereich haben.

Allerdings sind 15 Sek. auf einem uralten i7-4770k anno 2013 (CCRL) keine 15 Sek auf einem heutigen Durchschnitts-PC

.
Parent - - By Jörg Oster Date 2025-10-11 14:11
Euch ist bekannt, dass Trainingsdaten mit größerer Suchtiefe (BZ) zu einem schlechteren Netz bei Stockfish geführt haben?!
Parent - By Walter Eigenmann Date 2025-10-11 16:32
Mir ist dein Bezug vom Stockfish-Netz zu PlentyChess&CCRL nicht ganz klar 

.
Parent - - By Walter Eigenmann Date 2025-10-10 18:35
.

Es geht ja darum, dass PlentyChess und Stockfish offenbar ganz unterschiedliche NNUE-Implentierungen nutzen. Das würde erklären,
warum Plenty bei Blitz&Rapid (z.B. CCRL) so auffällig ganz zuvorderst mitspielt, während die Engine bei sehr langen BZ (z.B. TCEC) durchhängt.
Ich glaube, mit Statistik alleine ist das nicht erledigt, das Thema "Generalissimus (Stockfish) vs Spezialist (PlentyChess)" hat Diskussionspotential.
Sobald ich dazu komme, füttere ich mal die KI damit.

.
Parent - - By Peter Martan Date 2025-10-10 18:58 Edited 2025-10-10 19:03
Walter Eigenmann schrieb:

Das würde erklären, warum Plenty bei Blitz&Rapid (z.B. CCRL) so auffällig ganz zuvorderst mitspielt, während die Engine bei sehr langen BZ (z.B. TCEC) durchhängt.

Tut sie das? Erstens finde ich immer noch, dass CCRL mit 40 Zügen in 15 Minuten relativ zu anderen Listen relativ lange TCs hat (in der von dir zitierten Liste) und auf die starke Performance von PlentyChess bin ich gerade bei TCEC überhaupt erst aufmerksam geworden. Die statistische Relevanz von TCEC ist halt vor allem eine: keine

Die Partiezahlen dort taugen für viele sehr unterhaltsame und schöne Partien, statistisch geben sie just gar nichts her, und dass sich die Performance- Unterschiede, mal vom Zufall der SSS ganz abgesehen, mit größerer Hardware- TC aneinander annähern, das hatten wir ja auch schon weiter oben.
Parent - - By Andreas Matthies Date 2025-10-11 08:37 Edited 2025-10-11 08:45 Upvotes 2
Da ich vermutlich einer von ganz wenigen hier bin, der sich auch bei Discord rumtreibt und ich mir deshalb einbilde, relativ nah am Geschehen dran zu sein, hier mein Senf zu dem Thema in Stichworten, der im wesentlichen Peters Aussagen bestätigt.

Bei Veröffentlichung der Liste ist es im Discord-Kanal Stockfish / engines-dev kurzzeitig eskaliert (3.10. ab 12:11Uhr für diejenigen, die das nachlesen wollen) und Graham musste (nicht zum ersten Mal) herbe Kritik einstecken nicht nur von Seiten der Stockfish Anhänger sondern von vielen Engine Autoren. yoshie2000, der PlentyChess Autor hat die Liste amüsiert zur Kenntnis genommen und hier und da ein paar Scherze gemacht, er selbst kann die Ergebnisse sehr gut einordnen.

Die CCRL 40/15 Liste von Graham leidet nach übereinstimmender Meinung sehr vieler Autoren daran, dass
a. Graham, um seine riesige Datenbank konsistent zu halten, weiterhin nur sehr ausgeglichene Eröffnungen spielt und daher die Top-Engines eine sehr hohe Remis-Rate haben, was die Ergebnisse dann bei der relativ geringen Anzahl an Partien doch sehr fehleranfällig macht. Mit dem Niveau der Top-Engines ist Schach mit diesen Eröffnungen halt ausgelutscht und es gibt kaum Chancen, die Unterschiede zu messen. Graham argumentiert dann immer (neben der Konistenz seiner Datenbank), dass "UHO-Eröffnungen Müll sind und nichts mit Schach zu tun haben". Ich finde es (als Nicht-Schachspieler) ehrlich gesagt fast niedlich, wenn menschliche Schachspieler wie Graham immer noch glauben, den Computern den "menschlich korrekten" Weg zum Schach weisen zu müssen, weil ja nur sie das Spiel "verstanden haben".
b. die Auswahl der Gegner einer Engine sehr willkürlich und unterschiedlich ist, was man z.B. an der Spalte Average Opponent ablesen kann. Auch die Tatsache, dass Graham viele "Derivate" (Stockfish-Clone) in seiner Liste spielen lässt, macht die Ergebnisse nicht wirklich konsistenter.
c. Graham einige merkwürdige "Spielregeln" verwendet, teilweise durch seine veraltete, fehlerhafte und nicht mehr gepflegte GUI begründet. Z.B. werden Partien, in denen nach wenigen Zügen eine Engine eine (nach der Einschätzung von Graham) zu hohe Bewertung anzeigt, einfach abgebrochen und mit einer anderen Eröffnung neu gestartet. Das führt dann zu Partiepaaren mit unterschiedlichen Eröffnungen.

Dass Plentychess seine guten Ergebisse bei kurzen Zeitkontrollen hat, sehe ich vollkommen anders. Die CCRL 40/15 nutzt tatsächlich eine sehr lange Zeitkontrolle im Gegensatz zu der Pohl-Liste oder der von IPMan, die beide in der Szene als die derzeit viel besseren Listen anerkannt sind, die beide deutlich schnellere Zeitkontrollen nutzen als CCRL 40/15 und in denen Plentychess so um Platz 5-6 steht. Und das ist wohl auch genau der objektiv richtige Platz dieser Engine unabhängig von der gespielten Zeitkontrolle

Soweit mein Senf.
Schöne Grüße, Andreas
Parent - - By Lothar Jung Date 2025-10-11 09:54
Plentychess gleicht zu Stockfish im laufenden TCEC-Turnier aus.
Parent - - By Andreas Matthies Date 2025-10-11 10:07 Edited 2025-10-11 10:15 Upvotes 1
Genau wie Berserk. VVVSSS (very very very small sample size).
Und außerdem, wenn du genau hinschaust, stammt ein voller Punkt von Plenty aus einer eigentlich verlorenen Partie gegen Lco, weil diese scheinbar abgestürzt ist.
https://tcec-chess.com/#div=frdsl1&game=32&season=28

Edit: Eventuell ein Hardwareproblem "Black disconnects (CUDA failure 719: unspecified launch failure) (kernel: [10040610.473180] NVRM: Xid (PCI:0000:f1:00): 79, GPU has fallen off the bus.)"
Parent - By Thomas Plaschke Date 2025-10-11 17:09

>... GPU has fallen off the bus ...


Vom Bus gefallen? Die GPU also von dubioser Herkunft? Klar, dass die übrige Hardware damit nicht spielen will.
Sachen gibt's!
Parent - - By Walter Eigenmann Date 2025-10-11 11:29 Edited 2025-10-11 12:13 Upvotes 1
Andreas Matthies schrieb:
...hier mein Senf zu dem Thema in Stichworten...
Alles interessant, d'accord. Allerdings bin ich wie Graham ebenfalls kein Superfan von UHO-Openings. Die extreme Bevorteilung einer Seite nur in der Hoffnung, dass die Rematches
Stärke-Klarheit bringen, widerspricht IMO zutiefst dem Geist des Schachs.
Sondern ich persönlich bevorzuge die historisch gewachsenen und schachtheoretisch interessanten Gambit-Eröffnungen (von denen gibt es ca. 200 gut spielbare), wenn's denn unbalanced sein muss.
Übrigens sind diese neuen UHO-Openings im Grunde Schnee von gestern; Unbalanced Human Openings gibt's in Form eben der etablierten Gambits schon seit Jahrhunderten.
Das Grundübel ist halt aber, dass wir derart Gewinn-/Verlust-geil sind. Wir können nicht ab, dass die modernen Engines das Spiel allmählich gegen das Unentschieden lösen;
darum verbiegen wir es mit UHO-Antischach (FRC ist aber wieder eine andere Qualität).
Dabei ist eine hochstehende Remis-Partie um Klassen spannender als eine Kaffeehaus-Schach-Niederlage à la "Patricia" mit Harakiri-Opfer...

Andreas Matthies schrieb:
...Plentychess so um Platz 5-6 steht. Und das ist wohl auch genau der objektiv richtige Platz dieser Engine unabhängig von der gespielten Zeitkontrolle...
Das müsste noch weiter verifiziert werden.
Denn bei z.B. CEGT ist die neue Plenty 7 - hinter den Fischen und den Torchs - auf Rang drei: http://www.cegt.net/40_40%20Rating%20List/40_40%20All%20Versions/rangliste.html
BTW: Auch in den CEGT-Rankings findet sich Seltsames:
Stockfish 16.1  besser als Stockfish 17.1 ?? (siehe obiger Link)
Mein Vertrauen in diese "offiziellen" Listen schwindet zusehends.



Aber bitte: Alles auch nur "mein Senf"

Gruss: Walter

.
Parent - By Andreas Matthies Date 2025-10-12 08:57
Walter Eigenmann schrieb:

Das müsste noch weiter verifiziert werden.
Denn bei z.B. CEGT ist die neue Plenty 7 - hinter den Fischen und den Torchs - auf Rang drei.
...
BTW: Auch in den CEGT-Rankings findet sich Seltsames:
Stockfish 16.1  besser als Stockfish 17.1 ?? (siehe obiger Link)
Mein Vertrauen in diese "offiziellen" Listen schwindet zusehends.

CEGT krankt an ähnlichen Problemen wie die CCRL, zumindest was die Remis-lastigen Eröffnungen betrifft.
Parent - - By Michael Bechmann Date 2025-10-11 11:42 Upvotes 1
Heute abend, wenn Zeit ist(!), werde ich es mal testen.

Das vorwitzige "Plenty7" gegen Stockfish 17.1

Eröffnungsbuch:
Stockfish 17.1 - meines
"Plenty7" - Das Eröffnungsbuch Onlinedatenbank von Chessbase

Endspieldatenbanken: beide Zugriff

Ich will es mal in Aktion sehen, was es taugt.
Parent - - By Reinhold Stibi Date 2025-10-11 12:46 Edited 2025-10-11 12:54
PlentyChess 7.0  ist schlecht in der Mattsuche und wahrscheinlich auch in der Analyse
und ist für mich deshalb nicht interessant.

Was soll es denn bringen wenn PlentyChess 7.0 im praktischen Spiel etwa auf dem Niveau von
Stockfish und Abkömmlingen ist; dann nehme ich doch gleich diese.

Sehe da für den Anwender keinen Zugewinn.

Nach der Rangliste von Stefan Pohl liegt PlentyChess 7.0   81 Elo hinter Stockfish.

Die Super-Hardware von TCEC ist doch für den normalen Verbraucher uninteressant.
Parent - - By Walter Eigenmann Date 2025-10-11 13:02
Reinhold Stibi schrieb:

PlentyChess 7.0  ist schlecht in der Mattsuche und wahrscheinlich auch in der Analyse
Beides stimmt "wahrscheinlich" nicht.
Bitte keine Behauptungen, sondern Fakten. Beispielsweise in Form von konkreten Stellungen.

.
Parent - - By Reinhold Stibi Date 2025-10-11 15:22 Edited 2025-10-11 16:22
PlentyChess 7.0 ist ca. 1/3 schneller als Stockfish. Wahrscheinlich wurde der Code gekürzt; Vorteil zwar schneller
aber in anderen Bereichen schlechter.
Die Frage ist, wieviel Stockfish steckt in PlentyChess, wahrscheinlich recht viel.

Beispiele folgen.

Z.B.



1. Kg3  Matt in 15.  Der Zug 1. Kg3!  wird von den meisten Engines innerhalb einer Sekunde gefunden.

32.Kg3! - Short- Timman 1-0 0.0, Tillburg 1991


2r2rk1/1bpR1p2/1pq1pQp1/p3P2p/P1PR3P/5N2/2P2PPK/8 w - - 0 1

Analysis by PlentyChess 7.0.0  avx2 nnue: mit einem mittelstarken MiniPC ca. 6000 kN/s aus der Grundstellung

1.Df4 Kg7 2.Dg3 Tce8 3.Td3 Lc8 4.T7d4 Lb7 5.Sg5 Te7 6.Se4 Dxe4 7.Txe4 Lxe4 8.Td2 Lc6 9.Dg5 f6 10.De3 fxe5 11.c5 Lxa4 12.Dxe5+ Kh7 13.cxb6 cxb6 14.Dd6 Tef7 15.Dxb6 Tf4 16.Kg3 Tg4+ 17.Kh3 Tgf4 18.f3 e5 19.Dc7+ T4f7 20.Dxa5 e4 21.Dxa4 exf3 22.Tf2 Tf4 23.Da7+ T8f7 24.Db6 T7f6 25.Dc5 Tf7 26.g3
  Weiß steht klar auf Gewinn: +- (4.97)  Tiefe: 31/74   00:00:23  194MN
1.Df4 Kg7 2.Dg3 Tce8 3.Td3 Lc8 4.T7d4 Lb7 5.Sg5 Te7 6.Se4 Dxe4 7.Txe4 Lxe4 8.Td2 Lc6 9.Dg5 Tee8 10.Df6+ Kh7 11.f3 Lxa4 12.g4 hxg4 13.fxg4 Tg8 14.Dxf7+ Tg7 15.Df3 Tb8 16.Tf2 Le8 17.Df8 Ta8 18.Tf6 Lc6 19.Da3 a4 20.Kg3 Ld7 21.Kf4 c5 22.Kg5 Ta7 23.Dd3 a3 24.h5
  Weiß steht klar auf Gewinn: +- (4.54)  Tiefe: 32/75   00:00:24  199MN
1.Df4 Kg7 2.Dg3 Tce8 3.Td3 Lc8 4.T7d4 Lb7 5.Sg5 Te7 6.Se4 Dxe4 7.Txe4 Lxe4 8.Td2 Lc6 9.Dg5 Tee8 10.Df6+ Kh7 11.f3 Lxa4 12.g4 hxg4 13.fxg4 Tg8 14.Dxf7+ Tg7 15.Df3 Tb8 16.Tf2 Le8 17.Df8 Ta8 18.Tf6 Lc6 19.Da3 a4 20.Kg3 Te8 21.Kf4 Kh8 22.Ke3 Ta8 23.Kd2 b5 24.cxb5 Lxb5 25.Txe6 Ld7 26.Tf6 Lxg4 27.e6 c5 28.Dxc5 Kh7 29.h5 Lxh5
  Weiß steht klar auf Gewinn: +- (5.02)  Tiefe: 33/78   00:00:35  292MN
1.Df4 Kg7 2.Dg3 Tce8 3.Td3 Lc8 4.T7d4 Lb7 5.Sg5 Te7 6.Se4 Dxe4 7.Txe4 Lxe4 8.Td2 Tee8 9.Df4 Lc6 10.Df6+ Kh7 11.f3 Lxa4 12.g4 hxg4 13.fxg4 Tg8 14.Dxf7+ Tg7 15.Df3 Tb8 16.Tf2 Le8 17.Df8 Ta8 18.Tf6 Lc6 19.Da3 a4 20.Kg3 Te8 21.Kf4 Kh8 22.Ke3 Kh7 23.Kd2 Td8+ 24.Kc1 Td4 25.Txe6 Ld7 26.Te7 Lxg4 27.Txg7+ Kxg7 28.De7+ Kg8 29.e6 Td1+
  Weiß steht klar auf Gewinn: +- (5.29)  Tiefe: 34/81   00:00:46  378MN
1.Df4 Kg7 2.Dg3 Tce8 3.Td3 Lc8 4.T7d4 Lb7 5.Sg5 Te7 6.Se4 Dxe4 7.Txe4 Lxe4 8.Td2 Lc6 9.Dg5 f6 10.De3 fxe5 11.c5 Lxa4 12.Dxe5+ Kh7 13.cxb6 cxb6 14.Dd6 Tff7 15.Dxb6 e5 16.Dxa5 Le8 17.Td8 Tf4 18.Dc5 Te6 19.Kg1 Kg7 20.Td6 Tff6 21.Td5 e4 22.Dd4 Kf7 23.De3 Kf8 24.Td4 Lc6 25.Dh6+ Kg8 26.c4 Te7 27.c5 Tfe6 28.De3 Kh7 29.Td8 Te8 30.Td4
  Weiß steht klar auf Gewinn: +- (5.48)  Tiefe: 35/82   00:01:04  507MN

Ja klar, 1.Df4  gewinnt auch, aber dann bestimmt kein Matt in 15 und von einem Computerprogramm erwarte ich dass
es den besten Zug und nicht den 2. oder 3. besten Zug spielt.

Weitere Beispiele folgen:



Neue Partie Line 0.0

4k3/8/8/1P3QPP/8/5K2/1b1r4/8 w - - 0 1

Analysis by PlentyChess 7.0.0  avx2 nnue:

87.b6 Ld4 88.De6+ Kd8 89.Dd6+ Ke8 90.b7 Tb2 91.b8D+ Txb8 92.Dxb8+ Kd7 93.Ke4 Lf6 94.Db7+ Kd6 95.Db6+ Kd7 96.Dxf6 Kc7 97.Db2 Kd6 98.Db6+ Kd7 99.Ke5 Kc8 100.Kf4 Kd7 101.Ke4 Kc8 102.Ke5 Kd7 103.Db7+ Kd8 104.Ke6 Ke8 105.De7#
  Weiß setzt Matt: +- (#19)  Tiefe: 31/54   00:00:18  202MN

87.b6 La1 88.Db5+ Kf7 89.b7 Td8 90.b8D Txb8 91.Dxb8 Ke7 92.Da7+ Kd6 93.Dxa1 Kc5 94.g6 Kc4 95.Db2 Kc5 96.g7 Kc6 97.g8D Kc5 98.Dc8+ Kd6 99.Db6+ Ke7 100.Dbe6#
  Weiß setzt Matt: +- (#14)  Tiefe: 32/54   00:00:36  392MN

87.b6 La1 88.Db5+ Kf7 89.b7 Td8 90.Dc4+ Kf8 91.Dc7 Td3+ 92.Ke4 Tb3 93.Dd6+ Kg7 94.De7+ Kg8 95.De6+ Kf8 96.Dxb3 Ke7 97.b8D Kd7 98.Da4+ Ke7 99.Dae8#
  Weiß setzt Matt: +- (#13)  Tiefe: 33/29   00:00:38  417MN



Zum Vergleich:

Stockfish 2025 0928  Matt in 13 mit 16 Sek.

ShashChess 39.1 HT   Matt in 13  mit 17 Sek.

ShashChess 34.1 HT  Matt in 13  mit  6 Sek.
Parent - - By Reinhold Stibi Date 2025-10-11 16:31 Edited 2025-10-11 16:40
Hinsichtlich der Analyse 15 Sek.  ERET Test

Mit Rems M 091224 MultiPV 4, setzte ich auch erfolgreich auf Playchess im Internet, Blitz 5 Sek. ein

102 Stellungen gelöst aus 111.

Probiere das doch selber mit PlentyChess aus; die sind die Ergebnisse sicher viel schlechter.

Der ERET Test in inzwischen zu leicht.

Im HTC 114 Test kommt der Unterschied sicher noch besser
Parent - - By Walter Eigenmann Date 2025-10-11 17:04
Vergiss endlich meinen ERET

Er hatte vor hundert Jahren seine Nützlichkeit und seinen Erkenntniswert, aber nun gehört er endgültig ins CompiSchach-Museum.

Ausserdem beinhaltet er mind. drei unkorrekte Aufgaben - was zwar niemand gemerkt hat in all den Jahren...

Also, eine Testsuite, die mittlerweile die Engines zu 95% in Minuten lösen können, ist nicht für Schachprogramme, sondern für die Katz.

.
Parent - - By Peter Martan Date 2025-10-11 19:08 Edited 2025-10-11 19:52
Walter Eigenmann schrieb:

Ausserdem beinhaltet er mind. drei unkorrekte Aufgaben - was zwar niemand gemerkt hat in all den Jahren...

Da fallen mir aber außer dir schon noch ein paar weitere Leute auf Anhieb ein, Walter

Z.B. Dann Corbit, Vincent Lejeune und Horst Sikorsky haben hier und im Talkchess dieses und jenes gepostet im Lauf der Zeit.

https://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=153008#pid153008

https://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=153006#pid153006

Perssson C. -Teichmeister S. aus der European Corr. Team Championship 2009 ist ja überhaupt öfters durch die Foren gegangen, ich glaube, der erste, der auf die 2. Lösung aufmerksam gemacht hatte, war Dann Corbit. Vielleicht das erste darüber hatte er hier von Vincent Lejeune bestätigt bekommen, unmittelbar darunter übrigens auch von mir

https://talkchess.com/viewtopic.php?p=781719#p781719

Zuletzt hatte er sich hier

https://talkchess.com/viewtopic.php?p=979127#p979127

noch einmal dazu geäußert.

Und nur, weil ich mir jetzt die Mühe gemacht hatte, es zu suchen, eine Zusammenstellung von 102 Eret- Stellungen (diejenigen, die sich nicht mit HTC überschnitten haben) hatte ich hier mal in MEA- Syntax, überall, wo eine zweite Lösung angegeben ist, hatte ich die jedenfalls schon zur Kenntnis genommen:

https://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=169029#pid169029

Dass da z.B. die von Horst erwähnte Partiestellung aus Boudy B.- Szabo L. Varna 1979, die Nr. 17 im Eret, nicht vorkommt, liegt auch an ihrer doppelten Lösung. Überall, wo unter bm mehr als einer aufgeführt ist, wenn man's noch genauer nimmt, überall, wo nicht nur der unter bm angegebene Zug, sondern noch zumindest eine weiterer mit MEA- Punkten definiert ist, hab' ich das damals dort dokumentiert. In solcher MEA- Syntax auf die Art mit diesem Tool, sind die verbliebenen Stellungen mit entsprechend kleinerer Hardware- TC als anno dazumal, übrigens sehr wohl alle auch noch verwendbar, für eine Statistik geben sie für sich allein halt auch bei entsprechend kurzer Rechenzeit schon rein zahlenmäßig nicht mehr viel her, abgesehen davon, dass sie die meisten stärksten Engines heutzutage praktisch aus der "statischen" Eval (sprich aus dem NNUE oder den entsprechenden anderen neuronalen Netzen), also ohne wesentliche Suche lösen.
Parent - - By Walter Eigenmann Date 2025-10-11 19:50
Ja, sehr schön, Peter, gut so
Es freut mich immer, wenn die Leute zuerst prüfen, was sie bei mir stehlen wollen

Gruss: Walter

.
Parent - - By Peter Martan Date 2025-10-11 19:53 Edited 2025-10-11 20:32
Genau, drum prüfe, wer sich ewig bindet, ob sich nicht doch was Besseres findet

Ich spreche in so einem Zusammenhang, wenn ich derjenige bin, der klaut, allerdings lieber von "zitieren" als von "stehlen", in den meisten solchen Sammelsurien gebe ich dementsprechend daher nicht nur die orginäre Source an, sondern auch, aus welchen anderen Sammlungen ich sie habe, siehe z.B. das vom letzten Link oben. Bei vielen dieser alten Klassiker ist es halt oft gar nicht mehr leicht zu sagen, wer sie zuerst in eine Suite gepackt hat, du hast dabei mit deinem Eret halt das "Problem", dass du immer derjenige warst, der die Stellungen in seinem Eret schön dokumentiert hat, dadurch hast du's den Epigonen leicht gemacht (wobei es ein paar Vorfahren natürlich auch oft gab, immerhin sind die Stellungen im Eret ja in aller Regel solche aus bekannten Partien oder von namhaften Autoren komponierte Problemschach- Aufgaben), und hast dadurch praktisch zur Weiterverwendung eingeladen mit dem Eret. Der war anno dazumal schon ein Meilenstein.
Danke bei der Gelegenheit mal wieder dafür!

Edit: zu dem Thema fällt mir mal wieder der alte Witz ein von den 2 Komponisten, von denen der eine sagt, was du da als neu verkaufst, das ist doch von Mozart geklaut! Darauf der andere, ja, und, ist Mozart vielleicht schlecht?
Parent - - By Walter Eigenmann Date 2025-10-12 06:10
Peter Martan schrieb:
Zu dem Thema fällt mir mal wieder der alte Witz ein von den 2 Komponisten, von denen der eine sagt, was du da als neu verkaufst, das ist doch von Mozart geklaut! Darauf der andere, ja, und, ist Mozart vielleicht schlecht?
 

Es ist ja nicht nur mein ERET, bei dem man sich seit Jahren bedient. Da wären noch meine "Brillanten Schachzüge", oder "The Nightmare", oder die "Engine Crackers", oder der "E-E-T" u.a. -
die zahllosen Einzel-Posts in vielen Foren seit Jahrzehnten noch gar nicht gezählt...

Aber will ich klagen und jammern? Mitnichten! Sondern freue mich, wenn meine Erst-Fundstücke herumgereicht werden.

Überhaupt, "klauen", "zitieren", plagiieren" - who cares in unseren Internetpiraten- und KI-Zeiten...

Apropos Musiker: Alles doch nur "Inspiration"...
https://www.delamar.de/fun/plagiate-in-der-musik-39019/

Und war es Strawinsky, der meinte:
"Gute Komponisten leihen, grossartige stehlen"  ?


Gruss: Walter

.
Parent - - By Volker Pittlik Date 2025-10-12 11:19
Walter Eigenmann schrieb:

...
Überhaupt, "klauen", "zitieren", plagiieren" - who cares in unseren Internetpiraten- und KI-Zeiten...
...


Sowas ist in der gesamten Musikgeschichte noch niemals vorgekommen!

https://youtu.be/S3F8SQwTlwk?si=JFr93rIQqvc993g3&t=155

Volker
Parent - - By Walter Eigenmann Date 2025-10-12 16:48 Edited 2025-10-12 17:45
Natürlich hat schon Bach bei Vivaldi abgekupfert. Aber derart unter breitestem Druck wie in unseren KI-Tagen
war das Urheberrecht noch nie...
Im Schach? Siehe Stockfish vs Chessbase...
Ob Carlsen nicht doch seine genialen Kombinationen unters Copyright stellen sollte?
Parent - - By Volker Pittlik Date 2025-10-13 07:34 Upvotes 1
Walter Eigenmann schrieb:

Natürlich hat schon Bach bei Vivaldi abgekupfert. Aber derart unter breitestem Druck wie in unseren KI-Tagen
war das Urheberrecht noch nie...


Und wie so oft, ist es noch schlimmer als befürchtet:
https://www.digitec.ch/de/page/flut-von-ki-musik-mehr-ist-definitiv-nicht-besser-39920

Volker
Parent - - By Walter Eigenmann Date 2025-10-13 08:02 Edited 2025-10-13 08:17 Upvotes 1
.

Guter Link: Ebenso eindrückliche wie erschreckende Befunde, lesenswert.

Ich habe kurz mal KI gefragt, inwiefern KI die Musik verarmt...

Die Antwort von Chat-GPT (Auszug):

1. Standardisierung und Verlust von Originalität

Musik-KI-Systeme (z. B. Suno, Udio, AIVA, Mubert, etc.) erzeugen Musik meist auf Basis riesiger Datenmengen existierender Songs.
Das führt dazu, dass sie statistische Muster (Akkordfolgen, Rhythmen, Songstrukturen) reproduzieren, die bereits häufig vorkommen.
Ergebnis: Die Musik klingt oft „glatt“, eingängig und stilistisch korrekt – aber selten überraschend oder innovativ.
Dadurch kann sich eine Ästhetik der Mittelmäßigkeit durchsetzen.
Beispiel: Wenn viele Produzent*innen KI nutzen, um „Spotify-kompatible“ Lo-Fi- oder Pop-Tracks zu generieren, wird das Klangspektrum insgesamt homogener.

2. Verlust menschlicher Ausdruckstiefe

Musik ist traditionell ein Ausdruck persönlicher Emotion, Erfahrung und kultureller Identität.
KI erzeugt Musik jedoch ohne subjektives Empfinden oder biografischen Hintergrund.
Das kann zu einer emotionalen Leere oder Oberflächlichkeit führen – selbst wenn die Musik technisch perfekt klingt.
KI kann „Traurigkeit“ imitieren, aber sie fühlt sie nicht.
Die emotionale Authentizität, die wir bei einem Sänger wie Nina Simone oder Kurt Cobain spüren, fehlt.

3. Entwertung musikalischer Kreativität

Wenn KI-Musik in großem Maßstab verfügbar ist, sinkt der ökonomische und kulturelle Wert menschlicher Kompositionen.
Das kann:
Musiker*innen entmutigen, eigene Ideen zu entwickeln,
zu einer „Fast-Food“-Kultur führen, in der Musik als reines Konsumprodukt verstanden wird,
und die soziale Bedeutung musikalischer Bildung untergraben.

4. Verlust kultureller Vielfalt

KI-Modelle basieren auf Daten, die oft westlich geprägt sind (z. B. Pop, Rock, EDM).
Dadurch kann die Musikproduktion zunehmend monokulturell werden, da weniger repräsentierte Musiktraditionen (z. B. indigene, afrikanische, arabische Stile) im Training fehlen oder verfälscht werden.
Langfristig droht also eine globale Vereinheitlichung des Klangs.

Nette Selbstkritik, oder?
Sorry für das Off-Topic-Thema

Gruss: Walter


.
Parent - - By Michael Bechmann Date 2025-10-17 22:36 Edited 2025-10-17 22:39 Upvotes 1
Zitat:
Produzent*innen


                 

Zitat:
Musiker*innen


                 

Einer der bekanntesten Sänger Deutschlands, der seit über 60 Jahren sich sehr über traditionelles Deutsch in seinen Liedern und im Liedgut bemüht hat, zu Recht dazu:
"Euch hats ins Gehirn geschissen!"
Parent - - By Andreas Mader Date 2025-10-17 23:15 Edited 2025-10-17 23:18
Ich hatte vor einiger Zeit eine lange und anregende Diskussion mit ChatGPT, warum es als KI Formulierungen benutzt, die nicht der korrekten Rechtschreibung entsprechen, z.B. Satzzeichen mitten in Hauptworten. Am Ende der Diskussion haben wir uns darauf geeinigt, dass ChatGPT mir gegenüber in Zukunft grammatikalisch korrekte Formulierungen verwendet, was bisher auch der Fall war.

Es kommt halt darauf an, wie die KI trainiert wird. Da es auf den meisten Unis bei den Bachelor- und Masterarbeiten mittlerweile einen Genderzwang gibt (sprich: die Studenten werden ermuntert, geltende Rechtschreibung zu ignorieren, weil das weniger Folgen hat als das Verwenden des generischen Maskulins), verwendet es auch ChatGPT.
Parent - - By Michael Bechmann Date 2025-10-17 23:48 Edited 2025-10-17 23:52
Als ich noch Student war, war zur Diplomarbeit und bei anderen schriftlichen Arbeiten so etwas undenkbar. Mit solchen Wortungetümen hätte man sie abgelehnt. Mein Professor war bei Stil, Orthografie und Grammatik und natürlich auch inhaltlich sehr kleinlich.

Zitat:
Ich hatte vor einiger Zeit eine lange und anregende Diskussion mit ChatGPT


Ich rege an, dass es im BGB zu natürlichen und juristischen Personen nun auch gleichberechtigt virtuelle Personen eingeführt werden. 
Parent - - By Andreas Mader Date 2025-10-18 09:49
ChatGPT hat den immensen Vorteil, bei Meinungsverschiedenheiten nicht persönlich zu werden und die eigenen Statements auch einmal zu hinterfragen, wenn man mit guten Argumenten kommt. Und das beste: Die KI kennt keinen Whataboutismus.
Parent - By Reinhold Stibi Date 2025-10-18 10:14
Ja, das stimmt.
ChatGPT hat eine angenehme, freundliche, verständnisvolle und hilfsbereite  Sprache
und ist neutral.
Bringt doch manches schnell auf den Trichter und befasst sich damit umfangreich
bin angenehm überrascht.
Parent - - By Walter Eigenmann Date 2025-10-11 16:54
Reinhold Stibi schrieb:

PlentyChess 7.0 ist ca. 1/3 schneller als Stockfish. Wahrscheinlich wurde der Code gekürzt; Vorteil zwar schneller
aber in anderen Bereichen schlechter. Die Frage ist, wieviel Stockfish steckt in PlentyChess, wahrscheinlich recht viel.

Mal abgesehen davon, dass keine moderne Top-20-Engine ohne den Open-Source-Stockfish (bzw. AlphaZero) möglich wäre:
PlentyChess ist kein simples SF-Derivat (wie z.B. Rems u.a.), sondern eine eigenständige Entwicklung. Die Architekturen der neuronalen Netze und die Suchfunktionen sind unterschiedlich,
wie man in den einschlägigen Dokus liest, und ihre Quellcodes unterscheiden sich offenbar in wesentlichen Punkten.
PlentyChess (und andere wie z.B. Integral oder Obsidia) werden also zurecht in den Ranglisten geführt - im Gegensatz zu CorrChess, Rems, ShashChess u.ä.

.
Parent - By Reinhold Stibi Date 2025-10-11 17:50 Edited 2025-10-11 17:55
PlentyChess ist sicher bei den besten 10 Engines aber zu Stockfish mit 81 Elo (siehe Rangliste Stefan Pohl) doch
noch ein großer Unterschied.
Nicht zu bestreiten ist dass andere Engines besser in der Mattsuche und der Analyse ist.

Tatsache ist das Rems M 091024 oder Rems M 091224 die besten Analyse Engines sind und auch als Spieleengine sehr gut einsetzbar sind. 
Ob das nun am Quellcode oder an den Einstellungen liegt ist doch unbedeutend. Es kommt doch auf das Ergebnis
an und da hat keine andere Engine Rems M  übertroffen.
Parent - - By Jörg Oster Date 2025-10-11 17:41 Upvotes 4
Reinhold Stibi schrieb:

PlentyChess 7.0 ist ca. 1/3 schneller als Stockfish. Wahrscheinlich wurde der Code gekürzt;

Köstlich. 
Parent - - By Thomas Plaschke Date 2025-10-11 17:44 Upvotes 2
Ich habe den Code noch weiter gekürzt:
Code:
void main(void){}

Mag mal jemand testen?

VG Th. Plaschke
Parent - By Andreas Matthies Date 2025-10-12 09:01
Ich habe noch
Code:
while(1) nodes++;
eingefügt, um die Geschwindigkeit mit Plenty 7 und Stockfish vergleichen zu können. Läuft RICHTIG schnell.
Parent - By Volker Pittlik Date 2025-10-12 11:26
Thomas Plaschke schrieb:

...Mag mal jemand testen?
...


Dazu muss ich zuerst meine Hardware aufrüsten!
Parent - By Olaf Jenkner Date 2025-10-11 19:59
Einwortpostings gewinnen immer.
Parent - - By Stefan Pohl Date 2025-10-14 07:10 Edited 2025-10-14 07:19
Jörg Oster schrieb:

Reinhold Stibi schrieb:

PlentyChess 7.0 ist ca. 1/3 schneller als Stockfish. Wahrscheinlich wurde der Code gekürzt;

Köstlich. 


Ja, das ist schon unfreiwillig komisch. Aber mal was Sinnhaftes zum Thema: Der Autor von PlentyChess arbeitet an einer völlig neuen Netzstruktur, bzw. einem ganz neuen Daten-Input. Stichwort: Threat Inputs.
- das Netz bekommt alle Interaktionen von Figuren (wer wen von wo angreift bzw. verteidigt) direkt als Eingabe.
Das Konzept gilt als sehr vielversprechend, auch bei Stockfish arbeitet man schon daran, hat mir Patrick (PlentyChess Autor) erklärt. Größtes Problem: Schlimmer Speedloss.
Daher hier die Frage: Verliert man durch den Speedloss weniger Celo als man durch die bessere Informationsverabeitung des Netzes dazugewinnt? Oder eben nicht. Patrick feilt schon länger daran und mittlerweile gibt es eine Beta-Version (die hat auch schon im TCEC gespielt (erkennt man an der Endung "TI" im Enginenamen für Threat Inputs)). Ich mache gerade ein paar (inoffizielle) Testruns mit verschiedenen Bedenkzeitstufen.
Den Speedloss hat Patrick mitllerweile auf ca. -30% nps (im Vergleich zu PlentyChess 7) eingedämmt. Auch interessant: Die Binary von PlentyChess wächst durch die Threat Inputs von 33MB auf unglaubliche 112MB.

Kurios: Klemmts bei der Rechenzeit bzw. Rechenleistung, dann kramt man noch heute Konzepte aus der Steinzeit hervor: Die Threat Inputs werden nur mit pseudolegalen Zügen generiert, hat mir Patrick erklärt. Heißt: Man schaut nur, greift eine Figur ein Feld an, oder nicht. Aber nicht, ob dieser Angriff überhaupt legal ist (also ob er bestehendes Schach nicht beseitigt, bzw. die Figur gar nicht ziehen kann, weil sonst ein Abzugsschach entstünde etc.). Das hat man schon gaaaaaaaaanz früher gemacht, bei der sogenannten statischen Endknotenbewertung (die gibt es schon seit den frühen 1980er Jahren). Denn das spart massig Rechenzeit. Warum? Um zu erkennen, ob ein pseuolegaler Zug legal ist, muß ich ihn auf einem virtuellen Brett ausführen und dann wiederum alle pseudolegalen Gegenzüge generieren und schauen, ob einer dieser Gegenzüge den gegnerischen König schlägt. Es ist klar, daß das ein Vielfaches an Rechenaufwand bedeutet. Daher verzichtet man darauf. Natürlich führt das zu Fehlern in dieser Art der Bewertung, das kostet Celo. Aber dafür ist es eben um ein Vielfaches schneller, was wiederum Celo gewinnt.
Parent - By Reinhold Stibi Date 2025-10-14 07:49 Edited 2025-10-14 08:15
Reinhold Stibi schrieb:
PlentyChess 7.0 ist ca. 1/3 schneller als Stockfish. Wahrscheinlich wurde der Code gekürzt;
 
Von Stefan Pohl:
Ja, das ist schon unfreiwillig komisch.

Was schreiben sie denn da für einen Unsinn was bei ihnen auch schon öfters vorgekommen ist.

Ich bin doch diesbezüglich kein Experte und habe auch geschrieben "wahrscheinlich". Eine 
Annahme darf man doch noch äußern ohne eine schäbige überhebliche Antwort zu bekommen.

Ich nahm an dass ein umfangreicher, komplizierter Code die Geschwindigkeit
einer Engine ausbremst und eine einfachere Engine dann schneller ist;  ja und.
Parent - By Michael Bechmann Date 2025-10-11 18:07 Edited 2025-10-11 18:17
Das war kurz.
Im 4. Zug verfielen beide auf relativ seltene Züge in den Eröffnungsbüchern. Das gehört auch zu einer Simulation auch.
Ob aber zu den Eröffnungszügen von Chessbase dazu gehört, Figuren einfach schlagen zu lassen (18.Lg5?), mag dahingestellt bleiben.
Vielleicht gibt es diesen solchen Zug im Partiematerial, die aus dem Eröffnungsbuch von Chessbase erstellt wird.

"Plenty" kam gar nicht mehr zum Zug und ich kann erstmal nichts zu der Engine schreiben.

Erkenntnisgewinn bzw. Bestätigung: Mein Eröffnungsbuch ist besser - Sowas steht bei mir nicht drin, allenfalls mit 0%, um einen Folgezug zu finden.

Event:
Ort:
Datum:

Weiss:
Schwarz:

Ergebnis
Board


Vielleicht werde ich es mal ohne Chessbasebeigaben 100 Partien "offline", aber mit eigenem Eröffnungsbuch gegen Stockfish austragen. Da bekommt man sicher bessere Aussagen bezüglich der Qualität von "Plenty". Ich schreib es immer noch in Anführungszeichen, weil ich es noch nicht als ernste Engine sehe.
Up Topic Hauptforen / CSS-Forum / PlentyChess nun auf Stockfish-Niveau?
1 2 Previous Next  

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill