Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Neue Version Cool Iris 11.80
- - By Reinhold Stibi Date 2023-12-16 10:25 Upvotes 1
Auf Schach.de spielt ein Teilnehmer mit  Cool Iris 11.80.

Cool Iris 11.70 dürfte mit den Grundeinstellungen die beste Engine überhaupt sein;
besonders im taktischen Bereich.

Eduard Nemeth hat auch eine ganz prima private Engine mit Sun Light 14.1
die aber taktisch nicht ganz an Cool Iris 11.70 heranreicht.

Auf seiner Homepage hat er Cool Iris 11.70 zum Download bereitgestellt;  vielleicht
kommt da noch was, wenn es Cool Iris 11.80 überhaupt gibt.

Könnte Jemand den Direktdownload von Cool Iris 11.80 mitteilen ?
Parent - - By Peter Martan Date 2023-12-16 10:32 Upvotes 1
Wieder nicht ganz direkt wegen Erkenntlichkeit der Quelle:

https://outskirts.altervista.org/forum/viewtopic.php?p=61566&view=single_post#p61566

Aber da sind wieder 2 direkte Links im Posting, die ohne eingeloggt zu sein im Forum, funktionieren sollten (der oberste führt zum neuen Patch vom fishcooking), probiert hab ich nur den pixeldrain und die neue Version selbst noch gar nicht.
Parent - - By Reinhold Stibi Date 2023-12-16 10:39 Upvotes 1
Peter, du bist Spitze !  Vielen Dank !

Reinhold
Parent - - By Tommy Tulpe Date 2023-12-16 18:02
Reinhold Stibi schrieb:

Peter, du bist Spitze !  Vielen Dank !

Reinhold


Muss sich nuir hoch heraus stellen, ob auch Cool Iris 11.80 spitze ist.... 
Parent - - By Reinhold Stibi Date 2023-12-16 18:21
Der Unterschied zu Cool Iris 11.70 dürfte sehr gering sein.

Tatsache ist dass Cool Iris 11.70 und 11.80 absolute Spitzenklasse sind; das habe ich schon
festgestellt und überprüft

Taktisch und spielerisch unübertroffen. Zeigt auch auf Schach.de keine Schwächen.
Parent - By Tommy Tulpe Date 2023-12-16 20:23
Danke für die Einschätzung, Reinhold.
Du weißt, dass ich kein Onlineschach spielen lasse, sondern die Engines für Langzeitanalysen im Fernschach nutze. Bin gespannt, ob Cool Iris 11.70/80 auch dabei "glänzt".
Parent - - By Dietmar Klinger Date 2023-12-17 10:16 Upvotes 1
Reinhold Stibi schrieb:

Cool Iris 11.70 dürfte mit den Grundeinstellungen die beste Engine überhaupt sein;
besonders im taktischen Bereich.

Es gibt momentan einfach keine Engine welche besser als das Original Stockfish 16 ist.
Man lasse diese ganzen Abkömmlinge auf gleicher identischer Hardware einfach gegen Stockfish spielen.
Vergleiche auf Schach.de hinken ohnehin gewaltig und sind auch gar nicht aussagekräftig.
Weiterhin darauf einzugehen lohnt daher nicht.
Parent - - By Frank Quisinsky Date 2023-12-17 12:23
Nun ist Stockfish wahrscheinlich noch die Nummer 1 und da springen nach wie vor Leute auf jeden Abkömmling direkt an ... in der Hoffnung stärker als Stockfish.
Könnte ein 10jähriger etwas an Stockfish verändern und sofort kommen solche Meldungen!

Das geht schon seit vielen Jahren so, Wilhelm Hudetz hatte sich mal ein paar angesehen und kam zu den von Dir beschriebenen Resultat.
Habe auch mal ein paar getestet und da sah es nicht anders aus.

Denke Zeitverschwendung, viel spannender ist es die Fortschritte bei Stockfish selbst zu beobachten.

Denke eh das Stockfish nicht mehr die Nummer 1 ist.
Bei längeren Bedenkzeiten scheint es so das Dragon leicht vorbei zieht.
Ferner hat Dragon viel bessere Möglichkeiten und spielt meines Erachtens auch spannender.
Aber auf dem Level ist das schwer zu beurteilen und kostet auch wahnsinnig viel Strom um nachzuweisen.

Kein Reizthema mehr bei mir, weil sowohl Stockfish als auch Dragon und 100 Andere nicht Abkömmlinge weit über das maximal möglich menschliche Level spielen.
Nur mit Statistik läßt sich etwas nachweisen und selbst das ist schwierig. Ist doch kein Wunder das fast alle nur noch 3+1 etc. testen, selbst bei der Hardware
die wir haben bleibt für mehr kaum noch Zeit und mithin trampeln wir im Dunklen.
Parent - - By Dietmar Klinger Date 2023-12-17 13:25
Frank Quisinsky schrieb:

Denke eh das Stockfish nicht mehr die Nummer 1 ist.
Bei längeren Bedenkzeiten scheint es so das Dragon leicht vorbei zieht.

Bei langer Bedenkzeit im Turniermodus könnte das sein.
Nur dazu brauchte man einen Vergleich von vielleicht 500 Partien. In Anbetracht der Strompreise einfach unrealistisch.
Zitat:
Ferner hat Dragon viel bessere Möglichkeiten und spielt meines Erachtens auch spannender.

Wirklich sehr schwierig zu beurteilen und da helfen nur lange Vergleiche.
Zitat:
kein Wunder das fast alle nur noch 3+1 etc. testen, selbst bei der Hardware
die wir haben bleibt für mehr kaum noch Zeit und mithin trampeln wir im Dunklen.

So wird es auch weiterhin sein und bei ansprechender Hardware ist einfach alles remis.
Nur über lange Zeitdistanzen lassen sich dann wohl nur noch Unterschiede feststellen.
Doch wer lässt in der heutigen Zeit schon über Monate seine Server laufen?
Parent - - By Frank Quisinsky Date 2023-12-17 14:11
Hallo Dietmar,

genau, es deutet vieles darauf hin das Unterschiede bald nur noch bei längeren Zeiten zu sehen sind.
Ich vermute gar das dann eher die Remisquote zurück geht wenn denn die Engines auch unterschiedliche Statistiken zu den Spielstilen aufweisen.

Da es auch immer mehr Engines werden, die sich bei ca. maximal 300 Elo von Stockfish entfernt ansiedeln kann das kaum noch alles getestet werden.
Lasse selbst auch nur noch einen Rechner laufen, könnte drei laufen lassen aber das ist es mir nicht wert.

So muss man hier und dort ein wenig aussortieren hinsichtlich was gefällt oder eher nicht und dann auf spannende Turnier hoffen mit einem
möglichst niedrigen Zügedurchschnitt, möglichst niedriger Remisquote ... spannende Partien.

Also, einen Rechner lasse ich noch laufen ...

Bin eher davon überzeugt, dass viele Engines vieles gleich machen und das auch Remisquote und den sehr hohen Zügedurchschnitt bei den Partien treibt.
Das Mittelspiel ist und bleibt spannend und da kommt es auch noch zu sichtbaren Vorteilen zwischen vielen Engines.

Viele Grüße
Frank
Parent - - By Peter Martan Date 2023-12-17 14:35 Edited 2023-12-17 14:57 Upvotes 3
Frank Quisinsky schrieb:

genau, es deutet vieles darauf hin das Unterschiede bald nur noch bei längeren Zeiten zu sehen sind.
Ich vermute gar das dann eher die Remisquote zurück geht wenn denn die Engines auch unterschiedliche Statistiken zu den Spielstilen aufweisen.

Mit längeren TCs werden die Performance- Unterschiede zwischen denselben Engines natürlich kleiner, nicht größer.

Manche Engines brauche gegen manche andere eine Mindest- TC, um überhaupt ihre gleichen Chancen zu haben, das hat man gerade wieder beim CCC Bullet- Turnier gesehen, da wird bei so kurzer TC Lc0 selbst auf dieser Hardware unter Wert geschlagen, aber auch und gerade über solchen Mindest- Zeiten, die für verschiedene Engines verschieden lang sind (Hardware-, Eröffnungs- und Gegner- abhängig wie alles), sinken die Abstände mit immer längerer TC immer weiter, zwar immer weniger stark mit mehr Zunahme der Zeit aber dafür gleichmäßiger, einfach weil dann auch die schwächeren Engines weniger Fehler machen und weniger schwere solche, die spielentscheidend sind.
Die Geschichten, dass einzelne Engines andere überholen würden, wäre nur die Hardware- TC lang genug, sind auch immer schon herum gegeistert, mal hieß es das für Zappa (da hat's noch irgendwie Berechtigung gehabt, weil das Programm für damalige Verhältnisse ausnahmsgut skaliert hat) mal von Junior, mal von Shredder, mal von Fritz.
Programme mit weniger Pruning haben früher auch etwas länger gebraucht, ihre volle Stärke zu entfalten, aber das ist in Zeiten heutiger Hardware, den diesbezüglichen Optimierungen der Programme und spätestens seit der Eval aus neuronalen Netzen vollends vorbei. Wenn auch Lc0 und SF weiter noch und noch größere Netze verwenden werden, die Algorithmen und die Hardare- Nutzung werden mit STC mehr getestet, weil mehr Partien gespielt werden können, aber im SF Framework werden auch laufend LTC- Vergleiche gemacht mit den Patches, und die Anpassungen funktionieren daher mit LTC auch nur sehr selten wirklich schlechter (einzelne Regressionen bei einzelnen Stellungen kommen natürlich immer wieder mal vor, ev. leidet auch die Performance in einer bestimmte Suite, aber das sind lauter Randbefunde, denen man mehr oder weniger Beachtung schenken kann), im Allgemeinen wirken sich die größeren Vorteile bei längeren Bedenkzeiten einfach nur weniger aus. Und ja, natürlich lassen sie sich auch einfach weniger leicht statistisch beweisen, aber das liegt außer am größeren Zeitaufwand auch daran, dass die Abstände, die gemessen werden können, kleiner sind.
Parent - - By Frank Quisinsky Date 2023-12-17 14:52 Edited 2023-12-17 15:16
Hallo Peter,

das habe ich lange vermutet aber es gibt Hinweise warum es nicht so ist:

Ein Beispiel:
Wenn eine neue Engine Version z. B. bei 3+1 einen Zuwachs von 50 Elo hat, dann bei 8+2 der Zuwachs sich auf 30 Elo minimiert.

Soweit so gut ...

Eine andere Engine hat bei 3+1 50 Elo und bei 8+2 auch 50 Elo.

Ein weiteres Beispiel:
Gerade die Taktiker profitieren von den längeren Zeiten weil viele von diesen Programmen haben ein Endspielproblem.

Wasp profitiert von längeren Zeiten ... rückt näher auf.
Aber ... wenn derzeit ein Plus von 30 Elo bei 3+1 festgestellt wird, sind es bei 40 in 20 (90-Minuten Partien) dann gerade mal 10 Elo.

Da greifen viele verschiedene Aspekte ineinander!!
Also, ein wilder MIX, sowohl als auch.
Der Zügedurchschnitt geht gar herunter bei längeren Zeiten, jeder würde vermuten ... der geht hoch.
Dem ist nicht so!

Logische Erklärung ...
Der hohe Zügedurchschnitt entsteht im Endspiel.
Wenn mehr gesehen wird aufgrund höherer Zugtiefen geht der Zügedurchschnitt zurück.

Das es dann oftmals zu mehr Entscheidungen bei längeren Bedenkzeiten kommt liegt daran das Engines bei Zugtiefe 20, 30 oder 40
den gleichen guten Zug übersehen. Engines die weniger schnell auf Tiefe kommen oftmals nicht. Die Partien enden früher wenn der gewinnbringende
Zug gefunden wird und ein langes Endspiel vermieden wird.

In der Regel ist immer so, bei fallenden Zügedurchschnitt geht auch die Remisquote zurück.
Sehe in Stats nichts anderes.

Also Umkehrschluss ...
Bei längeren Bedenkzeiten kommt es zu mehr Entscheidungen ... wenn denn Programme am Start sind die nicht so aufällig gleiche Stats produzieren.
Die dann heraus zu selektieren ist eine Hercules-Aufgabe.

Sehe das im Test-Turnier (Move-Average Turnier) welches ich mit einer schnellen Bedenkzeit mal habe durchlaufen lassen.
Wie gut sind die Ergebniss gegen deutlich schwächer ... daraus läßt sich vieles ableiten wenn die Contempt Komponente entsprechend berücksichtigt wird.

Für mich auch relativ neu, ging bislang von der bisherigen These aus.
Muss aber dazu sagen, ich bin mir nicht zu 100% sicher auch wenn vieles darauf hindeutet.
Bräuchte mehr Rechner aber auch dieser Test ... macht nicht wirklich Sinn.

Weil vieles ist einfach auch logisch und ein Test dann unnötig oder zu aufwendig.

Übrigens ... Contempt Thema:
Teste seit geraumer Zeit

Dragon 3.3 gegen 14 Engines, die zwischen 3300-3450 liegen mit Contempt 24 zu Contempt 0!
Differenz = 2 Elo zu Gunsten von Contempt 24
Für diese 2 Elo ist der Zügedurchschnitt um 16 höher!

Dragon 3.3 gegen 14 Engines die zwischen 3000-3150 liegen mit Contempt 24 zu Contempt 0!
Differenz = 9 Elo zu Gunsten von Contempt 24.

Also gegen NN Engines macht zumindest bei Dragon 3.3 keinen relevanten messbaren Unterschied.
Gegen deutlich schwächere Engines ein Vorteil wenn Contempt = 24 steht.

In beiden Fällen bei 3+1 und nach über 2.000 Partien.
Nichts neues unter der Sonne!

Viele Grüße
Frank
Parent - - By Peter Martan Date 2023-12-17 15:30 Edited 2023-12-17 15:41
Es kommt immer auf den Vergleich von 2 bestimmten Engines bei bestimmter Hardware- TC und bestimmten Eröffnungsteststellung an.
Die Relationen verändern sich bei keiner Veränderung einer oder aller dieser Bedingungen linear, sondern z.B. von VSTC zu STC mehr, von STC zu LTC mehr oder weniger und von LTC zu VLTC am wenigsten. Bei der theoretischen Vorstellung unendlich langer Bedenkzeiten hättest du 0 Unterschiede, egal wie groß er bei STC wäre, schon deshalb, weil die erste Partie ewig dauern würde, bis sie Remis endete (eben nicht und nicht endete)

Schwache Hardware staucht die Kurven, starke streckt sie, dasselbe bewirken auf gleicher Hardware kürzere und längere TCs, genau so ist es mit Ranges an Vorteil einer Seite bei den Eröffnungen, bis zu einer gewissen Grenze kann man die Elo zwischen 2 bestimmten Engines mit bestimmter Hardware- TC mit mehr einseitigem Vorteil spreizen, über diese Grenze hinaus werden die 1:1- Paare die Statistik mehr ruinieren als es die Remis tun.
Sehr schön sieht man das genau so übrigens auch mit anderen Teststellungen als denen, die man in der Regel nur aus dem Eröffnungsbereich (warum das eigentlich?) zum Ausspielen verwendet, mit "Stellungstest"- Teststellungen hat man genau dieselben Verhältnisse in den Leistungskurven, es sind nicht dieselben Kurven mit denselben Engines und mit verschiedenen Teststellungen sind sie auch verschieden, aber die grundsätzlichen Verhältnisse der Leistungskurven zueinander ähneln einander bei (guten) verschiedenen Tests alle, je mehr Hardware- Zeit für dementsprechenden Schwierigkeitsgrad, desto enger rücken die Performances zusammen.
Zuviel Schwierigkeit für zu wenig Hardware- Zeit: zu wenige Lösungen für statistische Signifikanz, schadet mehr als zuviele Lösungen, die man dann schlimmstenfalls immer noch durch Lösungszeit- Vergleiche aus dem Remis- Dunkel holen kann, was nicht gelöst wird, ist zwangsläufig bei allen Teilnehmern gleich schlecht als Ergebnis.

Einzelbeobachtungen aus einzelnen bunten Turnieren (oder einzelnen Stellungstests mit zu wenigen Stellungen von zu wenig Signifikanz) verleiten gern dazu, Statistiken, die keine sind in Hinblick auf ihre Irrtumswahrscheinlichkeit, zu Vermutungen zu werden, "Spielstile", die man als Mensch zu erkennen glaubt (sie in die Engines hineinprojiziert, schachlicher Stil, wie er bei menschlichen Spielern auch schon sehr Geschmackssache ist, hat bei Engines zur Beschreibung dessen, was sie wie spielen, meiner Meinung nach überhaupt keine übertragbare Bedeutung) all solche Vermenschlichungen der Engines machen die Sache zwar vielleicht für Fans der einen und der anderen Engine spannender (man will ja wissen, wem man die Daumen hält), Substanz haben sie im Computerschach noch nie viel gehabt, und genau diese restliche Substanz geht schon allein deshalb mehr und mehr verloren, weil's immer mehr Engines werden, die einfach so weit weg sind in ihrem Schach von dem, was Menschen untereinander spielen, dass der Überblick schon über die Masse verloren geht.

Da bewahre ich eher noch Überblick über die Unmengen von Stellungen, die ich mir im Lauf der Zeit schon mit Engines angeschaut habe, da erkenne ich bestimmte Klassiker immer gleich wieder, wenn sie wieder irgendwo auftauchen und weiß auch schon oder noch, welche Engine da wann zuerst wie deutlich besser war als eine andere, Kunststück, meistens hab' ich das ja in extenso mit den Stellungen gemeinsam gespeichert, Output mit Evals und Kommentaren.
Und dann kommt eine neue Engine oder eine neue Version und sie verhält sich mit der wohlbekannten Stellung doch wieder irgendwie anders, das sind Unterschiede, die kann man wahrnehmen, vergleichen, speichern. Und da kann man von Stilen sprechen, Engines die bei der einen bestimmten Stellung besser sind, deren Stil ist ein dieser Stellung besser passender.
Für eine selektive Stellung bringt der entsprechend passende Spielstil time to solution, time to best line, time to best eval, all das bei bestimmter Engine im Vergleich zu bestimmter anderer.
Alles andere ist schiere Vermutung und sehr der Mode unterworfen
Parent - - By Max Siegfried Date 2023-12-17 16:00
Wie will man denn als schwacher bis bestenfalls durchschnittlicher Spieler Spielstile von Engines erkennen, die wesentlich stärker sind?
Also ich meine mehr erkennen als: Engine A spielt wie üblich sehr oft Bauern nach vorne. Weil das noch lange kein Spielstil ist.

Anbei noch die Fragen:
Gibt es eine Auflistung aller Spielstile?
Welche Engines würde ihr da, zu welchem Spielstil, einordnen?
Parent - By Max Siegfried Date 2023-12-17 16:04
Wie findet ihr bei Fritz 19 die unterschiedlichen Charaktere?
Kann man diese auch in anderen GUIs verwenden?
Parent - By Frank Quisinsky Date 2023-12-17 20:04
Spielstehe entstehen bei mir nicht aufgrund dessen was ich zu sehen glaube, vermute oder mir wünsche zu glauben.
Sondern aufgrund nackter Tatsachen zu unterschiedlichem Spielverhalten im Mittelspiel, spätes Mittelspiel und Endspiel.
Es gab dazu bei den FCP-Turnieren 2020, 2021 und 2022 super schöne Statistiken die Klaus Wlotzka dann in Excel übernommen hat.
Er hat das sehr schön aufgearbeitet.

Einfaches Beispiel:
Eine Engine die deutlich mehr Partien nach der Buchphase in der Lage ist zu gewinnen als vergleichbar andere Engines auf gleichem Level hat hier einen Punkt.
Eine Engine bei den Gewinnpartien einen deutlich niedrigeren Zügedurchschnitt produziert hat hier einen Punkt.

Und so gibt es x-Themen die sich aus wirklich guten Datenbanken zu Recht friemeln lassen.
Geht es zu Statistiken spätes Mittelspiel / Übergang Endspiel wirds kompliziert weil es mehrere denkbare Modelle gibt.

z. B. Stats nach Anzahl der Figuren auf dem Brett.
Die liefern meist die zuverlässigsten Ergebnisse aber sind aufwendig zu erstellen.

Wenn denn bei den Auswertungen unterschiedlicher Datenbanken gleiches herauskommt ... kann man von Stärken und Schwächen sprechen.
Sprechen wir von Stärken und Schwächen sind wir bei den Spielstilen.

Einfach nur einfache Statistik!

Mache das seit mehr als 20 Jahren so.
Nur kann ich heute mehr Partien produzieren als in Winboard Zeiten.
Da war es in der Tat so, dass man sich öfters mal bei einer Einschätzung geirrt hat.

Nach wie vor der Reiz in der Suppe Nummer 1 (nicht die Elo oder wer auf Platz 1 oder Platz 2 steht).
Es sind die Spielstile die reizen und meist unabsichtlich produziert werden.

Viele Grüße
Frank
Parent - - By Dietmar Klinger Date 2023-12-18 09:27
Hallo Frank,

ich kann dir zu all deinen Ausführungen nur recht geben.
Stockfish Derivate und sonstigen Abklatsch werde ich nicht mehr testen, sondern nur noch
eigenständige, total neu programmierte Engine, sofern da noch mal etwas Gutes kommt.
Vielleicht kann man in nächster Zeit noch eine enorme Steigerung bei Komodo erwarten.
Doch ehe Dragon 3.4 oder > merklich zulegt, wird wohl noch einige Zeit vergehen.

MfG Dietmar
Parent - - By Peter Martan Date 2023-12-18 09:40 Edited 2023-12-18 10:00 Upvotes 1
Dietmar Klinger schrieb:

Vielleicht kann man in nächster Zeit noch eine enorme Steigerung bei Komodo erwarten.
Doch ehe Dragon 3.4 oder > merklich zulegt, wird wohl noch einige Zeit vergehen.

Vor allem, weil die Entwicklung von Dragon derzeit eingestellt ist.

https://talkchess.com/forum3/viewtopic.php?p=953167#p953167
Parent - - By Dietmar Klinger Date 2023-12-18 11:19 Edited 2023-12-18 11:24
Peter Martan schrieb:

Vor allem, weil die Entwicklung von Dragon derzeit eingestellt ist. https://talkchess.com/forum3/viewtopic.php?f=2&t=82669&sid=fc6ae416a0608bcb2d24e282313937e9

Das die weitere Entwicklung direkt eingestellt ist, davon kann man aber nichts lesen.
Parent - - By Peter Martan Date 2023-12-18 11:58 Edited 2023-12-18 12:05
Lies dir den restlichen Thread vielleicht auch noch durch, es wird, was ich mich erinnere, auch noch deutlicher gesagt, als in diesem Eingangsposting, in dem Larry auch davon schreibt, dass es wahrscheinlich die letzte Version sein wird.

Zitat:
KomodoChess.com has released Dragon 3.3, expected to be the final version of Dragon


Aus einem Mail vom komodochess- support, das ich in der Folge noch gewechselt habe in Sachen laufender subscription (es gibt ja auch keine neuen derartigen Update- Abos mehr zu kaufen) steht wörtlich noch das:

Zitat:
Something to note, this is likely going to be the last version released, barring any bug fixes.


Glaub's mir einfach, Dietmar, Dragon ist zumindest derzeit und von den bisherigen Entwicklern auf Eis gelegt, Torch ist die Engine, die chess.com  statt Dragon (das ja auch schon eine Weile der Firma gehört hat) weiter entwickelt, leider vorläufig nicht zum Verkauf, nur zur Nutzung online am Server.
Parent - By Dietmar Klinger Date 2023-12-18 17:56
Peter Martan schrieb:

Glaub's mir einfach, Dietmar

Hallo Peter,

danke für die Rückmeldung. Ich werde mir das demnächst noch mal genau durchlesen.

MfG Dietmar
Parent - - By Frank Quisinsky Date 2023-12-22 22:49 Edited 2023-12-22 22:55
Hallo Dietmar,

ist nicht wichtig, ob die Entwicklung von Dragon abgeschlossen ist oder nicht.
Die Engine ist da und auf einem verdammt hohen Niveau, macht auch einen fertigen Eindruck aufgrund der herausragenden Features.

Vergleichbar mit SlowChess.
Der Programmierer schrieb er wüsste nicht mehr, was er noch verändert könnte.
Die Engine ist ausgereift, hat keine wirklichen Schwächen, eher viele Stärken.
Spielt auf einem Niveau ca. 100 Elo von Stockfish weg.

Je mehr Zeit, desto näher rückt alles zusammen, weil die Schwächeren einfach mehr sehen.
Das ist eine Aussage die einfach jedem klar sein sollte, weil so was von logisch!

Natürlich gibt es dann immer noch besondere Züge, die vielleicht nicht gefunden werden, aber die werden immer weniger bei mehr Zeit.

Beim Stockfish / Dragon Vergleich war es schon immer, so dass Dragon einen Vorteil im frühen Endspiel hat.
Dragon tauscht gekonnt ab und achtet wie auch immer geartet drauf das die Bauerstrukturen bei dem vorangegangenen Tausch sonstiger Figuren gut bleiben.
Das hatte ich mal mit vielen Stats in Erfahrung gebracht. Das ist ein Wissen, welches zu einem Vorteil führt, wenn es im Vergleich zu Stockfish geht.
Dafür ist Stockfish in der Mittelspielphase aggressiver und in puren Figurenendspielen stärker.

Mit mehr Bedenkzeit vermute ich, dass der Dragon Vorteil höher zu bewerten ist.
Nun wird aber Stockfish immer weiterentwickelt und wird sicherlich auch weiter zulegen, auch wenn nur noch in kleinen Schritten.

In meinem laufenden Turnier haben beide nach jetzt 600 90-Minuten Partien eine verloren.
Stockfish aufgrund einer schwierigen Eröffnung, die aber dennoch in Remis enden sollte gegen Clover und Dragon hat sich 1x von Caissa zusammenschieben lassen.

Auch Clover und Caissa sind bei längeren Bedenkzeiten nur ca. 50-60 Elo von Stockfish / Dragon weg.
Passiert, aber wie selten das bei näherer Betrachtung dann wirklich ist ... nach 600 Partien je nur 1x verloren.

Viele Grüße
Frank

Ach so, interessant auch die Analyse der späten Gewinne bei Stockfish und Dragon bei den längeren Bedenkzeiten.
Stockfish ist hier deutlich überlegen, was offenbar überwiegend an Schwerfigurenkonstellationen im Endspiel liegt.
Aber auch bei ungleichem Material hat Stockfish mehr Wissen und fährt mehr Punkte ein.
Zeugt von einem Neural-Network auf enormen Niveau bei Stockfish.
Aber wie gesagt der Vorteil von Dragon hinsichtlich optimaler Bauerkonstellationen auf dem Weg ins Endspiel ist nicht zu unterschätzen. Die kleinen Vorteile von Zug
zu Zug hängeln sich hoch. Denke das kommt alles von Larry Kaufmann der darauf offenbar speziallisiert ist.
Parent - By Frank Quisinsky Date 2023-12-22 23:00
Übrigens, Vorteile bei ungleichem Material zu erzielen, erst Recht wenn noch viele Figuren auf dem Feld sind ... das ist auch eine Stärke von RubiChess und Lc0.
Parent - By Max Siegfried Date 2023-12-17 15:50
Frank Quisinsky schrieb:

Nun ist Stockfish wahrscheinlich noch die Nummer 1 und da springen nach wie vor Leute auf jeden Abkömmling direkt an ... in der Hoffnung stärker als Stockfish.
Könnte ein 10jähriger etwas an Stockfish verändern und sofort kommen solche Meldungen!

Das geht schon seit vielen Jahren so, Wilhelm Hudetz hatte sich mal ein paar angesehen und kam zu den von Dir beschriebenen Resultat.
Habe auch mal ein paar getestet und da sah es nicht anders aus.

Denke Zeitverschwendung, viel spannender ist es die Fortschritte bei Stockfish selbst zu beobachten.

Denke eh das Stockfish nicht mehr die Nummer 1 ist.
Bei längeren Bedenkzeiten scheint es so das Dragon leicht vorbei zieht.
Ferner hat Dragon viel bessere Möglichkeiten und spielt meines Erachtens auch spannender.
Aber auf dem Level ist das schwer zu beurteilen und kostet auch wahnsinnig viel Strom um nachzuweisen.

Kein Reizthema mehr bei mir, weil sowohl Stockfish als auch Dragon und 100 Andere nicht Abkömmlinge weit über das maximal möglich menschliche Level spielen.
Nur mit Statistik läßt sich etwas nachweisen und selbst das ist schwierig. Ist doch kein Wunder das fast alle nur noch 3+1 etc. testen, selbst bei der Hardware
die wir haben bleibt für mehr kaum noch Zeit und mithin trampeln wir im Dunklen.


Das ist doch der Sinn für die meisten Menschen, wenn sie für eine Analyse ihrer Partien maximal 1 Sekunde pro Zug mit Stockfish brauchen und in dem Bereich das beste Kosten (Zeit) - Nutzen (Elo) Verhältnis vorliegt.
Da könnte selbst Dragon 3.3 10 ELO stärker sein als Stockfish bei langen Bedenkzeiten im Dragon vs Stockfish Vergleich. Aber wenn die Leute Dragon mit 5 Minuten Bedenkzeit pro Zug für Ihre Analysen einsetzen müssen, nur damit sie sicher sein können das im Dragon vs Stockfish Vergleich Dragon 10 Elo vorne liegt, macht das keinen Sinn zumal es nicht einmal sicher ist das Dragon in der menschlichen Partie bessere Ergebnisse liefern würde als Stockfish, was bei den meisten 1400 Elo Partien sowieso nicht der Fall wäre Aufgrund das Anzahl der Fehler und selbst zwei Menschen mit jeweils 3000 Elo würden zu viele Fehler machen. Stockfish ist bei 1er Sekunde pro Zug wahrscheinlich 100 Elo stärker als Dragon und somit viel nützlicher für die gigantische Mehrheit an Menschen.
Sobald aber 2 Menschen jeweils 200 Elo schwächer sind als die Top Engines, könnte es sich für sie lohnen mehr Analysen mit Dragon durchführen zu lassen als mit Stockfish, auch wenn es sie 5 Minuten pro Zug kostet um diese eine gespielte Ungenauigkeit zu entdecken und wie man da hätte besser spielen sollen.

Es spricht natürlich nichts dagegen Stockfish + Dragon + LC0 gleichzeitig für die Analysen von menschlichen Partien zu verwenden und von mir aus noch weitere deutlich schwächere Engines.
Parent - - By Peter Martan Date 2023-12-17 18:06 Edited 2023-12-17 18:20 Upvotes 1
Frank Quisinsky schrieb:

Denke eh das Stockfish nicht mehr die Nummer 1 ist.
Bei längeren Bedenkzeiten scheint es so das Dragon leicht vorbei zieht.

100 Partien mit 25'+5" sind single thread mit 30 Concurrencies ja auch schnell gespielt, hier mit UHO 6mvs. 110-119cp:

Score of stockfish_23120210 vs dragon-3.3: 36 - 5 - 59 [0.655]
Elo difference: 111.4 +/- 42.4, LOS: 100.0 %, DrawRatio: 59.0 %
100 of 500 games finished.

Die vollen 500 werde ich nicht abwarten, weil's ja jetzt auch schon klar aus der error bar raus ist und 100% LOS erreicht sind. Ein bisschen kann ich's ja noch laufen lassen, ob sich noch was tut.
Wüsste aber nicht, warum sich das bei noch längeren TCs und sonst gleichen Bedingungen wesentlich ändern sollte, vermutlich wären die Abstände kleiner bei doppelt so lang und mehr Threads pro Engine, aber wie Dragon SF überholen sollte mit den Versionen von beiden, die wir jetzt haben, sehe ich nicht.
Und wenn SF jetzt noch weiter entwickelt wird und Dragon nicht mehr...
Schade schon, ich schätze an Dragon vor allem die vielen verstellbaren Parameter, die Regular Eval, die Aggressive Personality und den Armageddon Mode.
Parent - - By Frank Quisinsky Date 2023-12-17 19:48 Edited 2023-12-17 19:51
Hallo Peter,

ich teste nie einen direkten Vergleich (es sein denn für den Zweck einen Test-Set zu erstellen um Match-Konstellationen zu testen).
Verwende bekanntlich immer viele Gegner.
Auch teste ich mit ausgeglichenen Eröffnungssystemen!

Bei Uhu ist ja eher das Ziel von einer schlechten Position in eine Remis-Position zu kommen.
Das wäre nur einer von vielen wichtigen Punkten beim Schach.

Was ich mache ist einfach stinknormales Schach.

Aber wie gesagt, gibt so viele Test-Modelle und ich will keinesfalls andere in Frage stellen.
Machen sich viele Gedanken und die sind definitiv immer interessant ... die Gedanken!

Bei meinem laufenden Turnier (90 Minuten Partien) hat Stockfish 16 drei Punkte Vorsprung auf Dragon 3.3 nach 560 Partien.
Bei einem Turnier mit ca. den gleichen Engines und 3+1 waren es nach 2.000 Partien 19 Punkte Vorsprung.

Schaue ich auf CCRL ist der Unterschied auch sehr knapp aber die Bedenkzeit liegt unter der von mir verwendeten bzw. in etwa ist das gleich.
CCRL verändert aber die Grundeinstellungen nicht, ich habe bei Dragon 3.3 Contempt = 0 gestellt damit die Partien nicht zu lange laufen.

Ein Schachfreund läßt seit einigen Monaten ein Turnier mit 8 Engines laufen. Partie dauert bei ihm ca. 4 Stunden im Schnitt.
Da wechseln sich Stockfish und Dragon regelmäßig ab. Er hat auch schon weit über 700
Partien pro Engine zusammen, es spielen Stockfish 16 und Dragon 3.2 bei ihm. Interessant finde ich das Dragon 3.2 bei den
Gewinnpartien einen Zügedurchnitt von 80 erreicht und Stockfish 16 von 84. Im direkten Vergleich hat Dragon 1 Partie gewonnen, der Rest
war bislang Remis. Aber das sind auch alles zufällige Ergebnisse ... schrieb es ja schon, es wird zu viel Strom unnötig verbraten wenn der
Anspruch auf ein genaues Ergebnis im Vordergrund steht. Und da es zu viele Test-Modelle gibt wäre selbst ein aussagekräftiges Ergebnis
heute im Grunde keines mehr ... nur ein kleiner Anhaltspunkt.

Viele Grüße
Frank
Parent - - By Peter Martan Date 2023-12-17 19:59 Edited 2023-12-17 20:14 Upvotes 1
Ja, Frank, ich sag ja, man kann Elo spreizen mit Eröffnungsstellungen, mit kürzeren Hardware- TCs, und man kann sie in den verschiedensten Engine- Pools erspielen, je mehr schwächere teilnehmen, desto mehr profitieren davon ja auch die Starken als Gruppe. Aber dass SF allein mit längeren TCs in Gefahr kommt, von Dragon überholt zu werden, das sehe ich nicht.
Mittlerweile sind's 160 Partien und immer noch 110 Elo bei +- 32, bei Stefan Pohl sind's 74 zu SF dev., bei 15000 Partien pro Engine und als Eröffnungen nimmt er ja jetzt schon eine Weile sogar das 120-129cp- UHO- Eröffnungsset, und es sind nur die 16 besten Engines, die da in dieser Liste mitspielen.

So viele Tests so viele Elo, wenn du mir ein Match zeigst, in dem Dragon gegenüber SF eine LOS von nahe 100% hat, also umgekehrt wie in allen anderen Matches der beiden, darauf wäre ich dann gespannt.
Parent - - By Frank Quisinsky Date 2023-12-17 20:13 Edited 2023-12-17 20:20
Hi Peter,

ich sehe das für Dich dann mit ...



Muss auch immer bedenken was bei der Entwicklung im Vordergrund steht.
Wenn ich mir so ansehe was Larry Kaufmann so geschrieben hat, alleine beim Test auf dem Server zur Absenkung der Spielstärke.
Welche Prios er sonst legte.

Kann leider auch nichts anderes schreiben.
Kann ja nicht entgegen festgestellter Fakten schreiben.
Macht nun überhaupt keinen Sinn!

Bin gespannt wie es Ende 2024 ausschaut.
Wahrscheinlich haben wir dann 40 Programme die alle nicht mehr als 100 Elo von Stockfish entfernt liegen.
Was bedeutet, dass in einem Turnier wo alle drin sind der Stockfish Vorsprung weiter schmilzt.

Besonders geil ist dann, die Engines herauszupicken, die in der für mich wichtigen Partiephase (Übergange Eröffnung zum Mittelspiel / frühes Mittelspiel)
herausstechen.

Im Jahr 2023 war es Urlaochka!
Sieht man aber auch schon in einfachen Analysen, dat Ding ist mega aggressiv.

Aber so richtig kann Uralochka, bei aller Aggressivität, vergleichbar starke Engines nicht gefährlich werden.
Das ist auch eine Erkenntnis!

Die Gegenfrage ist also ...
Warum glänzen vergleichbare starke Engines wie Uralochka nicht so deutlich gegen schwächere Gegner!

Ein ganz spannendes Thema!!

Bedeutet mehr Aggressivität im frühen Mittelspiel automatisch eine schwächere Endspielstellung?

Viele Grüße
Frank
Parent - - By Frank Quisinsky Date 2023-12-17 20:30
Uralochka produziert das doppelte an schnellen Gewinnen im Vergleich zu Stockfish oder Dragon gegen schwächere Gegner.
Das sind so Dinger die ich für deutlich interessanter halte als einen Abkömmling zu testen.
Weckt nicht meinen Forscherdrang!
Parent - - By Peter Martan Date 2023-12-18 09:37 Edited 2023-12-18 10:04
Trotzdem sollten wir Reinholds Thread nicht über Gebühr für Dinge missbrauchen, die nicht dazugehören. Das hingegen wollte ich doch noch nachreichen, mit 30'+5" single thread hab' ich noch bis 250 weiter spielen lassen:

Score of stockfish_23120210 vs dragon-3.3: 86 - 14 - 150 [0.644]
Elo difference: 103.0 +/- 26.5, LOS: 100.0 %, DrawRatio: 60.0 %
250 of 500 games finished.

Und dann, weil das ja unser Thema war, mit denselben UHO- Stellungen (6mvs 110-119cp) mit 3'+1":

Score of stockfish_23120210 vs dragon-3.3: 191 - 24 - 285 [0.667]
Elo difference: 120.7 +/- 19.3, LOS: 100.0 %, DrawRatio: 57.0 %
500 of 500 games finished.

Also, dass Dragon mit längerer TC näher an SF heranrückt, damit hattest du schon recht, gleich fast 20 Elo näher


Übrigens so, dass Larry Kaufman nichts vom Testen mit einseitigen Vorteilsstellungen hält, so ist das auch nicht, hier

https://talkchess.com/forum3/viewtopic.php?p=953196#p953196

hat er mal geschrieben, dass er selbst auch die 110-119 cp verwendet.
Parent - By Frank Quisinsky Date 2023-12-22 23:08
Hi Peter,

ist ja auch gut und richtig so wenn z. B. durch Uhu Positionen ein Test in andere Richtungen läuft (Dein Kommentar zu Larry).
FRC / Chess 960 Testerei zum Lernen einzusetzen ist auch eine Variante.

Und der Mix aus vielen Testmethoden führt wahrscheinlich zu einem größeren Erfolg weil einfach immer mehr auf dem Weg zum perfekten Schach deutlich wird.

Aber letztendlich zählt dann die knallharte Eröffnungstheorie und wie Engines damit klar kommen.
Das _normale Schach_ was weit über 90% der Schachspieler bevorzugen.

Ob sie unter zur Hilfenahme von Engines was neues in komplizierten Theorie-Varianten entdecken?
Ein sehr spannendes Thema bei den vielen komplizierten Systemen.
Das Mittelspiel geht es in den nächsten Jahren regelrecht an den Kragen wenn denn die Phase nicht schon längst läuft.

Viele Grüße
Frank
Up Topic Hauptforen / CSS-Forum / Neue Version Cool Iris 11.80

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill