Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Mystery
1 2 Previous Next  
- By Peter Martan Date 2023-07-11 12:01
https://www.chess.com/de/computer-chess-championship

Bullet Semifinals:

    Program                            Score     %    Av.Op.  Elo    +   -    Draws

  1 Stockfish                      : 264.0/400  66.0   3481   3596   22  21   58.0 %
  2 Dragon                         : 216.5/400  54.1   3495   3524   22  22   58.2 %
  3 Mystery                        : 210.5/400  52.6   3497   3515   20  20   64.2 %
  4 Lc0                            : 195.5/400  48.9   3501   3493   22  22   59.2 %
  5 Ethereal                       : 163.0/400  40.8   3511   3446   21  21   61.5 %
  6 Berserk                        : 150.5/400  37.6   3514   3427   20  20   63.2 %
- - By Peter Martan Date 2023-07-17 07:36
Dragon und Mystery sind offenbar jetzt zur gemeinsamen Fortsetzungs- Engine Torch geworden, sonst müsste nach den Semifinals eigentlich Dragon gegen SF das Finale spielen, so hingegen spielt Torch gegen SF, 1000 Partien sind geplant, erst etwas über 40 gespielt.
Parent - - By dkappe Date 2023-07-17 08:45
Peter Martan schrieb:

Dragon und Mystery sind offenbar jetzt zur gemeinsamen Fortsetzungs- Engine Torch geworden, sonst müsste nach den Semifinals eigentlich Dragon gegen SF das Finale spielen, so hingegen spielt Torch gegen SF, 1000 Partien sind geplant, erst etwas über 40 gespielt.


Torch ist eine ganz andere und vollkommen neue Engine. Dragon wurde da gar nicht einverleibt. Im Challenger hat Torch Dragon besiegt und darf nun sich mit SF schlagen.
Parent - By Peter Martan Date 2023-07-17 09:42 Edited 2023-07-17 09:45
Danke, Dietrich, ich weiß, es ließ sich kaum vermeiden, davon zu erfahren.

Ich wollte nur anmerken, dass der 3. Platz im Semifinale etwas Anderes ist, als der 1. im Challenger gegen nur die eine Engine, also in einem "normalen" Turnier hätte Dragon im Finale spielen müssen, meiner Meinung nach.
Es ist insofern egal, als die Weiterentwicklung von Dragon ja jetzt praktisch auch Torch ist und die Distanz zu SF dürfte vorläufig in dem einen Bullet- Match ohnehin auch noch ziemlich gleich sein, sofern man nach 64 Partien überhaupt schon etwas sagen kann (momentan 61 zu 39%).
Parent - - By Martin Steinwandter Date 2023-07-17 09:50 Upvotes 1
Torch ist geringfügig stärker als Dragon. Da liegt noch viel Arbeit vor Euch, um auch nur zu Stockfisch aufzuschließen, oder übersehe ich da etwas.
Parent - - By Max Siegfried Date 2023-07-17 10:43
Stockfish vs Torch
Nach 72 Partien:
43,5 vs 28,5

Torch ist im Moment sehr weit entfernt von Stockfish.
Die meisten Menschen werden Torch zwangsläufig in SchachGUIs verwenden wollen, sobald diese Engine interessant genug ist.
Parent - By Max Siegfried Date 2023-07-17 14:20
Max Siegfried schrieb:

Stockfish vs Torch
Nach 72 Partien:
43,5 vs 28,5

Torch ist im Moment sehr weit entfernt von Stockfish.
Die meisten Menschen werden Torch zwangsläufig in SchachGUIs verwenden wollen, sobald diese Engine interessant genug ist.


Nach 107 Partien:
64 vs 43

Die Remisquote wird deutlich ansteigen sobald Torch stärker ist und 8-Steiner vorhanden sein werden.
Parent - - By Benno Hartwig Date 2023-07-17 10:41
Wie ich es verstehe, ist die Torch-Entwicklung auch noch recht weit am Anfang.
Welche Ziele mit der Engine dann wirklich erreicht werden, wird sich noch zeigen. Und dies wird dann auch zeigen "müssen" in Events, die hinsichtlich Transparenz und statistischer Aussagekraft die Szene überzeugen.

Aber auch auf dem Wege dorthin sind natürlich alle "Wasserstandsmeldungen" hochwillkommen.
Wie überzeugend der Einzelne das dann findet, kann er ja selbst entscheiden.
Parent - - By Max Siegfried Date 2023-07-17 14:26
Die Engines haben 250 Kerne zur Verfügung und 16 GB RAM.

Gibt es weitere Informationen zur Torch Engine?
Version master-20230715-6f304af
Wie lange arbeitet man schon daran?
Werden NNUE Netze verwendet?
Wie läuft das Training ab?
Parent - - By Max Siegfried Date 2023-07-18 23:19
Stockfish vs Torch
266 vs 153

[+113]
Parent - - By dkappe Date 2023-07-19 04:03
Torch nur -99 elo gegen SF, und das für eine Engine die noch nicht drei Monate alt ist.
Parent - - By Reinhold Stibi Date 2023-07-19 08:12
Es dürfte für Torch sehr schwer sein über seine jetzige Grundstärke wesentlich
besser zu werden.
Ich finde den Abstand zu Stockfish  aufgrund der Spieleergebnisse doch sehr hoch.

Glaube nicht dass diese Engine zu Stockfish gleichziehen oder sogar übertreffen wird.

Das sind alles Vermutungen. Abwarten heißt die Devise.
Parent - By Max Siegfried Date 2023-07-19 08:37
Wie wäre ein Test gegen Stockfish 13, 14?
Parent - - By Benno Hartwig Date 2023-07-19 14:19 Edited 2023-07-19 14:27

> Das sind alles Vermutungen. Abwarten heißt die Devise.


Das stimmt.
Nach dem Verkünden der hochgesteckten Ziele lugt mancher natürlich auch mit Neugier und erwartungsfroh nach allem, was es an ersten Ergebnissen gibt.
Und vielleicht sollten sich die Entwickler mit diesen noch zurückhalten, wenn die Engine tatsächlich doch erst in der Frühphase der Entwicklung steckt.
Parent - - By Andreas Mader Date 2023-07-19 15:35 Upvotes 1
Ich finde es ja witzig, dass vor Kurzem hier noch mehrheitlich die Meinung vorgeherrscht hat, dass der Plafond der Schachengines mittlerweile erreicht ist und große Verbesserungen nicht mehr möglich wären.

Jetzt auf einmal ist es in Greifweite, dass Stockfish von einer vollkommen neuen Engine in absehbarer Zeit überholt wird.

Experten halt.

Parent - By Martin Steinwandter Date 2023-07-19 16:20
Andreas Mader schrieb:

Jetzt auf einmal ist es in Greifweite, dass Stockfish von einer vollkommen neuen Engine in absehbarer Zeit überholt wird.



Das wird eine Weile dauern, und Stockfisch entwickelt sich auch weiter.
Außerdem wurde am Anfang mit Meldungen wie stärker als Komodo geprahlt. Was heißt das schon? Und dann mit BZ von 1+1.
Könnte mir vorstellen, dass Dragon mit mittlerer BZ oder im Vergleich mit mehreren  Engines wieder stärker als Torch ist.
Die Ranglisten werden es zeigen.
Für mich wird  kein  Kommerzieller sich  gegen das Stockfisch Framework je behaupten können.
Parent - - By Thomas Zipproth Date 2023-07-19 20:22
Ich glaube man muss deutlich unterscheiden zwischen Stellungen die sich bei Engines aus der Grundstellung heraus entwickeln können,
und sehr unbalancierten Eröffnungen wie die UHO Stellungen von Stefan Pohl.

Während bei den UHO Eröffnungen durchaus noch viel Potential vorhanden ist, kann ich mir tatsächlich nicht vorstellen,
das es eine Engine geben könnte die Stockfish aus der Grundstellung heraus einfach überspielt.

Deswegen auch mein Experiment mit der "unschlagbaren" SF/Cerebellum Kombination.
Auch wenn es schief geht wird es interessant
Parent - - By Olaf Jenkner Date 2023-07-19 20:51
Wenn die Programme stärker werden und die UHO-Stellungen nur noch 1:1 ergeben, wird Stefan sich nicht lumpen lassen und eine neue Serie zusammenstellen.
In einem anderen Thread wurde die Amar- Eröffnung heißt (1.Sh3 d5 vorgegeben) genannt, die etwas ausgeglichener, aber vielleicht doch für Schwarz gewonnen ist.
Es bleibt also spannend und Spielstärkeunterschiede lassen sich noch eine zeitlang messen.
Parent - By Peter Martan Date 2023-07-19 21:35 Edited 2023-07-19 22:15
Naja, Olaf, Spielstärkeunterschiede lassen sich noch beliebig lange messen, sie sind nur immer weniger aus verschiedenen Matches (oder Stellungstests) untereinander vergleichbar, das ist jetzt schon (länger) so und das wird nicht mehr besser, weil entweder sind Stellungen zu unausgeglichen und geben bei entsprechend hoher Spielstärke und Hardware- Zeit dann nur mehr 1:1- Paare, oder sie sind zu ausgeglichen, dann geben sie wieder nur mehr Remis.

Und natürlich könnte man statt nur von (mehr oder weniger frühen) Eröffnungsstellungen auch von Mittel- und Endspielstellungen aus spielen lassen, aber alle diese Thementurniere geben halt nur Themenelo her. "Overall playing strength" war immer schon ein frommer Wunsch (eine Elosion), die gibt's ja bei Menschen auch und erst recht nicht, da haben auch Alle ihr Eröffnungsrepertoire, ihre Lieblingsgegner und ihre Angstgegner, und bei Engines wird's halt jetzt dann auch mehr und mehr solche geben, die mit bestimmten Eröffnungen (vielleicht auch den zugehörigen Büchern und oder zugehörigen Spezial- Netzen) die Nase vorn haben bei bestimmten Turnieren, und andere Engines (oder Settings, die Unterschiede zwischen dem, was hard coded ist, werden ja auch immer kleiner, je mehr sich bestimmte Algorithmen durchsetzen, die Eval z.B. wird bei SF gar nicht mehr codiert, was für Daten fürs Netztraining herangezogen werden, macht noch einen gewissen Unterschied, aber je mehr da Hardware- Zeit hineingesteckt wird, desto ähnlicher werden einander die Ergebnisse halt vermutlich auch da werden) für andere Turniere mit anderen Gegnern, anderen Eröffnungen, anderer Hardware- TC.

Wenn solche wie Torch dann auch nicht mehr allgemein zugänglich sind, kann man mit denen sowas ja dann erst recht gut bedienen von bestimmten Spielservern aus, ob das Publikumsinteresse das alles noch beliebig finanzieren wird, das ist die Frage.
Übrigens, weil du die TCEC- Eröffnung erwähnt hast, in dem Match dort, aus dem sie stammt, RubiChess- Igel steht mittlerweile 10:10, nur so als Beispiel
Parent - By Stefan Pohl Date 2023-07-20 07:23 Edited 2023-07-20 07:55
Olaf Jenkner schrieb:

Wenn die Programme stärker werden und die UHO-Stellungen nur noch 1:1 ergeben, wird Stefan sich nicht lumpen lassen und eine neue Serie zusammenstellen.
In einem anderen Thread wurde die Amar- Eröffnung heißt (1.Sh3 d5 vorgegeben) genannt, die etwas ausgeglichener, aber vielleicht doch für Schwarz gewonnen ist.
Es bleibt also spannend und Spielstärkeunterschiede lassen sich noch eine zeitlang messen.


Wenn die Megabase 2024 im Herbst erscheint, beginne ich mit der Erstellung neuer UHO-Eröffnungen. Über den Winter läuft dann die Evaluierung der Endstellungen der Eröffnungslinien. Es wird dann irgendwann im Frühjahr 2024 neue UHO Eröffnungssets geben. Aber nicht, weil eine Erneuerung wirklich nötig wäre. In meinen UHO-Downloads gibt es ja UHO-Eröffnungssets mit ansteigendem Vorteil (höherer Eval) für Weiß.

Hier als Beispiel die Größe der jeweiligen Eröffnungs-Sets aus meinem aktuellen UHO 2022 Download:

Eval [+1.10;+1.19] 6mvs: 3317 lines  8mvs: 8940 lines  8mvs_big: 27074 lines
Eval [+1.20;+1.29] 6mvs: 2608 lines  8mvs: 7296 lines  8mvs_big: 22336 lines
Eval [+1.30;+1.39] 6mvs: 2214 lines  8mvs: 6100 lines  8mvs_big: 18252 lines
Eval [+1.40;+1.49] 6mvs: 1777 lines  8mvs: 4856 lines  8mvs_big: 15048 lines
Eval [+1.50;+1.59] 6mvs: 1440 lines  8mvs: 4092 lines  8mvs_big: 12130 lines
Eval [+1.60;+1.69] 6mvs: 1098 lines  8mvs: 3182 lines  8mvs_big: 9831 lines
Eval [+1.70;+1.79] 6mvs: 823  lines  8mvs: 2557 lines  8mvs_big: 7787 lines
Eval [+1.80;+1.89] 6mvs: 614  lines  8mvs: 2048 lines  8mvs_big: 6192 lines

https://www.sp-cc.de/uho_2022.htm

Wie man sieht, gibt es insgesamt 8 "Stufen" von UHO-Eröffnungen mit immer weiter ansteigendem Vorteil für Weiß. Das ist ja gerade das Tolle an den UHO-Eröffnungen: Man kann die Remisquote gezielt steuern, indem man de UHO-Stufe einfach wechselt.
Sinnvoll sind Remisquoten zwischen 45% und 60% (ideal sind Remisquoten möglichst nahe an der 50%-Marke). Ist die Remisquote niedriger als 45%, dann hat man zu viele 1:1 Paare in den Ergebnissen, was bedeutet, die gewählte UHO-Stufe ist unter den gewählten Spielbedingungen (Engines, Hardwaregeschwindigkeit, Bedenkzeit) zu hoch. Dann nimmt man einfach eine niedrigere Stufe.
Ist die Remisquote über 60%, dann ist die gewählte UHO-Stufe zu niedrig und man geht einfach eine oder zwei Stufen hoch. Eine Stufe hochzuschalten senkt die Remisquoten um circa 7%-10% (aber das muß man mit den eigenen Testsetups natürlich ausprobieren, diese Werte sind nur Schätzungen)

Somit sind meine UHO-Eröffnungen absolut zukunftssicher. Generell ist es ja so, daß Remisquoten mit stärkeren Engines und/oder schnellerer Hardware tendenziell eher steigen (und 1:1 Paare eher weniger werden). Das ist auch bei UHO-Eröffnungen der Fall, allerdings steigen dort die Remisquoten weit langsamer an, als bei ausbalancierten Eröffnungen. Aber einen Anstieg der Remisquote gibt es auch mit UHO, wenn tiefer gerechnet wird oder die Engines stärker sind. Aber das kann man dann jederzeit ausgleichen, indem man einfach eine höhere UHO-Stufe nimmt.

Ich z.B. benutze für meine UHO-Top10 Rangliste und auch für meine Lc0-Testruns gegen Stockfish 15.1 die 2.UHO Stufe, also Eval [+1.20;+1.29], weil unter meinen Testbedingungen so Remisquoten von knapp 50% entstehen, und das ist einfach ideal:

UHO-Top10-Rangliste:
Games        : 55000 (finished)
White Wins   : 26622 (48.4 %)
Black Wins   : 1611 (2.9 %)
Draws        : 26767 (48.7 %)

NN-Tests, Lc0 vs. SF 15.1:
Games        : 12000 (finished)
White Wins   : 6048 (50.4 %)
Black Wins   : 53 (0.4 %)
Draws        : 5899 (49.2 %)

PS: Daß die Eval-Intervalle so relativ hoch sind (schon die unterste UHO-Stufe ist ja Eval [+1.10;+1.19]) liegt nur daran, daß ich für die Evaluierung KomodoDragon 2.6 benutzt habe, und diese Komodo-Version hat einfach recht hohe Evals. Heutige Stockfishe (und auch neuere Komodos) bewerten längst nicht mehr so extrem. Hier sind die Bewertungen mindestens 0.20 niedriger.
Wenn UHO 2024 erscheint, werden also die UHO-Stufen Evals vermutlich auch wieder niedriger sein. Im Vorgänger von UHO 2022, den alten UHO V3 Eröffnungen, habe ich noch KomodoDragon 1.0 benutzt und dort waren die UHO-Stufen 0.20 Eval-Punkte niedriger (bei etwa gleicher Remisquote), einen Vergleichstest von UHO 2022 und UHO V3 habe ich auf meiner Seite auch dabei, dort kann man das gut sehen:

Hier die beiden Testruns, altes UHO V3 und neues UHO 2022 (praktisch identisches Ergebnis, obwohl die Evals eben beim neuen UHO 2022 um +0.20 höher sind):
UHO_V3_8mvs_+090_+099:      1000 (+332,=580,-88),  Score: 62.2%, Elo: +87, Draws: 58.0%
UHO_2022_8mvs_+110_+119:     1000 (+340,=575,-85), Score: 62.8%, Elo: +91, Draws: 57.5%
Parent - By Andreas Mader Date 2023-07-20 11:50
Olaf Jenkner schrieb:

Wenn die Programme stärker werden und die UHO-Stellungen nur noch 1:1 ergeben, wird Stefan sich nicht lumpen lassen und eine neue Serie zusammenstellen.
In einem anderen Thread wurde die Amar- Eröffnung heißt (1.Sh3 d5 vorgegeben) genannt, die etwas ausgeglichener, aber vielleicht doch für Schwarz gewonnen ist.
Es bleibt also spannend und Spielstärkeunterschiede lassen sich noch eine zeitlang messen.


1. Sh3 d5 war eine der Eröffnungen, die vor Kurzem beim Marathon-Kampf zwischen Igel und RubiChess auf TCEC gespielt wurde. Beide Partien endeten Remis, nachdem über lange Zeit ein relativ großer Vorteil für Schwarz angezeigt wurde - wobei die Kibitze LC0 und Stockfish immer um einiges weniger enthusiastisch waren als die spielenden Engines selbst.
Parent - - By Olaf Jenkner Date 2023-07-19 20:55 Upvotes 1
Andreas Mader schrieb:
Experten halt.
Hier wimmelt es von solchen und ein guter Teil weiß ganz genau, wie sich
die Spielstärke bestimmter Programme in den nächsten Jahren entwickeln wird.
Parent - - By Thomas Plaschke Date 2023-07-19 22:45
Ja, das können wir, wir Experten! Dafür schätzt man uns. Keine Gabe und immer ein Fluch.   - Wenn wir auch Schwierigkeiten damit haben, die Lotto-Zahlen des letzten Wochenendes oder die Seite, mit der der Frühstückstoast auf den Fußboden fällt, vorherzusagen.

Viele Grüße
Th. Plaschke
Parent - - By Benno Hartwig Date 2023-07-19 23:26 Edited 2023-07-19 23:29

> Wenn wir auch Schwierigkeiten damit haben, die Lotto-Zahlen des letzten Wochenendes [...] vorherzusagen.


Oh, gerade die Zahlen des letzten  Wochenendes kriegen wir vielleicht ja doch hin.
Parent - - By Olaf Jenkner Date 2023-07-20 00:05
Vermeide die Zahlendreher!
Parent - - By Thorsten Czub Date 2023-07-20 00:25
Lotto ? Da warte ich lieber vom Blitz getroffen zu werden weil das wahrscheinlicher ist.
Parent - By Peter Martan Date 2023-07-20 00:34 Upvotes 3
Dafür deutlich unangenehmer.
Parent - - By Benno Hartwig Date 2023-07-20 11:54

> Lotto ? Da warte ich lieber vom Blitz getroffen zu werden weil das wahrscheinlicher ist.


Man kauft sich das Gefühl, dass man (mit viel Glück eben) schon am kommenden Wochenende Millionär sein kann.
Parent - - By Thorsten Czub Date 2023-07-20 12:50
Alles leute mit schlechtem Mathe Unterricht
Parent - By Benno Hartwig Date 2023-07-20 12:57
Es ist hier nicht die Frage "Wie groß ist die Wahrscheinlichkeit"
sondern das Bewusstsein "Es besteht die sehr konkret bezifferbare Chance", die man dann entweder hat oder eben auch nicht.
Parent - - By Andreas Mader Date 2023-07-20 16:42
Thorsten Czub schrieb:

Alles leute mit schlechtem Mathe Unterricht


Leute mit "gutem Mathe-Unterricht" wissen, dass man diese beiden Dinge nicht vergleichen kann, weil man sich die Wahrscheinlichkeit für einen Haupttreffer im Lotto exakt ausrechnen kann, während die Wahrscheinlichkeit vom Blitz getroffen zu werden von derartig vielen verschiedenen Faktoren abhängig ist, dass es unmöglich ist, die für eine bestimmte konkrete Person zu ermitteln.
Parent - - By Rainer Neuhäusler Date 2023-07-28 20:57 Edited 2023-07-28 21:01
Andreas Mader schrieb:

Thorsten Czub schrieb:

Alles leute mit schlechtem Mathe Unterricht

Leute mit "gutem Mathe-Unterricht" wissen, dass man diese beiden Dinge nicht vergleichen kann, weil man sich die Wahrscheinlichkeit für einen Haupttreffer im Lotto exakt ausrechnen kann, während die Wahrscheinlichkeit vom Blitz getroffen zu werden von derartig vielen verschiedenen Faktoren abhängig ist, dass es unmöglich ist, die für eine bestimmte konkrete Person zu ermitteln.

Bevölkerungsstatistisch gesehen ist es viel wahrscheinlicher vom Blitz getroffen zu werden als 6 aus 49 richtig zu tippen. Dazu gibt es im Internet jede Menge Info. Wohnt jemand noch dazu in Starnberg am gleichnamigen See, dann schleunigst wegziehen, das ist nämlich die Blitzhauptstadt Deutschlands. Am besten hinauf nach Solingen oder Bremen, Gegenden, die mit Blitzgewittern völlig unterversorgt sind. So steht es im Siemens Blitzatlas. https://www.chip.de/downloads/Blitzatlas_145320618.html

Wie schon Karl Valentin besang, dürfte im Mittelalter allein schon wegen des hohen Eisenanteils in der Männerbekleidung, ein sehr hohes Blitz(er)schlagrisiko bestanden haben: https://www.youtube.com/watch?v=EPNeFQOmIpc

So ein alter Rittersmann
Hatte sehr viel Eisen an,
Die meisten Ritter, muß ich sag'n,
Hat deshalb der Blitz erschlag'n


Individuell gesehen ist natürlich der Umgang mit den Wetterrisiken Thorstens ureigenste Angelegenheit.  Bleibt er zu Hause und tüftelt Wettkämpfe gegen CSTal aus oder aber auch als Raumschiffpassagier der Orion geht das Risiko gegen Null. Geht er hingegen bei heftigem Blitzgewitter im Starnberger See schwimmen, dann steigt das Risiko sprunghaft an und pendelt vielleicht sogar in Richttung Jackpotwahrscheinlichkeit, die sich, wie jeder weiß, nach dem Binomialkoeffizienten „n über k“ = "6 über 49" = 1 : 14 000000  berechnet.
https://www.schlauerlernen.de/binomialkoeffizient-rechner/
.
Parent - - By Thorsten Czub Date 2023-07-28 21:05
Meist sitze ich zuhause , maximal auf dem Balkon wenn ich Schachcomputer oder Computerschach mache.

Was soll ich an einem See oder im freien wo kaum Strom ist ?!
Parent - By Thomas Müller Date 2023-07-28 21:57
Powerstation mit Solarpanel mit nehmen?!
Parent - - By Jörg Oster Date 2023-07-19 11:59 Upvotes 5
So ist es!

Der allgemeine Grundton hier ist ja fast nicht mehr zu ertragen!
Als wenn jeder einzelne hier schon mal eine Engine von Grund auf neu geschrieben hätte,
und die dazu noch sofort Stockfish-Spielstärke erreicht hat.
Es ist ja nichts leichter als das!

Stockfish hat eine mehr als 10-jährige Entwicklungszeit hinter sich.
(Genau genommen werden es im November sogar schon 15 Jahre sein!)

So gesehen ist der Entwicklungsstand von Torch nach gerade mal ca. 3 - 4 Monaten mehr als bemerkenswert!

Und ich hoffe sehr, dass Torch in der Lage sein wird, Stockfish spielstärkemäßig hinter sich zu lassen.
Erstens, weil Konkurrenz belebt das Geschäft!
Und zweitens, weil ein paar der sog. Entwickler beim Stockfish-Projekt sind dermaßen von sich überzeugt, um nicht zu sagen arrogant,
und behandeln manchmal Personen, die vielleicht mal anderer Meinung als sie selbst sind, ohne jeglichen Respekt!

Nicht immer, aber ich war schon Zeuge von vielen derartigen Vorfällen auf discord,
und sowas muss auch mal öffentlich gesagt werden!
Und die brauchen mal einen gehörigen Dämpfer ... 
Parent - By Thorsten Czub Date 2023-07-19 13:41
Wird sicherlich bald passieren wenn Gott dann plötzlich doch nicht unfehlbar ist.
Parent - - By Benno Hartwig Date 2023-07-19 14:25

> Und ich hoffe sehr, dass Torch in der Lage sein wird, Stockfish spielstärkemäßig hinter sich zu lassen.
> Erstens, weil Konkurrenz belebt das Geschäft!


Stimmt.
Und ich finde eine Situation auch durchaus gesund, in der die Spitze vielleicht von einer kommerziellen Engine erreicht wird, die freie Engine aber dicht und fordernd und drängend dahinter.
Dies könnte dann eben auch eine kommerzielle Motivation beflügeln, das Computerschach voranzutreiben. "Vielleicht kann man damit ja doch Geld verdienen!"

Unabhängig davon, ob solch eine Engine tatsächlich nötig ist, haben viele Computerschach-Interessierte vielleicht eben doch Lust, auf jeden Fall auch die allerstärkste Engine auf ihrem Rechner zu haben.
Parent - - By Reinhold Stibi Date 2023-07-20 14:16
Träume sind süß.

Torch wird sicherlich "das Rad nicht neu erfinden" sondern wird hauptsächlich auf das Bisherige aufbauen.

Deshalb denke ich dass Torch nicht an Stockfish heranreichen wird.

Für 50 Elo mehr hat Stockfish ca. 3 Jahre gebraucht und so wird es Torch nicht anders ergehen.

Da wird Stillstand, vergleichbar mit Lc0, kommen wo die Weisen nicht mehr weiterwissen und vielleicht die
Lust an der Weiterentwicklung verlieren.

Stockfish ist doch inzwischen weit übermenschlich.
Parent - - By dkappe Date 2023-07-20 14:30 Upvotes 3
Reinhold Stibi schrieb:

Träume sind süß.

Torch wird sicherlich "das Rad nicht neu erfinden" sondern wird hauptsächlich auf das Bisherige aufbauen.

Deshalb denke ich dass Torch nicht an Stockfish heranreichen wird.

Für 50 Elo mehr hat Stockfish ca. 3 Jahre gebraucht und so wird es Torch nicht anders ergehen.

Da wird Stillstand, vergleichbar mit Lc0, kommen wo die Weisen nicht mehr weiterwissen und vielleicht die
Lust an der Weiterentwicklung verlieren.

Stockfish ist doch inzwischen weit übermenschlich.


Schau noch mal die Engines an und die Entwickler. Die haben schon bei ihren eigenen Engines — Ethereal, Berserk, Koivisto, Dragon — eine Menge gutes neu erfunden. Ich selbst habe schon mit Finn, Jay und Andrew einen recht guten Ideen Austausch über NNUE gehabt. Das wird schon was.
Parent - By Reinhold Stibi Date 2023-07-20 16:00
Die Frage ist auch, welcher Etat steht zur Verfügung und gibt es genug ehrenamtliche Helfer die das Projekt
unterstützen.
Die Entwicklung von Stockfish, Lc0, Dragon und Andere sind mit wahnsinnig viel Fleiß und Testerei verbunden.

Eine Einzelperson kann das nicht mehr leisten; dazu braucht man ein Team.

Bewunderswert ist aber auch die Leistung von Einzelpersonen die Stockfish, in Teilbereichen wie die Taktik,
noch verbessern können. Man denke da nur ein ShashChess
Parent - By Thorsten Czub Date 2023-07-28 22:18
Also sei es so.
- - By Peter Martan Date 2023-07-21 12:28 Edited 2023-07-21 12:35

    Program                            Score     %    Av.Op.  Elo    +   -    Draws

  1 Stockfish                      : 640.0/1000  64.0   3450   3550   13  13   61.0 %
  2 Torch                          : 360.0/1000  36.0   3550   3450   13  13   61.0 %

Und den Kern des modernen Elo- Dilemmas sieht man z.B. auch daran recht gut, dass, obwohl dort nur 3. von 6, Mystery unter dem damaligen Namen weniger Elo- Abstand zu SF hatte (81)

https://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=164792#pid164792

als jetzt Torch im head to head- Match (100).
Mag ja sein, weil sich Torch gegen schwächere Engines besser schlägt als gegen SF allein, (und besser als sich SF gegen schwächere Engines relativ zum direkten Vergleich mit Torch schlägt) mag auch an der unterschiedlichen Partie- Anzahl liegen, aber alle diese Dinge machen das Testen ja gerade so spannend heutzutage, jedes neue Match ein neues Ergebnis, das ganz für sich allein steht.
Oder wie man früher schon gern so treffend sagte, wer misst, misst Mist
Parent - - By Stefan Pohl Date 2023-07-21 13:50
Peter Martan schrieb:

Code:

    Program                            Score     %    Av.Op.  Elo    +   -    Draws

  1 Stockfish                      : 640.0/1000  64.0   3450   3550   13  13   61.0 %
  2 Torch                          : 360.0/1000  36.0   3550   3450   13  13   61.0 %




Gamepair Auswertung:

Code:

   # PLAYER       :  RATING  ERROR  PLAYED    W    D    L   (%)  CFS(%)
   1 Stockfish    :       0   ----     500  284  212    4  78.0     100
   2 Torch        :    -222     27     500    4  212  284  22.0     ---


Noch ein weiter Weg für Torch. Nur 4 Gamepairs von 500 gewonnen. Stockfish dagegen 284 von 500 Gamepairs gewonnen...
Parent - - By Peter Martan Date 2023-07-21 14:01 Edited 2023-07-21 14:10
Danke. 1:1- Paare können's dann ja auch höchstens 4 gewesen sein, erstaunlich.

Eröffnungen müssen wohl wie im übrigen Bullet die hier gewesen sein:

Zitat:
Openings will be selected randomly from Stefan Pohl's UHO_2022_8mvs_+110_+119
Parent - - By Stefan Pohl Date 2023-07-21 14:09
Peter Martan schrieb:

Danke. Hast du auch die 1:1- Paare zählen lassen? Während die Editierzeit weiter läuft, überlege ich noch, ob man sich die aus den Zahlen, die du angegeben hast, schon leicht selbst ausrechnen kann, wären's vielleicht gar nur 4?

Eröffnungen müssen wohl wie im übrigen Bullet die hier gewesen sein:

Zitat:
Openings will be selected randomly from Stefan Pohl's UHO_2022_8mvs_+110_+119



Nein. 4 waren es aber sicher nicht, da ein 1:1 Paar in der Gamepair-Auswertung logischerweise ein Remis ist.

Aber bei einer Remisquote von 61% aus den 1000 Partien, kann es nicht viele 1:1 Paare gegeben haben.
Parent - - By Peter Martan Date 2023-07-21 14:10 Edited 2023-07-21 14:41
Bin noch während der Editierzeit selbst draufgekommen, aber danke neuerlich

Bevor mir da jetzt auch dieselbe (Editierzeit) abläuft, mal die händische Auszählung der ersten 200:
23-24
41-42
45-46
87-88
93-94
113-114
133-134
137-138
157-158
165-166
175-175
193-194
197-198
, das wären 13.
Wenn ich bis 1000 noch in der Editierzeit fertig werde, reiche ich's nach.

Edit: 47 insgesamt, gezählt wär ja schneller gewesen (ich kann welche übersehen haben, weniger sind's hingegen sicher nicht), aber ich wollte die Nummern der Paare auch gleich weiter notieren, falls sich jemand die Mühe beim nächsten Suchen ersparen will, kann ich sie auf Anfrage auch noch posten.
Parent - By Stefan Pohl Date 2023-07-21 14:14
Peter Martan schrieb:

Bin noch während der Editierzeit selbst draufgekommen, aber danke neuerlich



Ich muß mal darüber nachdenken, ob ich mein Gamepair Rescoring Tool noch so erweitere, daß 1:1 Paare irgendwie separat ausgewiesen werden. Weiß nur noch nicht, wie ich das vernünftig in den Output integrieren kann.

https://www.sp-cc.de/files/gamepairs_rescoring_tool.7z
Parent - - By Stefan Pohl Date 2023-07-21 14:50
Peter Martan schrieb:

Bin noch während der Editierzeit selbst draufgekommen, aber danke neuerlich

Bevor mir da jetzt auch dieselbe (Editierzeit) abläuft, mal die händische Auszählung der ersten 200:
23-24
41-42
45-46
87-88
93-94
113-114
133-134
137-138
157-158
165-166
175-175
193-194
197-198
, das wären 13.
Wenn ich bis 1000 noch in der Editierzeit fertig werde, reiche ich's nach.

Edit: 47 insgesamt, gezählt wär ja schneller gewesen (ich kann welche übersehen haben, weniger sind's hingegen sicher nicht), aber ich wollte die Nummern der Paare auch gleich weiter notieren, falls sich jemand die Mühe beim nächsten Suchen ersparen will, kann ich sie auf Anfrage auch noch posten.


Da muß ein Fehler sein. Ich habemein Tool jetzt erweitert und das kam raus:
*******************************************************************
*** Number of drawn Gamepairs overall: 212
*** Number of 1:1 drawn Gamepairs    : 51
*** Number of 2-draws drawn Gamepairs: 161
*******************************************************************

Wie erwartet, sehr wenige 1:1 Paare. Nur 51 von 500 Gamepairs. Da kann man nun wirklich nicht meckern.
Parent - - By Peter Martan Date 2023-07-21 15:01 Edited 2023-07-21 15:11
Einfach 4 übersehen beim Durchschauen vermutlich, super- Tool, danke!
Und natürlich gleich wieder Edit, edit: beim ersten Ausprobieren dessen, was im Link weiter oben zum Runterladen ist, die 1:1- Paare noch nicht gesehen, ist der Link schon zur jüngsten Version des Tools?
Parent - - By Stefan Pohl Date 2023-07-21 15:03
Peter Martan schrieb:

Einfach 4 übersehen beim Durchschauen vermutlich, super- Tool, danke!


Die neue Version wird in wenigen Minuten herunterzuladen sein...
Up Topic Hauptforen / CSS-Forum / Mystery
1 2 Previous Next  

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill