Excel-Spezialisten, Hilfe benötigt

By Klaus Wlotzka Date 2022-05-05 18:38

Wilhelm Hudetz schrieb:

Hallo,
ich überarbeite gerade meine Testsuite Seite und die Testsuite selbst. Ich möchte eine Spalte mit einem Elowert hinzufügen komme aber mit der Formel nicht klar.
Zum Beispiel:
Ergebnis 900 sollte Elo 3500 ergeben
Ergebnis 373 sollte Elo 2550 ergeben

dazwischen dementsprechende Elozahl. Ist das möglich?

Danke schon mal im Voraus.

Hallo Wilhelm,

das schaue ich mir gleich mal an und melde mich dann.

Grüße

Klaus

By Klaus Wlotzka Date 2022-05-05 18:56 Upvotes 2

Wilhelm Hudetz schrieb:

Hallo,
ich überarbeite gerade meine Testsuite Seite und die Testsuite selbst. Ich möchte eine Spalte mit einem Elowert hinzufügen komme aber mit der Formel nicht klar.
Zum Beispiel:
Ergebnis 900 sollte Elo 3500 ergeben
Ergebnis 373 sollte Elo 2550 ergeben

dazwischen dementsprechende Elozahl. Ist das möglich?

Danke schon mal im Voraus.

Hallo Wilhelm,

anbei die Formel für Deinen Anwendungsfall

Falls Du die Exceldatei benötigst, kann ich Dir diese gerne per Mail zusenden.

Grüße

Klaus

By Wilhelm Hudetz Date 2022-05-05 21:17 Upvotes 1

Hallo Klaus, Du bist ein Genius !

Werde das gleich mal Testen. Melde mich gleich wieder.

DANKE !

Grüße
Wilhelm

By Wilhelm Hudetz Date 2022-05-05 21:40 Edited 2022-05-05 21:47

Funktioniert super

Sieht doch so einfach aus, aber ich wär da nie draufgekommen

Vielen Dank nochmal!

Grüße
Wilhelm

PS: apropo einfach: mußte gerade voll Lachen über mich, je länger ich die Formel anschaue umso größer wird der Knopf in meinen Windungen

By Klaus Wlotzka Date 2022-05-05 22:00 Edited 2022-05-05 22:20

Hallo Wilhelm,

kein Problem, habe ich gerne gemacht.

Mit Excel halte ich meine schon betagten Gehirnwindungen auf Touren. Wer rastet, der rostet - gilt auch oder insbesondere für den Denkapparat.

Viele Grüße

Klaus

By Kurt Utzinger Date 2022-05-06 08:12

Klaus Wlotzka schrieb:

Hallo Wilhelm,

kein Problem, habe ich gerne gemacht.

Mit Excel halte ich meine schon betagten Gehirnwindungen auf Touren. Wer rastet, der rostet - gilt auch oder insbesondere für den Denkapparat.

Viele Grüße

Klaus

Hallo Klaus
Ich kenne niemanden, der Excel so beherrscht wie Du. Bevor ich deine Tabellen gesehen habe, war mir
gar nicht bewusst, was mit diesem Programm so alles machbar ist. Weiter so ...
Gruss
Kurt

By Klaus Wlotzka Date 2022-05-06 12:46

Kurt Utzinger schrieb:

Hallo Klaus
Ich kenne niemanden, der Excel so beherrscht wie Du. Bevor ich deine Tabellen gesehen habe, war mir
gar nicht bewusst, was mit diesem Programm so alles machbar ist. Weiter so ...
Gruss
Kurt

Hallo Kurt,

vielen Dank für die Blumen.

Auch wenn ich schon einiges mit Excel mache, so gibt es aufgrund der immensen Komplexität und Funktionsumfangs des Programms noch immens viele Excelthemen, die ich noch nie angewendet habe.

Für Excel gilt im Besonderen: „Viele Wege führen nach Rom“

Und hier unterscheiden sich talentierte Anwender wie mich von den wirklichen Spezialisten. Ich habe schon Funktionsabwendungen gesehen, welche mit nur einer komplexen, mir nicht geläufigen Formel zum Ziel führt und bei mir nur mit zusätzlichen Zwischenschritten über Hilfstabellen funktionierten. Das Ergebnis ist letztlich das Gleiche, nur das Programm bleibt bei der kurzen Lösung wesentlich schlanker. Das ist gerade bei großen Tabellen sehr von Bedeutung. Ich habe gerade deswegen schon komplexe Programme komplett neu aufgebaut, um wesentlich schlanker zu werden.

Viele Grüße

Klaus

By Chess Player Date 2022-05-06 08:10

Guten Morgen zusammen, ich glaube es geht nicht so einfach da die Elo Kurve nur etwa im Bereich von +/- 150 annähernd linear verläuft. Das ist hier nicht gegeben. Und auch das ist, da die Elo Werte teils 6-stellig ausgegeben werden nicht so möglich.

By Wilhelm Hudetz Date 2022-05-06 08:56

Für das was ich es verwende ist es völlig ausreichend. Es geht ja nur um einen Wert der erwartet werden kann und nicht um einen Absoluten der mit einer Testsuite sowieso nicht festgestellt werden kann.

By Ingo Althöfer Date 2022-05-06 12:52

Hallo Herr Hudetz,

Wilhelm Hudetz schrieb:

Für das was ich es verwende ist es völlig ausreichend.
Es geht ja nur um einen Wert der erwartet werden kann ...

die Bedenken von Chess Player teile ich voll und ganz.
Ihr Vorschlag, Ergebnisse aus einer Testserie linear in ELO-Ratings
umzurechnen, macht keinen Sinn.

Bleiben Sie doch einfach bei Ihren Daten und schreiben:
Im Hudetz-Test erreicht Programm A 236 Punkte, Programm B 291
Punkte usw.
Dann weiß jeder Leser, was los ist.

Ingo Althöfer.

By Peter Martan Date 2022-05-06 14:00 Edited 2022-05-06 14:45

Hallo Wilhelm!

Schon mal an EloStatTS (Test Suite) von Frank Schubert gedacht?

Rechnet nicht Punkte in Elo um, sondern wertet jede einzelne Stellung als Minimatch zwischen je zwei einzelnen von allen verglichenen Engines anhand der Lösungszeiten
Stellung für Stellung und Engine für Engine.

Ein paar Links, die dazu von Interesse sind:

https://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=147781#pid147781

https://glarean-magazin.ch/2017/03/05/computerschach-testaufgaben-engines-eigenmann-rapid-engine-test-eret/

Insbesondere die Lektüre der .pdf- Beschreibung des Programms vom Autor sagt dir am besten, was genau es macht und kann:

https://glarean-magazin.ch/wp-content/uploads/2017/03/L%C3%B6sung-eines-alten-Problems-Frank-Schubert-1.pdf

Und der Download- Link:

https://glarean-magazin.ch/wp-content/uploads/2017/03/ELOStatTS-104-1.7z

Leider funktioniert's nur mit Fritz- Auswertung im .cbh- Format, das man dann noch in .pgn umwandeln muss, aber dann lässt man das Programm einfach über die Ergebnis- .pgn laufen, so wie EloStat vom selben Autor zur Auswertung einer anderen Match- .pgn.

Es hat schon seinen Lernbedarf, aber wenn's mal läuft, hast du schön tabellarisch geordnete Listen von Engines, die zur Hardware- TC und den Stellungen passen, die dich interessieren und die du ständig aktualisieren und ausbauen kannst. Mit jedem neuen Engine- Run werden die Elo- Werte aller schon Gelisteten neu berechnet.
Von den Testergebnissen, die ich auf die Art immer poste, wirst du schon welche gesehen haben, zuletzt wieder im Thread über Blue Marlin.
Ich persönlich möchte dieses Programm nicht mehr missen.

By Wilhelm Hudetz Date 2022-05-06 16:23

Hallo Peter,
mit fritz die 1100 Stellungen zu testen ist leider viel zu zeitaufwändig da keine Parallelfunktion unterstützt wird und die Tests viel zu lange dauern würden. Zum Vergleich: ein Durchlauf in Banksia mit 22 parallelen laufenden Test bei 20min/40Z (was in Fritz auch nicht möglich ist) dauert ~40min. In Fritz würde das 16 Std. dauern...
Trotzdem danke für den Vorschlag.

Grüße
Wilhelm

By Peter Martan Date 2022-05-07 14:32 Edited 2022-05-07 15:15

Dann könnte ich dir für dein Prinzip des Testens mit mehreren Lösungszügen und verschieden vielen Punkten pro richtig gefundenen Zügen noch das hier anbieten:

https://sites.google.com/site/strategictestsuite/sts-elo-estimate

Da geht das Tool von ähnlich vielen Stellungen aus wie du (STS sind 1500) und rechnet die Punkte dann zu Vergleichswerten aus CCRL- Elo um, wenn ich das richtig verstehe. Hab's nie probiert, die Elo- Werte von damals, als das Tool und die STS aktuell waren, müssten wohl angepasst werden.

Ferdinand Mosca hat STS und Auswertung auch mal mit einem eigenen Tool adaptiert:

https://www.chessprogramming.org/Strategic_Test_Suite

http://www.talkchess.com/forum3/viewtopic.php?t=56653

Das mit der Gesamtzeit im Banksia ist mir ehrlich gesagt, so wie die ganze Behandlung von Testsuiten in diesem GUI, (hab' allerdings auch immer noch nur die 0.52beta Version), etwas verdächtig. Bei einer Gesamtzeitvorgabe für eine Partie geht die Engine von durchschnittlichen Partielängen aus, wie sie das bei einer fixen Zahl von unterschiedlich schweren Teststellungen adäquat machen soll, kann ich mir eigentlich nicht wirklich vorstellen. Sie müsste sich dann, wenn sich die automatische Zeiteinteilung irgendwie Partie- konform auswirken sollte, für die (für sie) schwereren Stellungen mehr Zeit nehmen, für die, die sie für leichter hält (nach welchen Kriterien, wenn sie die multiplen Lösungen nicht kennt? Nach dem Prinzip der self fulfilling prophecy? Sie hält den zweitbest gereihten für den besten, der nicht viel schlechter ist an Punkten und geht mit weniger Rechenzeit daher schon zum nächsten Zug, statt bis zum als beste Lösung gereihten weiterzurechnen?) ob das dem Sinn der Gleichbehandlung verschiedener Engines und verschiedener Stellungen nicht genau entgegen wirkt?

Das vielseitigste Auswertungs- Tool ist wohl Chess Artist vom selben Autor wie dem der neuen STS- Version oben, auch von Ferdinand Mosca:

https://github.com/fsmosca/chess-artist

Noch zu deinen Zeitaufwand- Bedenken, abgesehen davon, dass du Fritz auch mehrmals starten kannst (keine Ahnung, ab wievielen Instanzen er dann abstürzt) lasse ich halt statt 22 Engines single thread 1 Engine mit 30 Threads und dafür entsprechend kürzeren Rechenzeiten laufen. SMP- Streuung, naja, schert man sich bei Eng-Eng ja auch nicht drum, bzw. wenn, haben wir damit halt auch schon wieder einen Grund mehr für ein weiteres eigenes Ranking und Rating, in welchen Maßeinheiten auch immer wir es messen

Edit:

Zitat:

abgesehen davon, dass du Fritz auch mehrmals starten kannst (keine Ahnung, ab wievielen Instanzen er dann abstürzt)

Hat mich jetzt doch wieder mal interessiert, bei 10xFritz17 mit 10 verschiedenen Engines, absichtlich ein paar NNUEs dabei und LC0 für die GPU, im Daueranalysemodus kein Problem bisher (läuft jetzt so 10 Minuten).

By Klaus Wlotzka Date 2022-05-06 12:25 Upvotes 1

Chess Player schrieb:

Guten Morgen zusammen, ich glaube es geht nicht so einfach da die Elo Kurve nur etwa im Bereich von +/- 150 annähernd linear verläuft. Das ist hier nicht gegeben. Und auch das ist, da die Elo Werte teils 6-stellig ausgegeben werden nicht so möglich.

Hallo,
die gestellte Anforderung hat nichts mit der normalen Eloberechnung gemeinsam, vielmehr wird hier eine Elospanne auf Basis eines erzielbares Punktebereichs definiert.

Grüße

Klaus

By Chess Player Date 2022-05-06 12:43 Edited 2022-05-06 13:33

Klaus Wlotzka schrieb:

Chess Player schrieb:

Guten Morgen zusammen, ich glaube es geht nicht so einfach da die Elo Kurve nur etwa im Bereich von +/- 150 annähernd linear verläuft. Das ist hier nicht gegeben. Und auch das ist, da die Elo Werte teils 6-stellig ausgegeben werden nicht so möglich.

Hallo,
die gestellte Anforderung hat nichts mit der normalen Eloberechnung gemeinsam, vielmehr wird hier eine Elospanne auf Basis eines erzielbares Punktebereichs definiert.

Grüße

Klaus

Da muß ich aber Mal einfach nur

. (Symbol entspricht einem Lächeln)

Aber die Ursprungsfrage ist doch sehr alt, wie ermittle ich Elo Werte aus Teststellungen, meine mich erinnern zu können.

Ob EloStat es kann?? Ob Dr. F. Schubert dazu etwas hatte, keine Ahnung....

By Benno Hartwig Date 2022-05-06 15:06 Edited 2022-05-06 15:09

> Aber die Ursprungsfrage ist doch sehr alt, wie ermittle ich Elo Werte aus Teststellungen...

Ich glaube, die Ursprungsfrage war zu verstehen als: Wie formuliere ich lineare Interpolation in Excel?
Wobei das "linear" nicht ausdrücklich gefordert war.
Zum Hintergrund und ggf. weiteren Erfordernissen hatten wir da doch noch gar nichts erfahren.
Nur der Begriff "Elowert" schwebte immerhin schon mal locker durch das Posting.

By Chess Player Date 2022-05-06 15:09

Genau das geht nicht!

By Benno Hartwig Date 2022-05-06 15:11

Was geht nicht?
Lineare Interpolation mit Excel?

By Chess Player Date 2022-05-06 15:17

Willst Du Haare spalten?

Deine Interpretation ist ja schon falsch.

Siehe dir einfach die Ursprungsfrage von Wilhelm an. Und überlege...

By Klaus Wlotzka Date 2022-05-06 16:02

Chess Player schrieb:

Willst Du Haare spalten?

Deine Interpretation ist ja schon falsch.

Siehe dir einfach die Ursprungsfrage von Wilhelm an. Und überlege...

Ich denke, nicht Benno sondern Du bist derjenige der Haare spalten möchte. Wilhelm hat doch mitgeteilt, dass ihm die beschriebene lineare Lösung vollkommen ausreicht. So hatte ich Wilhelm auch verstanden auch wenn er hier eine Elozahl erwähnt.

Aber man kann daraus natürlich auch eine Doktorarbeit machen.

By Benno Hartwig Date 2022-05-06 21:36 Upvotes 1

> Willst Du Haare spalten?

Dann sage doch einfach, was konkret an dem falsch war, was ich sagte.
Und erkläre bitte auch, was von dem nicht geht, was ich sagte. Du behauptetest das ja.

Doch, ich denke, das von mir Geschriebene war schon ganz richtig und auch stimmig.
"Haare spalten"? Und was du jetzt damit meinen könntest, verstehe ich schon gar nicht.

Aber vielleicht schenkst du den Lesern ja gleich Klarheit.

By Chess Player Date 2022-05-07 09:49

Wilhelm Hudetz schrieb:

Hallo,
ich überarbeite gerade meine Testsuite Seite und die Testsuite selbst. Ich möchte eine Spalte mit einem Elowert hinzufügen komme aber mit der Formel nicht klar.
Zum Beispiel:
Ergebnis 900 sollte Elo 3500 ergeben
Ergebnis 373 sollte Elo 2550 ergeben

dazwischen dementsprechende Elozahl. Ist das möglich?

Danke schon mal im Voraus.

Grüße
Wilhelm

Ein interessantes neues System mit der Zeitkontrolle 40/20, kannte ich bisher noch nicht.

Läßt sich der Test auch unter Arena durchführen? Was muß man dort eingeben?

Interessant wäre dann der Vergleich mit der Eigenmann Liste.

By Wilhelm Hudetz Date 2022-05-07 10:13

Chess Player schrieb:

Ein interessantes neues System mit der Zeitkontrolle 40/20, kannte ich bisher noch nicht.

Läßt sich der Test auch unter Arena durchführen? Was muß man dort eingeben?

Interessant wäre dann der Vergleich mit der Eigenmann Liste.

Die freie Wahl der Zeitkontrolle hat den Vorteil das auch das Zeitmanagement der Engine mit einfließt.
Ob's in Arena geht weis ich nicht, aber da Arena keine parallele Funktion hat wirst du bei 1100 Positionen alt werden (Banksia-~40min, Fritz- ~15Std.).
Sind sehr viele Positionen von Eigenmann enthalten.

By Chess Player Date 2022-05-07 10:37

Nun gut, man kann ja die Datei beliebig teilen und Arena mehrfach starten. Wo ein Wille ist, ist auch ein Weg.

Auf meinem schwachbrüstigen, ehemals Top Maschine, macht das aber keinen Sinn mehr.

By Klaus Wlotzka Date 2022-05-06 16:47

Wilhelm Hudetz schrieb:

PS: ich bin mir aber sicher das Klaus auch eine wesentlich genauere Funktion erstellen könnte

Hallo Wilhelm,

in der Tat ginge das.

Dazu benötige ich allerdings noch die Info, ob die beiden vorgegebenen Punkteanzahlen und zugehörigen Wertungen die min./max.-Werte (0% bzw. 100% der Aufgaben gelöst) oder beispielsweise andere Ansätze (z.B. 25%/75% oder ähnliches) darstellten.

Grüße

Klaus

By Wilhelm Hudetz Date 2022-05-06 17:09

Hallo Klaus,

also ich bin mit der derzeitigen Lösung voll zufrieden.
Wenn es dir aber Spass machen würde damit zu experimentieren kann ich dir die Exceldatei und meine aktuelle Rangliste schicken.
Wie gesagt, nur wenn es dir Spass macht.

Grüße
Wilhelm

By Klaus Wlotzka Date 2022-05-06 17:56

Hallo Wilhelm,

ich habe Dir eine E-Mail geschickt.

Grüße

Klaus

By Ingo Althöfer Date 2022-05-06 16:57

Hallo Herr Hudetz,

Wilhelm Hudetz schrieb:

Wir brauchen keine Doktorarbeit ...

es geht nicht um Doktorarbeit oder irgendetwas Tiefsinniges.
Es ist einfach so, dass Ihre Idee einer Spalte mit Elo-Werten
aufgrund der Testergebnisse Murx ist.

Unabhängig davon ist die Lösung von Klaus Wlotzka
für das technische Problem der linearen Interpolation
gut und sinnvoll.

*******************************************
Um mal ein drastisches Beispiel aus einem ganz anderen Beispiel
zu bringen: Jemand fragt in einem Forum für Brotmesser, wie er
diese wohl am besten schärfe, er wolle nämlich seine Schwieger-
mutter einen Kopf kürzer machen.

Hätte er nur nach dem Schärfen von Brotmessern gefragt, wären
normale Antworten eingegangen. Durch die vorgesehene schlimme
Nutzung wird die Sache aber problematisch.

Nichts für ungut,
Ingo Althöfer.

By Wilhelm Hudetz Date 2022-05-06 17:15

Hallo Herr Althöfer,

man sieht ja alle Ergebnisse, aber zusätzlich die zu erwarteten Elo.
Wie gesagt, nur ein Werkzeug.

Hoffentlich macht mich keiner um einen Kopf kürzer

Grüße
Wilhelm

By Chess Player Date 2022-05-06 17:23

Ich sage dazu nur:learning by doing

By Ingo Althöfer Date 2022-05-06 17:31

Lieber Herr Hudetz,

Wilhelm Hudetz schrieb:

man sieht ja alle Ergebnisse, aber zusätzlich die zu erwarteten Elo.

wobei Elo-Zahlen durch lineare Interpolation von Stellungs-
Test-Ergebnissen wenig Sinn machen.

Ich geb mal ein anderes Beispiel, ohne Kopf kürzer. Jemand
vergleicht im Lebensmittel-Supermarkt verschiedene Produkte, z.B.

Literpackung Milch 1000 Gramm 0,84 Euro
Butter    250 Gramm 1,69 Euro
Erdnussflipse von Bahlsen 200 Gramm   1,99 Euro

Jetzt möchte er zusätzlich auch noch Elo-Zahlen angeben,
nur als Behelfs-Werkzeug.

Vielleicht kommt dann so etwas heraus:
Literpackung Milch 1000 Gramm 0,84 Euro Elo 2.450
Butter    250 Gramm 1,69 Euro Elo 2.725
Erdnussflipse von Bahlsen 200 Gramm   1,99 Euro   Elo 2.320

Wenn ich jetzt noch formatieren könnte, sähe es auch noch vertrauenerweckend aus

Ingo Althöfer.

Wie gesagt, nur ein Werkzeug.

Zitat:

Hoffentlich macht mich keiner um einen Kopf kürzer

Auf keinen Fall!

By Frank Quisinsky Date 2022-05-06 21:35 Edited 2022-05-06 21:38 Upvotes 1

Hallo,

dem ist leider so!

Da hatten schon viele Kopfschmerzen bei vergleichbaren Versuchen!
Im Grunde will das gemeine Volk etwas in Elo ausdrücken, mittels Stellungstest ermittelt, ohne sich die Arbeit einer Ratingliste zu machen.
Strom und Zeit ist das Thema ... wir wollen ja immer sehr schnell irgend ein Ergebnis in die weiten Welten des Internets beamen.

Nichts dageben einzuwenden und natürlich auch nicht an der sehr guten Idee die dahinter steckt!
Sei es von Wilhelm, Klaus bei der Umsetzung mittels Excel oder anderen die sich schon Gedanken machten!

Aber grundsätzlich muss das ganze Thema aus einem anderen Betrachtungswinkel gesehen werden.

Welche "Berechnungsfaktoren" stehen für Messungen zur Verfügung:

- Zeit
- Stellungsbewertung (schwierig, da diese bei Engines niemals gleich ist).
- Zugtiefe (schwierig, da je nach Selektivität etc. genau das nur sehr begrenzt verglichen werden kann).
- die errechnete Variante (schwierig, eher interessant bei nicht eindeutigen Lösungen).

Meines Erachtens gilt es für eine Berechnung den Faktor: Stellungsbewertung zu knacken.
Wie kann ich stark unterschiedliches vereinheitlichen!
Das geht mit Schablonen-Denken!

Daraus kann berechnet werden ohne Elo zu vergewaltigen!

Habe mir auch schon oft den Kopf zerbrochen!
Die Probleme beginnen wenn ich z. B. eine ältere Engine in einem Stellungstest mit neueren Engines einbeziehe.
Nehme ich z. B. AnMon und denke mir: In der Realitität liegt AnMon ca. 1000 Elo hinter einer aktuellen Stockfish Version.

Nun ist AnMon ein sehr guter Problemlöser aber ich hatte noch keine Idee wie ich das so darstellen kann, dass der reale Spielstärkeunterschied von 1000 Elo zu sehen ist.
Wahrscheinlich liegt das auch an meinen gesammelten Stellungen, die ich mal irgend wann für gut befunden hatte.

Für Ingo:
Die Erdnussflipse von Bahlsen würde ich mit mindestens 125 Elo höher bewerten.
Das möchte ich noch zu bedenken geben.

Egal, Ingo hat leider Recht.
Es muss eine komplett andere Formel entwickelt werden und das geht im Grunde auch nur mit dem was tatsächlich vorhanden ist, siehe oben!

Möchte ein Endergebnis sehen bei dem klar wird das AnMon 1000 Elo hinter einer aktuellen Stockfish liegt.
Das wäre mein Ziel wenn ich mal wieder einen solchen Versuch starten würde!

Gruß
Frank

By Frank Quisinsky Date 2022-05-06 22:03 Edited 2022-05-06 22:06

Hallo zusammen,

war ja Thema in einer Diskussion mit Peter.
"Stellungsbewertung bewerten" muss meines Erachtens der "Zeitkomponente" vorgeschoben sein!

Schablonendenken zu "Stellungsbewertung bewerten".

Im Grunde wie es Klaus bei FEOBOS machte.

Die Frage die seinerzeit bei FEOBOS zu beantworten war:
Wie können 41.614 Analysen, Stellungsbewertungen verglichen werden, um ein "Engine-Berechnungs-Resultat" mit 9 anderen Engines zunächst zu vergleichen um es zu vereinheitlichen.
Dieser Punkt war wichtig um keine Eröffnungsstellungen zu Unrecht auszuselektieren, wenn irgend eine der 10 Engines im Teamwork der Analysen z. B. offene Stellungen deutlich höher bewertete.

Also, ich lege im Grunde auf 41.614 Stellungsbewertungen eine Schablone um Durchschnittswerte zu ermitteln.

Ausgehend von diesem Durchschnittswert kann dann eine einzelne Stellungsbewertung einer Engine zunächst beurteilt werden und dann erst kommt der Zeitfaktor!

Beispiel:
Wir haben ein Matt in 16 Zügen, enthalten sind stille Züge (keine Schachzüge).

Max. Zeit für eine Lösung z. B. 5 Minuten:

Engine 1: Löst nach 3 Minuten
Engine 2: Löst nach 4 Minuten ... Engine 1 ist bei dieser Stellung logischer Weise besser!
Engine 3: Kommt nach 5 Minuten mit einer Bewertung von 0.5 daher ... blickt nicht durch!
Engine 4: Liegt bei +0.8 nach 2 Minuten, nach 4 Minuten dann bei +5.7 aber löst nicht nach 5 Minuten!

Wir wissen, dass Engine 3 max. um 0.5 von der Durchschnitts-Eval abweicht!
Wir wissen, dass Engine 4 max. um 0.9 von der Durchschnitts-Eval abweicht!

0.5 oder 0.8 ... beide blickten nicht durch.
Aber Engine 4 war dann im weiteren Verlauf zumindest auf dem Weg.

Und Bingo ...
Wir haben neben der Zeit eine Komponente mehr mit der gerechnet werden kann.

Das Spielchen könnte man auch mit der Zugtiefe treiben.
Thema: Zugtiefe bewerten!

Und so lange nur die Zeit zur Verfügung steht, so lange haben wir ein Problem!
Für eine komplexe Bewertung ist nur die Zeit allein nicht ausreichend!

Je mehr Faktoren desto besser eine Formel!
Das sollte bei dieser Überlegung meines Erachtens im Vordergrund stehen!

Das war dann auch immer mein Ansatzpunkt wenn ich Versuche gestartet habe.
Sehr kompliziert ...

Viele Grüße
Frank

By Frank Quisinsky Date 2022-05-06 22:30 Edited 2022-05-06 22:33

Und wenn das vorliegt wird es einfach:

Max. Punkte und erreichte Punkte:
Daraus könnte etwas gebastelt werden.

z. B. wenn eine Aufgabe innerhalb von 30 Sekunden (der 5-Minuten) gelöst wird = maximal Punktwert x
z. B. wenn keine Lösung aber auf dem Weg zum Lösungszug (Engine 4 in meinem Beispiel) ... zusätzlicher Punktwert x

Und wenn dann optimaler Weise auch die Stellungen selbst so gut ausgewählt werden das das Verhältnis stimmt zwischen:

x Stellungen zu: Nach der Eröffnung
x Stellungen zu: Frühes Mittelspiel
x Stellungen zu: Spätes Mittelspiel
x Stellungen zu: Frühes Endspiel

Endspiel können wir uns schenken ...

Würde ein schöner Test stehen!

Ferner müssen Stellungen rein die für Punktabzug sorgen könnten:
Standardfragen wie ...

1. Wie schätzt die Engine eine bevorstehende Stellungen bei falscher Läufer mit Freibauern am Rand ein.
2. Wie schätzt die Engine eine Stellung mit KSS - Kbb ein.
3. Beherscht die Engine Matt mit KSL - K
4. Beherscht die Engine die korrekte Mattführung und Anzeige des Matts ... also Matt in 14, dann Matt in 13, Matt in 12 ... und nicht Matt in 38, Matt in 19, Matt in 12 etc..

Etc.

Dafür muss ein Punktabzug geben!

Um auch die Programmierer zu annimieren sich die Sachen wirklich mal im Detail anzusehen!
Bei einigen Engines sehe ich immer rot wenn solche Muster aufs Brett kommen!

Und wenn dann bei einem solchen Test zu erkennen ist ...
Das z. B. ein AnMon 1000 Elo hinter einen aktuellen Stockfish liegt ist der Test wirklich gut!

Eine Lebensaufgabe!
Nicht die Formel die entwickelt werden könnte aber die passenden Stellungen zu allen Spielphasen zu haben.

Viele Grüße
Frank

Ein komplett anderer Ansatzpunkt wäre es, die kompletten Züge einer Partie zu bewerten.
Wahrscheinlich könnte eine Auswertung der Züge aus 100 Partien ein genaueres Spielstärkeresultat produzieren als Elo!!!

By Peter Weise Date 2022-05-07 09:43

Frank Quisinsky schrieb:

Und wenn dann bei einem solchen Test zu erkennen ist ...
Das z. B. ein AnMon 1000 Elo hinter einen aktuellen Stockfish liegt ist der Test wirklich gut!

Dafür muß man nicht erst einen aufwändigen Test zusammenbasteln, das geht alles bereits heute!
Man nimmt einfach eine Datenbank her in welcher sowohl Stockfish als auch Anmon enthalten sind
und wertet diese mit 2 (zwei) Ankern und dem Tool Ordo aus.
Anker 1 = Stockfish mit z.B. 3000 und Anker 2 = Anmon mit 2000. Schon hat man eine Auswertung
mit genau 1000 Punkten Unterschied zwischen diesen beiden Programmen.
Wenn man diesen Aufwand scheut: es gibt Listen wo diese "Vorgabe" ziemlich genau erfüllt ist, z.B.:
https://ccrl.chessdom.com/ccrl/4040/rating_list_pure_single_cpu.html

By Frank Quisinsky Date 2022-05-07 09:55

Hallo Peter,

hatte mich ganz sicher falsch ausgedrückt.
Ich meinte eher wenn z. B. aus einem Stellungstest erkennbar wäre, dass z. B. AnMon 1000 Elo spielschwächer als ein aktueller Stockfish ist bzw. eher im Verhältnis ein solcher Unterschied zu vermuten wäre.
Halte ja auch nichts davon bei einem Stellungstest Elo anzuwenden.

Genau das zeigt auf wie problematisch ein Stellungstest ist.
Weil, AnMon ist ein sehr guter Problemlöser und schon bei dieser einfachen Konstellation wird auffällig, wie schwierig ein guter Stellungstest ist.
Habe sich schon so viele Personen dran versucht.

Gibt ja nun wirklich einige die ... sage mal ... befriedigend sind.
Lehne Stellungs-Test Klamotten grundsätzlich nicht ab aber mir fehlen hier die guten Konzepte.
Meine sind zu aufwendig und scheitern bislang hinsichtlich passender Stellungen zu allen Partiephasen.
Dürfte nichts anderes machen wenn ich mich darauf konzentriere.

Aber Dein Hinweis stimmt natürlich!
Mit Ordo ist einiges möglich!!

Viele Grüße
Frank

By Peter Weise Date 2022-05-07 11:39

Ich glaube schon dich richtig verstanden zu haben.
Mir stellen sich aber Fragen auf welche ich keine vernünftige Antworten finden kann.
So ich nichts wesentliches verpasst habe, war die Hauptintension für das abarbeiten von Teststellungen immer der Zeitgewinn gegenüber dem üblichen "Programm gegen Programm spielen lassen", richtig?
Wenn ich nun aber die vielen (zum Teil komplexen) Überlegungen bezüglich eines solchen Tests hier lese, dann kommt in mir der Gedanke auf, daß eine Durchführung und das Ermitteln eines Ranking (und auch eines Rating falls erwünscht) länger dauern würde als das typische "Programm gegen ..."?!
Sollte ich richtig liegen dann braucht man das alles nicht, weil wir bereits alles vorliegen haben. Und falls die großen Ratinglisten weiter machen auch in Zukunft haben werden.

By Frank Quisinsky Date 2022-05-07 15:49

Hallo Peter,

so sehe ich das auch!
Ein guter Test erfordert wahnsinnig viel Arbeit und letztendlich bleibt ein finales Ergebnis dann trotzdem zumindest "fraglich".
Das 1:1 ein Ratinglisten-Ergebnis simuliert werden könnte ist eher unwahrscheinlich.

Gegen die Ratinglisten spricht, dass es zu viele Beeinflussungsfaktoren gibt.
Ergebnisse sind teils unterschiedlich, gerade wenn die Hardware schneller wird oder mehr Zeit gegeben wird.
Fast alle testen mehr oder weniger Blitz oder an der Grenze zum Schnellschach.

Grundsätzlich stimmen aber die Ergebnisse der Ratinglisten grob bzw. die Rangfolge der Engines innerhalb der Listen ist meist gleich.

Es reizt halt immer auf die Suche zu gehen um irgend etwas zu verbessern.

Viele Grüße
Frank

By Benno Hartwig Date 2022-05-07 08:18 Upvotes 1

> Wenn ich jetzt noch formatieren könnte, sähe es auch noch vertrauenerweckend aus

Was für eine Formatierung meinten Sie hier, Herr Althöfer? Vielleicht doch sowas:

Literpackung Milch         1000 Gramm   0,84 Euro    Elo 2.450
Butter                      250 Gramm   1,69 Euro    Elo 2.725
Erdnussflipse von Bahlsen   200 Gramm   1,99 Euro    Elo 2.320

Die Forum-Software bietet dies ja ganz direkt mit dem tt-Button.
Nur das Zurechtruckeln des Textes macht man dann am besten mit einem Editor.

By Frank Quisinsky Date 2022-05-06 22:20

Hi Wilhelm,

sehe ich nicht so!
Eine einheitliche Lösung (Engine Protokolle, Elo-Formel, PGN, EPD, Endspieldatenbanken, FRC etc..) ist immer gut!

Die gibt es zu diesem Thema leider nicht!

Viele Grüße
Frank

By Benno Hartwig Date 2022-05-07 08:21

> So viel Tamtam wegen einem Werkzeug

Das "Tamtam" ist eben auch das, was die Zeit mit Unterhaltung füllt.

By Chess Player Date 2022-05-07 09:38

Wer öffentlich Fragen stellt muß damit rechnen das es viele unterschiedliche Antworten gibt. Damit muß der TO leben.

By Hauke Lutz Date 2022-05-07 09:54

Das was ich hier wahrgenommen habe ein "Linear ist falsch".
Bestreitet auch keiner, aber diese Meinungsäußerungen für eine Antwort zu halten ist doch ziemlich einfach gedacht.

Vielleicht arbeitest du an einer richtigen Antwort und machst eine genauere Berechnung fertig.
So schnell wie deine Kritik kam sollte es dir schnell von der Hand gehen.

Statt meckern bitte besser machen.

By Chess Player Date 2022-05-07 10:02

Klaus Wlotzka wird das schon regeln...

vermute ich. Wenn nicht gleich, dann vielleicht später.

By Wilhelm Hudetz Date 2022-05-07 10:04

Habe kein Problem mit "TamTam" und anderen Meinungen, ist schon ok

War nur überrascht

By Ingo Althöfer Date 2022-05-07 10:12

Um die Sache zu einem gewissen Abschluss zu bringen:
Es gibt sogar einen ELO-Song "Don't make TamTam!"
mit Youtube-Video

https://www.youtube.com/watch?v=uFglr3HCMmY

By Wilhelm Hudetz Date 2022-05-07 10:21

Genau. Klaus hat mir schon was neues geschickt, gestern noch!!! Muß mich aber erst ein wenig einarbeiten.
Wenn's fertig ist können wir weitermachen mit "TamTam"