Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Remistod ... hier noch eine nette kleine Statistik!
- - By Frank Quisinsky Date 2016-11-11 22:02 Edited 2016-11-11 22:12
v4.15 meiner Ratingliste:
Draw rate (equal opponents) : 49.14% +/- 0.21
Picken wir uns irgend eine Engine raus:
07 Critter 1.6a x64                 :  2989.95   2450    70.2  1238   966   246  1721.0   39.4  11.30  2821.96  10.91   49.0

v4.41 meiner Ratingliste:
Draw rate (equal opponents) : 52.07% +/- 0.23
10 Critter 1.6a x64                 :  2982.02   2450    65.6  1069  1074   307  1606.0   43.8  10.70  2857.85  10.60   49.0

Da in meinem Download File (ca. 475Mb) auch alle jemals erstellte Ratinglisten sind kann natürlich auch jede erdenkliche Frage beantwortet werden.

Die Remisquote hat zugenommen ...
von 2.93%

Zwischen den beiden Elo Ausgaben (einfach mal Critter herausgepickt) haben sich die 49 Gegner von Critter um durchschnittlich 35,89 Elo verbessert. Tja, unsere Schachprogrammierer sind wie immer sehr aktiv. Bedeutet wir wissen genauso viel wie vorher ... denn wenn die Ratings steigen, steigt die Remisquote. Insofern ...

Allerdings haben wir massive Veränderungen durch die vielen Updates erfahren.
Bin mit meinen Latein am Ende ...
Zu spät für Erklärungen und je mehr ich drüber nachdenke finde ich keine.
Habe ich mir wieder selbst ein Ei gelegt.

Fest steht ...
Wer mehr Nerven dafür hat kann die Datenbank runterladen samt sämtlichen Statistiken und nach genauer Prüfung ja mal in ein paar Jahren wenn fertig berichten.

Gruß
Frank

Eigentlich ja logisch wenn die Gegner von Critter durchschnittlich um 36 Elo besser werden das die Remisquote steigt.
Alles andere wäre unlogisch. Wir müssen nur alles in ein gesundes Verhältnis setzen ...
Kann doch nicht so schwierig sein.

Übrigens hat Critter 8 Elo verloren.
Nicht  weil die Liste nach 2450 Partien ungenau ist, sondern weil wenn ich nur 2 engines Austausche entsteht das gesunde Chaos mit unseren Ratings.
Hier wurden 26 ausgetauscht ...

Die Erklärung für 8 Elo ist genauso scheiße zu später Stunde bevor wieder so ein ErrorBar Jünger um die Ecke kommt.
Also vergessen wir dieses Posting und begeben uns in die wohlverdiente Nachtruhe.
Parent - - By Guenter Stertenbrink Date 2016-11-12 09:10
ich nahm CCRL, weil die laengere Bedenkzeiten haben und jeweils die Elos mit angeben im .pgn  ==> einfacher
aber ich koennte den gleichen Chart auch mit deiner Liste machen, Elos aus der Ratingliste einfuegen,
vielleicht spaeter

http://magictour.free.fr/DRAW4A.GIF

Remisquote bei 2000 = 23%
Remisquote bei 2500 = 32%
Remisquote bei 3000 = 51%
Remisquote bei 3330 = 76%  (nur SF,KO)

(CCRL-40/40 Elos)
Parent - - By Frank Quisinsky Date 2016-11-12 11:12
Hi Guenter,

lassse Dich nicht  blenden von 40 in 40 ... das ist auf Athlon 3800 ... ohne Prozessordinge wie AVX und BMI2.
Deutlich langsamerer RAM als ich einsetze.

Wenn ich RAM und Prozessoroptimierungen nicht miteinkalkuliere ist 40 in 40 bei denen gerade mal 40 in 12 unter meinen Bedingungen auf moderer i7 4Ghz hardware.

Genau das passiert mit deren Angaben oder bei CEGT mi 40 in 20.
Das was CEGT 40 in 20 schimpft ist heute weniger als 40 in 5 auf meinem i7.

Hatten das Thema ja schon mal ...

Könnte ja auch mal schreiben 40 in 40 auf Athlon 3.800 auch wenn ich mit i7 4Ghz spiele.
Das führt nur in die irre und die Leute denken ... wow 40 in 40!

Nun ja ...
Egal ... sind alte Listen und früher war es so für die Berechnung.
Nur sollte das endlich mal angepasst werden, weil der Beobachter der das nicht verfolgt hat denke ... wow ... 40 in 40 und wird total geblendet.

Gruß
Frank
Parent - - By Guenter Stertenbrink Date 2016-11-12 11:16
du argumentierst jetzt pro-Remistod ?
CCRL hat hohe Remisquote _trotz_ deiner Meinung nach ueberschaetzten Hardware
Parent - By Frank Quisinsky Date 2016-11-12 12:07
Hi Günther,

wollte das gestern Abend nochmals prüfen anhand von Ordo Ausgaben.
Aber so richtig läßt sich das nicht prüfen anhand von Elo-Ausgaben, meine es ist klar das wenn die Gegner stärker werden und wenn die Gruppe von TOP-50 näher zusammenrücken dann die Remisquote steigt.

Beschäftige mich später nochmals damit.

Aber grundsätzlich ...
Schaue ... mal hier vom laufenden Houdini Test-Run:

Houdini 5 Pro x64 C1 - SF 18Sep2016 BMI2 x64 C10=====1====X
Komodo 10.2 x64 C15 - Houdini 5 Pro x64 C1====0=====X

Bis auf eine Partie jeweils alles Remis.
Klar, die liegen sehr eng zusammen!!

Später mal ...
Muss jetzt auch weg!

Gruß
Frank
Parent - - By GS Date 2016-11-12 14:11
Frank Quisinsky schrieb:

[...snip...]
Genau das passiert mit deren Angaben oder bei CEGT mi 40 in 20.
Das was CEGT 40 in 20 schimpft ist heute weniger als 40 in 5 auf meinem i7.
[...snip...]


Nun, man kann sich jede, VOR ALLEM DIE EIGENE, Rangliste "schön saufen" !
Parent - - By Frank Quisinsky Date 2016-11-14 01:10
Hallo Gerhard,

bei mir ist alles zu 100% dokumentiert (ob die Engine Konfigurationen, die Conditions), einfach alles.
Die Links auf meiner Seite stimmen (die bei der CEGT sollten mal überarbeitet werden) und vor allem sage ich nicht ich spiele mit 40 / 40 auf 2Ghz Pentium oder so Scherze sondern passe alles laufen an und dokumentiere.

Bei der CEGT als auch bei CCRL schaut alles etwas merkwürdig aus.
40 in 20 ist in Wirklichkteit ca. 40 in 5 auf moderner i7 Hardware und bei CEGT ist 40 in 40 in Wirklichkeit maximal 40 in 12 auf moderner i7 Hardware.

Das dann 40 in 20 vergleichbar ist zu IPON ... das wäre ca. 40 in 2 auf moderner i7 Hardware ... ist auch klar denn mittlerweile ist das alles Blitz.
Einzig die 40 in 12 CCRL ist überhaupt noch vergleichbar mit meiner 40 in 10. Wenn gleich die auch nicht BMI2 oder AVX etc. einsetzen etc..

Ich habe die größte Hochachtung wenn jemand sich so viel Mühe macht wie CCRL oder CEGT und das die Interessierten überhaupt etwa haben zu schauen. Aber ich finde es schrecklich das durch die älteren Informationen aus Startzeiten die Leute nicht komplett richtig informiert werden. Viele denken ... wow 40 in 20 und verstehen die Conditions nicht korrekt.

Finde diese Geschichten sind bei einem Rating-System (Bench Ausgaben ... wie z. B. bei meinem Conditions) sehr wichtig.
Wenn doch schon ein einzelner wie der Frank mit seiner FCP Rating List damit keine Probleme hat sollte es doch die CEGT oder die CCRL auch nicht haben.

Das finde ich wirklich schlecht.

Das 40 in 4 im Grunde 40 in 2 ist ... dann schreibt es auch.

Und das hat nichts mit schön saufen zu tun ... eher mit Frust saufen wenn ich mir die Informationen hierzu auf CEGT und CCRL Seiten ansehe.

Sorry aber hinsichtlich Dokumentationen ist CEGT als auch CCRL ... vom Testverfahren her ... vom Eröffnungsbuch her ... wenn ich mir anschaue wie viele Buch-Verluste drin sind ... um Längen von meiner Arbeit entfernt. Da liegen mindestens 3 Klassen dazwischen so weit seit Ihr weg im Vergleich zur FCP Rating List.

Nochmals, ich habe gehörigen Respekt vor einer solchen Arbeit aber kann mit der 40 in 2 oder der 40 in 5 (40 in 4, oder 40 in 20) CEGT Liste überhaupt nichts mehr anfangen. Viele Engines sind um 50 Elo vom Ergebnis entfernt welches ich mit ein paar tausend Partien mehr unter ganz klaren Testbedingungen (jede Partie wurde überprüft ... ok seit ca. Partien Nummer 40.000 sehr pingelig genau) ... auf altes Material wird neues draufgesetzt ... weiß Du was ich für ein Chaos produzieren würde wenn in SWCR und FCP zusammenlegen würde ...

etc.

Sind sehr harte Worte und die dienen nicht dazu meine Arbeit in den Vordergrund zu rücken ...
Denn ich habe gar keine Absichten mehr mit meiner Liste und die Zahlen die meine Liste produziert waren mir immer schon egal.
Mir geht es um Spielstile und Buchentwicklung ... die Ratingliste ist ein Nebenprodukt für mich ...

Ich finde bei einer reinen Elo-Liste sollte das ganze Drumherum einfach stimmen, auch wenn diese frei ist.
Heute sehe ich die CEGT so wie die SSDF ... alles ist irgendwie stehen geblieben, nichts geht voran ... die Ratings stehen sich selbst im Weg.

Mit der Power die Ihr habt ist sehr viel mehr möglich ...
Alles wirkt sehr lieblos ...

Die 5 + 3 ist dagegen sehr interessant, die mag ich und die beobachte ich auch gern.
Finde das ist eine der besten Listen überhaupt die wir haben.
Die 40 in 120 ... mein Gott ... diese Arbeit das zu tun ... ist mir zu langatmig aber das wäre eine solche Liste vom jedem es sei denn er hat 10-15 Rechner die er dafür nutzt. Trotzdem interessant wie ich finde und sehr aufschlussreich ...

Will mich mit Dir auch nicht anlegen weil ich denke das Du einer besten Engine Tester weltweit bist und vor allem einer mit sehr viel Erfahrung und auch Kenntnissen.
Aber die angesprochen CEGT Probleme sollten endlich mal angegangen werden, auch wenn es mich nichts angeht und ich mir denke wenn die CEGT dazu nicht in der Lage ist ... mache ich es halt selbst.

Also wer Kritik übt sollte es besser machen ...
Genau das tat ich ... wobei ... meine ist auch nicht perfekt und hat ganz andere Probleme!

Gruß
Frank
Parent - - By Frank Quisinsky Date 2016-11-14 01:23 Edited 2016-11-14 01:28
Verstehe das eh alles nicht.
Da hat die CEGT, Gerhard, Wolfgang und Werner, den Johan und noch so ein paar echte Volltreffer ... mit viel Wissen und sehr viel Ausdauer, Energie und wie gesagt mit einen enormen Spektrum an wirkliche Computerschach Erfahrung. Eine solche Gruppe könnte Bäume ausreißen und könnte das was ich so mache um eine Vielfaches toppen. Aber es kommt einfach nichts und alles läuft wie bislang mit den immer gleichen Problemen etc..

Es wäre schön wenn ich mal irgend eine Liste hätte mit denen ich etwas genauer vergleichen kann.
Muss laufend immer die Fehler bzw. Ungereimtheiten ... die mir bei CEGT oder auch andere Listen bekannt sind für sich betrachten, raus rechnen etc. um überhaupt mal etwas Vergleichbares zu haben. Alle anderen guten Arbeiten sind stark überwiegend auch immer nur Blitz, gar Extremblitz.

Ich wünsche mir einfach, dass sich mal viele Leute zusammen tun und mit dem vorliegenden Wissen heute mal eine wirklich geile Ratingliste aufbauen.
Bin zwar zu 80-85 zufrieden mit der eigenen Arbeit und könnte die letzten Schwachpunkte, die ich als Schwachpunkte sehe, herausnehmen und wieder neu starten aber mir fehlt die Zeit und die Energie.

In einem Punkt allerdings ...
Die CEGT Leute arbeiten trotz der ganzen unschönen Sachen kontinuierlich seit vielen Jahren ...
Ich könnte das gar nicht ... müsste immer etwas verbessern oder neues tun ... kann gut und schlecht sein ... schlecht weil mir die Beständigkeit fehlt aber da rasen die Engines davon, die Hardware Entwicklung geht weiter und die CEGT steht seit 10 Jahren still. Das wäre so als wenn Ferrari immer bessere Motoren baut aber es immer noch Holzräder sind die eingesetzt werden.

Könnte sagen ...
Die CEGT Leute sind beim Saufen eingeschlafen ... werden offenbar aus dem Tiefschlaf nicht mehr erwachen.
Um mit Deinem Ausdruck zu arbeiten.

Und nochmals das schreibe ich nicht weil ich eigenes hervorheben will.
So selbstbewusst bin ich das ich denke das das was ich in den drei Jahren erstellt habe ich der CEGT um Längen voraus.
Aber das ist nicht der Aufhänger ... ich wünsche mir eine stärkere und bessere CEGT weil ich die Leute die dort am werkeln sind sehr schätze aber offenbar haben alle Angst die schöne und große Datenbasis zu verlieren. Keine Ahnung ... dabei ist doch jede Partie die heute gespielt wird morgen Geschichte. Die Datenbasis ist eher nur begrenzt wichtig ... gibt viel wichtigere Punkte ... Anzahl der Gegner z. B..

Gruß
Frank
Parent - - By GS Date 2016-11-14 15:39 Edited 2016-11-14 15:47
Vor nicht allzu langer Zeit warst Du es, welcher immer wieder schrieb:
"man braucht keine Tausende von Games, es reichen auch deren 600.
Spätestens nach 800 Spielen bewegt sich nichts mehr."

Heute lese ich in jedem dritten Satz von Dir:
"die IPON/CEGT/CCRL ... haben viel zu wenige Spiele gegen viel zu wenige Gegner."

So ändern sich die Zeiten ..., deshalb auch das "schön saufen" !
Parent - - By Frank Quisinsky Date 2016-11-16 00:21
Hallo Gerhard,

das stimmt so nicht.
Mir persönlich reicht ein Rating nach 800 Partien wenn denn ausreichend Gegner vorhanden sind.
Bei ausreichend Gegner reicht mir 20-26.

Dann habe ich in den meisten Fällen +-10 und das ist für mich ausreichend.

Wenn ich genauer werden will habe ich festgestellt das die Schwelle meiner Excel bei 26 Gegner und ca. 1.200 Partien im Grunde sehr selten um +-5 abweicht. Eine Stufe höher wäre das also nach meinen Ansprüchen. Aber wie gesagt mir reichen im Grunde 800 Partien bei ca. 20-26 Gegner aus. Das Problem ist das für meine Move Stats natürlich viel mehr Partien notwendig werden um die Stärken und Schwächen besser sehen zu können. Je mehr Partien desto besser. Wie genau diese dann sind bzw. wie viele Partien notwendig werden habe ich nie wirklich errechnet weil zu kompliziert. Meine Move-Stats sollen ja auch keine genauen Elo's zu Tage fördern, sondern es soll anhand der Elo in etwa abgeschätzt werden können ob eine Engine in einer Partiephase durch gute oder schlechte Leistung auffällig ist ... das reicht hier. Elo benutze ich bei den Move Stats zwar um die Tabelle zu generieren aber die Elos die dort ausgegeben werden sind eher zweitrangig ...

z. B. wie schwach Smarthink startet und wie stark dann im Endspiel.
Diese Geschichten sind anhand der Move Stats abzulesen.

Oder das bei Houdini oder DiscoCheck ein extrem Contempt verwendet wurde ... durchschnittliche Zuglänge und wie die Partien dann ohne Aufgabefaktor ins Endspiel verschoben werden. Das Fizbo sehr viele kurze Gewinnpartien produzieren kann ... das bei Junior die Stärke in der ersten Partiephase deutlicher wird ... etc.

Wie gesagt, mir persönlich sind die Ratings nicht so wichtig wie sicherlich bei Euch bei CEGT. Bei mir geht es in dieser Reihenfolge ...

1. Buchentwicklung
2. Statistiken zu Spielstilen
3. Elo für die Ratingliste

Letztendlich ist die Buchentwicklung also wichtig. Ich wollte immer schon ein perfektes Buch fürs Engine testen haben. Alles soll ausgespielt werden, nach Beliebtheit die Prios ... ausgeglichen soll gestartet werden und zwar die Chance wenn möglich mit allen TOP-50 Engines. Das ist schwieriger als ich dachte aber ich bin in den letzten 3 Jahren sehr weit gekommen. Nach Abschluss der Liste geht es ans eingemachte ... allerdings lasse ich mir dafür Zeit ... zumal ich auch weniger habe. Aber da ich den Stress mit der Ratingliste dann nicht mehr habe kann ich mich besser darauf konzentrieren. Später möchte ich dann natürlich auch wieder eng-eng spielen lassen aber immer mit dem Gedanken ... Ziel erreicht, ich habe das Buch dafür welche ich immer haben wollte und das mit eigenen Mitteln und Möglichkeiten so gut es geht selbst generiert.

Gruß
Frank
Parent - - By GS Date 2016-11-16 10:13
Na dann will ich deinem Gedächtnis mal auf die Sprünge helfen.

http://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=99193#pid99193

Zitat:
[...snip...]
Auch bin ich der Meinung durch mehr Gegner benötigen wir weniger Partien
um schneller aus aussagekräftiges Ergebnis zu erhalten.
CEGT und CCRL haben oftmals wenige Gegner und wenige Partien
(besonders CCRL bei der 40 in 40 die von der Zeit her die höchsten
Voraussetzungen hat)" ...
[...snip...]

http://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=97417#pid97417

Zitat:
[...snip...]
"Bei größeren Listen wie CEGT wird aber mit der Zeit und massig Gegner und
Partien für ältere Programme alles ein wenig ungenauer ... siehe Zappa dort
oder viele andere die bis zu 30 und 40 zu meiner Liste mit deutlich mehr
Gegnern und Partien gegen aktuelle abweicht
...
[...snip...]"

http://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=96593#pid96593

Zitat:
[...snip...]
"wobei weder CEGT noch CCRL so viele Gegner haben und mit mehr Gegner
werden die Ergebnisse sehr früh sehr genau
...
[...snip...]

Willst Du noch weitere Beispiele haben ?
Parent - By Frank Quisinsky Date 2016-11-16 11:33
Genau ... immer in Kombination mit weniger Gegnern.
Das ist der Punkt!

Viele Gegner ist wichtig !!
Wenige Partien bezieht sich immer in Kombination mit auf wenige Gegner.
Musst mir nicht auf die Sprünge helfen, meine Argumentation ist immer gleich.
Parent - - By Guenter Stertenbrink Date 2016-11-13 01:24
ich fand just diesen Artikel aus 2012 wo die maximale Elozahl auf 3600 geschaetzt wurde

http://blog.chess.com/cavedave/is-3600-elo-the-max
http://rjlipton.wordpress.com/2012/05/31/chess-knightmare-and-turings-dream/

jemand postete einen Hinweis im TCEC chat, aber ohne naehere Angaben oder Link,
obiges aus 2012 war das einzig passende, das ich mit google fand

Die ganze Diskussion kam glaub' ich auf weill die Stockfish eval in jener
Partie uerklaerlich vom 1. Zug an konstant auf 0.00 blieb (Partie laeuft noch)
Waerend die erste Partie mit derselben Eroeffnung besonders stark schwankende evals hatte.
Parent - - By Benno Hartwig Date 2016-11-13 08:07
Sehr viel Bauchgefühl steckt in diesen 3600 Elo!
Und vor allem wohl der Wunsch, überhaupt mal so eine Schätzung abzugeben.

Ich denke, wir haben keine Vorstellung davon, wie oft (gänzlich uninteressant ist "wie schnell"! Jedes Einbeziehen von Geschwindigkeiten einer Entwicklung ist daher irreführend.) sich das Spielchen noch wiederholen wird, dass die neuen, stärkeren Spieler/Engines die schwächeren wegputzen.
Und wir können kaum schätzen, wie das Elo-Doing zukünftig mit Blick auf Elo-Inflation und Elo-Deflation ganz praktisch ausgestaltet wird.

Benno
Parent - - By Guenter Stertenbrink Date 2016-11-13 10:05
wir koennen Hardware und Bedenkzeit erhoehen

{
und so verschieden starke engines etwa gleichstark machen
und erst dann testen. So bekommen wir aussagekraeftige Statistiken
ueber die Remisquote. Erstaunlich, dass das offensichtlich noch nicht gemacht wurde
}
Parent - By Guenter Stertenbrink Date 2016-11-13 11:31
oder Zuege zuruecknehmen lassen (gegen Uebernahme der verlorenen Bedenkzeit
plus ~3 Zugbedenkzeiten Strafe oder so)

{
sehe es gerade in Houdini-Stockfish #7, 19.Ra2?
Houdini sah es nach Stockfish's Antwort dann auch
}
Parent - - By Benno Hartwig Date 2016-11-13 17:23

> wir koennen Hardware und Bedenkzeit erhoehen


Bei heutigen Gegebenheiten??
Da bekommen wir doch nicht annähernd eine Vorstellung davon, was sehr langfristig praktisch erreicht wird,
was theoretisch möglich ist.
Da sind wir denn doch noch viel zu weit von weg.

Außerdem spielt, ich schrieb es schon einige mal, die konkrete Ausgestaltung der Elo-Verwaltung eine entscheidende Rolle.
siehe: https://de.wikipedia.org/wiki/Elo-Zahl#Deflation_und_Inflation

Ich denke auch, die Elo-Zahl, die solch einer Engine dann irgendwann gegeben werden würde, hängt ganz maßgeblich davon ab, über welche und wieviele Zwischenstufen dieses Vermögen tatsächlich (und damit in der allgemeinen Elo-Entwicklung) erreicht wird.

Benno
Parent - - By Guenter Stertenbrink Date 2016-11-14 04:33
ich denke da ans Auffuellen der Luecke hier : http://magictour.free.fr/DRAW4A.GIF (Shredder 13, Fire 5)
und einiger neuer Werte (Houdini 5) oberhalb von 3300, um zu sehen, ob die
juengste Erhoehung bei 3330 Stockfish-Komodo spezifisch ist

und, wie gesagt, durch Bedenkzeit-Anpassung kann man den Engines gleiche Elos geben
und sie dadurch vergleichbar machen. Und durch Bedenkzeit/Hardware-Erhoehung
bekommt man weitere Werte im oberen Bereich, , um die Kurve -zunaechst bis 3500- abzuschaetzen
Parent - - By Benno Hartwig Date 2016-11-14 06:09

> um die Kurve -zunaechst bis 3500- abzuschaetzen


Nun habe ich doch nicht verstanden, was du da abschätzen willst, so bis 3500.


Ich dachte es ginge darum, was überhaupt durch Programmierung erreichbar ist,
oder eigentlich eher auch darum, was bei perfektem Spiel (was das ist, ist sicher auch noch nicht abgeklärt) herauskäme.
Zumindest bezog ich ich auf diese Fragestellung.

Der Einfluss von Hardware und Zeit mag mit deinem Hinweis etwas weiter betrachtet werden können.
Nach meinem Eindruck aber nicht weit genug, selbst wenn du ein Jahr pro Zug rechnen lässt.

Ganz entscheidend zeigte sich in den letzten Jahren aber auch (und vor allem?) der Einfluss der logischen Weiterentwicklung.
Die bekommst du nicht durch noch so drastische Ressourcenerhöhungen abgebildet.

Benno
Parent - - By Guenter Stertenbrink Date 2016-11-14 06:47 Edited 2016-11-14 06:51
abschaetzen, wie Kurve weitergeht, wo sie wohl die 100% erreicht.
Bei 2000-3000 sieht die Kurve ganz gut aus, da gibt es viele Datenpunkte.
Es ist keine Gerade, die Steigung steigt mit hoeherer Elo.

Ab 3200 sieht die Kurve ulkig aus, da gibt es wenig Datenpunkte
Dann bei 3330 gibt es einige Datenpunkte aus Stockfish - Komodo
Partien mit einer sprunghaft gesteigerten Remisquote.

Es geht darum, wie stark Engines werden koennen, ab welchem Punkt sich eine weitere
Steigerung (und die wird es immer geben, schon allein weil die Hardware besser und billiger wird)
ueberhaupt noch in Spielstaerke,Elopunkten niederschlaegt.

Durch Hardware und Bedenkzeitmanipulierung will ich in erster Linie erreichen, dass mehr gleichstarke
Gegner vorhanden sind, die gibt es ja zur Zeit fuer Komodo und Stockfish kaum.
Die Luecke zwischen 3200 und 3300 soll aufgefuellt werden mit neuen Datenpunkten=Partien

Bisher zeigte sich, das die Remisquote eigentlich ganz gut nur von den Elozahlen, nicht so sehr
vom Spielstil oder dem Eroeffnungsbuch abhaengt.
Allerdings ist nun die Remisquote in Partien SF-SF deutlich hoeher als in Partien SF-KO
Parent - - By Benno Hartwig Date 2016-11-14 07:22

> abschaetzen, wie Kurve weitergeht, wo sie wohl die 100% erreicht.


100% wovon? 100%-Remis?
Wer will ausschließen, dass sich die Ausgangsstellung nicht doch als ein "Matt in 345 Zügen erweist"?

Ich denke, solch eine Extrapolation bekommen wir nicht hin.
Zu unsicher ist, was die Zukunft an Softwareentwicklung bringen wird.

Aber, Ok, einen Versuch könnte man ja trotzdem wagen.

Aber bei der Abschätzung maximaler Elo-Werte sollte man nicht vor allem an gleichstarke Engines denken.
Viel wichtiger ist doch, wie häufig es geschehen wird, dass die neuen Engines sichtbar stärker sind als die etwas älteren. 10 mal? 100 mal? 1000 mal? Traust du dir zu, das langfristig abzuschätzen.
Ich befürchte, die Softwareentwicklung birgt dafür zu viele Überraschungen.

Wichtig auch: wie sich das Eintreten und Austreten aus den Elo-Listen gestaltet.

Benno
Parent - - By Guenter Stertenbrink Date 2016-11-14 08:13
annaehernd 100% Remisquote. Hier auch "Remistod" genannt.
Im praktischen Spiel der Engines gegeneinander.

Die Remisquote (als Funktion der Elozahl) ist am groessten, und laesst sich am besten
abschaetzen beim Spiel gleichstarker Engines.

Bei 100% Remis ist kein "sichtbar staerker" mehr moeglich,
daher sehe ich da dann auch das Ende der Elo-Steigerung.

Manche engines werden auch dann noch "besser" sein als andere,
sie finden Problemzuege schneller, allerdings kann das dann im
Spiel gegeneinander nur noch sehr selten in Gewinnpartien umgesetzt werden.
Parent - - By Benno Hartwig Date 2016-11-14 13:02

> Bei 100% Remis ist kein "sichtbar staerker" mehr moeglich,
> daher sehe ich da dann auch das Ende der Elo-Steigerung.


Im Moment halte ich aber für völlig offen
- ob die Remisquote mit steigender Spielstärke an 100% heran geht
    (insbesondere auch, ob 100% nicht schon lange vor dem perfekten Spiel erreicht wird!)
- ob die Remisquote mit steigender Spielstärke an 95% heran geht, bis dann womöglich doch erkannt wird, dass Schach letztlich nicht remis ist, und die Gewinnwahrscheinlichkeiten steigen dann womöglich wieder.

Wir würden uns halt mit einer Extrapolation versuchen, bei der nur ungefähre Werte in einer Ecke bekannt sind, und wir versuchen damit nicht nur gefährlich weit aus diesem Bereich heraus zu extrapolieren, wir würden unseren Werten eine Genauigkeit und Aussagekraft zubilligen müssen, die meiner Meinung nach nicht drin steckt.

Wer würde denn schon bei einer Wertefolge
1 1/2 1/3 1/4 1/5 (jeweils mit keinen Fehlern verfälscht) erkennen wollen, ob das auf 0 oder auf 0,0001 oder -0,0001 hinausläuft.
Dies mag unwichtig erscheinen. Wenn uns aber interessiert, nach wie vielen Schritten die 0,000 erreicht wird, dann scheitern wir an der Unverlässlichkeit.
Bei der Abschätzung des maximalen Elo-Wertes kommt man aber genau zu solchen Fragen, denke ich.

Benno
Parent - - By Guenter Stertenbrink Date 2016-11-14 14:08
siehe den anderen thread,
siehe Fernschach, z.B.
WM mit 53/55=96.4% Remis der top11 untereinander,
siehe Arno Nickel's Artikel und Postings
siehe TCEC superfinals
aber vor allem, siehe den obigen chart mit >500000 CCRL Partien.
Parent - - By Guenter Stertenbrink Date 2016-11-16 11:08 Edited 2016-11-16 11:38
ICCF-WM 25 (Start in 2009) : 41/45 = 91.1% Remis der top10 untereinander
ICCF-WM 26 : 28/28=100% Remis der top8 untereinander
ICCF-WM 26 : 71/78=91.0% Remis der top13 untereinander
ICCF-WM 27 : 74/78=94.9% Remis der top13 untereinander
ICCF-WM 28 :  53/55=96.4% Remis der top11 untereinander
ICCF-WM 29 : derzeit 86/89=96.6% Remis

zusammen : 325/345 = 94.2% Remis

[auf den hinteren Plaetzen laesst im Verlauf des Turniers oft
das Engagement nach, Leute werden krank oder sterben
oder treten zurueck, daher zog ich eine Grenze dort,
wo die Remisquoten abnahmen ]
Up Topic Hauptforen / CSS-Forum / Remistod ... hier noch eine nette kleine Statistik!

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill