Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Stockfish 1.6 added to the IPON List
- - By Ingo Bauer Date 2009-12-28 00:16
http://www.inwoba.de

more games will follow

Bye
Ingo
Parent - - By Patrick Götz (Mod.) Date 2009-12-28 02:17
Vielen Dank!

Eine wirklich beeindruckende Leistung von Stockfish 1.6

Stockfish 1.6 x64         2840
Rybka 2.3.2a mp x64     2811

Gruß
Patrick
Parent - By Patrick Götz (Mod.) Date 2009-12-29 11:08
[quote="Patrick Götz"]

Stockfish 1.6 x64         2840
Rybka 2.3.2a mp x64     2811

[/quote]

Wenn man sich dann noch sieht das Stockfish 1.5.1  auf dem gleichen Level mit Rybka 1.2f  ist

Rybka 1.2f x64         2769  
Stockfish 1.5.1 x64   2769

...wird einen ersteinmal klar dass das Update von 1.5.1 auf 1.6 deutlich mehr Elozuwachs gebraucht hat als ein Jahr lang Rybka Entwicklungszeit:

Rybka 1.2f -> 2.3.2a : +42 Elo
Stockfish 1.5.1->1.6 : +71 Elo

Einfach unglaublich beeindruckend!
Parent - - By Michael Scheidl Date 2009-12-28 04:15
In den FRC-Ratings(*) bei CCRL ist Stockfish 1.6 nach 700 Partien ebenfalls an Naum 4 sowie (knapp) an Shredder 12 vorbeigezogen:

http://www.computerchess.org.uk/ccrl/404FRC/

*) Chess960 auf Singlecore, 40/4m und ponder off

Also m.o.w. dasselbe Bild unter relativ unterschiedlichen Testbedingungen.
Parent - - By Ingo Bauer Date 2009-12-28 09:26
[quote="Michael Scheidl"]
...
Also m.o.w. dasselbe Bild unter relativ unterschiedlichen Testbedingungen....
[/quote]

"m.o.w."?

Was ist das?

Gruß
Ingo
Parent - By Michael Scheidl Date 2009-12-28 10:13
Abk. für "mehr oder weniger".
Parent - - By Ingo Bauer Date 2009-12-29 00:21
Now 1500 games for Stockfish 1.6.

Stockfish is 2nd best single engine now.

Bye
Ingo

PS: and some small changes regarding the former leader!
Parent - - By Michael Scheidl Date 2009-12-29 01:27
Danke, das tolle Rating wurde also bestätigt bzw. liegt nun sehr verläßlich bei ca. +70 gegenüber Stockfish 1.5.1.

Zitat:
No engines with fake programmer names are accepted!

Das ist aber eine "Lex Robbo", eine sog. Anlaßgesetzgebung. Ich kann verstehen, daß man manchmal geneigt ist zu solchen Notlösungen zu greifen, um unliebsamen Diskussionen auszuweichen und sich nicht die Abneigung mancher Personen zuzuziehen. Es wäre zwar interessant gewesen, ob und wer sich beschwert hätte (oder schon hat?) wenn Du Robbolito drin gelassen hättest, und mit welchen Begründungen... aber es ist klar daß man solchen Ärger lieber vermeidet.

Es soll allerdings auch schon echte oder vermeintliche Clones mit realen, richtigen Programmierernamen gegeben haben, also ein Allheilmittel ist diese Regel sowieso auch keine.

Ich kann nicht behaupten daß ich eine optimale Patentlösung aus dem Ärmel schütteln könnte, wenn ich mich in derselben Situation befände. Ich würde vermutlich zögern eine Engine zu verbannen, solange überhaupt nichts greifbares vorliegt.
Parent - - By Ingo Bauer Date 2009-12-29 15:06
Hallo Michael,

[quote="Michael Scheidl"]
Danke, das tolle Rating wurde also bestätigt bzw. liegt nun sehr verläßlich bei ca. +70 gegenüber Stockfish 1.5.1.

Zitat:
No engines with fake programmer names are accepted!

Das ist aber eine "Lex Robbo", eine sog. Anlaßgesetzgebung. Ich kann verstehen, daß man manchmal geneigt ist zu solchen Notlösungen zu greifen,


Notlösung ja, aber aus anderem Grund als du vermutest.

[quote="Michael Scheidl"]
...um unliebsamen Diskussionen auszuweichen und sich nicht die Abneigung mancher Personen zuzuziehen. Es wäre zwar interessant gewesen, ob und wer sich beschwert hätte (oder schon hat?) wenn Du Robbolito drin gelassen hättest, und mit welchen Begründungen... aber es ist klar daß man solchen Ärger lieber vermeidet.


Eigentlich gehe ich keinen verbalen Streit aus dem Weg
Ich habe es mir nicht einfach gemacht. Nach meiner Prüfung sehe ich mich Aufgrund meines Wissens nicht in der Lage endgültig zu Entscheiden ob Robbo geklaut ist ober nicht. Ich hatte aufgrund folgender Überlegung Robbo ursprünglich in meine Liste aufgenommen:

Die Robbomacher haben sich R3 angesehen und einen wichtigen Teil decompiliert, dann verstanden und dann neu programmiert. Danach haben sie verschiedenen Versatzstücke aus anderen Programmen genommen und Robbo als eine Art Frankenstein zusammengebaut. Was die anderen Programme betrifft kann ich es nicht sagen, aber der Rybkateil mag moralisch verwerflich, rechtlich aber haltbar sein. (Wikipedia: Softwarepatente). Da ich weiterhin annehme das praktisch keine Engineprogrammierer ein Patent auf ein Verfahren seiner Engine angemeldet hat (bekommt er auch kaum) bliebe also nur das Copyright, und das betrifft nur direktes Kopieren.

Insofern war ich erstmal zufrieden, wenngleich sich mein Gewissen regte. Also habe ich eine lange Reihe Programmierer angeschrieben und um Standpunkte gebeten, in der Hoffnung dort eine berufenere Meinungen zu lesen. Ich habe einige Antworten erhalten, die wie die Foren von absolut Schwarz bis völlig Weiß reichen (Wie beim Schach - wen wunderts)

Also kam ich mit Hilfe auf die Idee mit dem Namen. Solange einige honorige Personen den Programmierernamen einer Engine anerkennen teste ich die Engine (Lenin gehört nicht zu der Gruppe der Namen).

[quote="Michael Scheidl"]
Es soll allerdings auch schon echte oder vermeintliche Clones mit realen, richtigen Programmierernamen gegeben haben, also ein Allheilmittel ist diese Regel sowieso auch keine.


Meine obige Regel passt auch da, das war ja das was mich fasziniert hat. Wenn eine echte Person etwas klaut, dann muß sich der Programmierer um das einhalten der Regeln kümmern, und nicht ich als Ranglistenmacher. Unfair ist in dem Zusammenhang halt ein Fakename. Da kann der Programmierer nicht einschreiten ... also halte ich Fakenamen für mich als Ranglistenmacher für das größere Übel, nicht den "Clone".

[quote="Michael Scheidl"]
Ich kann nicht behaupten daß ich eine optimale Patentlösung aus dem Ärmel schütteln könnte, wenn ich mich in derselben Situation befände. Ich würde vermutlich zögern eine Engine zu verbannen, solange überhaupt nichts greifbares vorliegt.


Das einzig Greifbare ist der offensichtlich falsche Name! Je mehr ich darüber nachdenke, desto besser finde ich die Regel!

Gruß
Ingo
Parent - - By Günther Höhne Date 2009-12-29 15:33 Edited 2009-12-29 15:40
[quote="Ingo Bauer"]
Das einzig Greifbare ist der offensichtlich falsche Name! Je mehr ich darüber nachdenke, desto besser finde ich die Regel!
[/quote]

Hallo Ingo,

und genau das ist auch der Grund warum CCRL,CEGT und WBEC den Motor nicht "anfassen". Und auch bei ChessWar wird man keinen Robbolito sehen..

Gruß
Günther
Parent - By Ingo Bauer Date 2009-12-29 15:45
[quote="Günther Höhne"]
[quote="Ingo Bauer"]
Das einzig Greifbare ist der offensichtlich falsche Name! Je mehr ich darüber nachdenke, desto besser finde ich die Regel!
[/quote]

Hallo Ingo,

und genau das ist auch der Grund warum CCRL,CEGT und WBEC den Motor nicht "anfassen". Und auch bei ChessWar wird man keinen Robbolito sehen..

Gruß
Günther
[/quote]

Ja, und ich will nochmal darauf hinweisen das ich nicht entscheiden kann ob die Engine geklaut ist oder nicht!

Ansonsten bin ich sicher das alle genannten Listen mindestens schon Teile von Robbo testen - und 2010 wird das noch deutlich mehr werden - nur heißt das dann anders ...

Gruß
Ingo
Parent - - By Michael Scheidl Date 2009-12-30 01:08
Zitat:
Also habe ich eine lange Reihe Programmierer angeschrieben und um Standpunkte gebeten, in der Hoffnung dort eine berufenere Meinungen zu lesen. Ich habe einige Antworten erhalten, die wie die Foren von absolut Schwarz bis völlig Weiß reichen (Wie beim Schach - wen wunderts)

Das zeugt von einem bewundernswerten Fleiß bei der Entscheidungsfindung. Das unklare Resultat der Umfrage ist ebenfalls lehrreich.

Die IPON-Engineratings halte ich jedenfalls trotzdem für eine der qualitativ besten Ranglisten hinsichtlich Methodik, Aktualität und Präsentation.
Parent - - By Ingo Bauer Date 2009-12-30 08:05
Hallo Michael,

[quote="Michael Scheidl"]
...
Die IPON-Engineratings halte ich jedenfalls trotzdem für eine der qualitativ besten Ranglisten hinsichtlich Methodik, Aktualität und Präsentation.
[/quote]

Vielen Dank für das Lob. Ich werde mich weiterhin bemühen.
Was die Aktualität betrifft weiß ich aber nicht ob ich das Tempo halten kann und will! Ich ich kann auf jeden Fall nicht die 100ste Engine testen ... die Top 20 mit ordentlicher Implementation habe ich aber als Ziel.

Gruß
Ingo
Parent - - By Frank Quisinsky Date 2009-12-30 21:36
Hi,

die Präsentation der Ratingliste gefällt mir auch.
Werde auch später in der Schach-Welt noch auf die Ratinglisten hinweisen, bevorzugt auf die Liste von Ingo (er spielt mit Ponder).

Ist für mich auch eine schöne Ergänzung, denn Ingo spielt mit 64bit.

Vergleichen kann ich dennoch die Ergebnisse nur begrenzt, weil ich mit 32Bit spiele und die Partien mehr als doppelt so lange dauern wie bei Ingo. Allerdings glaube ich nicht das sich das statistisch arg bemerkbar macht (Unterschied der Bedenkzeit von Ingo zu unserer Liste). Ingo spielt auch mit Aufgabefaktor, ich lasse bis zum Matt spielen. Von daher wird Ingo mehr Partien produzieren können

Von meiner Seite auch ein Kompliment.
Mir gefällt die Liste und der Aufbau von Ingo sehr gut !!

Gruß
Frank

PS: Habe auch einige Ideen zu der Darstellung der Ratingliste. Mal schauen ob ich das nicht vielleicht vorziehe und die ganzen Seiten schon Anfang Januar erstelle.
Parent - - By Ingo Bauer Date 2009-12-30 22:47
Auch dir ein Dank,

ich werde sehen das sich auch nächstes Jahr noch etwas bewegt

Gruß
Ingo
Parent - - By Frank Quisinsky Date 2009-12-31 14:02 Edited 2009-12-31 14:04
Hi Ingo,

schüre jetzt aber nicht zu viel Konkurrenzdenken zwischen uns
Komme ja gar nicht mehr mit und stehe unter Zugzwang

Nein, mache ruhig weiter so.
Verfolge das sehr gerne und aus Deinen Ideen der Umsetzung resultieren dann auch wieder andere und die Kausalkette nimmt Ihren Lauf.

Bei der Schach-Welt gab es noch ein paar Darstellungsprobleme mit Tabellen.
Ein Grund warum ich z. B. bei dem verwendeten System die Umsetzung unserer Ratingliste noch zurücklegen musste.
Sollen aber jetzt behoben sein, werde ich ausprobieren.

Zu Deiner Liste:
Du hast ja Rybka 3 32Bit und 64Bit integriert.
Würde es gut finden wenn Du bei allen Engines die wirklich deutliche Unterschiede zwischen 32Bit und 64Bit zeigen den Vergleich einführst. Zum Beispiel auch bei ZapChess. Das reicht ja völlig aus bzw. wäre besser als wenn Du jetzt in Deiner 64Bit Liste auch alle 32Bit integrierst. Dachte ich mir so bei der Betrachtung ...

Gut wäre es auch wenn wir z. B. die Listen hinsichtlich ELO anpassen würden.
Ich halte mich an der Meinung von GMs bzw. eigenen Statistiken von Comp-Human Partien. Rybka 3 auf einem herkömmlichen Rechner (32Bit, 1 Core soll ca. bei 2900 liegen). Setze Rybka selbst mit 2.925 an. Zwecks besserer Vergleichbarkeit wäre es schön zu vereinheitlichen. In diesem Fall dann wenn Du vielleicht die ELOs anpassen könntest.

So haben wir nicht alle unterschiedliche Zahlen die auch in die Irre führen.
Da Du mit Ponder spielt, ich selbst mit Ponder spielen lasse wäre es gut wenn sich zumindest auf Dauer unsere Liste anpassen würden.
Denke mal drüber nach ...

Viele Grüße
Frank

PS: Optimal wäre dann Rybka 3 32Bit zum eichen mit ELO 2.925 !!
Wir können dann auch später gegenseitig verlinken, wenn ich mit meiner Umsetzung fertig bin.
Parent - - By Ingo Bauer Date 2009-12-31 14:12
[quote="Frank Quisinsky"]
...

So haben wir nicht alle unterschiedliche Zahlen die auch in die Irre führen.
Da Du mit Ponder spielt, ich selbst mit Ponder spielen lasse wäre es gut wenn sich zumindest auf Dauer unsere Liste anpassen würden.
Denke mal drüber nach ...
[/quote]

Das brauche ich nicht, finde ich grundsätzlich eine interessante Idee.

[quote="Frank Quisinsky"]
PS: Optimal wäre dann Rybka 3 32Bit zum eichen mit ELO 2.925 !!
[/quote]

Es sträubt sich in mir eine Single Engine auf 3000er Niveau zu sehen. Wenn R3-32 auf 2925 steht, steht die 64bit Version auf 2975 und Robbo knackt die 3000. Spätestens 2010 werden da vielleicht noch mehr folgen - insofern ist mir das zu hoch.
Weiterhin sollte man nicht die beste ENgine als "Anker" verwenden, sieht nach zu viel Aufmerksamkeit aus - sprich: Ich muß nochmal darüber nachdenken was ein guter Fixpunkt ist/wäre.

Gruß und guten Rutsch
Ingo
Parent - - By Frank Quisinsky Date 2009-12-31 14:22
Hi Ingo,

sehr gut !!
Wir können uns dann austauschen, wäre auch bereit meine Liste herunterzusetzen.

Bedenke aber:
Wir haben in der kommenden Schach-Welt ein Interview mit GM Georg Meier. Er ist in Deutschland derzeit die Nummer 2 mit ca. 2.675 ELO. Es sind auch einige Kommentare von Geo hinsichtlich Spielstärke von Rybka 3 enthalten. Geo und auch andere GMs sind der Meinung das Rybka 3 auf einem herkömmlichen PC (die GMs setzen meist schnelle Notebooks ein, sind ja viel unterwegs) mit ca. 2.900 ELO spielt.

Dummerweise habe ich nicht nachgefragt ob er 2 Cores meint. Kann Geo mal anmailen und die Folgefrage stellen. Allerdings wird er dann sicherlich schreiben, Frank so sehr beschäftige ich mich mit diesem Thema nicht ... also kann ich mir das auch sparen

Gehe auch ungerne zu hoch, denke wir haben die gleiche Meinung.
Aber in der Tat scheint Rybka 3 mit einem Core und 32Bit wirklich ca. bei 2.900 zu liegen.

Berücksichtige das dann bei Deiner Betrachungsweise.
Wichtig ist, dass wir dann auch wirklich auf eine Engine eichen.
Zwischen unseren Listen würde sich natürlich Rybka 3 32Bit dann anbieten.

Denke mit Rybka 3 32Bit dann auch 2.875 ELO hätte ich auch kein Problem.
Wie gesagt, würde mich hier auch anpassen ...

Du bist niedriger, ich bin höher ... 2.875 wäre ca. die Mitte

Gruß
Frank
Parent - - By Ingo Bauer Date 2009-12-31 16:41
Hallo,

Ich habe jetzt mal deine und meine Liste angesehen.

1. Ich würde ungern eine Single Engine über 3000 pushen (auch wenn das irgendwann passiert, egal was wir ansetzen)
2. Ich würde ungern an der besten Engine eichen
3. Du willst nicht zu tief gehen
4. Du willst eine 32 bit Rybka Engine.

Also 32bit Rybka hat bei mir nicht viele Spiele, ob der ein guter Anker ist bezweifle ich. Shredder 12 hingegen ist mir ein guter Kompromiss - die 32 und 64 bit Version sind praktisch identisch und ich habe viele Spiele ...
Wohin festsetzen ...?
Ich habe S12 im Moment bei 2815/2816, du bei 2851. Eine schöne Runde Zahl für ich wäre 2800, aber eigentlich ist es "Wurst".

Vorschlag 1 von mir: 2800 für S12 (x32)
Vorschlag 2 von mir: 2825

Wobei der letzte natürlich R3 + viele 2010er Engines in die Nähe von 3000 rückt (aber wie gesagt, früher oder später kommen wir sowieso dahin). Die 2800 sind einfach schön rund - na wie wärs?

Gruß
Ingo

PS: Das mit dem Verlinken ist auch ok, will sowieso noch alle anderen Ranglisten verlinken um Vergleiche zu ermöglichen.
Parent - - By Frank Quisinsky Date 2009-12-31 17:20
Hallo Ingo,

OK, nehmen wir Shredder 12 (1 Core, 32-Bit) und setzen 2.800 ELO fest. Das ist einfach und vielleicht passen sich die anderen Betreiber von Ratinglisten ja noch an. Rybka 3 32Bit liegt dann ca. bei 2.860 und ich halte das auch für OK. Lieber etwas zu tief als zu hoch ansetzen.

Komme aber erst ca. am 04.01. dazu das neu zu berechnen bzw. versuche dann auch den Anfang zu den Ratinglisten Seiten zu finden.
Diese Arbeit sollte ja in zwei Tagen erledigt sein (Erstellung der ersten Ratinglisten Seiten auf Schach-Welt).

Gruß
Frank
Parent - - By Ingo Bauer Date 2009-12-31 17:30
Moin

Bei meinem nächsten Update steht S12-32 auf 2800!

Rutsch gut und Prost
Ingo
Parent - - By Michael Scheidl Date 2010-01-01 01:52
Die FIDE-ähnlichen Zahlen finde ich seit langem problematisch, denn sie suggerieren vom Zahlenniveau her eine Kalibrierung, die es nicht gibt. Niemand weiß ob 3000 Punkte für irgendeine aktuelle gute Engine bezogen auf FIDE-Ratings zu hoch oder sogar zu niedrig sind.

Viele Leute gehen sicherlich mit der Frage "wie stark ist Engine X im Vergleich zu Y" auf Ratingseiten, nicht mit der Frage "wie stark ist Engine XY auf Zeitkontrolle soundso und auf genau dieser Hardware"... Daß Ratings eigentlich bezogen auf Hardware bzw. CPU und -Cores und die Bedenkzeit gesehen werden müssen, trägt zur Klarheit nicht bei. Aus demselben Grund halte ich auch die paar Resultate von Man vs. Machine-Matches die es gibt, von Vorgabepartien etc. ohnehin abgesehen, für ungeeignet um sie sozusagen rechnerisch benutzen zu können. Alles unter verschiedenen Bedingungen. Diese haben lediglich gezeigt daß Computerschachengines im allgemeinen "irgendwie übermenschlich stark" sind, nichts genaueres.

Ich fürchte, ein Festsetzen einer Wertung deutlich unter 3000 bei einer Top-3-Engine (wenn nicht sogar weiteren) kann dazu führen, daß Engines am unteren Ende der Skala unterbewertet aussehen. Das ist ein Eindruck der von der SSDF bekannt ist, obwohl das seinerzeit m.E. auch eher nur auf Einschätzungen beruhte, und kaum auf methodischen Vergleichen mit Spielern die Verbandsratings hatten. Aber der praktisch einhellige Tenor war, daß damals die lineare Abwertung um 100 Punkte - weil die Ratings an der Spitze quasi optisch zu hoch wurden - zu einer Unterbewertung diverser Schachcomputer am unteren Ende führte, relativ zu "gefühlten" menschlichen Spielstärken.

In der CCRL-Single/32 Bit-Liste steht Rybka 3 auf 3095 und alle Top-10 sind über 2900. Eine an sich starke Engine wie Nimzo 8 steht auf 2612 (SSDF: 2553, aber von Museumshardware) oder Hiarcs 9 auf 2720 (SSDF: 2739 mit Athlon/1200).

Ich würde eine alte, aber weit verbreitete Engine wie z.B. Fritz 8 als Bezugsengine und Untergrenze hernehmen und auf Null fixieren. D.h. die Ratings anderer Engines könnten dann als "...um soviel stärker als Fritz 8" gelesen werden. Die Ratings würden sich offenbar in einem Bereich von 0...400 befinden, sodaß eine Verwechslung mit FIDE-Ratings ausgeschlossen ist. Die Informationen über Rangfolge und Abstände bliebe erhalten.

(CCRL hat das zu Beginn auch so ähnlich gemacht, aber leider nicht beibehalten.)

P.S. Bei Fritz 8 könnte man auf Bilbao 2004/2005 verweisen, obwohl ich nicht sicher bin ob es 2005 noch Fritz 8 oder schon Fritz 9 war.
http://en.wikipedia.org/wiki/Man_vs_Machine_World_Team_Championship
Die Partienzahl war ganz gering, die Gegner dafür bekannte Top-GM bis rauf zu Topalov.
Parent - - By Werner Schüle Date 2010-01-01 10:47
Hallo zusammen,
zuerst die Info: unsere Liste basiert auf Shredder 9.1 mit 2750.
Ich könnte versuchen, unseren Statistiker zu einer anderen Referenz-Engine zu überreden. Die müsste dann aber möglichst viele Spiele schon haben, wie z.B.
138 Deep Shredder 11 w32 1CPU 2888 10 10 3089
Euer Vorschlag passt nicht so gut bei CEGT.
PS: das ist meine private Ansicht - es ist noch nichts diskutiert in der Gruppe.

Gruß
Werner
Parent - By Ingo Bauer Date 2010-01-01 12:22 Edited 2010-01-01 12:26
Hallo Werner

[quote="Werner Schüle"]
Hallo zusammen,
zuerst die Info: unsere Liste basiert auf Shredder 9.1 mit 2750.
Ich könnte versuchen, unseren Statistiker zu einer anderen Referenz-Engine zu überreden. Die müsste dann aber möglichst viele Spiele schon haben, wie z.B.
138 Deep Shredder 11 w32 1CPU 2888 10 10 3089
Euer Vorschlag passt nicht so gut bei CEGT.
PS: das ist meine private Ansicht - es ist noch nichts diskutiert in der Gruppe.

Gruß
Werner
[/quote]

Ich bin SOFORT bereit mit der CEGT und Frank Q. nach einem Kompromiss zu suchen!!!

DS11 32bit ist mir auch recht, zur Not spiele ich den ein, aber 2888 ist mir deutlich zu hoch! Mailt ich mal an, dann diskutieren wir das "offline"!

Gruß
Ingo
Parent - - By Ingo Bauer Date 2010-01-01 12:34
Hallo Michael,

[quote="Michael Scheidl"]
Die FIDE-ähnlichen Zahlen finde ich seit langem problematisch,...

Viele Leute gehen sicherlich mit der Frage "wie stark ist Engine X im Vergleich zu Y" auf Ratingseiten,...
Daß Ratings eigentlich bezogen auf Hardware bzw. CPU und -Cores und die Bedenkzeit gesehen werden müssen...
Aus demselben Grund halte ich auch die paar Resultate von Man vs. Machine-Matches die es gibt,..., für ungeeignet ...

Ich fürchte, ein Festsetzen einer Wertung deutlich unter 3000 bei einer Top-3-Engine (wenn nicht sogar weiteren) kann dazu führen, daß Engines am unteren Ende der Skala unterbewertet aussehen....

Ich würde... auf Null fixieren...

[/quote]

Ich stimme dir da bei allem zu, ich bin aber auch sicher das bekommst du nicht an den Duchschnitsschachspieler vermittelt. Der kleinste gemeinsame Nenner dürfte sein, dass die gegenwärtigen TOP-Engines auf einer aktuellen CPU als SINGLE auf menschlichem Super-GM Niveau spielen. Wenn man also die Engine-Spitze um 2800 Elo setzt macht man nicht so viel falsch. Das die unteren zu tief liegen ist auch mein Eindruck, liegt aber daran das die Menschen schlicht zu wenig Partien spielen (man überlege sich mal die Abweichung )

Sprich, auf 0 setzen wäre toll, geht aber nicht, weil man dann aus dem erklären per Email nicht raus kommt.

Gruß
Ing
Parent - - By Michael Scheidl Date 2010-01-01 13:08
An den Erklärungsbedarf habe ich auch gedacht gehabt, aber dem sollte eigentlich durch einen klaren Kommentar direkt bei der Liste (nicht an anderer Stelle) vorzubeugen sein. Also etwas wie

Das Rating stellt die Spielstärkedifferenz zu Engine... dar.

(oder so ähnlich)

Aber ich sehe schon ein, daß der Vorschlag zu radikal ist, weil einfach zu viele Leute "aus allen Wolken" fallen würden wenn sie plötzlich Zahlen von 0...400 sähen statt von 2700...3100 oder so, und vielleicht nicht gleich verstehen daß ihnen das dieselbe Information bietet, nur ohne willkürliche Niveaufestsetzung zwecks FIDE-Ähnlichkeit.

Allerdings wäre es schon ein Fortschritt, wenn sich mehrere Listen, hoffentlich auch inkl. CCRL, auf dieselbe "Kalibrier-Engine" und ein bestimmtes Rating dafür einigen würden. Mir ist zwar nicht klar wie eine plausible, begründbare Herleitung von so einem Rating aussehen soll, aber das werdet ihr schon machen...
Parent - By Frank Quisinsky Date 2010-01-02 15:14
Hi Michael,

genau, denn für die Betrachter wäre eine Vereinheitlichung der Berechnungsgrundlage auch wesentlich einfacher.

Würde bedeuten:

1. Engine auf die geeicht wird.
Shredder 12, 1 CPU, 32Bit = 2.800 ELO

2. Programm mit dem berechnet wird.
Bayes oder ELostat oder bei keiner Einigung mit Beiden.

Mit Ingo bin ich mir ja im Grunde einig und es wäre gut wenn so eine Art Standard festgelegt werden könnte.

Gruß
Frank
Up Topic Hauptforen / CSS-Forum / Stockfish 1.6 added to the IPON List

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill