Nachdenkliches ...

By Frank Quisinsky Date 2013-12-27 22:13

Hi Peter,

mit einer Sammlung von Stellungstests deckst Du ja trotzdem immer nur einen kleinen Bereich ab.
Da müsste schon eine gigantische Sammlung von Stellungen zu allen möglichen Typen von entscheidungsreifen Positionsbildern zusammenfließen. Falscher Läufer, Randbauer, etc.. Das müsste dann auch noch sehr ausgewogen sein und um das dann auch noch richtig gut zu machen muss der Ersteller selbst ein wahnsinniges Schachverständnis mitbringen (zu wirklich allen Dingen die es im Schach gibt). Das Unterfangen wird dann wirklich zu einer Lebensaufgabe (zitiere Gurevich).

Gruß
Frank

By Peter Martan Date 2013-12-28 08:28 Edited 2013-12-28 08:33

Verstehe, Frank, du willst weniger Stellungen händisch aussuchen, als du für einen Stellungstest bräuchtest und mit denen dann weiterhin viele viele Partien aber vielleicht nicht ganz so viele wie bisher von ein paar mehr und stärker verschiedenén Stellungen spielen lassen?
Ok, wäre immerhin auch ein Ansatz in die richtige Richtung, scheint mir.
Aber wie viele Stellungen willst du jetzt dann wirklich nehmen und wie viele Partien meinst du damit spielen zu müssen, um zusätzliche Aussage treffen zu können?

Bisher waren wir (

) ja damit zufrieden, uns einzureden, die 5-8zügigen ausgeglichenen Eröffnungsstellungen würden das Schach abbilden, dadurch, dass die engines dann ohnehin alles andere, was es darüber hinaus noch gäbe, selbst erfinden würden.

Wenn du jetzt andere Kriterien an "Spielstärke" anlegst, wie viel mehr Daten brauchst du für wie viel mehr Erkenntnisgewinn?
Und wieso musst du für einen Stellungstest, wenn du die Stellungen ja ohnehin ausspielen lässt, also für einen ausgespielten Stellungstest, von dem ich annahm, dass es bei deiner neuen Idee auf ihn hinausliefe, wieso brauchst du weniger Stellungen, als für einen Stellungstest, so wie du ihn dir offenbar immer noch ausschließlich vorstellen kannst? Und wenn du dir schon wirklich quantitativ Partiezahlen ersparen willst, wie wär's dann auch hier mit einem echten in between?
Z.B. Ausspielen lassen von Varianten bestimmter Länge und Vergleich von denen (dem eigentlichen Partiematerial, nicht wieder nur dem ganzen oder halben Punkt am Ende) mit Testvarianten, von denen du eine HV, ein paar Nebenvarianten und einen optimalen Evalverlauf (bei dem es ja wieder gar nicht auf Absolutwerte, sondern nur auf die Relationen ankäme) kennst?
Wie schon Michael Scheidl da so ähnlich dazu gemeint hat, müsste man ja vielleicht überhaupt nicht wieder mit dem einzigen Liebkind des bisherigen Testens, mit der Statistik, an die Sache herangehen, eine reine Verhältnismäßigkeit von einzelnen engines bei einzelnen Varianten und deren Evalverläufen würde mir persönlich immer schon genügt haben, für so etwas, was bei mir schon lange zwischen Stellungstest und Beurteilung des Spielverhaltens lag.
Die Ranglisten, die wir bisher hatten, werden wir ja weiterhin haben und mir scheint nicht, dass es weniger werden werden in der nächsten Zeit.

Ich vermute mal, du gehst immer noch davon aus, die engines würden die Vielfalt, die du ihnen nicht abverlangst, von sich aus einbringen?
Sei mir nicht böse, der Grundirrtum, ich nenne ihm mal "spielen lassen statt spielen", besteht da für mich immer noch.
Wenn du nicht selbst bestimmst, was gespielt wird, wirst du nach wie vor nicht wissen, was du getestet hast. Du wirst es vielleicht besser wissen, aber eigentlich bewegt es sich für mich immer noch in der Grauzone Zufall und Notwendigkeit, wobei die Notwendigkeit immer wieder als bias verkannt wird und der bias als Zufall.

By Frank Quisinsky Date 2013-12-28 10:39

Hi Peter,

in der Tat hatte ich immer vor einen schönen Test zu kreieren. Aber ich möchte das auch verknüpfen mit den Erkenntnissen aus einer Ratingliste. Also aus dem praktischen Spiel heraus die Schlüsselstellungen sammeln. Interessante Stellungen aus den Ratinglistenpartien sind ja sehr schön anhand vom Bewertungsdiagramm zu filtern. Das war im Grunde mein Denkfehler seinerzeit als die SWCR1 spielte. Ich löschte die Bewertungen aus den Partien heraus, welche aber richtig hilfreich sind Positionen zu sammeln. Habe derzeit aus der SWCR2 schon 722 Stellungen in meiner Blunder Datenbank. Nur wenn Engine A den Blunder spielt, spielen die meisten anderen der TOPs diesen nicht. Es wird ein Unterfangen werden die geeigneten Stellungen für einen Test herauszufiltern und diese dann in Kategorien einzuteilen.

Wollte ich eigentlich machen anstatt wieder an einer Ratinglisten zu spielen. Aber die Ratingliste SWCR1 aus der ich das Material ziehen wollte fehlen die Bewertungsdiagramme (wie gesagt hatte ich seinerzeit rausgelöscht um für die Veröffentlichung der Partien auf den Webseiten Platz zu sparen).

Derzeit sieht die Geschichte aber ganz anders aus, ich pflücke wirklich jede einzelne SWCR2 Partien im wahrsten Sinne des Wortes auseinander. Die Ratingliste benötige ich für die natürlich wichtige Information der Grundspielstärke die Partien dann für Beurteilung der Stärken und Schwächen und letztendlich die Blunder für den Versuch einen Test zu kreieren.

Wenn ich z. B. weiß das Equinox taktisch anfällig ist kann ich mir einen für Equinox eigenen Test erstellen, der genau dieses Problem angeht. Hätte ich ein paar schöne Aufgaben für den Programmierer diese vor der Veröffentlichung einer neuen Version zu prüfen.

Problematisch an dem vorgenommenen Unterfangen ist:
Ich spiele nur 20-25 Minuten Partien auf einem Core. Das heißt mit mehr Zeit finden die TOPs Ihrer Fehler meist. Auf der anderen Seite wenn ich einen Test-Set mit 500 Stellungen habe muss dieser auch schnell durchlaufen, wenn nun eine Engine mit 4Cores 3 Minuten an einer Stellung rechnen würde, würde ich ja nie zu Ergebnissen kommen. Das ist immer so ein kleines Problem wie mit dem Ratinglisten auch ... bei immer mehr Zeit werden die Ergebnisse weniger aussagekräftig. Denke ja immer das mit gut durchdachten Lösungen das Zeitproblem eingegrenzt werden kann, also mit den vorhandenen Mitteln den größtmöglichen Erfolg ...

Gruß
Frank

By Thomas Müller Date 2013-12-28 10:46

Hi Frank,

was ist denn aus dem STS geworden?
Da gabe es doch auch solche ansätze und dort gab es glaube ich 1300 stellungen.
Mal den link suchen.....

https://sites.google.com/site/strategictestsuite/

ok...seit 3 jahren wohl kein update.
Ich fand den ansatz jedenfalls gut...mal was anderes als ELOs

gruß
thomas

By Frank Quisinsky Date 2013-12-28 14:05

Hallo Thomas,

tja, hatte die Entwicklung vom Test auch gerne verfolgt. Der war nicht schlecht und es wurden wirklich vernünftige Ergebnisse produziert.
Ja, jeglicher Ansatz weg von ELO zu Alternativen ist interessant.

Was ich auch immer sehr gut gefunden habe ist es anhand von einer Stellung nicht nur den besten Zug zu bewerten. Es gab hierüber mal ein richtig gutes Schachbuch und ich jagte Mephisto I, II, III drüber. Daran hatte ich auch sehr viel Spaß. Mein Gott das ist schon mehr als 25 Jahre her.

Viele Grüße
Frank

By Thomas Müller Date 2013-12-28 15:01

ich hatte damals ein liste für mich erstellt mit 15-20 engines.
Problem war teilweise, dass es zuerst 8 waren dann 10 und jetzt sind es sogar 14 teile.
Ein neuer test müsste von anfang an stehen nicht laufend ergänzt werden.
Und beim STS sind die engines fast schneller stärker geworden als die suite gewachsen ist.
Test #1 war dann mittlerweile zu einfach. Bei lösungsquoten von über 90%.
Das ist vielleicht auch ein problem das du auch haben wirst?!
Eine teststellung sollte evtl. auch noch in 3-4 Jahren schwer genug sein?
Aber das "vorherzusagen" ist auch schwierig?!
Den EET gab es ja auch noch.
Alles nicht so einfach, aber evtl. doch lösbar!?

gruß
thomas

By Peter Martan Date 2013-12-28 12:23

Jetzt wird mir schön langsam klarer, was du vorhast und ja, find ich auch eine gute Idee, Partien auf Stellungen zu durchsuchen, wo sich Stärken und Schwächen bestimmter engines zeigen.

By Frank Quisinsky Date 2013-12-27 22:09

Hallo Benno,

je höher die Spielstärken werden desto mehr sollte es uns interessieren wie sich diese Spielstärke entschlüsselt.
Viele Diskussionen hier rund um wer ist die Nummer 1 zu welcher Zeitkontrolle etc. sind unsinnig weil der Schlüssel fehlt.
Meines Erachtens macht es mehr Sinn zunächst mal an eine Klassifizierung der Spielstärke zu arbeiten um dann die eigentlich einfache Frage "wer ist denn nun die Nummer 1" im Detail zu beantworten. Es ist ja nicht so das wir keine Möglichkeiten hätten eine Schachpartie zu klassifizieren. Hatte ja ein paar Beispiele genannt und sicherlich gibt es da noch ganz andere Ideen.

Weißt Du Benno es ist wie es immer ist mit der Entwicklung von etwas neuem.
Erinnere mich gerne an Arena ... da sagten doch zu viele zu Beginn der Entwicklung ... ja aber wir haben doch GUIs und das brauchen wir nicht denn was sollen wir damit. Ob es Arena war, ob es die Diskussionen zu den Endspieldatenbanken, zu den Protokollen egal zu was. Was wir zunächst mal nicht kennen benötigen wir nicht. Was wir dann aber haben wird auf Dauer gefeiert und gerne genutzt. Und genau hier setze ich an, ELO allein ist zu wenig und die ewigen Diskussionen um ELO sind in meinen Augen unsinnig (wenn es wirklich nur um die blanken Zahlen geht).

Stimme Dir zu das das Niveau derzeit zu hoch ist. Aber wir haben so viele Helfer im Statistik Bereich und es ist ja nicht so das uns die Phantasie für statistische Auswertungen ausgeht.

Viele Grüße
Frank

By Hauke Lutz Date 2013-12-28 02:55

Hallo Frank,

es macht grundsätzlich Sinn eine Schachpartie nicht als ein Ganzes anzusehen, sondern für die einzelnen Abschnitte eine Bewertung abzugeben.
Es stellt sich nur die Frage wie man sowas sinnvoll umsetzen möchte.
Hast du da schon einen spruchreifen Vorschlag, wie man z.B. feststellt das Engine 1 im frühen Mittelspiel einer geschlossenen Stellung besser ist als Engine 2?

Gruß
Hauke

By Frank Quisinsky Date 2013-12-28 04:03

Hallo Hauke,

gibt im Grunde zwei Möglichkeiten wie ich mir z. B. behelfe.

1. Die einfachere, haben ja derzeit leider keine Software die das für uns macht, bzw. es geht schon mit den Tools von Norm Pollack, Lyabko (schneiden von Partien) und einem guten Texteditor, Datenbank.

Nimmst die Remispartien, Gewinnpartien, Verlustpartien und fertigst zu jeder Engine drei Datenbanken.
Die Remispartien sortierst Du grob in 4 Kategorien nach Zugnummer von, bis ..

Die Gewinnpartien / Verlustpartien sortierst Du händisch in diese 4 Kategorien je nachdem wann die Entscheidung der Partie erfolgte.

Als Ergebnis hast du vier Datenbanken, benennst die Engine um in ...
Stockfish 1, Stockfish 2, Stockfish 3 und Stockfish 4.

fügst dann die Datenbanken wieder zu der Hauptdatenbank aller Partien und machst eine einfache Auswertung mit ELOstat oder Bayes, Ordo. Vorher natürlich eine Auswertung aller Stockfish Partien. Schnell erkennst Du wie stark Stockfish in den einzelnen Partiephasen ist.

--- Weg 1, noch sehr einfach ... etwas aufwendig aber noch einfach ---
Ein Tool könnte das sehr schnell erledigen!

2. Eleganter aber sehr aufwendig ...
Zwei Datenbanken erstellen. Gewinnpartien und Verlustpartien herausfiltern. Dann die durchschnittliche Stellungsbewertung nach Zug 20, 21, 22 aller Partien bis Zugnummer x errechnen lassen. Es entsteht eine nette Kurve an der erkannt werden kann wann durchschnittlich die Partie kippte. Optimal wäre es nun diese Kurve zu beeinflussen nach Anzahl der verbliebenden Figuren auf dem Brett. Die Remispartien sind hier auch nicht uninteressant, zumal es viele Partien gibt die schon entschieden waren und dann noch zu einem Remis kippten. Diese kannst Du aber schon nach Möglichkeit 1 herausfiltern.

Hast Du Dir mal eine solche Arbeit gemacht, kannst Du dann mit den Daten spielen. Sortieren nach ECO etc..

Hätten wir z. B. Tools die das erledigen würden könnte das immer weiter optimiert werden, verschiedene Variablen hinzugefügt oder weggelassen werden. Vor allem ist es interessant die Kurven der einzelnen Engines dann aufeinander zu legen. Engines wie Stockfish oder Junior setzen sich sehr schön von anderen Engines ab. Oder Quazar ... Fruit, Shredder. Im Grunde fertigst Du ein statistische Kurve die Aufschluss über besonders starke oder schwache Partiephasen ausgibt.

Könnte das weiter im Detail beschreiben, aber es würde ein ziemlich langer Beitrag werden und ich weiß nicht ob es sich hier und jetzt wirklich lohnen würde. Bin selbst immer am versuchen die einzelnen Schritte meist mit Texteditoren so zu optimieren das mir schnelle Auswirkungen gelingen. Das ist echt eine nette Spielerei mit Excel und wirklich was für Statistik Freaks.

Gruß
Frank

By Hauke Lutz Date 2013-12-28 04:26

Also schlägst du im Prinzip ne grafische Auswertung vor, welche eine aufwendige Vorarbeit mit sich zieht.

By Frank Quisinsky Date 2013-12-28 10:41

Hallo Lutz,

und deswegen brauchen wir einfache Tools die das lösen.
Das ist der Aufhänger ...

Es fehlt gute Software um die Sklaven besser einzusetzen und herausfinden wo liegen denn die Stärken und auch Schwächen.
Durch die händischen Auswertungen wird vieles klar aber es ist alles sehr aufwendig und meines Erachtens besser lösbar.

Muss mal versuchen Martin Blume hierfür zu begeistern!

Gruß
Frank

By Hauke Lutz Date 2013-12-28 12:21

Ich wünsche Dir dabei viel Erfolg!

By Chess Player Date 2013-12-27 18:22

Ich muss gestehen, dass ich auch nichts verstanden habe!

By Guest Date 2013-12-27 19:54

ich muss gestehen, das mein Posting (Attribute betreffend) eigentlich ironisch gemeint war.
Nichts für ungut, und allen einen guten Rutsch ins neue Jahr.

By Dieter Kraft Date 2013-12-27 21:21

Das war doch auch ohne Ihr outing klar!
Dieter

By Guest Date 2013-12-28 10:33

Motor Punkte
1: Stockfish_13121918_x64_m 27,5/48 =11=10=0010====1=10===10=11=========1======1=1=1
2: Houdini_4_Pro_x64A 20,5/48 =00=01=1101====0=01===01=00=========0======0=0=0

48 Partien gespielt / Turnier beendet
Name des Turniers: H4-ST1912 Pondern (je 2 CPU) Spielstufe: Blitz 20/10
und wieder ein kurzer Stockfishsieg. letzter Buchzug 6.....c5

Event:

Ort:

Datum:

Weiss:

Schwarz:

Ergebnis

Board

Horst

By Tom Paul Date 2013-12-28 12:46

Das Superfinale und Stage 4 bieten auch ein paar interessante Vorgabestellungen, wo Stockfish diese Stellungen sowohl mit weiß als auch mit schwarz gewonnen hatte. Bzw. Komodo.

Partie 1 Remis, 2 1-0
Partie 3, 4 0-1
Partie 5 1-0, 6 Remis
Partie 7, 8 0-1
Partie 9, 10 Remis
Partie 11, 12 1-0
Partie 13, 14 Remis
Partie 15, 16 Remis
Partie 17 Remis, 18 1-0
Partie 19, 20 Remis
Partie 21, 22 Remis
Partie 23, 24 Remis
Partie 25 0-1, 26 1-0 z.B. Diese Stellung, die verlierer Engine muss hier mehr falsch machen, da sie sowohl mit weiß als auch mit schwarz verliert.
Partie 27 0-1, 28 Remis
Partie 29, 30 Remis
Partie 31, 32 Remis
Partie 33, 34 Remis
Partie 35 1-0, 36 Remis
Partie 37, 38 Remis
Partie 39, 40 0-1
Partie 41 1-0, 42 Remis
Partie 43 1-0, 44 Remis
Partie 45, 46 Remis
Partie 47 Remis, 48 1-0

Das macht dann 30x Remis.
3, 4
7, 8
11, 12
39, 40
Waren aber auch immer nach Farbwechsel von der selben Seite (also entweder 2x Weiß oder 2x Schwarz) gewonnen.
Somit haben wir 38 Remis aus 48 Partien.
Das macht dann 2.08 x 38 = 79.04% Remis Quote

Deshalb wäre es sinnvoller mit 90+15 oder 60+15 zu spielen, sonst haben wir nächstes Superfinale 100% Remis.
Bei über 80% Remis gibt es schon fast eine Garantie, dass das Superfinale unentschieden endet.

By Klaus Meier Date 2013-12-29 11:34 Edited 2013-12-29 11:42

Hallo Frank,

Du kannst eine Spielstärkebewertungsfunktion (Methode) beliebig komplex oder beliebig kompliziert machen.
Die Frage ist : was ist der Vorteil, wenn es sehr kompex wird. Ein Vorteil könnte sein,das die Bewertung genauer wird.
Der Nachteil wird sein, das es kaum noch handhabbar wird. z.B. wenn alle Positionsbewertungen für jeden Zug einer Partie mit berücksichtigt werden sollen um diese
in eine Spielstärkebwertungsfunktion einfliessen zu lassen.

Einfach und überschaubar wird es, wenn lediglich die simplen Spielergebnise berücksichtigt werden.

Nach diesem Muster ist das simple Spielstärke-Bewertungssystem "ELO" gestrickt.

Diese ELO-Systematik ist streng genommen jedoch nur für sehr schwache Spieler mit weniger als etwa
1400 ELO-Punkten korrekt. Das betrifft etwa Spielstärken zwischen 900 und 1300 ELO-Punkten
Das liegt daran:
Spieler unterhalb 1400 ELO spielen schwach, so das sie noch nicht gelernt haben, z.b. den Anzugvorteil (WEISS) vorteilhaft umzusetzen.
Deshalb ist nach ELO-Systematik bei bei Spielern mit ELO-Differenz=0 die Punkterwartung = 50% egal ob mit WEISS oder SCHWARZ gespielt wird.
Spieler mit Spielstärken ab 1400 haben jedoch schon gelernt, den Anzugvorteil vorteilhaft umzusetzen so das für WEISS sich eine Punkteerwartung von größer 50% ergibt, etwa 54% ergibt und das allein wegen dem Anzugvorteil. Das Spielergebniss ist also auch nicht mehr zufällig, der Spieler mit WEISS hat ab 1400 ELO schon gelernt den Anzugvorteil zu nutzen. Allein diese Tatsache ist in der ELO-Systematik nicht berücksichtigt. Also ist jede ELO-Zahl größer 1400 schon allen wegen dieses simplen Fehlers im ELO-Bewertungssystem falsch sobald sich die Bewertung auf Menschen bezieht. Jedoch sind die Mehrzahl der MEnschen eher schwache Schachspieler, so das ein solches ELO-Berertungssystem hier einen Sinn macht. Die ELO-Systematik ist jedoch grundsätzlich , sobald sie auf stärkere Schachspieler angewendet wird, schon im theoretischen Ansatz falsch.

Bei Schachcomputern ist es anderes. Bei Schachcomputern ist es meines Wissens nicht wirklich untersucht. Die klassische ELO-Systematik wird hier einfach übernommen und für die Schachcomputer-Spielstärkenbewertung ebenfalls eingesetzt. Hier ist natürlich leicht Kritik anbringbar. Aber muss ein verbessertes Bewertungssystem für Schachcomputer besonders kompliziert sein ? Ich meine nicht. Eher das Gegenteil ist der Fall. Ein Lerneffekt spielt bei Schachprogrammen wohl eine viel geringere Rolle, als beim Menschen. Vermutlich sind Schachprogramme auch mit geringen Spielstärkern in der Lage einen Anzugvorteil mit WEISS vorteilhaft zu nutzen. Jedoch heutzutage werden Schachcomputer mit Spielstärken unterhalb 1400 sowieso kaum noch jemanden intressieren. Für Schachcomputer ist ein Spielstärke-Bewertungssystem gefordert, welches praktisch aussschliesslich auf hohe Spielstärken zugeschnitten ist. Also auch eine gute Unterscheidbarkeit zwischen sehr starken Schachprogrammen ermöglicht. Dies zu erreichenmit möglichst wenig Aufwand und mit einer möglichst simplen und eingängigen Methode, könnte eine Herausforderung sein. Vermutlich wird es aber sehr schwierig sein, selbst ein geniales neuese Bewertungssystem gegen die alte und weit verbreitete ELO-Systematik durchzusetzen. Vermutlich wird schon allein der Versuch auf eine Zeitverschwendung hinauslaufen.

By Guest Date 2013-12-29 12:57

Klaus Meier schrieb:

Vermutlich sind Schachprogramme auch mit geringen Spielstärkern in der Lage einen Anzugvorteil mit WEISS vorteilhaft zu nutzen.

Wie ist das bei Schachprogrammen wirklich ?
Ich glaube für einen Schachcomputer spielt es keine Rolle, ob er mit WEISS spielt oder mit SCHWARZ.
Das macht nur beim Menschen einen Unterschied in der Punkte-Erwartung aus oder ?

By Klaus Meier Date 2013-12-30 12:38

Guest schrieb:

Hallo,
wie das bei Schachcomputern aussieht in der Punkteerwartung in Abhängigkeit der Seitenwahl,
und zwei gleichstarken Programmen, dazu habe ich momentan nicht genügend Informationen.
Ist aber kein Problem, ich komme mit einer konkreten Antwort auf die Frage zurück, sobald mir ausreichende
Informationen dazu bekannt sind.
Mit freundlichen Grüßen

By Benno Hartwig Date 2013-12-30 18:50

> Ich glaube für einen Schachcomputer spielt es keine Rolle, ob er mit WEISS spielt oder mit SCHWARZ.

Da glaubst du wohl falsch.

Beispiel:
http://www.husvankempen.de/nunn/40_40%20Rating%20List/40_40%20All%20Versions/rangliste.html
White Perf. : 54.8 %
Black Perf. : 45.2 %
bei immerhin 710076 Partien.

Benno

By Klaus Meier Date 2013-12-31 01:19

Benno Hartwig schrieb:

Da glaubst du wohl falsch.

Beispiel:
<a class='urs' href='http://www.husvankempen.de/nunn/40_40%20Rating%20List/40_40%20All%20Versions/rangliste.html'>http://www.husvankempen.de/nunn/40_40%20Rating%20List/40_40%20All%20Versions/rangliste.html</a>
White Perf. : 54.8 %
Black Perf. : 45.2 %
bei immerhin 710076 Partien.

Benno

Wie kommst du auf diese Zahlen ?
(Hab mal nachgezählt in der Tabelle sind 1418328 Partieen in der Summe angegeben
Summe Draws: 525467
Summe White gwinnt : 446579
Summe Black gewinnt : 446282

==>
White Perf.: 50,02%
Black Perf. : 49,98%
(bei 1418328 Partien)

demnach können Schachcomputerprogramme den Anzugvorteil nicht
umsetzen. Schachcomputer spielen also eher so wie Zufallsgeneratoren.
Jedenfalls deutet die Tabelle auf der WEBseite das recht klar an.

By Klaus Meier Date 2013-12-31 15:05 Edited 2013-12-31 15:15

Benno Hartwig schrieb:

Irgend etwas stimmt bei diesen Angaben aus ELOSTAT
nicht mit der gesamten Tabelle überein.
Aber egal. Die Tabelle ist intressant.
Einige Engines etwa oberhalb 2600 ELO
können scheinbar schon einen Anzugvorteil (White Perf. >50%)
umsetzen oder kommen zumindest schon nahe an 50%.
Rybka fällt häufig auf mit White-Perf. >50% :

   no    Programm    ELO + - White Perf. [%]
104    Rybka 3 2912 +17-17    50.05
161    Rybka 2.3 2826 +24-24    54.60 *
162    Rybka 2.3 2822 +23-23    55.75 *
168    Rybka 2.3.1 2818 +19-19    54.95 *
181    Rybka 2.1 2810 +13-13    54.25 *
182    Rybka 2.0 2809 +26-26    65.85
214   Stockfish 1.5.1 2782 +68-68    67.95
228    Thinker 5.4Ci 2771 +68-68    50.70
238    Rybka 1.1 2765 +17-17    71.10
240   Protector 1.3.6 2764 +78-78    51.70
250    Rybka   1.2f 2759 +12-12    51.75
258    Rybka 2.3.1 2754 +21-21    50.75
276    Rybka 2.2 2744 +16-16    50.80
292    Rybka   1.2f 2737 +25-25    58.35
304    Rybka 2.3 2726 +48-48    51.30
308    Rybka   1.01 2724 +25-25    66.20
347    Rybka 1.1 2701 +14-14    58.75
360    Rybka   1.01 2697 +37-37    64.80
408   BugChess2 v.1.9 2670 +79-79    61.10
413    Rybka   1.01 2669 +27-27    59.80
437    Tornado 4.4 2654 +78-78    60.25
449 Umko 1.0 2649 +62-62    49.50
547 Bobcat   2.75 2599 +73-73    48.55
1120    Tytan   8.75 2220 +85-85    48.20

By Klaus Meier Date 2013-12-31 15:51

Klaus Meier schrieb:

Huch...
Statt "White Perf."
muss es heissen: "Gewinnquote"
ob nun mit WEISS oder mit SCHWARZ gespielt wurde, und
gewonnen wurde geht aus der Ratingliste
http://www.husvankempen.de/nunn/40_40%20Rating%20List/40_40%20All%20Versions/rangliste.html
leider nicht hervor.
Diese Rating-Listen bieten keine besonders aussagefähige Datengrundlage.
Geeignete Spielergebnisse aus Computer-Computer-Matches sind leider so gut wie nicht zu bekommen.