Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / H4 oder S5 ?!
- - By Ingo B. Date 2014-06-02 17:45 Upvotes 1
Hallo all,

Was Interessantes:

Die offizielle IPON Methode zur Ranglistenberechnung ist Bayes mit mm01, Draw rate consideration:

Code:
   1 Houdini 4           3111    9    9  3300   75%  2921   31%
   2 Stockfish 5         3106    9    8  3300   75%  2921   39%
   3 Komodo 7a           3088    9    9  3300   72%  2922   37%
   4 Gull 3              3057    8    8  3300   68%  2924   41%
   5 Critter 1.4a        2980    8    8  3300   57%  2930   46%
   6 Equinox 2.02        2975    8    8  3300   56%  2930   47%
   7 Deep Rybka 4.1      2959    8    8  3300   54%  2931   45%
   8 Deep Fritz 14       2894    8    8  3300   44%  2935   45%
   9 Chiron 2            2889    8    8  3300   44%  2936   45%
  10 Protector 1.6.0     2870    8    8  3300   41%  2937   44%
  11 Hannibal 1.4b       2870    8    8  3300   41%  2937   43%
  12 Naum 4.2            2838    8    9  3300   36%  2939   41%
  13 Texel 1.04          2838    8    8  3300   37%  2939   38%
  14 Senpai 1.0          2838    8    8  3300   36%  2939   41%
  15 HIARCS 14 WCSC 32b  2812    9    9  3300   33%  2941   37%
  16 Jonny 6.00          2798    9    9  3300   31%  2942   36%


Die selben Daten mit Bayes default:

Code:
   1 Houdini 4           3111   11   11  3300   75%  2931   31%
   2 Stockfish 5         3105   10   10  3300   75%  2931   39%
   3 Komodo 7a           3088   10   10  3300   72%  2932   37%
   4 Gull 3              3057   10   10  3300   68%  2934   41%
   5 Critter 1.4a        2984   10    9  3300   57%  2939   46%
   6 Equinox 2.02        2980    9   10  3300   56%  2939   47%
   7 Deep Rybka 4.1      2964   10   10  3300   54%  2940   45%
   8 Deep Fritz 14       2905    9   10  3300   44%  2944   45%
   9 Chiron 2            2900   10   10  3300   44%  2945   45%
  10 Protector 1.6.0     2883   10   10  3300   41%  2946   44%
  11 Hannibal 1.4b       2883   10   10  3300   41%  2946   43%
  12 Naum 4.2            2854   10   10  3300   36%  2948   41%
  13 Texel 1.04          2854   10   10  3300   37%  2948   38%
  14 Senpai 1.0          2853   10   10  3300   36%  2948   41%
  15 HIARCS 14 WCSC 32b  2830   10   10  3300   33%  2949   37%
  16 Jonny 6.00          2816   10   10  3300   31%  2950   36%


So macht das Elostat:

Code:

    Program                          Elo    +   -   Games   Score   Av.Op.  Draws

  1 Stockfish 5                    : 3127   10  10  3300    74.9 %   2936   38.6 %
  2 Houdini 4                      : 3123   11  10  3300    74.5 %   2937   30.7 %
  3 Komodo 7a                      : 3103   10  10  3300    72.1 %   2938   37.0 %
  4 Gull 3                         : 3071    9   9  3300    68.0 %   2940   41.0 %
  5 Critter 1.4a                   : 2994    9   9  3300    57.0 %   2945   46.1 %
  6 Equinox 2.02                   : 2990    9   9  3300    56.3 %   2945   46.9 %
  7 Deep Rybka 4.1                 : 2974    9   9  3300    53.9 %   2947   45.2 %
  8 Deep Fritz 14                  : 2911    9   9  3300    44.4 %   2951   44.9 %
  9 Chiron 2                       : 2906    9   9  3300    43.5 %   2951   45.1 %
10 Protector 1.6.0                : 2889    9   9  3300    40.9 %   2952   44.1 %
11 Hannibal 1.4b                  : 2887    9   9  3300    40.7 %   2952   42.6 %
12 Texel 1.04                     : 2858    9   9  3300    36.5 %   2954   38.5 %
13 Naum 4.2                       : 2857    9   9  3300    36.4 %   2954   40.9 %
14 Senpai 1.0                     : 2857    9   9  3300    36.3 %   2954   40.7 %
15 HIARCS 14 WCSC 32b             : 2834   10  10  3300    33.2 %   2956   37.5 %
16 Jonny 6.00                     : 2820   10  10  3300    31.2 %   2957   35.7 %


und zum Schluß Ordo:

Code:
   # PLAYER                : RATING    POINTS  PLAYED    (%)
   1 Stockfish 5           : 3115.1    2473.0    3300   74.9%
   2 Houdini 4             : 3111.0    2458.5    3300   74.5%
   3 Komodo 7a             : 3089.3    2379.0    3300   72.1%
   4 Gull 3                : 3054.9    2245.5    3300   68.0%
   5 Critter 1.4a          : 2968.9    1882.0    3300   57.0%
   6 Equinox 2.02          : 2963.8    1859.5    3300   56.3%
   7 Deep Rybka 4.1        : 2945.6    1778.5    3300   53.9%
   8 Deep Fritz 14         : 2875.7    1464.5    3300   44.4%
   9 Chiron 2              : 2869.4    1436.5    3300   43.5%
  10 Protector 1.6.0       : 2850.1    1351.0    3300   40.9%
  11 Hannibal 1.4b         : 2848.3    1343.0    3300   40.7%
  12 Texel 1.04            : 2816.4    1204.5    3300   36.5%
  13 Naum 4.2              : 2815.5    1200.5    3300   36.4%
  14 Senpai 1.0            : 2814.9    1198.0    3300   36.3%
  15 HIARCS 14 WCSC 32b    : 2790.6    1096.0    3300   33.2%
  16 Jonny 6.00            : 2774.4    1030.0    3300   31.2%


Das ist sehr schön, so kann sich jeder das raussuchen was ihm gefällt

Gruß
Ingo
Parent - - By Frank Quisinsky Date 2014-06-02 22:22 Edited 2014-06-02 22:30
Hi Ingo,

im Grunde ist es die niedrige Remisquote von Houdini.
Gut gegen die Schwächeren, nur gegen die Stärkeren zieht das kaum noch ... sofern ich verfolge fährt Houdini hier dann die Niederlagen ein und macht keine 50% mehr. Habe jetzt bei Dir nicht im Detail geschaut, muss ich auch nicht, die Remisquote sagt im Grunde alles aus.

Die Frage wo sich Houdini nun diese Remisquote erkämpft habe ich mir auch schon längst beantwortet. Kann auch jeder andere, SWCR2 Daten runterladen und die Mittelspiel / Endspiel / Übergang Endspiel Statsitik machen die ich kürzlich gepostet habe. Dann die Partien im Detail mit "Figurenaufenthalt" untersuchen, vorher noch die Gruppe der Partien nach Anzahl Figuren auf dem Brett sortieren.

Und dann wird's deutlich mit welchen Trick der Programmierer gearbeitet hat

Mit ein wenig Geduld, Ruhe und ein paar weiteren Ideen ...

Nur, ich halte das gar nicht für so gut. Ich meine OK, die Engine wird damit Elo mäßig nach oben getrieben gegen schwächere Gegner beim Übergang Endspiel (habe etwas vorweg genommen) aber Remis zu vermeiden wenn Türme und Dame auf dem Brett sind (habe wieder etwas vorweg genommen) gar in minimal schlechterer Stellung wird gegen stärkere Gegner bestraft.

Klar, wir haben unterschiedliche Bewertungsprogramme mit minimal unterschiedlichen Ideen. Aber interessant wird's im Grunde wenn auf das entscheidende Detail geschaut wird und das hatten wir doch schon alles. Hinzu kommt lediglich eine neue Version von SF und Komodo, die haben aber indirekt nichts damit zu tun. Houdini wird den Platz halten weil zu viele Gegner in den Listen sind, die auf Übergang Endspiel nicht derart optimiert sind bzw. auf Punktausbeute optimiert sind (nicht auf Qualität der Partie selbst) ... und insofern ein Computerschach-Trick. Wohl wissend ... ich weiß ja wo die anderen schwach sind und da die Meute auf die Ratinglisten setzt nutze ich das für meine Zwecke aus und optimiere darauf

Also, die Remisquote bei Houdini ist zu mehr als 70% deswegen so niedrig weil bei mehr als 16 Figuren auf dem Brett Remis bei Schwerfiguren auf dem Brett vermieden werden bzw. versucht wird durch die Bewertung gar den Abtausch dieser zu vermeiden. Das ist der Grund ... für ca. runtergerechnet 20 Elo mehr und da im Endspiel die Übergang zum Endspiel die Partien entschieden wird wirkt dieser Umstand ca. x2.5 und macht gar 50 Elo aus, hieraus dann ca. 70% ... alleine dieser Vorteil macht also ca. 35 Elo aus. Unglaublich aber nichts anders sagt die Analyse.

Viele Grüße
und weiterhin viel Spaß beim Testen

Gruß
Frank

Übrigens um das festzustellen brauche ich keine 10.000 Partien
Die sagen mir dann in diesen Tabellen auch nichts aus.
Und das was ich beschrieben habe ist sehr sehr aufwendig in Eigenarbeit herauszufinden.
Nach wie vor, wir brauchen ein Programm für die Auswertungen der Partien der Ratinglisten.
Dann wissen wir das was wir leider aus den Listen nicht erkennen können.
Per Hand ist das sehr mühselig und selbst die Tools von Norm reichen nur bedingt ...

Bin von Bayesian weg ... halte es für falsch die Remisquote so sehr Gewicht zu geben.
Zwar stecken in Baysian die interessanteren Ansatzpunkte (gibt ja noch ein paar andere als das) aber Elostat gefällt mir besser rein von dem Gehalt dessen was dann wirklich ausgegeben wird.
Parent - - By Frank Quisinsky Date 2014-06-02 22:36 Edited 2014-06-02 23:11
Noch einer ... Statistik bestätigt Statistik ... ohne Inanspruchnahme auf den Wahrheitsgehalt aus dieser Gegen-Darstellung.

Bei einer solchen Aussage macht also die Gegenstatistik Sinn ...

Frage:
Wie würde eine Ratingliste mit Houdini aussehen wenn z. B. bis Zugnummer 25 keine Tanten mehr auf dem Feld sind.

Also alle Houdini Partien dann wieder in eine Datenbank und auswerten ...
Ergebnis: 20 Elo weniger ... nach 12 Zügen Vorgabe ... nach 20 Zügen Vorgabe mit immer weniger Figuren auf dem Brett richtig krass.

Die Statsitik wie schaut es dann bis Zug Nummer x ohne Tanten und Brüstungen aus.
Die habe ich noch nicht gemacht weil ich zu wenige Partien dafür habe ... aber wahrscheinlich die fehlenden 15 Elo.

Aussage:
Ohne Tanten und Brüstungen Houdini dann sehr wahrscheinlich die festgestellten 35 Elo schwächer.

Gruß
Frank

Also mit Pony auf dem Feld ist Houdini nicht besser bzw. erreicht z. B. keine niedrigere Remisquote (macht auch wenig Sinn, weniger zu berechnende Stellungen ... sieht die Engine bei dieser Spielstärke eh). Bei den Sprintern wird es sehr kompliziert das der richtiger Abtausch wichtig ist, den beherrscht Houdini so gut wie Rybka. Auch ein Geheimnis für die hohe Spielstärke im Übergang zum Endspiel, allerdings hat das nichts mehr mit der niedrigen Remisquote zu tun, maximal das Abtausch vermieden wird bei Schwerfiguren auf dem Feld. Und ca. 20 ELO kommen bei Houdini zusammen weil generell der Abtausch in der frühen Partiephase vermieden wird. Auch hier sind es ca. 10% weniger an Remisquote. Nur diese 10% bei den wenigen Partieentscheidungen im Mittelspiel machen maximal 20 Elo, eher 10 Elo aus.

--- Geheimnis für die hohe Elo ist also im Grunde wesentlich ... Abtausch wird bei Schwerfiguren im Übergang zum Endspiel vermieden, Remisstellungen bei den Bauernstrukturen wird aus den Weg gegangen). Das ist das ganze Houdini Geheimnis nachdem 99% vom Code gleich zu Robo ist.
Parent - - By Frank Quisinsky Date 2014-06-02 23:03 Edited 2014-06-02 23:15
Ach so, damit es noch klarer wird ...

Gegen Statistik 2:
Nehme einen beliebigen IPP Clone, in dem Fall mal den Verursacher Robbolito.

Gleiche Stats mit Robbolito ... und Bingo!
20% höhere Remisquote, Null Ahnung von Abtausch vermeiden!

Das muss in Houdini gar so krass drin sein, dass Houdini sich denkt ... auch im frühen Mittelspiel vermeide ich den Tantentausch. Da in 87% der Eröffnungen nach ECO bis Zug Nummer 12 der Tantentausch nicht vorkommt ...

Wie würde Houdini spielen wenn ich die 13% in einem Buch ansetzen würde
Vergleiche ich doch direkt mal mit den anderen IPPs

und siehe da ...
Die Spielstärke ist bei Houdini ja plötzlich nur noch 20 Elo höher und keine 100 Elo mehr. Wenn ich Vorgabestellungen nehme bei den sehr viel getauscht wird bis in Zug Nummer 20 hoch ... da macht die gute Bauerstruktur plötzlich nur noch 20 Elo aus.

Das hat alles nichts mit Menschenschach zu tun. Beim Menschenschach werden gleich viele Partien im Mittelspiel wie im Übergang zum Endspiel entschieden. Die Stats sind hier völlig anders. Schachprogramme führen uns ein wenig vor, in dem vermittelt wird ... ihr Menschen habt doch bei Schwerfiguren auf dem Feld im Übergang zum Endspiel eh keine Chance mehr. Nur bei den Menschen werden mehr Partien durch Ungenauigkeiten im Mittelspiel entschieden und die haben Engines auch noch reichlich.

Das heißt der GM kann die Engine immer noch im Mittelspiel schlagen ... vielleicht nicht Spark oder Stockfish so regelmäßig wie andere aber immerhin. Das Houdini hier bei 3.111 liegt ist viel zu hoch aufgrund dieser Tatsache. Lasse es mal 2.950 sein, mehr ist das ist im Vergleich zum Menschenschach und die Aussagen der GMs z. b. Interview mit GM Meyer bekommen dann auch das gebührende Niveau ... denn die wissen wovon sie reden. Wir nicht, wir schauen nur auf die dumme Ratingliste.

Insofern ...
Es bleibt für mich immer die Frage ...
Wie kann ich Schachprogramme besser messen als mit dummen Eng-Eng Partien ... ich teste nichts anders aus als wie gut der Übergang zum Endspiel ist und wie geschickt abgetauscht wird bzw. wie stark die Schwerfiguren zusammen wirken. Schaue ich auf eine Ratingliste schaue ich zu mir meist immer das an. Aber daraus allein besteht keine Schachpartie!

Und insofern ...
Die Idee mit Teststellungen etwas herauszufinden ist plötzlich wieder interessanter als mit Eng-Eng.
Dem Thema müssten wir mehr Interesse widmen um mehr bei den hohen Spielstärken zu erfahren.
Bei den niedrigeren Spielstärken sieht es ein wenig anders aus. Hier werden viele Partien durch die niedrigere Suchtiefe schon vergeigt wenn Stark gegen ca. 200 Elo abwärts Schwach spielt. Macht die Sache bei der Analyse dann richtig kompliziert weil zu viel einfließt was so ohne weiteres nicht mehr so schön und einfach auseinander zu nehmen ist.

Gruß
Frank
Parent - - By Peter Martan Date 2014-06-03 06:03
Frank Quisinsky schrieb:

Die Idee mit Teststellungen etwas herauszufinden ist plötzlich wieder interessanter als mit Eng-Eng.


Du meinst mit anderen Teststellungen als mit den für eng-eng gängigen?
Ja, natürlich!
Parent - - By Frank Quisinsky Date 2014-06-03 06:41 Edited 2014-06-03 06:45
Hi Peter,

mit der Einsicht, dass Stellungen mit eindeutigen Lösungen nur ein wirklich kleiner Bestandteil dessen sind was im Grunde während der Partie seltener ist.

Um herauszufinden wie setze ich was ein, dienen natürlich die Engine Partien.
Nur für Stats haben wir keine Programme und alles ist sehr aufwendig.

Bei Teststellungen haben wir nichts in folgender Richtung:

z. B. Mittelspielstellung:
Spielt die Engine den möglichen Zug g4 und einen Angriff einzuleiten, oder c3 um den Springer von a3 über c2 umzugruppieren, oder b4 um einen Angriff am Damenflügel zu spielen, oder Kh1 ... weiß nicht was ich tun soll, oder was spielt die Engine in einer Stellung in der direkt 8 Züge möglich sind. Sind das Regelzüge der Engines? .... mehrere gleiche Stellungen mit ähnlichen Konstellationen sind notwendig. Ist eine Engine stark im strategischen Bereich durch Umgruppierungen von Figuren ... wird ein Plan erarbeitet oder ist so was ansatzweise zu erkennen. Spielt die Engine die Abtäusche richtig ... vielleicht Stellungen mit denen ein Bauergewinn möglich ist aber durch falsche Läufer ein Remis wahrscheinlich ist (als Beispiel) ... etc., etc. was so möglich ist brauchen wir Teststellungen.

Im Grunde könnten wir mit einen Testset zu Bauernstrukturen und Abtäuschen im Übergang zum Endspiel gar eine Ratingliste auf hohem Niveau, meine mit spielstarken Engines clonen. Da nehmen wir 20 Stellungen und haben dann die gleichen Infos wie bei einer Ratingliste.

Der Vorteil der Ratinglisten ist meines Erachtens das Partiematerial.
Nur das Partiematerial wird derzeit nicht verwendet um mehr herauszufinden, glaube das was ich treibe machen eher wenige wenn ich mir das so ansehen was zur Diskussion gestellt wird. Das Partiematerial dient eher um Listen zu erstellen und zu versuchen mittels tausender Partien die ErrorBar nach unten zu treiben (was für ein Schwachsinn aus meiner Sicht, sorry aber es Schwachsinn weil wir nicht um einen einzige gute Info reicher sind). Auch wenn ich niemanden zu Nahe treten will aber was bringt und das bei all den anderen Beeinflussungsfaktoren die ja nicht alleine auftreten sondern meist zusammen werkeln.

Den Stellungstest müssen wir trotz vieler guter Ansätze die es in der Vergangenheit gab erst neu erfinden wenn dieser uns etwas erzählen möchte. Aber auch hier ... diejenigen die ein klares Ergebnis wollen (und Männer ticken von Natur so) werden auch hier immer nur auf erreichte Punkte schauen aber nicht auf mögliche andere Aussagen. Insofern, der wirklich gute Stellungstest wurde meines Erachtens noch gar nicht geboren auch wenn wie gesagt ein paar richtig gute Ansätze schon zu sehen waren.

Gruß
Frank
Parent - - By Peter Martan Date 2014-06-03 11:18 Edited 2014-06-03 11:26
Frank Quisinsky schrieb:

...
mit der Einsicht, dass Stellungen mit eindeutigen Lösungen nur ein wirklich kleiner Bestandteil dessen sind was im Grunde während der Partie seltener ist.
...

z. B. Mittelspielstellung:
Spielt die Engine den möglichen Zug g4 und einen Angriff einzuleiten, oder c3 um den Springer von a3 über c2 umzugruppieren, oder b4 um einen Angriff am Damenflügel zu spielen, oder Kh1 ... weiß nicht was ich tun soll,


Ich glaube, du siehst es zu kompliziert, Frank.
Dass Stellungen mit eindeutigen einzelnen best moves als Lösungen relativ selten sind, stimmt, wenn man vereinfacht meint, mit Lösungen, die sich als eindeutige best moves beweisen lassen, genau genommen müssen alle Stellungen solche haben, der Mensch ist nur mit und ohne engine- Unterstützung bei den meisten (noch) nicht imstande, sie zu finden und gegen die Alternativen ausreichend gut zu unterscheiden, aber das nur so am Rande.
Was das Bewerten von mehreren Zügen angeht, die in einer Stellung ähnlich stark sind, und den daraus folgenden Abspielen mit und ohne Zugumstellungen, hält dich ja erstmal nichts davon ab, diese Stellungen jeweils ganz ausspielen zu lassen.
Interessiert dich hingegen nur das Mittelspiel, das aus einer Mittelspielstellung entsteht, oder auch nur das späte Eröffnungsspiel nach einer frühen Eröffnungsstellung, kannst du ja eine bestimmt Variantenlänge ausspielen lassen und das Ergebnis 1, 0, 1/2 dadurch das GUI ermitteln lassen, dass du die Verhältnisse zwischen den Ausgangs- und Endevals der verschiedenen engines mit denen vergleichen, die du innert einer gewissen Range als ganze oder halbe Punkte vordefinierst.
Die numerischen Unterschiede einzelner engines bei einzelnen Stellungen werden durch das Berechnen der Verhältnisse zwischen den Ausgangs- und Endevals schon für sich großteils nivelliert, und wenn du eine Range von Steigerung um z.B. 0 bis 200% als noch-Remis definierst und im Zweifelsfall so lange weiterspielen lässt, bis Einigkeit herrscht, hast du vollends keine Sorgen mehr mit einzelnen Ausreißerwerten.
Alles klar?
Ja natürlich!
Parent - - By Frank Quisinsky Date 2014-06-03 11:30 Edited 2014-06-03 11:32
Hi Peter,

wer macht es jetzt kompliziert?




Nee, das ist viel zu kompliziert ...das Schachspiel ist schon kompliziert genug.
Mich interessiert doch nur folgendes ...

Tendiert die Engine zur Umgruppierung, zum Angriff auf den Königsflügel ... such die Engine Ihr Heil auf dem Damenflügel oder weiß die Engine mit der Stellung wenig anzufangen. Ich brauche keine eindeutige Lösung in einem Stellungstest, sondern ich brauche die Tendenz wie eine Engine vorgeht und wann und wo ich den Sklaven - die Engine - wie einzusetzen habe.

Wenn ich Fernschach spielen würde, würde ich natürlich immer die Engine suchen die meinen Stil Nahe kommt. Wenn ich denke die Stellung muss Du offen spielen wenn der Punkt eingefahren werden soll dann suche ich mir keinen Rybka aus. Wenn ich eine GM Partie Live verfolge bin ich sehr wohl in der Lage zumindest meist richtig zu beurteilen ... wo und wer hat wo die besseren Möglichkeiten. Also suche ich mir die Analyse Engine aus die ich dann zur Unterstützung verwende. Gibt natürlich dann wieder den Fall ... ups das habe ich ja gar nicht gesehen

Die Erleuchtung ist das Salz in der Suppe beim Schach!

Das was ich an einem Stellungstest hasse sind die eindeutigen Lösungen. Oftmals in der Vergangenheit wurde gar hingegangen und es wurden zu verschiedenen Schwerpunkten in einer Schachpartie mit Gewalt nach Best Moves gesucht. Das ist nicht korrekt und gaukelt uns auch nur etwas vor. Sicher sollten auch solche Stellungen in einem Test sein ... für die taktischen Fähigkeiten nicht uninteressant aber strategisch oder positionell sehen wir mit Best Moves zu wenig.

Deswegen hat mich persönlich bislang auch noch kein Stellungstest wirklich überzeugt.
Ich bin mir aber sicher das in der Richtung etwas besseres entwickelt werden könnte.

Ferner werden die Engines immer stärker das Niveau wird höher und nicht zuletzt steigert sich hierdurch auch unsere eigene Spielstärke weil wir durch intensives zusehen und der Analyse mehr lernen.

Gruß
Frank
Parent - - By Peter Martan Date 2014-06-03 11:57
Frank Quisinsky schrieb:

Das was ich an einem Stellungstest hasse sind die eindeutigen Lösungen.


Naja, das ist aber halt das eindeutig einfachste.

Und ganz ohne Lösungen geht's halt auch nicht.
Du kannst dir schon auch einfach Strategien ausdenken, nach denen kann man aber schwer bis gar nicht reproduzierbare und messbare Urteile fällen, außerdem müssen sie sich immer erst einmal umsetzen lassen, sonst sind sie eventuell auch einfach taktisch falsch.

Du brauchst keine eindeutigen einzelnen best moves, aber du brauchst interaktiv durchanalysierte Varianten, die du für (so und so sehr für eine Seite) gut erachtet hast, und denen kannst du dann in bestimmten Verlaufsranges engine- Evals als Ergebnis vordefinieren.
Kompliziert finde ich das nicht, es ist das Vorgehen, das alle User als Grundlage ihrer eigenen computerunterstützten Analysen heranziehen, soll mir doch keiner erzählen, er würde dabei nicht auf die Evals der engines schielen.
Loskommen von den Einzelwerten numerischen Outputs aber dem Bewertungsverlauf über eine bestimmte Zugzahl die entsprechende Bedeutung beimessen.

Wenn wir diesen Maßstab, den wir ständig interaktiv von den engines anlegen (lassen), nicht langsam anfangen, ein bisschen ernst und beim Wort zu nehmen, auch in der Bewertung der engines selbst, werden wir die Sache nur mehr ihnen allein überlassen können, und ob das dann noch irgendetwas mit dem menschlichen Interesse an Schach zu tun hat, ist reine Glückssache.
Parent - By Frank Quisinsky Date 2014-06-03 12:06
Hi,

vielleicht in Zeiten als wir noch Programme hatten die über echte 2200 nicht hinaus gekommen sind.

Und denke ich an Zeiten zurück als ich mit meinem ChessChallenger 7 auf CL5 (die höchste Stufe, glaube 20 Stunden pro Zug) auf ein Matt in 3 wartete (einige konnte das Gerät auf dieser Stufe finden). Aber diese Zeiten sind vorbei und eindeutiges wird immer schneller gefunden.

Ansonsten kann ich ja nachvollziehen was Du schreibst aber das was wir an Stellungstest haben ist vergleichbar mit ...

Wir fliegen von der Erde zum Mars.
Das schaffen wir ...

Interessanter ist ... wie kommen wir immer tiefer in die Galaxien!
Und da ist es eben nicht so einfach mit eindeutigen Sachen etwas herauszufinden.
Erfindergeist ist gefragt, umdenken ist gefragt.

Schließlich wollen wir doch die Engines quälen und nicht langweilen.

Gruß
Frank
Parent - - By Frank Quisinsky Date 2014-06-03 12:16 Edited 2014-06-03 12:23
Ist das einfachste ...
Wenn die Engines denken könnten, würden die sich ja in Grund und Boden kichern und sich denken ...
Fordere mich doch mal endlich ... fordere mich!

Ist das einfachste ...
Erkläre mal einen Außerirdischen der in Windeseile von 20 Galaxien Entfernung angereist ist ... technisch ein bissel mehr Ahnung hat als wir ... warum der i7 Prozessor eine Kanone ist. Der wird sich das anhören und sich denken ... mein Gott ein Neandertaler

Entweder verschwinde ich hier schnell wieder oder ich bleibe ein wenig und erzähle denen mal was Sache ist.
Und so ist es heute mit den eindeutigen Lösungen beim Stellungstest.

Das ChessChallenger 7 Prinzip mit Gewalt auf die Boliden von heute???

Gruß
Frank

Der Stellungstest wird so lange rückwirkend Früchte treiben und uns erhellen bis wir in 500 Jahren bei der wirklich schwierigsten Stellung angekommen sind.
Die Grundstellung!
Parent - - By Peter Martan Date 2014-06-03 17:14 Edited 2014-06-03 17:17
Frank Quisinsky schrieb:

Der Stellungstest wird so lange rückwirkend Früchte treiben und uns erhellen bis wir in 500 Jahren bei der wirklich schwierigsten Stellung angekommen sind.
Die Grundstellung!


Weder ist die Grundstellung die schwierigste Stellung, noch ist sie sonst irgendetwas besonderes.
Sie hat hingegen am meisten aus der Eröffnungstheorie bekannte gut durchanalysierte Abspielvarianten, der leichte Vorteil von Weiß ist bis zu vielen Folgestellungen mit Ausgleich für Schwarz oder Ausbau des Anzugsvorteils für Weiß gut dokumentiert, und die vielen bekannten Folgestellungen sind allesamt schwieriger, weil sie entweder mehr oder noch weniger Dynamik haben als die Grundstellung selbst.

Dazu kommt, dass wir zu ihr mehr komplettes Partienmaterial haben als zu irgendeiner anderen Stellung, und was Stellungstests angeht, haben wir an Computerpartien dazu auch bereits zum Saufüttern genug spielen lassen, wir nennen das nicht gern Stellungstest, ist aber auch einer.

Warum machst du dir's so unnötig schwer, Frank, wenn du nicht auf die Evals der engines schauen willst, spiel alle die Stellungen, die dich intereressieren, weiter komplett aus, sei dir nur im Klaren darüber, dass das dennoch auch nur (ausgespielte) Stellungstests bleiben, und du auch immer nur stellungsabhängige Spielstärkenergebnisse bekommst.

Ich sage ja nicht, dass die Spielstärke von der Grundstellung aus nicht die vielleicht relevanteste wäre, du testest sie nur halt auch selten rein, weil immer irgendwelche Bücher oder Testsets dreinpfuschen, macht aber auch nix, weil die 5 bis 8 Züge, die da meistens vorgegeben werden, von den heutigen engines eh schon in wenigen Sekunden im hash sind von der Grundstellung aus und am Grundstellungstestergebnis eh praktisch nix ändern.
Sie machen die Sache nur noch etwas remisträchtiger, weil der Anzugsvorteil meistens auch schon ausgeglichen ist.
Parent - - By Frank Quisinsky Date 2014-06-04 00:12
Hi Peter,

weiß nicht was Du meinst.
Das mit der Grundstellung ist ein bekannter Spruch von einem Altmeister!
Der war jetzt nur sinnbildlich gemeint.

Die Stellungsbewertung der Engines ist doch wichtig.
Für mich wichtig um z. B. jetzt mein deutlich erweitertes Buch mittels den gespielten Partien zu verbessern bzw. Stellungen raus zu nehmen.

Habe ein riesiges Buch-Update vorbereitet aber ich brauche für die Veröffentlichung noch gut und gerne 100 Stunden Editier Arbeit.
Und dann brauche ich Ruhe mit dem Buch, denke ich bin da zunächst mal da wo ich hin wollte.

Endlos-Aufgabe, hätte ich besser mit dem Buch nicht angefangen aber noch macht es Spaß und schließlich will ich es ja selbst noch ein paar Jahrzehnte einsetzen je nach dem wie lange ich das noch durchhalte mit dem Computerschach.

Gruß
Frank
Parent - - By Peter Martan Date 2014-06-04 06:24
Frank Quisinsky schrieb:

Die Stellungsbewertung der Engines ist doch wichtig.


Das will ich meinen, Frank!

Frank Quisinsky schrieb:

Für mich wichtig um z. B. jetzt mein deutlich erweitertes Buch mittels den gespielten Partien zu verbessern bzw. Stellungen raus zu nehmen.


Natürlich, genau das Beispiel schlechthin. Ich hab jahrzehntelang immer weiter ganze Spiele importiert und bis zum 20., 30., dann schon bis zum 40.Zug gespeichert, um möglichst viele möglichst tiefe Varianten drin zu haben, das ist völlig sinnlos, wenn die Sortierung am Anfang zuviel Schmarrn enthält und zuviel Zufall zulässt.
Zum Editieren braucht man Varianten, die sich im Evalverlauf unterscheiden lassen und wie weit die gespeichert sein müssen, hängt nur davon ab, wieviele forcierte und wieviele positionelle Varianten mit "gleichguten" Verzweigungen in der einzelnen vorkommen.
Nur so kann man steuern, wohin die Reise gehen soll, oft ist es vorrangig, dem Gegner nicht zuviele Antworten zuzulassen und dafür halt auch auch selbst nicht möglichst breit aufgestellt zu sein.
Was hab ich davon, wenn in meinem Buch alles zum Sizilianer drin ist und der Gegner spielt ihn nicht?
Teilbücher und Spezialbücher für bestimmte Gegner und bestimmte Gegenbücher, wie willst du das anders als über die Evals machen?
Und noch einmal: der Witz ist der Verlauf, über wieviele Züge ist die Eval im Verhältnis zum Anfang wie sehr steiger- oder senkbar.

Übrigens wäre das meiner Meinung nach auch der erfolgversprechendste Ansatz gegen die letzte große Schwäche der engines: die Festungen, die blockierten oder auch nur geschlossenen Stellungen.
Der Horizont, der durch endloses Lavieren immer wieder zu weit ins Nirvana rutscht, sieht die engine innerhalb ihres Suchhorizontes keinen Fortschritt, sollte das in die Bewertung mehr eingehen und die Suche umdirigieren, ich glaube einfach nicht, dass da schon alles ausgereizt ist, was aus Evals und Suchbaum herauszuholen wäre, das Missing Link zu Monte Carlo, nicht alles ultraschnell zum Ende durchspielen, sondern bei fehlendem Fortschritt mehr beschneiden und in andere Richtungen vertiefen.
Nur über die Evals, wie sonst?
Ja natürlich!
Parent - - By Ludwig Buergin Date 2014-06-04 09:23
Hallo Peter

Willkommen im Kreise der Buchtuner

Gruß Ludwig
Parent - - By Peter Martan Date 2014-06-04 10:00
Ach Ludwig, ich bin seit 25 Jahren von schachlicher Hauptbeschäftigung Buchmacher.
Parent - - By Ludwig Buergin Date 2014-06-04 11:20
Hallo Peter

Sorry ,wollte Dir nicht zu Nahe treten.Das war von mir als Gratulation zu Deinem Schreiben gedacht.
Hatte halt bisher immer noch etwas von Deinen Bemühungen um die Auflösung von Peters Traxler im Hinterkopf und war deshalb von Deinem Schreiben sehr angetan.

Gruß Ludwig
Parent - By Peter Martan Date 2014-06-04 12:46
Ich hatte es eh nur positiv aufgefasst, Ludwig, ich wollte nur mal wieder in Erinnerung rufen, was eigentlich ohnehin die meisten von uns allen so ständig mit den engines machen, ich bin halt zeitweise einer der Vielschreiber, während die meisten Anderen eher im Stillen werken, ich glaube aber, was die Bücher angeht, ist die Arbeit dahinter und daran durchaus eine gemeinsame, wenn wir auch alle so unsere kleinen oder großen Geheimnisse haben.
Parent - By Frank Quisinsky Date 2014-06-04 12:28
Hi Peter,

beachte aber das ich kein Buch erstelle für eine Engine sondern für alle Engines.
Hier ist das Ziel möglich alles breit ausspielen zu lassen, alle ECO codes anzuspielen mit der Gewichtung aus moderner GM-Theorie.
Mit Gewichtigung meine ich, wenn GMs B33 öfters spielen sollte es mein Buch auch tun.

Ferner setze ich Gewichtungen nur um die ECO Bandbreite nach GM-Theorie zu setzen, maßgeblich soll das Buch zufällig ausspielen.
Das ist also ein Buch für eine Ratingliste oder einem sehr langen Eng-Eng Match.

Würdest Du z. B. ein Match spielen lassen.
1.000 Partien Stockfish - Komodo dann hoffe ich das bei 1.000 Partien ...

Ca. 400 der 500 per Zufall angespielt wurden, beide Engines in ausgeglichenen Stellungen beginnen zu rechnen, die 1.000 Partien dann in etwas der GM ECO Aufteilung entsprechen und vor allem es nicht zu doppelten Partien gekommen ist. Und genau das ist eine Herausforderung.

Ich habe testweise so viele Bücher ausprobiert und schon wenn ich 50 Partien spielen lassen habe ich oft 10 gleiche ECO codes drin, doppelte Varianten etc..
Für meinen Einsatzzweck sind daher die meisten im Grunde alle Bücher die ich ausprobiert habe nicht zu gebrauchen.

Also, kein Buch mit Killervarianten (wären hier total fehl am Platz) oder sonstigen Maßgaben die vielleicht für spezielle Engine Bücher oder Bücher die auf Schachservern wichtig sind eingesetzt werden.

Gruß
Frank

PS: Und die Ergebnisse sind bislang zu ca. 90% so wie ich es mir vorstelle.
Von Version zu Version arbeite ich mich an mein eigenes Ziel durch ... bislang stecken schon ca. 1.000 Arbeitsstunden drin.
Parent - By Frank Quisinsky Date 2014-06-03 07:14 Edited 2014-06-03 07:16
Wer Dworetski liest wird schnell auf die Idee kommen ... die reinen Computerschächler ... wenn denn wir Menschen unsere Spielstärke steigern können wenn wir richtig abtauschen oder auf die Feinheiten in der Partie achten dann können wir das bedingt auch für's Computerschach einsetzen. Bin ein großer Dworetski Fan auch wenn er nicht immer verständlich zu lesen ist, denke meine Spielstärke ist auf der Kippe dessen um das oftmals alles richtig zu verstehen und stundenlang habe ich auch nicht die Lust mich immer mit einem Thema zu beschäftigen mit dem ich nicht klar komme. Dann ist der Autor zu schwer bzw. die Lektüre zu schwer.

Glaube wäre Dworetski Computerschächler ... der würde uns ganz klar erzählen können warum und weshalb aber Dworetski selbst würde dann mit meinem Problem daher kommen und oftmals das was die Engine auf diesem hohen Niveau gespielt hat nur in langer Analyse erklären können weil es ihm als Mensch nicht logisch genug ist was er oftmals sehen würde.

Also Dworetski ist gut um Schach zu verstehen und ich glaube auch gut um letztendlich mehr herauszufinden beim Computerschach hinsichtlich warum und weshalb ist der richtige Abtausch wichtig etc.. aber alles kann damit auch nicht geklärt werden.

Glaube wer wirklich einen guten Stellungstest kreiert muss denken können wie Dworetski. Und ein solches Genie ... die wachsen ja nicht auf den Bäumen. Nur im Computerschach bekommen wir es offenbar nicht hin, dass sich mehrere Personen mal wieder zusammen einfinden um dann in einem Team was auf die Beine zu stellen. Die alten Computerschächler wie Gabor oder Graham, die CEGT Leute oder auch viele andere widmen sich meist einen Thema und nicht 5 Schwerpunkten gleichzeitig ... auch wenn sie es könnten. Geht auch kopfmäßig nicht ... arbeite ich an meinen Listen und Stats fällt es mir richtig schwer umzuswitchen und wieder an dem Buch weiter zu machen. Das geht einfach nicht!

Gruß
Frank
Parent - - By Ingo B. Date 2014-06-03 06:59
Frank Quisinsky schrieb:

Hi Ingo,

im Grunde ist es die niedrige Remisquote von Houdini....


Hätte ich bis gestern auch gesagt, aber ich wurde inzwischen darauf aufmerksam gemacht das Texel 3% weniger Remisen hat als Naum und doch nur mit dem gleichen Rating geführt wird ...
Vielleicht is Bayes in solchen Grenzfällen nicht "das Gelbe vom Ei"

Diskusion auf Talkchess.

Gruß
Ingo
Parent - By Frank Quisinsky Date 2014-06-03 09:56 Edited 2014-06-03 10:22
Hi Ingo,

ja da ist bedingt etwas dran.

Sind ja nur 3% und wenn Naum gegen stärkere besser punktet dann steht Naum trotz höherer Remisqoute auch vor Texel.
Das ist der Punkt den Bayesian gut macht, halte ich für völlig richtig.

Noch besser geht es aber auch der SB Wertung hervor (die ist genial).
Siehe zum Beispiel hier ...

http://www.amateurschach.de/ftptrigger/basic-fct1-t01.html (schaue mal auf SB)
Gibt drei Fälle ...

Höhere SB Platz dahinter!
Bei dem Vergleich Junior / Texel wird's deutlich und wenn Du dann in die Tabelle schaust wird's auch deutlich.
Wie viele Punkte Junior den besseren abgenommen und und dann Texel den besseren abgenommen hat.

Wie gesagt, dass macht Bayesian richtig gut und die Ergebnisse spiegeln im Grunde immer auch die SB wieder.

Aber 9% höhere Remisquote ... bei Houdini und in der Detailanalyse wird's klar warum.

Drei Dinge macht Houdini anders als die anderen IPPs.

1. Vermeidet Remis wenn Schwerfiguren auf dem Feld sind, dadurch wahrscheinlich auch in der Eröffnung bis Zug Nummer 40 ... fast nie ein Remis bei Houdini dabei !! Schaue mal wie viele bei Stockfish.
2. Hat das drin was Rybka hat und die IPPs nicht haben. Das war damals auch in der Diskussion. Bei den schlecht lesbaren Code der IPPs (den Norman ja gerade biegte) fehlte ein großer Bereich (Endspiel). Nun gingen wir alle davon aus ... der IPP Code ist ein Rybka ... vielleicht war es so, stark modifiziert. Also, das starke Läuferspiel von Rybka, die Abtäusche von Rybka hinsichtlich der verbleibenden Bauerstrukturen ... das alles kann auch Houdini.
3. Taktisch ist Houdini besser, ca. ab Version 2.0 als die ersten Houdini Versionen (die große Änderung bei der Version 2.0).

Und Bingo entsteht der Eindruck da spielt eine andere Engine ... Nee ... nur diese Dinge macht Houdini besser als die anderen IPPs, ansonsten ist alles gleich zu den anderen.

Die extrem niedrige Remisquote befördert Houdini auf Platz 1.

Letztendlich ist für einen GM Houdini aber nicht gefährlicher als Stockfish oder Komodo. Durch die niedrige Remisquote und den Änderungen hier, werden mehr Punkte gegen die schwächeren eingefahren und meines Erachtens hat das nichts damit zu tun ob eine Engine dann letztendlich die Nummer 1 ist oder nicht. In den Listen bei vielen Engines ja ... tatsächlich würde ich sage nicht! Die Analysen zu wichtigen Partiebereichen sind bei Stockfish und Komodo ne Klasse besser und das Spiel selbst menschlicher. Das von Houdini wirkt künstlich durch diesen Trick mit der Remisquote.

Meine Meinung!
Auch wenn ich Houdini nicht mag und sich meine Meinung auch aufgrund dessen beeinflusst aber ich nutze die Engine noch nicht mal mehr für ne Analyse. Hinzukommt das sich Engines wie Komodo oder Stockfish mit mehr Zeit in die Stellung rein fressen. Die IPPs selbst finden sehr schnell und bleiben dabei.

Egal in welcher Partiephase, Houdini, gerade bei Analysen oder langen Bedenkzeiten nimmt logischer Weise immer mehr Power ab ... im Vergleich zu den anderen. Würdest Du mit verdoppelter Zeit spielen würde bei keinem Berechnungsprogramm Houdini mehr vorne stehen und wenn dann auch unter Bayesian wahrscheinlich gleich ... und mit immer mehr Zeit holen die anderen noch mehr Punkte ... und logischer Weise geht auch die Remisquote bei Houdini nach oben, denn auch die schwächeren haben dann eine höhere Remisquote und sehen im Übergang zum Endspiel mehr.

Also Remisquote steigt mit mehr Zeit bei Houdini da diese auch bei den anderen Engines steigt!
Insofern beantwortet sich die Frage von allein welche die besten Engines derzeit sind!
Hier wirken alle Listen sehr schön zusammen und zeigen uns das deutlich auf.

Gruß
Frank

Arbeite doch mit dem Trick sagen sich Komodo und Stockfish denn da kommt Houdini nicht durch mit der Stärke zum Übergang im Endspiel. Und auch Remis vermeiden in gar minimal schlechteren Stellungen wird gerade von Komodo und Stockfish in den Stärken der Partiephasen dieser Engines gnadenlos ausgenutzt. So ganz nach dem Motto ... Lieber Houdini, mit uns nicht dafür sind wir zu stark.

Weil Komodo das noch viel perfekter als Houdini spielt und Stockfish schon weit vorher die Grundsteine durch die besonders gute Taktik legt.
Was gut ist, ist der Umstand das wir mit Stockfish und Komodo zwei Engines haben, die ca. auf einem Level liegen aber komplett unterschiedlich dieses Level erreichen.
Das ist wirklich ein Eldoradoo für Fernschachspieler in Ergänzung mit den Stärken mit denen andere Engines noch daher kommen.
Parent - - By Benno Hartwig Date 2014-06-05 15:49 Edited 2014-06-05 15:51

> im Grunde ist es die niedrige Remisquote von Houdini.


Das mag gut sein.
Nur inwieweit gehen Elostat und Bayes dann so unterschiedlich damit um, dass der eine (Bayes) sagt:
   1 Houdini 4           3111   11   11  3300   75%  2931   31%
   2 Stockfish 5         3105   10   10  3300   75%  2931   39%

und der andere (Elostat) erklärt
  1 Stockfish 5                    : 3127   10  10  3300    74.9 %   2936   38.6 %
  2 Houdini 4                      : 3123   11  10  3300    74.5 %   2937   30.7 %

Klar, die absoluten ELO-Differenzen sind recht klein.
Aber woher, ganz praktisch, rühren diese unterschiedlichen Bewertungen bei schließlich identischer(!) Datenlage?
Bayes mag ja vielleicht sogar die in irgendeinem Sinne bessere Methode sein, aber was passiert da bei der Berechnung anderes?

Benno
Parent - - By Ingo B. Date 2014-06-05 16:46
Benno Hartwig schrieb:


Nur inwieweit gehen Elostat und Bayes dann so unterschiedlich damit um, dass der eine (Bayes) sagt:
<code>   1 Houdini 4           3111   11   11  3300   75%  2931   31%
   2 Stockfish 5         3105   10   10  3300   75%  2931   39% </code>
und der andere (Elostat) erklärt
<code>  1 Stockfish 5                    : 3127   10  10  3300    74.9 %   2936   38.6 %
  2 Houdini 4                      : 3123   11  10  3300    74.5 %   2937   30.7 %</code>
Klar, die absoluten ELO-Differenzen sind recht klein.
Aber woher, ganz praktisch, rühren diese unterschiedlichen Bewertungen bei schließlich identischer(!) Datenlage?
Bayes mag ja vielleicht sogar die in irgendeinem Sinne bessere Methode sein, aber was passiert da bei der Berechnung anderes?



Hallo Benno,

SO unterschiedlich sehen die das gar nicht.

Zum einen ist dein (meine) Elostatstatistik fälschlicherweise mit der falschen Basis berechnet worden. Im CCC konnte ich das noch ändern hier nicht. Die Abstände sind aber richtig. Korrekt muß es heißen:

ELOSTAT:

  1 Stockfish 5                    : 3115   10  10  3300    74.9 %   2924   38.6 %
  2 Houdini 4                      : 3111   11  10  3300    74.5 %   2925   30.7 %


Einmal 6 Elo drunter, einmal 4 Elo drüber.

Ich habe halt gerade einen "Grenzfall der Statistik" getroffen. Ein Punkt könnte sein das Bayes sagt das ein Remis das selbe ist wie ein Gewinn und ein Verlust. Nun sind ein Gewinn und ein Verlust aber 2 Spiele. also verdoppelt Bayes intern alle Remisen und macht 2 Spiele draus. Damit fallen die mehr ins Gewicht. Wenn man ORDO nimmt und alle Remisen manuel verdoppelt kommt ein Bayesranking heraus (Mit H4 vorne)! Was genau passiert weiß ich auch nicht. Es ist ein bischen unglücklich gelaufen. Hätte iche eine Enigne mehr oder weniger genommen wäre die Sache vielleicht eindeutiger ... Pech gehabt, unwichtig (de fakto sind die gleich stark, ist sowieso alles in der Errorbar, was mich nur wieder bestärkt das alles an Genauigkeit unter 10 Elo sowieso "egal" ist.)

Sei es wie es sei, ich habe mit SYLZbases nochmal nachgespielt und S5 hat 0.89% mehr erreicht, das sollte für Nr. 1 langen. Ich spiele noch S5-SÜLZ gegen DF14 und schau mal wie es dann aussieht, evtl streiche ich die S5-Nackig Version.

Gruß
Ingo
Parent - - By Thomas Müller Date 2014-06-05 17:36
na dann "passt" ja alles    juhu !!
Das da in einem anderen thread (den ich besser nicht kommentiere) so ein ballyhoo aufgemacht wird ?!??!
Jetzt habe ich es doch kommentiert, aber human 

gruß
thomas
Parent - - By Ingo B. Date 2014-06-05 19:37
Thomas Müller schrieb:

Das da in einem anderen thread (den ich besser nicht kommentiere) so ein ballyhoo aufgemacht wird ?!??!


Wo? Und wer hat ein ballyhoo aufgemacht und was ist das?

Gruß
Ingo
Parent - - By Thomas Müller Date 2014-06-05 19:51
ach nicht der rede wert...so ein listen thread
http://www.duden.de/rechtschreibung/Ballyhoo
Parent - By Ingo B. Date 2014-06-05 19:55
Thomas Müller schrieb:

ach nicht der rede wert...so ein listen thread
<a class='ura' href='http://www.duden.de/rechtschreibung/Ballyhoo'>http://www.duden.de/rechtschreibung/Ballyhoo</a>


Ballyhoo, Herkunft ungeklärt! Man lernt nie aus.

Gruß
Ingo
Parent - By Peter Martan Date 2014-06-03 06:00
Ingo B. schrieb:

Das ist sehr schön, so kann sich jeder das raussuchen was ihm gefällt


Raussuchen, auf welche Art ihm das "Wissen ist Macht, ich weiß nix, macht auch nix!" am schmackhaftesten präsentiert wird?
Ja natürlich!
Parent - - By Andreas Aicher Date 2014-06-03 13:00
interessant, dass Bayes einen Score von 75 % für beide Engines ausgeben, während Elostat und Ordo jeweils 74.9 und 74.5 ausgeben.
Rundet Bayes da auf ?
Erinnert ja fast an die legendäre US Wahl Bush gegen Gore, to close to call

Andreas
Parent - By Benno Hartwig Date 2014-06-04 09:34
Ja, vermute ich mal, aber wohl nur bei den Ausgaben.
2458.5 / 3300 ist eben 0,745
(Auch Elostat vermeldete für Houdini4 übrigens 74,5%)
Benno
Parent - By Ingo B. Date 2014-06-06 09:15
Abschließend:

S5 ohne Tbs:

   1 Houdini 4           3111    9    9  3300   75%  2921   31%
   2 Stockfish 5         3106    9    8  3300   75%  2921   39%
   3 Komodo 7a           3088    9    9  3300   72%  2922   37%
   4 Gull 3              3057    8    8  3300   68%  2924   41%
   5 Critter 1.4a        2980    8    8  3300   57%  2930   46%
   6 Equinox 2.02        2975    8    8  3300   56%  2930   47%
   7 Deep Rybka 4.1      2959    8    8  3300   54%  2931   45%
   8 Deep Fritz 14       2894    8    8  3300   44%  2935   45%
   9 Chiron 2            2889    8    8  3300   44%  2936   45%
  10 Protector 1.6.0     2870    8    8  3300   41%  2937   44%
  11 Hannibal 1.4b       2870    8    8  3300   41%  2937   43%
  12 Naum 4.2            2838    8    9  3300   36%  2939   41%
  13 Texel 1.04          2838    8    8  3300   37%  2939   38%
  14 Senpai 1.0          2838    8    8  3300   36%  2939   41%
  15 HIARCS 14 WCSC 32b  2812    9    9  3300   33%  2941   37%
  16 Jonny 6.00          2798    9    9  3300   31%  2942   36%


und mit 4 Steinern:

   1 Stockfish 5 SYZ4    3112    9    9  3300   76%  2920   39%
   2 Houdini 4           3111    9    9  3300   75%  2920   31%
   3 Komodo 7a           3086    9    8  3300   72%  2922   37%
   4 Gull 3              3057    8    8  3300   68%  2924   41%
   5 Critter 1.4a        2979    8    8  3300   57%  2929   46%
   6 Equinox 2.02        2973    8    8  3300   56%  2930   46%
   7 Deep Rybka 4.1      2958    8    8  3300   54%  2931   45%
   8 Deep Fritz 14       2895    8    8  3300   44%  2935   45%
   9 Chiron 2            2887    8    8  3300   43%  2935   45%
  10 Protector 1.6.0     2870    8    8  3300   41%  2936   44%
  11 Hannibal 1.4b       2866    8    8  3300   40%  2937   42%
  12 Texel 1.04          2838    8    9  3300   37%  2939   39%
  13 Naum 4.2            2838    8    8  3300   36%  2939   41%
  14 Senpai 1.0          2838    8    8  3300   36%  2939   41%
  15 HIARCS 14 WCSC 32b  2811    9    8  3300   33%  2940   37%
  16 Jonny 6.00          2798    9    8  3300   31%  2941   36%


Sind die 6 Elo jetzt wegen der 4 Steiner oder nur statistisches Rauschen ... keine Ahnung.

Gruß
Ingo

PS: Mehr später bei mir auf der HP
Up Topic Hauptforen / CSS-Forum / H4 oder S5 ?!

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill