Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / SWCR2: Stockfish 08.02.2014 SSE42 x64 gestartet ...
- - By Frank Quisinsky Date 2014-02-09 00:32
Hallo zusammen,

nun läuft Stockfish 08.02.2014 SSE42 x64 mit Syzygybases (alle gestesteten Versionen je mit Syzygybases in meiner SWCR2).
Hatte auf einem zweiten Intel System einen Quick Test laufen (Q9550, 200 Partien).

Prognose demnach ca. 10 ELO stärker als Houdini 4.0 STD x64 A und mithin unter meinen Bedingungen wahrscheinlich die neue Nummer 1.
Bei der Prognose von GullChess 2.8 lag ich mit meinem Quick Test nur 3 ELO daneben
Lassen wir uns überraschen ob die Prognose auch diesmal hält.

Der Test läuft wieder 8 Tage und wer beobachten möchte ...

Frank's Chess Page
http://www.amateurschach.de

Gruß
Frank
Parent - - By Tom Paul Date 2014-02-11 10:11
Stockfish 08.02.14 SSE42 x64 - Equinox 2.02 x64 (2972)  9.0 - 10.0  47.37%  Perf=2954
Da drängt sich mir die Frage auf warum?
Wäre das nicht passiert, dann hätte Stockfish vielleicht bei 14 - 5 über 3000 ELO?
Der Rest, gegen die anderen Engines, ist wie erwartet.
Wurde Equinox speziell auf 40 in 5 getunt?
Gab es zu oft zu früh Remis?
Parent - - By Frank Quisinsky Date 2014-02-11 11:30
Hi Tom,

kann es mir auch nicht erklären.
Zufallsergebnis?

Equinox nehme ich bald aus der Liste raus (private Engines teste ich zukünftig nicht mehr).
Würde das Ergebnis ganz verschwinden wäre SF ziemlich nah an Houdini dran.

Mal schauen wie das weiter geht aber es sieht noch nicht danach aus das SF Houdini überholt.

Gruß
Frank
Parent - - By Tom Paul Date 2014-02-11 18:41
Stockfish 08.02.14 SSE42 x64 - Houdini 4 STD x64 A (3108)        13.5  -  8.5    61.36%    Perf=3188
Stockfish 08.02.14 SSE42 x64 - Komodo TCECr x64 (3043)           14.0  -  8.0    63.64%    Perf=3140
Stockfish 08.02.14 SSE42 x64 - GullChess 2.8 Beta x64 BMI2 (3014)15.5  -  6.5    70.45%    Perf=3164
Stockfish 08.02.14 SSE42 x64 - Equinox 2.02 x64 (2972)          11.0  -  11.0    50.00%    Perf=2972 XXX
Stockfish 08.02.14 SSE42 x64 - Rybka 4.1 SSE42 x64 (2950)        16.0  -  6.0    72.73%    Perf=3120
Stockfish 08.02.14 SSE42 x64 - Chiron 2.0 x64 (2894)             16.0  -  6.0    72.73%    Perf=3064 X
Stockfish 08.02.14 SSE42 x64 - Hannibal 1.4b x64 (2859)          16.0  -  6.0    72.73%    Perf=3029 XX
Stockfish 08.02.14 SSE42 x64 - Protector 1.5.0 JA x64 (2842)     18.5  -  3.5    84.09%    Perf=3131
Stockfish 08.02.14 SSE42 x64 - Naum 4.2 x64 (2833)               19.0  -  3.0    86.36%    Perf=3153
Stockfish 08.02.14 SSE42 x64 - Hiarcs 14 WCSC w32 (2822)         18.0  -  4.0    81.82%    Perf=3083 X
Stockfish 08.02.14 SSE42 x64 - Jonny 6.00 Yokohama x64 (2820)    16.5  -  4.5    78.57%    Perf=3045 XX
Stockfish 08.02.14 SSE42 x64 - Sjeng c't 2010 w32 (2795)         18.0  -  3.0    85.71%    Perf=3106
Stockfish 08.02.14 SSE42 x64 - Texel 1.03 x64 (2790)             16.5  -  4.5    78.57%    Perf=3015 XX
Stockfish 08.02.14 SSE42 x64 - Shredder 12 x64 (2785)            16.5  -  4.5    78.57%    Perf=3010 XX
Stockfish 08.02.14 SSE42 x64 - Junior 13.8.04 Yokohama x64 (2782)19.0  -  2.0    90.48%    Perf=3173
Stockfish 08.02.14 SSE42 x64 - Spike 1.4 Leiden w32 (2781)       19.0  -  2.0    90.48%    Perf=3172
Stockfish 08.02.14 SSE42 x64 - Quazar 0.4 x64 (2754)             19.0  -  2.0    90.48%    Perf=3145
Stockfish 08.02.14 SSE42 x64 - Spark 1.0 x64 (2753)              18.5  -  2.5    88.10%    Perf=3100
Stockfish 08.02.14 SSE42 x64 - Booot 5.2.0 x64 (2752)            20.0  -  1.0    95.24%    Perf=3272
Stockfish 08.02.14 SSE42 x64 - SmarThink 1.50 SSE3 x64 (2690)    18.5  -  2.5    88.10%    Perf=3037 XX
                                                               339.0  -  91.0    78.84%    Perf=3081


XXX steht für sehr schlechte Performance gegen Engine XY, unter 3000 ELO.
XX steht für schlechte Performance gegen Engine XY, zwischen 3000-3049 ELO.
X steht für schwache Performance gegen Engine XY, zwischen 3050-3099 ELO.

Jetzt stellt sich mir die Frage warum Stockfish ausgerechnet gegen diese Engines so eine schlechte Performance hat?
Haben einige der Engines bestimmte Gemeinsamkeiten untereinander, mit denen Stockfish nicht so gut zurecht kommt?
Vielleicht ein aggressiver Spielstil?
Spielen diese Engines oft auf Remis z.B. beim Angriff verschätzt und es gab nur noch Dauerschach?
Gute Mischung aus taktischer Stärke und Positionellem Spiel?
Parent - - By Frank Quisinsky Date 2014-02-11 19:06
Hi Tom,

das ist aber normal nach der Anzahl der bisherigen Partien.
Kannst ja auch die Frage stellen, warum so viele Ergebnisse weiter über 3.100 bis hin zu über 3.200 Elo gehen.

In der Regel gleichen sich mit mehr Partien dann die Ergebnisse wieder aus bzw. gehen auf das tatsächliche durchschnittliche Niveau.

Wohl auch der Grund warum so viele Engine Tester dann meinen sie müssten 100, 300 bis zu 1.000 Partien pro Match spielen und innerhalb eines Matches die ErrorBar gering zu halten. Lasse selbst 50 Partien spielen und denke die reichen auch aus. Es ist sehr unwahrscheinlich das nach 50 Partien die grobe Tendenz nicht stimmt. Diese Tendenz braucht auch nur grob sein, weil durch die anderen 20 Ergebnisse das Gleichgewicht wieder hergestellt ist. Natürlich wären mehr Partien besser aber nicht gerne hierzu diskutiert wird dann ...

Unterschiedliche Gegner produzieren unterschiedliche Ergebnisse.
Hat eine Engine nun wirklich einen Angstgegner und diese Engine taucht als Gegner nicht auf, oder taucht doppelt auf (z. B. wegen Clone) dann verzerrt trotz mehr Partien die Liste erheblich und die vielen Partien mehr verlieren den Einfluss der Genauigkeit.

Aber in der Regel ist an Deiner Feststellung etwas dran bzw. auch meine Beobachtung:
Stockfish hat mit ruhigen Engines wie z. B. Naum oder Komodo, GullChess  oder Sjeng kaum Probleme. Taktisch starke Engines punkten dann schon eher mal. Und so wird die Aussage "Angstgegner" plausibel.

Im laufenden Spießroutenlauf aber in der Tat interessant wie es gegen Equinox weiter geht.

Hier mal zwei Beispiele zur obigen Aussage:

Code:
GullChess 2.8 Beta x64 BMI2 - Houdini 4 STD x64 A (3098)  16.0 - 34.0  32.00%  Perf=2968
GullChess 2.8 Beta x64 BMI2 - Stockfish 05.12.13 SSE42 x64 (3066)  20.0 - 30.0  40.00%  Perf=2996
GullChess 2.8 Beta x64 BMI2 - Komodo TCECr x64 (3046)  28.0 - 22.0  56.00%  Perf=3087
GullChess 2.8 Beta x64 BMI2 - Equinox 2.02 x64 (2974)  29.0 - 21.0  58.00%  Perf=3030
GullChess 2.8 Beta x64 BMI2 - Rybka 4.1 SSE42 x64 (2950)  29.5 - 20.5  59.00%  Perf=3013
GullChess 2.8 Beta x64 BMI2 - Chiron 2.0 x64 (2893)  32.0 - 18.0  64.00%  Perf=2992
GullChess 2.8 Beta x64 BMI2 - Hannibal 1.4b x64 (2862)  37.5 - 12.5  75.00%  Perf=3052
GullChess 2.8 Beta x64 BMI2 - Protector 1.5.0 JA x64 (2844)  40.0 - 10.0  80.00%  Perf=3084
GullChess 2.8 Beta x64 BMI2 - Naum 4.2 x64 (2833)  35.0 - 15.0  70.00%  Perf=2980
GullChess 2.8 Beta x64 BMI2 - Hiarcs 14 WCSC w32 (2824)  38.5 - 11.5  77.00%  Perf=3033
GullChess 2.8 Beta x64 BMI2 - Jonny 6.00 Yokohama x64 (2824)  41.5 - 8.5  83.00%  Perf=3099
GullChess 2.8 Beta x64 BMI2 - Sjeng c't 2010 w32 (2798)  41.0 - 9.0  82.00%  Perf=3061
GullChess 2.8 Beta x64 BMI2 - Texel 1.03 x64 (2792)  38.5 - 11.5  77.00%  Perf=3001
GullChess 2.8 Beta x64 BMI2 - Junior 13.8.04 Yokohama x64 (2787)  43.0 - 7.0  86.00%  Perf=3102
GullChess 2.8 Beta x64 BMI2 - Shredder 12 x64 (2785)  35.5 - 14.5  71.00%  Perf=2940
GullChess 2.8 Beta x64 BMI2 - Spike 1.4 Leiden w32 (2780)  37.5 - 12.5  75.00%  Perf=2970
GullChess 2.8 Beta x64 BMI2 - Booot 5.2.0 x64 (2757)  43.5 - 6.5  87.00%  Perf=3087
GullChess 2.8 Beta x64 BMI2 - Quazar 0.4 x64 (2757)  42.0 - 8.0  84.00%  Perf=3045
GullChess 2.8 Beta x64 BMI2 - Spark 1.0 x64 (2756)  42.0 - 8.0  84.00%  Perf=3044
GullChess 2.8 Beta x64 BMI2 - SmarThink 1.50 SSE3 x64 (2694)  44.5 - 5.5  89.00%  Perf=3057
  714.5 - 285.5  71.45%  Perf=3015


Code:
Stockfish 05.12.13 SSE42 x64 - Houdini 3 Pro x64 (3056)  30.5 - 19.5  61.00%  Perf=3133
Stockfish 05.12.13 SSE42 x64 - Komodo 6 x64 (3014)  28.0 - 22.0  56.00%  Perf=3055
Stockfish 05.12.13 SSE42 x64 - Critter 1.6a x64 (2983)  30.0 - 20.0  60.00%  Perf=3053
Stockfish 05.12.13 SSE42 x64 - Equinox 2.00 x64 (2972)  31.5 - 18.5  63.00%  Perf=3064
Stockfish 05.12.13 SSE42 x64 - Bouquet 1.8 x64 (2960)  31.5 - 18.5  63.00%  Perf=3052
Stockfish 05.12.13 SSE42 x64 - GullChess 2.2 x64 (2957)  29.5 - 20.5  59.00%  Perf=3020
Stockfish 05.12.13 SSE42 x64 - Rybka 4.1 SSE42 x64 (2950)  35.0 - 15.0  70.00%  Perf=3097
Stockfish 05.12.13 SSE42 x64 - Hannibal 1.4b x64 (2859)  38.5 - 11.5  77.00%  Perf=3068
Stockfish 05.12.13 SSE42 x64 - Chiron 1.5 x64 (2844)  38.0 - 12.0  76.00%  Perf=3044
Stockfish 05.12.13 SSE42 x64 - Protector 1.5.0 JA x64 (2841)  42.5 - 7.5  85.00%  Perf=3142
Stockfish 05.12.13 SSE42 x64 - Jonny 6.00 Yokohama x64 (2830)  41.0 - 9.0  82.00%  Perf=3093
Stockfish 05.12.13 SSE42 x64 - Naum 4.2 x64 (2829)  40.5 - 9.5  81.00%  Perf=3080
Stockfish 05.12.13 SSE42 x64 - Hiarcs 14 WCSC w32 (2827)  40.5 - 9.5  81.00%  Perf=3078
Stockfish 05.12.13 SSE42 x64 - Sjeng c't 2010 w32 (2796)  41.5 - 8.5  83.00%  Perf=3071
Stockfish 05.12.13 SSE42 x64 - Junior 13.8.04 Yokohama x64 (2790)  42.0 - 8.0  84.00%  Perf=3078
Stockfish 05.12.13 SSE42 x64 - Shredder 12 x64 (2786)  41.0 - 9.0  82.00%  Perf=3049
Stockfish 05.12.13 SSE42 x64 - Spike 1.4 Leiden w32 (2777)  43.5 - 6.5  87.00%  Perf=3107
Stockfish 05.12.13 SSE42 x64 - Quazar 0.4 x64 (2763)  44.0 - 6.0  88.00%  Perf=3109
Stockfish 05.12.13 SSE42 x64 - Spark 1.0 x64 (2758)  43.0 - 7.0  86.00%  Perf=3073
Stockfish 05.12.13 SSE42 x64 - Booot 5.2.0 x64 (2749)  42.0 - 8.0  84.00%  Perf=3037
  754.0 - 246.0  75.40%  Perf=3061
Parent - - By Ernest Bonnem Date 2014-02-11 19:30
Frank Quisinsky schrieb:
das ist aber normal nach der Anzahl der bisherigen Partien.

Naja, endlich!, Frank!  
Parent - - By Frank Quisinsky Date 2014-02-11 19:43
Hi,

freue Dich nicht zu früh!

Hier gleichen 20 Engines Zufallsresultate im Gesamtresultat einzelner aus. Insofern sind für aussagekräftige Ergebnisse bei vielen Gegnern weniger Partien notwendig. An diesen Aussagen werde ich auch nie etwas ändern weil es einfach Fakt ist und noch schlichter ... nachvollziehbar für jeden ist der sich mit den zur Verfügung gestellten Daten ernsthaft beschäftigt.

Natürlich richtig ist, dass wenn es jemand um ein Einzelmatch geht die 50 Partien zwar schon grob gesehen gut sind, aber besser sind in der Tat 100 oder optimal im Grunde 300 (wie es Ingo jetzt treibt). Was dann über 300 hinaus geht wird nur bei vielen gleichen Engines oder im Grunde wenigen unterschiedlichen Engines noch sehr geringfügige Auswirkungen haben. So gesehen auch nachvollziehbar das Stefan 1.000 pro Match spielen lässt. Gibt so viele Dinge die alle beachtet werden müssen und ineinander greifen.

Pauschale Aussagen sind kaum möglich bzw. könnten möglich sein wenn die Conditions klar sind.

Gruß
Frank
Parent - - By Ernest Bonnem Date 2014-02-11 23:46
OK, Frank!
Aber wenn ich so was lese:

Von Tom Paul Datum 2014-02-11 11:11
Stockfish 08.02.14 SSE42 x64 - Equinox 2.02 x64 (2972)  9.0 - 10.0  47.37%  Perf=2954
Da drängt sich mir die Frage auf warum?


   
Parent - - By Frank Quisinsky Date 2014-02-12 15:59
Hi Ernest,

also das wäre dann mal sein ein Fall der im Grunde aber wirklich selten ist.
Derzeit korrigiert ja SF das Equinox Ergebnis der ersten Partien.
9:10 sah wirklich sehr ungewöhnlich aus.

Interessant auch das Ergebnis gegen Shredder 12.
Aber Shredder 12 hält ausgesprochen gut im Mittelspiel dagegen und kommt es dann zu einem ausgeglichenen Endspiel hält Shredder oftmals auch hier.
Aber wahrscheinlich auch nur ein Zufall.

Mal abwarten wie das ausgeht.

Gruß
Frank

PS: Auch wenn wir wissen das es zu solchen Zufällen kommt biste immer am Zweifeln wenn Du dann mal ein solches Ergebnis hast.
Parent - - By Ernest Bonnem Date 2014-02-13 18:39
Frank Quisinsky schrieb:
ein Fall der im Grunde aber wirklich selten ist.

Nichts ist selten mit nur 19 Partien!...  

(bereits weiß man nichts auf + - = ... 
Chris Whittington nennt Die, die von Statistik nichts wissen/verstehen, "useful idiots")
Parent - - By Frank Quisinsky Date 2014-02-13 23:55
Hallo Ernest,

musst immer den Umstand bei der Betrachtung Aufmerksamkeit schenken.
Viele Engines, ausgeglichene Bedingungen und ca. 110-120 ELO Unterschied.
Da ist nach 19 Partien die Wahrscheinlichkeit schon sehr niedrig das es zu einen solchen Aussetzer kommt.

Kann mich bei den ca. 180.000 gespielten Partien an 3 oder 4 von solchen Fällen erinnern.
Aber sicher ist, solche Dinge passieren!

Statistik ist immer so ein Thema.
Ich vertrete die Auffassung das statistische Grundsätze nicht immer 1:1 aufs Computerschach übertragen werden können. Dafür fehlt es an Beweisen und noch interessanter an Fakten, denn die sehen meist anders aus. Wahrscheinlich ist alles statistisch gesehen viel einfacher als wir denken, denken zu müssen

Dieses dämliche Hobby, irgendwann werfe ich den ganzen Scheiß aus dem Fenster raus.



Gruß
Frank
Parent - By Ernest Bonnem Date 2014-02-14 17:56
Frank Quisinsky schrieb:
...und ca. 110-120 ELO Unterschied.
Da ist nach 19 Partien die Wahrscheinlichkeit schon sehr niedrig das es zu einen solchen Aussetzer kommt.

Come on, Frank!
Da kannst Du ja selbst die Error-Bar rechnen (mit Remis-Faktor ungef. 50%):
95% Error-Bar = ca. ± 114 Elo
Also selten, aber nicht unwahrscheinlich...
Parent - - By Tom Paul Date 2014-02-13 19:10
Testest du Stockfish mit deinem aktuellen oder dem kaputten Buch?

Habe bei mir früher festgestellt, dass wenn die Eröffnung zu positiv oder zu negativ ist, dann kann es passieren, dass eine Engine zwischendurch oder auch ganz bis zum Schluss mehr Punkte als Stockfish hat.
Oder überraschend gut gegen Stockfish Punkte holt.
Parent - - By Frank Quisinsky Date 2014-02-13 23:13
Hallo Tom,

was meinst Du mit kaputten Buch.
Jede einzelne Variante im Buch ist geprüft von 4 Engines.

Da ist nichts kaputt ... lediglich an den Ausspielpräferenzen habe ich nochmal Hand angelegt weil einige Varianten zu oft ausgespielt wurden.
Spiele natürlich mit der neuen Version bzw. habe das geändert.

Gruß
Frank
Parent - - By Tom Paul Date 2014-02-14 19:20
Mit welchen 4 Engines hast du die Vorgabestellungen getestet?
Aktuellen oder alten Engines, weil Stockfish damals und Stockfish heute, da weiß ich selbst Stockfish hatte früher in einigen Stellungen 0.00 gesagt und der aktuelle Stockfish sagt bei der gleichen Stellung +0.70.
Nach welchen Kriterien, maximal +0.20 bis -0.20 ?
Ich z.B. verwende nur 0.00 Vorgabestellungen, dass garantiert mir mehr oder weniger gleich viele weiß und schwarz Siege z.B. 30% weiß und 30% schwarz, weil bei dir unter Stats da hast du 35% weiß und 25% schwarz.
Das führt schon zu Problemen, wenn nicht jeder ECO A00-E99 gleich oft gespielt wird.
Ich lasse immer A00-E99 immer nur einmal spielen + Seitenwechsel versteht sich.
Und selbst wenn gleich oft gespielt, kann es sein, dass z.B. Stockfish A00 besser kann als alle anderen Engines (z.B. Houdini) und mit +0.20 immer gewinnt und beim Seitenwechsel mit schwarz zwar -0.20 schlechter steht aber immer Remis hält, dass Problem gibt es bei mir nicht, da ich 0.00 Stellungen verwende, was die Siegesquote von Stockfish hier senken würde und die Remisquote durch 0.00 erhöht.
Wenn du jetzt z.B. bei A01-E99 nur 0.00 Vorgabestellungen hast, dann würde Stockfish durch A00 bevorteilt werden.
Bei den Vorgabestellungen zählt nur, dass sie alle 0.00 sind und keine Dubletten erzeugen und dass lässt sich gut durch ausgedachte Stellungen vermeiden. Oder einfach einen (dummen) Zug als weißer machen und dann mit schwarz den passenden 0.00 Zug ausspielen im MV Modus sichtbar und nicht den Zug der weiß erledigt und das dann als Vorgabestellung nehmen, da gibt es Partien zu sehen die einfach WOW sind.

Denn so ein Ergebnis wie Stockfish gegen Shredder bei dir habe ich noch nie gehabt, bei mir wird Shredder aus jeder 0.00 Stellung heraus regelrecht vernichtet, da gibt es nicht einmal 0.5 Punkt für Shredder, geschweige denn +10.
Als ich früher Vorgabestellungen von +- verwendet habe, war das Ergebnis aber genauso wie bei dir.
Parent - - By Thomas Müller Date 2014-02-14 19:35
poste mal eine handvoll 0.00 stellungen oder wieviele hast du denn?
Parent - - By Tom Paul Date 2014-02-14 21:38
Ich verwende nur Stellungen in denen maximal 1 Bauer auf beiden Seiten abgetauscht wurde.
Und höchstens 5 Züge beiderseits gespielt wurden. Mehr macht für mich keinen Sinn, weil das Eröffnungspotential zu stark gemindert wird und es schwachen Engines leichter fällt gegen stärkere Engines remis zu spielen.
Falls jemand zu wenig Rechenpower hat, länger rechnen lassen bis die 0.00 erscheint oder sich immer unter +- 0.10 beim Suchen orientieren.

D05: Damenbauernspiele (Colle-Aufbau)


A43: Alt-Benoni


C07: Französische Verteidigung (Tarrasch-Variante)


D35: Damengambit (Abtauschvariante)


A20: Englische Eröffnung


Habe doch bereits geschrieben, wie viele Stellungen ich mindestens habe.
Parent - - By Thomas Müller Date 2014-02-14 22:15
Hallo,

ich finde die angabe im vorigen posting nicht so genau?!
Oder meinst du wirklich du hast von a00 bis e99 für jedes ECO eine 0.00 stellung?!
Nö oder?!
Habe mal wahllos E44 rausgepickt

das ist doch kein 0.00 oder 0.10
Welche engine sollte den prüfen?

gruß
thomas
Parent - By Tom Paul Date 2014-02-14 23:08
Stockfish zum prüfen benutzen, weil Stockfish alles (doppelt so hoch bewertet) also bei +0.08 : 2 = 0.04, deshalb meinte ich immer unter +-0.10.
Wenn du jetzt noch Ld2 spielst, dann hast du eine 0.00 Vorgabestellung.
Das mit maximal 5 Zügen sollte eigentlich nur das so kurz wie möglich halten verdeutlichen.
Einige ECO bekommt man ja erst nach 10, 11 Zügen, dann muss man eben noch einen weiteren Halbzug machen der zum 0.00 führt, falls die Stellung nicht schon 0.00 ist.

Um nochmal auf deine obere Frage zurückzukommen.
Antwort: Ja doch
Wie sollte ich denn sonst testen?
Ich habe aber auch Eröffnungsvorgaben nach 1.g4 die auch 0.00 sind, von denen gibt es auch keine Dubletten, einfach weil es für Vielfalt sorgt und ich will ja die Engines auf alles mögliche hin untersuchen und nicht nur 1.d4 xy,xy,xy Eröffnungsvorgaben spielen lassen.

Die Folge davon ist, dass der Abstand zwischen schwachen und starken Engines größer geworden ist und auch einige Engines ihre Ranglistenplätze miteinander getauscht haben.
Stockfish ist bei mir schon länger die Nr. 1 auch mit LS Bedenkzeit, weil die Engine einfach kreativer spielt als Houdini und mehr aus sehr vielen verschiedenen 0.00 Eröffnungsvorgaben herausholen kann.
Parent - By ? Date 2014-02-14 23:05
Hi Tom,

will eigentlich keine langen Abhandlungen mehr über das Buch schreiben. Das machte ich schon bei der Erstellung.

Aber kurz:
SF, Critter, Spark und Houdini (je die Versionen die zu diesem Zeitpunkt verfügbar waren).
Ein Quad Core System wurde für die ca. 20.000 Analysen (je 1 Minute mal ca. 5.000 Stellungen) fast 5 Monate abgestellt.

Die Stellungsbewertung darfst Du nicht zum Aufhänger machen. Wichtig ist das die Blunder raus sind. In vielen System kommt der Ausgleich erst mit deutlich mehr Zügen und nicht direkt nach der Vorgabe in Zug 9. Auch das wurde anhand von ca. 100.000 45-Minuten SWCR1 Partien überprüft.

Die Stellungen selbst sind aus moderner Super GM Praxis (siehe Dokumentation). Interessant sind die vielen Blunder die in den Datenbanken enthalten sind. Auch die wurden herausgefiltert und in eine extra Datei geschrieben. Diese Blunder nehme ich z. b. wenn ich mir Eröffnungsbücher anschaue. Sind die Blunder enthalten lege ich das Buch zur Seite denn der Ersteller hat sich mit den Daten nicht wirklich umfassend beschäftigt. Und glaube mir, in so vielen kommerziellen Büchern stecken die Blunder drin.

Musst immer die Zielvorgabe betrachten:
In ca. 85.000 Super GM Partien entstanden ca. 5.600 verschiedene Stellungen nach schwarz Zug 8. Damit Eng-Eng nicht langweilig wird sollen nun diese Stellungen zufällig von der Shredder GUI über Buchoptionen ausgespielt werden und das unter Beibehaltung der ECO-Code Aufteilung in Prozent einer modernen GM Datenbank.

Spielt also z. B.
Stockfish - Houdini ein Match mit 500 Partien, sollten so wenige Dubletten wie möglich enthalten sein. Und genau das macht dieses Buch mit ausgeglichenen Stellungen die Mittels 4-Core Analyse (1 Minute) und einer Datenbank mit 100.000 Partien (die mittels dem Buch gespielt wurden) überprüft sind.

Es gibt nun natürlich noch andere ergänzende Ideen.
Deswegen habe ich die Doku hierzu geschrieben damit andere Personen die ein Interesse haben aufbauen können, Ideen entnehmen können und selbst mit einem solchen Werk aktiv werden.

Musst davon weg das jeder ECO Code gleich oft gespielt werden soll, oder das die Engines mit 0.00 rausgehen. Weder das eine, noch das andere macht Sinn denn die Engines beurteilen die Systeme unterschiedlich. Sinn macht es so ausgeglichen wie möglich zu starten, große Vielfalt und ob A02 oder B67 gespielt wird ist der Engine egal.

Nehme z. b. mal so eine Vorgabedatenbank ... Ergebnis: Langeweile, keine Überraschungseffekte, gleiche Ergebnisse.
Oder ein kommerzielles Buch ... und lasse mit dem kommerziellen Buch mal 500 Partien spielen.

Alles ausprobiert und oftmals wurde eine Eröffnung bei 500 Partien dann 30-50x gespielt, viele Dubletten ...
Zum Testen oder erstellen einer Ratingliste sind diese Bücher nicht zu gebrauchen.

Vorgabestellungen ja, aber dann kommt es wieder nach einer Zeit zur Langweile.

Stockfish - Shredder ...
Schaue Dir mal an wie die älteren Stockfish Versionen gegen Shredder abschneiden. Shredder punktet bei mir immer gut gegen Stockfish (der Spielstärke entsprechend etwas stärker). Aber auch hier, das ist das Ziel der SWCR2. Viele Spielstile einpicken damit erkannt wird gegen welchen Stil z. b. Stockfish ein kleines Problem hat. Dann erst macht testen wirklich Spaß, sonst wird's eher langweilig.

Also, lasse Dich berieseln von der GM-Welt bis Zugnummer 8 und dem was die Engines dann draus machen. Es fehlt nichts, alles ist enthalten und Shredder spielt es zufällig aus
Das finde ich richtig geil und das war auch richtig viel Arbeit dieses Buch in dieser Form zu erstellen.

Für Ratinglisten oder lange Engine-Matches sehr gut geeignet.
Setzen übrigens seit vielen Jahren einige Engine Programmierer ein und konnten (so der Tenor), hierdurch das Thema Buch beim Testen abhaken.

Gruß
Frank
Up Topic Hauptforen / CSS-Forum / SWCR2: Stockfish 08.02.2014 SSE42 x64 gestartet ...

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill