Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Stockfish-Elo im Höhenflug
1 2 Previous Next  
Parent - By Benno Hartwig Date 2014-01-10 09:32 Edited 2014-01-10 09:38

> aber eben auch wieder wenig Partien.


Natürlich steigert eine größere Anzahl von Partien die Aussagekraft.

Aber auch mit vergleichsweise wenigen Partien (Beispiel: 30) lassen sich Thesen (Beispiel: "A und B sind gleichstark") 'widerlegen ', wenn die Ergebnisse drastisch genug sind (extremes Beispiel: 30,0 zu 0,0).

Ein wenig ging Haukes Eingangsposting schon in diese Richtung.
Ich vermute in seinem Test eher einen systematischen Fehler als nur die Auswirkung des schnöden Zufalls.

Benno
Parent - - By Benno Hartwig Date 2014-01-10 09:14
Natürlich kann man 124-Partien-Ergebnisse kritisieren, weil die Partienanzahl noch recht klein ist.
Das sollte hier aber nicht der Punkt sein, denke ich, denn man kann überlegen, wie groß denn tatsächlich die Wahrscheinlichkeit ist, dass z.B. bei gleichstarken Engines eine derart deutliche Überlegenheit herauskommt.
(Dass der Zeitaufwand für z.B. wenigstens einige Hundert Partien klein ist, dass da selbst eine oder zwei Nächte schon deutlich weiter führen, ist natürlich trotzdem richtig)

Bei einer angenommenen Remis-Wahrscheinlichkeit 0,30 (bei kleinen Remiswahrscheinlihckeiten kommt es noch am ehesten zu deutlichen Vorsprüngen!)
und gleichstarken Spielern ist die Wahrscheinlichkeit dafür, dass irgendeiner bei 124 Spielen mit sagenhaften mindestens 79,0 Punkten rauskommt nur 0,03%!!

Solch ein extremes Ergebnis mit "War doch nur Zufall!" abwerten zu wollen, ginge dann wohl daneben.
Eine These "SF ist nicht stärker als H4" könnte also durch dieses Ergebnis schon als widerlegt betrachtet werden.

Noch ein paar Zahlen:
Bei 124 Partien ist die Wahrscheinlichkeit für mindestens 79,0 Punkte für eine bestimmte Engine von deren Überlegenheit abhängig

Überlegenheit       Wahrscheinlichkeit
50:50                    0,00015     (Da hätten wir ein sensationell seltenes Ereignis erwischt)
51:49                    0,00040
52:48                    0,001 (Auch bei dieser kleinen Überlegenheit käme ein Sieg von mindesten 79:45 im MIttel nur in jedem 1000 Testlauf vor! These widerlegt?)
55:45                    0,01

Da ich aber trotzdem noch nicht an eine SF-Überlegenheit glaube, solltest du bitte noch mal genau deine Bedingungen überprüfen, besonders auch mit Blick auf Stefans Hinweis.

Benno
Parent - - By Joe Boden Date 2014-01-10 12:12
Das Ergebnis hat nicht nur mich, sondern sicherlich alle hier verblüfft. Und ich gestehe, dass ich meinen Augen nicht getraut habe.
Jezt lasse ich ein 3-rundiger Turnier mit 24 Teilnehmern laufen, um mal mehr in die Breite zu testen.
Das Ergebnis nach 100 von über 800 zu spielenden Partien sieht so aus:
(sorry fürs nichtformatierte Format)

1  Stockfish 080114 64 SSE4.2 [new]  X                       1.0  1.0           1.0           1.0     0.5  1.0  1.0  1.0     7.5 / 8  23.75  93.75%  
2  Houdini 4 Pro x64     X           1.0     1.0           1.0  0.5     0.5  1.0        1.0              1.0  7.0 / 8  27.00  87.50%  
3  Stockfish 080114 64 SSE4.2 attack        X                    1.0           1.0        1.0  1.0     1.0  0.5  1.0  0.5     7.0 / 8  21.50  87.50%  
4  Stockfish 311213 64 SSE4.2 4t           X  1.0                 0.0        1.0        0.5  1.0     0.5     1.0  1.0     6.0 / 8  19.00  75.00%  
4  Stockfish Rockwood030114 64 SSE4.2 [new           0.0  X                 0.5     1.0  1.0        1.0  1.0           0.5  1.0     6.0 / 8  19.00  75.00%  
6  PanChess 00.537 x64     0.0           X     0.5  0.5  0.5     0.5  1.0     1.0                 1.0        1.0  6.0 / 9  20.50  66.67%  
7  Stockfish 241013 64 SSE4.2 4t                    X        1.0  0.5        0.5        0.5  1.0     1.0     0.5  0.5     5.5 / 8  18.00  68.75%  
8  Robodini 1.1     0.0           0.5     X  0.0  0.0              1.0              1.0  1.0  1.0     1.0  5.5 / 9  13.50  61.11%  
9  Houdini 3 Pro x64  0.0              0.5     1.0  X        0.5        0.5  0.5        1.0              1.0  5.0 / 8  17.75  62.50%  
10  Gull 2.3 x64 4t  0.0     0.0        0.5  0.0  1.0     X     1.0           1.0        0.5              1.0  5.0 / 9  18.50  55.56%
Parent - By Frank Brenner Date 2014-01-10 13:02
Ich habe gerade entdeckt, dass du ja der Joe Boden von hier bist:

http://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?tid=5990

**

Ich hab mir "JOE BODEN" damals leider nicht gut genug gemerkt und mir ist das erst jetzt  aufgefallen, aber echt *asche auf mein haupt*  . .. sowas wird mir nich nochmal passieren wenn ich "JOE BODEN" lese.

Vielleicht hast du ja per zufall wieder ein paar bytes in einer Engine geändert oder diesmal in der shreddergui *rofl*
Parent - - By Stocky Überlegenheit ist Real Date 2014-01-14 23:59
. . . mich interessieren nicht irgendwelche Testcharts von vielen Testern, sondern ich schaue mir die Engine selbst an, da ich mit ihr auf Schach.de täglich spiele. Ich sehe derzeit eine Überlegenheit von Stockfish, welche sich auch in der Anwendung der vielen User auf Schach.de widerspiegelt. Stcokys belegen in der Mehrheit die forderen Plätze. Nun werden einige sagen, ja die kosten ja nichts und deshalb werden sie so oft benutzt - falsch, diejenigen, die auf schach.de spielen besitzen oft auch H4 oder Komodo und möchten eine gute Engine und daher werden die stockys gespielt. Insgesamt sind mir die Stockys sehr lieb . . . Spielen ein fast menschliches Schach -hätte ich fast gesagt.
Ich jedenfalls gege keinenCent für Houdini 4 aus . . .
Und da können irgendwelche Ratings sagen was sie wollen. Vor einem Houdini habe ich keine Angst auf schach.de - im Gegenteil.
Von der Unsitte der "most boring" contempt 1-Einstellung mal ganz zu schweigen . . .
Grüße
Parent - By Stefan Pohl Date 2014-01-15 04:49
Stocky Überlegenheit ist Real schrieb:

. . . mich interessieren nicht irgendwelche Testcharts von vielen Testern, sondern ich schaue mir die Engine selbst an, da ich mit ihr auf Schach.de täglich spiele. Ich sehe derzeit eine Überlegenheit von Stockfish, welche sich auch in der Anwendung der vielen User auf Schach.de widerspiegelt. Stcokys belegen in der Mehrheit die forderen Plätze. Nun werden einige sagen, ja die kosten ja nichts und deshalb werden sie so oft benutzt - falsch, diejenigen, die auf schach.de spielen besitzen oft auch H4 oder Komodo und möchten eine gute Engine und daher werden die stockys gespielt. Insgesamt sind mir die Stockys sehr lieb . . . Spielen ein fast menschliches Schach -hätte ich fast gesagt.
Ich jedenfalls gege keinenCent für Houdini 4 aus . . .
Und da können irgendwelche Ratings sagen was sie wollen. Vor einem Houdini habe ich keine Angst auf schach.de - im Gegenteil.
Von der Unsitte der "most boring" contempt 1-Einstellung mal ganz zu schweigen . . .
Grüße


Stimmt schon. Ingo hatte hier schon vor kurzem sehr zu Recht festgestellt, daß man leicht feststellen kann, welche Engine mit großen Hardwareressourcen und längeren Bedenkzeiten die Nummer 1 der Welt ist, indem man einfach eine "Volkszählung" auf playchess durchführt. Und das Kostenargument ist auch keins, da Houdini 4 längst als illegale Crack-Version im Internet kursiert. Komodo natürlich auch. Das galt natürlich aber auch schon seinerzeit für Rybka oder Houdini 2 bzw. 3. Ich kann aber nur jeden echten Computerschachfan dringend dazu aufrufen, die echten Bezahlversionen zu kaufen. Ich schwimme bestimmt nicht im Geld, aber das kann selbst ich noch bezahlen. Und tue es auch (sogar gerne), denn sonst gäbe es keinen Houdini oder Komodo mehr. Die Frage ist natürlich, was passiert, wenn Stockfish auch in den Ranglisten die Nummer 1 sein wird, was ja nach menschlichem Ermessen irgendwann 2014 passieren wird. Eine OpenSource und Freeware-Engine als Nummer 1, wahrscheinlich auch längerfristig - das könnte durchaus auch negative Folgen fürs Computerschach haben...Muß man sehen. Wird wohl auch davon abhängen, wie weit sich Stockfish von den Verfolgern wird absetzen können.

Stefan
Parent - By Benno Hartwig Date 2014-01-16 08:19

> Nun werden einige sagen, ja die kosten ja nichts und deshalb werden sie so oft benutzt - falsch, diejenigen, die auf schach.de spielen besitzen oft auch H4 oder Komodo und möchten eine gute Engine...


Da stimme ich dir natürlich zu. Wer sich für Computerschach interessiert, wer dafür doch einige Zeit investiert, der scheut sich sicher auch nicht, mal einen Fuffi auf den Tisch zu legen, um sich noch mal eine nette Engine anzusehen und ggf. zu nutzen, so sie ihm den irgendwie vorteilhaft erscheint.

> Ich jedenfalls gege keinenCent für Houdini 4 aus . . .


Und das finde ich wieder ausgesprochen überraschend. Für diesen Fuffi bin ich allemal am Computerschach und auch an Houdini 4 genug interessiert.
Du wirklich nicht?

Benno
Parent - - By Joe Boden Date 2014-01-10 16:31
Bei meinem Breitenturnier mit 24 Engines wird es zunehmend spannender an der Tabellenspitze. Die Stockis scheinen die Houdinis von der Spitze zu verdrängen. Kann es selbst kaum glauben.

1  Stockfish 080114 64 SSE4.2 attack  X  0.5                 0.5  1.0     0.5  1.0  1.0  1.0  1.0        0.5  1.0  0.5     1.0  1.0     10.5 / 13  61.75  80.77%  
2  Stockfish 311213 64 SSE4.2 4t  0.5  X  1.0              0.5  1.0     0.0  1.0  0.5     1.0        1.0  1.0     1.0  0.5  1.0     10.0 / 13  60.50  76.92%  
3  Stockfish 080114 64 SSE4.2 [new]     0.0  X        1.0     0.5  0.5     1.0  1.0  0.5  1.0           1.0  1.0  1.0     0.5  1.0     10.0 / 13  57.75  76.92%  
4  Houdini 4 Pro x64           X  1.0  0.0  1.0        0.5           0.0  0.5  1.0  1.0        1.0  1.0  1.0  1.0  1.0  10.0 / 13  46.75  76.92%  
5  PanChess 00.537 x64           0.0  X  0.5  0.5        1.0     0.0     0.5  1.0     0.5  0.0  1.0  1.0     1.0  1.0  1.0  9.0 / 14  41.25  64.29%  
6  Houdini 3 Pro x64        0.0  1.0  0.5  X  1.0        0.5           0.5  0.0  0.5  0.5        1.0  1.0  1.0     1.0  8.5 / 13  44.50  65.38%  
7  Robodini 1.1           0.0  0.5  0.0  X        1.0     0.0  1.0  0.0           1.0  1.0  1.0     1.0  1.0  1.0  8.5 / 13  36.50  65.38%  
8  Stockfish 241013 64 SSE4.2 4t  0.5  0.5  0.5              X  0.5     0.5  0.5  0.5  1.0  0.5        0.5  1.0        1.0  0.5     8.0 / 13  50.75  61.54%  
9  Stockfish Rockwood030114 64 SSE4.2 [new  0.0  0.0  0.5              0.5  X     0.5  1.0  1.0     1.0  0.0     1.0  1.0     1.0     0.5     8.0 / 13  47.00  61.54%  
10  Komodo TCEC 64-bit [new]           0.5  0.0  0.5  0.0        X           1.0  0.5  0.5  0.5     1.0  0.5     1.0  1.0  1.0  8.0 / 13  35.50  61.54%
Parent - - By Hauke Lutz Date 2014-01-10 18:34
Durch Robodini, H3 und die Stockfishe bekommst du wahrscheinlich ein zu gutes Ergebnis.
in wie weit sich das auswirkt ist schwer zu sagen.
PanChess ist ein guter Gegner, aber Bouquet, Shredder, Fritz & Co. sollten gut geeignet sein, jedenfalls einiges besser als die oben genannten, um festzustellen in wie weit sich das Setting negativ auf relativ schwache Gegner auswirkt.

Gruß
Hauke
Parent - - By Joe Boden Date 2014-01-10 18:50
habe einige schwächere engines eingebunden..sind ja insgesamt 24 engines. mal schauen, wo stockfish landet
Parent - - By Hauke Lutz Date 2014-01-11 06:40 Edited 2014-01-11 06:49
ich teste es mal mit 15s+0,15" 1000 Partien mit nur einem Kern machen.... weiß der Geier warum Houdini mit mehreren Kernen so unnatürlich schlecht ist.... Bei den ersten 10 Partien habe ich jedenfalls komische 8 zu 2 Überlegenheit... Sollte das so bleiben, wovon ich erstmal nicht ausgehe, wäre das Setting ein tiefer Griff ins Klo
Parent - - By Hauke Lutz Date 2014-01-11 15:00
Es steht +520/-10/=12 für Houdini4..... das Ergebnis ist wohl mehr als Eindeutig........ die Knotenzahl kommt hin. Houdini hat zwischen 2.900 und 3.000, Stockfish meist um die 2.500 Knoten/Sekunde.

Ich werde das jetzt Abbrechen und das Setting schnell vergessen; Es scheint leider ein ziemlich tiefer Griff ins Klo zu sein.

Gruß
Hauke
Parent - - By Thomas Müller Date 2014-01-11 15:07
was hast du jetzt genau getestet ?!
Habe da langsam den überblick verloren
Und du hast dich nicht vertippt.... 520!! siege für H4 gegen 10 siege von SF ?!

gruß
thomas
Parent - By Hauke Lutz Date 2014-01-11 15:13
15s+150ms/zug, 1 echter Kern, ohne Pondern und bei Stocki ohne Idle Threads Sleep auf der Arena 3.5 Gui.
Parent - - By Joe Boden Date 2014-01-11 15:13
Da scheint Dir ein Tippfehler unterlaufen zu sein. Was genau hast Du getestet und mit welchen Einstellungen?

In meinem Breitenturnier habe ich Stocki 8.1.14 mit und ohne Setting spielen lassen.

Die Tabelle nach über 300 Partien sieht für die ersten 15. Plätze folgendermassen aus:

1  Stockfish 311213 64 SSE4.2 4t  X  1.0  0.5  1.0  0.5  1.0  0.5  0.5  0.5  0.5  0.5  1.0  0.0  1.5  1.0  1.0  1.0  1.0  1.0  2.0  1.0  1.5  1.5  1.0  21.0 / 27  244.00  77.78%  
2  Stockfish 080114 64 SSE4.2 [new]  0.0  X  0.5  0.5  1.0  0.0  0.5  1.5  0.5  1.0  1.5  1.0  1.0  1.0  1.0  0.0  1.0  1.0  0.5  1.0  2.0  1.5  1.0  1.0  20.0 / 27  235.50  74.07%  
3  Stockfish 080114 64 SSE4.2 attack  0.5  0.5  X  1.0  1.0  1.0  0.5  0.0  1.0  0.0  1.0  0.5  0.5  1.0  0.5  0.0  0.5  0.5  1.0  1.0  1.5  2.0  2.0  1.0  18.5 / 27  208.25  68.52%  
4  Stockfish Rockwood030114 64 SSE4.2 [new  0.0  0.5  0.0  X  0.5  1.0  0.5  0.5  1.0  1.0  0.0  0.0  0.5  2.0  1.0  0.5  2.0  0.0  1.0  2.0  1.0  1.0  1.5  1.0  18.5 / 27  205.50  68.52%  
5  Houdini 4 Pro x64  0.5  0.0  0.0  0.5  X  0.5  0.5  0.0  0.5  1.0  0.0  0.5  1.0  1.0  1.0  1.5  1.0  2.0  2.0  0.5  1.0  1.0  1.0  1.0  18.0 / 26  197.25  69.23%  
6  Fire 3.0 x64  0.0  1.0  0.0  0.0  0.5  X  0.5  1.0  1.0  0.0  0.5  0.5  0.5  1.0  0.5  1.0  2.0  0.5  1.0  1.0  1.0  0.5  1.0  2.0  17.0 / 26  182.75  65.38%  
7  Stockfish 241013 64 SSE4.2 4t  0.5  0.5  0.5  0.5  0.5  0.5  X  1.0  0.5  0.5  2.0  0.0  0.5  0.5  1.0  0.0  0.5  1.0  0.5  2.0  0.5  2.0  0.5  1.0  17.0 / 27  200.75  62.96%  
8  Houdini 3 Pro x64  0.5  0.5  1.0  0.5  1.0  0.0  0.0  X  0.0  0.5  0.5  0.5  0.5  1.0  1.0  0.5  0.0  1.5  2.0  1.0  1.0  1.0  1.0  1.0  16.5 / 26  187.00  63.46%  
9  Bouquet 1.8 x64 [new]  0.5  0.5  0.0  0.0  0.5  1.0  0.5  1.0  X  0.5  0.5  0.5  0.5  1.0  0.0  1.0  1.5  1.0  1.0  1.0  1.0  0.5  1.0  1.0  16.0 / 26  184.50  61.54%  
10  PanChess 00.537 x64  0.5  0.0  1.0  0.0  0.0  1.0  0.5  0.5  0.5  X  0.5  1.0  1.0  0.0  1.0  0.5  0.0  1.0  1.0  1.0  1.0  1.0  1.0  2.0  16.0 / 26  171.50  61.54%  
11  Gull 2.3 x64 4t  0.5  0.5  1.0  1.0  1.0  0.5  0.0  0.5  0.5  0.5  X  0.0  0.5  0.5  1.0  1.0  1.0  1.0  1.5  0.5  0.5  1.0  0.5  1.0  16.0 / 27  196.75  59.26%  
12  Komodo TCEC 64-bit [new]  0.0  0.0  0.5  1.0  0.5  0.5  1.0  0.5  0.5  0.0  1.0  X  0.5  0.0  0.5  1.5  0.5  1.5  1.0  1.0  0.5  1.0  1.0  1.0  15.5 / 26  176.25  59.62%  
13  Strelka 5.5 x64  1.0  0.0  0.5  0.5  0.0  0.5  0.5  0.5  0.5  0.0  0.5  0.5  X  0.0  0.5  1.0  2.0  0.5  1.0  1.5  0.5  1.0  1.0  1.0  15.0 / 26  166.25  57.69%  
14  Critter 1.6a 64-bit  0.5  0.0  0.0  0.0  0.0  0.0  0.5  0.0  1.0  1.0  0.5  1.0  2.0  X  1.0  0.5  1.0  1.0  1.0  0.5  1.0  0.5  1.0  1.0  15.0 / 27  170.75  55.56%  
15  Robodini 1.1  0.0  0.0  0.5  0.0  0.0  0.5  0.0  0.0  1.0  1.0  0.0  1.5  0.5  0.0  X  1.0  1.0  0.5  1.0  1.0  1.0  1.0  1.0  2.0  14.5 / 26  140.25  55.77%
Parent - By Hauke Lutz Date 2014-01-11 15:22
Ich hab dein Setting getestet. Unter den um 15:13 genannten Bedingungen.

Ein Rechtschreibfehler war es nicht. Für den Fall das du auf den Fotobeweis bestehst, habe ich schon einen auf meinem Desktop gespeichert & könnte ihn Dir schicken, wenn du mir deine E-Mail zukommen lässt.

Gruß
Hauke
Parent - - By Stefan Pohl Date 2014-01-11 17:05 Edited 2014-01-11 17:07
Hauke Lutz schrieb:

Es steht +520/-10/=12 für Houdini4..... das Ergebnis ist wohl mehr als Eindeutig........ die Knotenzahl kommt hin. Houdini hat zwischen 2.900 und 3.000, Stockfish meist um die 2.500 Knoten/Sekunde.

Ich werde das jetzt Abbrechen und das Setting schnell vergessen; Es scheint leider ein ziemlich tiefer Griff ins Klo zu sein.

Gruß
Hauke


Die Knotenzahlen sind OK, das Ergebnis aber nicht. Das ist nun wieder viel zu schlecht. Sooo schlecht kann dieses relativ moderate Setting auf keinen Fall scoren. Es sollte zwischen 40%-55% liegen, sofern genügend Partien gespielt wurden.
Schau dir unbedingt mal die Partien an, besonders die kurzen Verlustpartien. Da muß irgendeine Auffälligkeit zu erkennen sein...
Ich kann nur raten, eine GUI zu benutzen, von der man durch Ranglistenbetreiber weiß, daß sie zuverlässig funktioniert. Also die Shredder GUI (Ipon-Liste), die LittleBlitzerGUI (LS-Liste) oder den cutechess-cli, falls du keine Angst vor kryptischen, langen Kommandozeilen hast...

Stefan
Parent - - By Hauke Lutz Date 2014-01-12 10:25
Das Setting hat ziemlich gerne unvorteilhaft geopfert wenn du das meinst.
Parent - - By Hauke Lutz Date 2014-01-15 04:07
Ich lasse mal die 14011409-Version von Stockfish mit dem Setting: Mobility (Midgame) + Aggressiveness = 115 ; Contempt = -50 gegen Houdini 4 80mal spielen.

Zeit: 20+15"
Kerne = 1
Hash = 2 GB
Pondern = off

ich bin gespannt was bei rum kommt.
Parent - - By Stefan Pohl Date 2014-01-15 04:35
Hauke Lutz schrieb:

Ich lasse mal die 14011409-Version von Stockfish mit dem Setting: Mobility (Midgame) + Aggressiveness = 115 ; Contempt = -50 gegen Houdini 4 80mal spielen.

Zeit: 20+15"
Kerne = 1
Hash = 2 GB
Pondern = off

ich bin gespannt was bei rum kommt.


Interessant. Falls du noch eine Inspiration brauchst: Ich spiele (bzw. spielte, habe ja gar keine PC-Ressourcen mehr frei) ab und zu mit Stockfish auf playchess mit Aggressiveness=150 und Space=125 mit recht großem Erfolg (bezogen auf meine schwache Hardware). Könnte bei längeren Bedenkzeiten auch mal eine Test wert sein...

Stefan
Parent - - By Hauke Lutz Date 2014-01-15 13:17
Bei Bullet hatte ich das Setting schon mal grob angetestet und dort konnte es mit Houdini 4 mithalten, lag meist sogar etwas vorne. Genaue Daten hab ich leider nichtmehr davon aber es spielte sich im Bereich um die 20 Elo ab.

Die ersten 7 Partien sehen mit leichten Vorteilen für Houdini erstmal Plausibel aus. Mal sehen was die Zeit bringt.

Das Setting liest sich interessant und das würde ich nach diesem Setting in Angriff nehmen.
Auf playchess spielen wäre auf jeden Fall interessant. Ich muss mir mal anschauen wie man das macht. Solange ich gegen kein Server-PC spiele sollte ich mithalten können.

Hauke
Parent - - By Hauke Lutz Date 2014-01-16 04:00
Nach 1/4 des Turnieres (20 Partien (10x Hin- und Rückspiel)) steht es beim 20m+15" Turnier +5/=12/-3 zugunsten von dem Stockfish 140114 mit der Settingänderung: Mobility + Aggressivness = 115 ; Contempt -50.

In der 21. Partie steht Stocki mit Schwarz nach 17 Züge unwesentlich besser.

Hauke
Parent - - By Joe Boden Date 2014-01-16 06:48
hauke,

ich habe bei den ganzen intensiven stockitests der vergangenen wochen immer wieder eine interessante feststellung gemacht. in einzelvergleichen stokci - h4 konnten spezielle stockisettings überzeugen, teilweise sogar drastisch.
in breitenturnieren hat sich dann aber immer die originalversion von stocki durchgesetzt.
über dieses phänomen bin ich noch am rätseln.
Parent - - By Hauke Lutz Date 2014-01-16 18:22 Edited 2014-01-16 18:24
Hallo Joe,

danke für in Information, aber eine Frage hab ich zu deinen Tests: Hast Du die Veränderung alleine durch Bullet-Partien festgestellt oder auch mit Schnellschach-Partien?

Gruß
Hauke
Parent - - By Joe Boden Date 2014-01-16 20:04
hauke,

ich habe bislang  immer bullet und 4+2 oder 3+1 gespielt.
Parent - By Hauke Lutz Date 2014-01-16 20:30
Ok, dann werde ich mal nicht aus allen Wolken fallen, sollte es sich auch bei längerer Bedenkzeit bestätigen
Parent - By Tom Paul Date 2014-01-15 13:24
Stockfish Testing Queue
Pending - 14 tests 15.8 hrs Hide

  12-01-14  rs  castle_pre_bonus  diff 
Pending... (5.2 hrs) (+bin)
40000 @ 60+0.05 th 1  Simplification test. Remove anticipatory castle bonus. Low prio.

  10-01-14  ur  f14cd1bb89d080f36a11df3  diff 
Pending... (5.2 hrs) (+bin)
40000 @ 60+0.05 th 1  Test Marco simplification of TM (I am going to apply the patch, but I want to be sure there is no regression)

  10-01-14  jo  less_pawns  diff 
Pending... (0.7 hrs) (+bin)
20000 @ 15+0.05 th 1  PP: Measure less pawns bonus

  10-01-14  jo  rook_pawns_2  diff 
Pending... (0.7 hrs) (+bin)
20000 @ 15+0.05 th 1  PP: Measure rook pawns 2

  10-01-14  jo  rook_pawns_1  diff 
Pending... (0.7 hrs) (+bin)
20000 @ 15+0.05 th 1  PP: Measure rook pawns 1

  10-01-14  jo  supporting_pawns_2  diff 
Pending... (0.7 hrs) (+bin)
20000 @ 15+0.05 th 1  PP: Measuring supporting pawns 2

  10-01-14  jo  supporting_pawns_1  diff 
Pending... (0.7 hrs) (+bin)
20000 @ 15+0.05 th 1  PP: Measuring supporting pawns 1

  10-01-14  gl  kingAttWeight  diff 
LLR: -0.75 (-2.94,2.94) [0.00,6.00]
Total: 50783 W: 7969 L: 7765 D: 35049
sprt @ 60+0.05 th 1  Long TC for joster: Increase KnightAttackWeight

  12-01-14  ur  test_value_of_first_mov  diff 
Pending... (0.7 hrs) (+bin)
20000 @ 15+0.05 th 1  test the value of the first move code(I guess that it should be significant with 20000 games but I prefer to see it to estimate how much I can earn by playing faster during first move if I can earn)

  10-01-14  ur  fixing_a_bug  diff 
LLR: -1.19 (-2.94,2.94) [-1.50,4.50]
Total: 39131 W: 7312 L: 7252 D: 24567
sprt @ 15+0.05 th 1  second try of fixing a bug and this time play faster in part of the cases when there was no fail low in the root.

  14-01-14  rs  pp_blocked2  diff 
LLR: 0.31 (-2.94,2.94) [-1.50,4.50]
Total: 41605 W: 7721 L: 7602 D: 26282
sprt @ 15+0.05 th 1  Blockade of rook passers is difficult to eliminate. Take 2

  14-01-14  sg  update_stats  diff 
LLR: -1.49 (-2.94,2.94) [-1.50,4.50]
Total: 39670 W: 7329 L: 7279 D: 25062
sprt @ 15+0.05 th 1  Retest updating stats on pv moves, now followupmoves introduced.

  15-01-14  jo  KBBKN_fix  diff 
Pending... (0.6 hrs) (+bin)
sprt @ 15+0.05 th 1  Retest KBBKN_fix against current master without KBBKN knowledge.

  15-01-14  jo  easymove  diff 
Pending... (0.6 hrs) (+bin)
sprt @ 15+0.05 th 1  another condition to stop early

Active - 59 machines 240 cores 1.45M nps (349.05M total nps) 563 games/minute
Machine  Cores  MNps  System  Version  Running on  Last updated
racerschmacer   4  1.34  Windows 7  51  kingAttWeight  seconds ago
garry561   3  2.37  Windows 7  51  kingAttWeight  seconds ago
team-oh   5  1.43  Windows 7  51  kingAttWeight  seconds ago
team-oh   5  1.43  Windows 7  51  kingAttWeight  seconds ago
jfd1   3  2.17  Windows 7  51  kingAttWeight  seconds ago
homyur   1  0.78  Linux 2.6.32-5-amd64  51  kingAttWeight  seconds ago
cepteo   3  1.14  Windows 7  51  kingAttWeight  seconds ago
adb76   3  0.93  Linux 3.10.13-x86_64-jb1  51  kingAttWeight  seconds ago
tinker   2  1.34  Windows Vista  51  kingAttWeight  seconds ago
oryx   1  1.37  Windows 7  51  kingAttWeight  seconds ago
hjc   3  1.17  Darwin 12.5.0  51  kingAttWeight  seconds ago
joachimrang   3  1.04  Windows 2012Server  51  kingAttWeight  seconds ago
llv   3  0.97  Windows 7  51  kingAttWeight  seconds ago
nssy   3  2.04  Linux 3.12.7-srv-nssy2  51  kingAttWeight  seconds ago
renouve   7  1.53  Windows 8  51  kingAttWeight  seconds ago
OssumOpossum   2  2.10  Linux 3.2.0-57-generic  51  kingAttWeight  seconds ago
Antihistamine   3  1.06  Windows 7  51  kingAttWeight  seconds ago
renouve   7  1.43  Windows 8  51  kingAttWeight  seconds ago
mibere   3  2.37  Linux 3.2.0-4-amd64  51  kingAttWeight  seconds ago
biffhero   1  1.45  Linux 3.2.0-3-amd64  51  kingAttWeight  seconds ago
team-oh   5  1.43  Windows 7  51  kingAttWeight  seconds ago
OssumOpossum   7  1.33  Linux 3.11.0-15-generic  51  kingAttWeight  seconds ago
infinity   7  1.36  Windows 8  51  kingAttWeight  seconds ago
hjc   7  0.92  Windows 7  51  kingAttWeight  seconds ago
Rohrbruch   6  1.58  Windows 7  51  kingAttWeight  seconds ago
Zirie   6  1.39  Windows 7  51  kingAttWeight  seconds ago
hjc   7  0.84  Windows 7  51  kingAttWeight  seconds ago
vdbergh   5  1.40  Linux 2.6.32-279.5.1.el6.x86_64  51  kingAttWeight  seconds ago
Pyafue   2  1.69  Windows 7  51  kingAttWeight  seconds ago
spams   3  2.16  Windows 7  51  kingAttWeight  seconds ago
Chris1971   5  2.19  Windows 7  51  kingAttWeight  seconds ago
sdemel   5  2.22  Windows 8  51  kingAttWeight  seconds ago
Fisherman   5  1.20  Windows 7  51  kingAttWeight  seconds ago
jromang   3  2.10  Windows 7  51  kingAttWeight  seconds ago
OssumOpossum   7  1.39  Windows 7  51  kingAttWeight  seconds ago
BrunoBanani   7  1.02  Linux 3.2.0-53-generic  51  kingAttWeight  seconds ago
bking_US   5  2.21  Windows 8  51  kingAttWeight  seconds ago
jundery   3  2.03  Windows post2008Server  51  kingAttWeight  seconds ago
team-oh   5  1.42  Windows 7  51  kingAttWeight  seconds ago
team-oh   7  0.79  Windows 2008ServerR2  51  kingAttWeight  seconds ago
joachimrang   4  1.08  Windows 2012Server  51  kingAttWeight  seconds ago
OssumOpossum   7  1.08  Windows 7  51  kingAttWeight  seconds ago
BrunoBanani   8  1.55  Linux 3.2.0-56-generic  51  kingAttWeight  seconds ago
Patrick_G   3  2.10  Linux 3.2.0-58-generic  51  kingAttWeight  seconds ago
BrunoBanani   7  1.02  Linux 3.2.0-45-generic  51  kingAttWeight  seconds ago
Sims3ftw   4  2.42  Windows 8  51  kingAttWeight  seconds ago
Eckeneckepen   3  1.28  Windows 7  51  mate  seconds ago
malala   3  2.27  Windows 7  51  mate  seconds ago
Antihistamine   3  1.74  Windows 7  51  mate  seconds ago
mschmidt   3  1.41  Windows 7  51  mate  seconds ago
mibere   3  1.76  Windows 7  51  mate  seconds ago
jeka   3  1.51  Windows 7  51  mate  seconds ago
xor12   3  1.59  Linux 3.11.0-15-generic  51  mate  seconds ago
cw   4  1.04  Windows 7  51  mate  seconds ago
Farseer   3  1.46  Windows Vista  51  mate  seconds ago
hjc   1  1.01  Linux 3.12.6-300.fc20.i686+PAE  51  mate  seconds ago
treblera   1  1.25  Linux 2.6.32-358.23.2.el6.x86_64  51  mate  seconds ago
vdbergh   3  0.95  Linux 2.6.32-431.3.1.el6.x86_64  51  master  seconds ago
tinker   2  1.27  Windows 7  51  master  seconds ago

14-01-14  jo  kingAttWeight  diff 
LLR: -1.10 (-2.94,2.94) [-1.50,4.50]
Total: 17391 W: 3203 L: 3197 D: 10991
sprt @ 15+0.05 th 1  Increase KnightAttackWeight, take 3.
12-01-14  lb  mate  diff 
LLR: 0.92 (-2.94,2.94) [-1.50,4.50]
Total: 125458 W: 23534 L: 23173 D: 78751
sprt @ 15+0.05 th 1  Mate detection
14-01-14  gl  master  diff 
ELO: 28.64 +-2.8 (95%) LOS: 100.0%
Total: 19452 W: 4142 L: 2542 D: 12768
20000 @ 60+0.05 th 1  Regression test after followup moves

2 neue, jetzt insgesamt 14 aktive Tester aus Deutschland (nicht doppelt gezählt) und 7 aus America.
41 Tester sind insgesamt aktiv.
Es gibt 39 Entwickler.
Aber wir brauchen noch mehr Tester, wenn man sich mal die Anzahl der Tests anschaut und dabei bedenkt, dass die Entwickler sich sogar Zeit mit Tests erstellen lassen, weil diese einfach nicht schnell genug abgearbeitet werden können, bräuchten wir ~40 weitere Tester.
Helft mit weitere Tester zu finden
Up Topic Hauptforen / CSS-Forum / Stockfish-Elo im Höhenflug
1 2 Previous Next  

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill