Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Stockfish 1.9 live on IPON
- - By Ingo Bauer Date 2010-10-02 17:37
Stockfish 1.9 x64 running now:

http://www.inwoba.de

Bye
Ingo
Parent - - By Frank Quisinsky Date 2010-10-02 17:43
Hi Ingo,

sehr gut!
Kann selbst in den nächsten 30 Tagen keine neuen Engines / Updates testen.
Habe einen festen Zeitplan mit Engines die ich noch testen möchte.

Insofern bin ich jetzt sehr gespannt auf Deine Ergebnisse, zumal Stockfish zu meinen 3 Lieblingsengines gehört.

Die neuen Engines der nächsten 30 Tage folgen dann bei mir wieder gesammelt als Turnier.

Viele Grüße
Frank
Parent - - By Ingo Bauer Date 2010-10-02 18:21
Hi

[quote="Frank Quisinsky"]

Habe einen festen Zeitplan mit Engines die ich noch testen möchte.

[/quote]

Wolltest du nicht mal nur die besten 20 testen ...? Ansonsten, das ist Stockfish 1.9! Was auch immer du jetzt testest, mußt du gegen die 1.9 auch noch spielen lassen. Dann lass doch gleich neue Engines gegen die 1.9 Spielen und du spartst vielleicht ein paar hundert Spiele ...
(Es sei denn die 1.9 ist schlechter asl die 1.8 ...)

Gruß
Ingo
Parent - By Frank Quisinsky Date 2010-10-02 18:33 Edited 2010-10-02 18:39
Hi Ingo,

neben dem IPP Familie Test (6 werden gestestet, eine verbleibt) baue ich beide Listen derzeit von 21 auf 24 aus. Wenn der IPP Familie Test abgeschlossen ist, habe ich 23 in der SWCR-64. Lasse dann noch ein paar BugChess Partien nachspielen und habe Engine 24 in der SWCR-64. Dann läuft die SWCR-32 mit dem Ausbau von 21 auf 24. Hierbei nehme ich dann auch den neuen Stockfish 1.9 als Update auf.

Also, derzeit friemel ich sowohl an den Ausbau beider Listen von 21 auf 24 und daran einen IPP IvanHoe ausfindig zu machen, der dann in der SWCR-64 verbleibt. Das geht natürlich nicht von heute auf morgen. In der Ruhe liegt die Kraft.

Für mich ist es eh besser wenn ich mehrere Engines gleichzeitig testen kann. Ich mache mir sehr viel Mühe mit meinen Listen und den Download Files und daher wäre das einfach zu viel Arbeit jede neue Engine einzeln zu starten / testen um dananch die riesigen Download Files zu aktualisieren.

Beispiel:
Wenn ein großes Turnier, wie das was jetzt mit 4 neuen Engines läuft, zu Ende geht, benötige ich ca. 4 Stunden um alle Updates auf meinen Seiten zu haben. Dabei lasse ich mir natürlich auch Zeit und studiere selbst ein wenig die eigenen Ergebnisse.

Von daher ist es gut so, wenn ich immer ca. 2-3 Wochen hinterherhinke. Auch scheint ja die Regel um sich zu greifen, dass kurz nach einem Release einer neuen Version ein Update kommt (siehe zuletzt GullChess). Bei Stockfish ja auch schon sehr oft passiert.

Bei der IPON ist das nicht so wild, da Du mit deutlich schnelleren Bedenkzeiten testet, ich brauche für den Test einer Engine bei 920 Partien etwas über 3 Tage weil meine 4 QuadCore Systeme maximal 288 Partien pro Tag schaffen.

Also, ich muss dahingehend nicht der Schnellste sein.

Übrigens mir gefällt das auch!

1. IPON kommt zuerst mit Ergebnissen (wie gesagt aufgrund Deiner schnellen Bedenkzeit)
2. CEGT schießt nach und ich komme meist kurze Zeit später zum Zug!

Diejenigen die verfolgen haben so dann auch etwas davon, denn die Ergebnisse kommen nicht alle gebündelt sondern etwas verteilter. Denke das macht auch den Beobachtern mehr Spaß.

Viele Grüße
Frank
Parent - - By Peter Martan Date 2010-10-02 17:52
Das ist schon irgendwie ein tolles service hier.
Parent - - By Ingo Bauer Date 2010-10-02 18:15
Hallo

Danke für die netten Worte, freut mich wenn das jemand begrüßt!

Gruß
Ingo
Parent - - By Peter Martan Date 2010-10-02 18:29
Bitte gern, unter uns, ich bin sicher, das begrüßen noch viel mehr Leute, als es extra sagen und dann kommen noch die dazu, die es nicht einmal zugeben würden und trotzdem heimlich sofort nachschauen gehen.
Parent - - By Patrick Götz (Mod.) Date 2010-10-02 22:09
Das kann ich nur bestätigen, denn ich gehöre selbst dazu 
Nichtsdestotrotz: Danke Ingo!

Patrick
Parent - By ernst happe Date 2010-10-02 22:11
und du bist nicht allein 
Parent - By Stefan Pohl Date 2010-10-02 19:02
Hallo Ingo,

auch von mir Respekt und Anerkennung. Du bist ja schneller als die Feuerwehr. Bin schon sehr gespannt auf die neue Stockfishversion. Keine Engine der Spitzenklasse spielt so druckvoll und auf Angriff.

Weiter so. Dein Live-Service: SUPER !!!

Die allerbesten Grüße - Stefan

P.S: In ca. 5-7 Tagen gibts von mir hier einen ausführlichen Testbericht zu 3 Ivanhoes gegen 8 Top-Engines (je 100 Spiele). Da werde ich dann deine Elozahlen nutzen, um eine ungefähre Einordnung der Ivans durchzuführen.
Parent - - By Frank Rahde Date 2010-10-02 20:34
Super Sache, Ingo.

Aber konnte ich nicht bis neulich auch immer während des Turniers den "Ratingstand" der getesteten Engine am Ende der Liste mitverfolgen? Ich vermisse diese Zwischeninfo.

Gruß, Radost (Frank R)
Parent - - By Klaus S. Date 2010-10-02 20:40
Hi Frank,

Mußt einfach ein bisschen nach unten scrollen

Gruß Wilfried
Parent - - By Frank Rahde Date 2010-10-02 21:03
Ich Trottel.
Parent - By Klaus S. Date 2010-10-02 21:17
Aber nich doch 
Parent - By Ingo Bauer Date 2010-10-02 22:15
Hallo Frank,

Das mit dem Ratingstand hat sich ja geklärt, aber nochmal zur Info: Das Rating im laufenden Turnier ist für eine Top Engine minimal höher als mit der späteren Bayesauswertung. (Elostat haut halbwegs hin, aber die Startwerte sind Bayes). Also "im Kopf" einfach mal ein paar Elo abziehen, dann kann man auch mit der aktuellen IPON vergleichen.

Gruß
Ingo
Parent - - By Stefan Pohl Date 2010-10-03 07:44
Bin eben gleich nach dem Aufstehen ins Internet, weil ich so gespannt war, wie es bei Stockfish läuft. Nach nun 754 von 1900 Spielen 2900 Elo. Enttäuschend, weil praktisch der gleiche Wert wie Stockfish 1.8. Die neue Version bringt wohl nichts... Klar sind große Sprünge auf diesem hohen Niveau nicht zu erwarten, aber das sieht doch stark nach Stagnation aus.

Bin etwa enttäuscht - Stefan

Parent - - By Ingo Bauer Date 2010-10-03 10:29
Hallo Stefan,

[quote="Stefan Pohl"]
Bin eben gleich nach dem Aufstehen ins Internet, weil ich so gespannt war, wie es bei Stockfish läuft. Nach nun 754 von 1900 Spielen 2900 Elo. Enttäuschend, weil praktisch der gleiche Wert wie Stockfish 1.8. Die neue Version bringt wohl nichts... Klar sind große Sprünge auf diesem hohen Niveau nicht zu erwarten, aber das sieht doch stark nach Stagnation aus.

Bin etwa enttäuscht - Stefan

[/quote]

Na ja, wenn ih die mitgelieferten changes so lese finde ich das:

[quote="Stockfish 1.9 Changes"]
Apart from that the increment is really silly at fast time controls
(as we normally test), perhaps we could have some surprises (hopefully
not bad ones) at longer TC where the new time management code by Joona
could kick in with a bit of luck.

Another change from 1.8 is that we lowered the aggressiveness of both
LMR and pruning, we will se if this will pay at longer TC, at fast TC
change is almost zero....
[/quote]

Also sie erwarten keinen Elozuwachs bei sehr kurzen Zeitkontrollen, hoffen aber das, Aufgrund eines neuen Zeit Managements und gesenkter Aggresivität der LMR (late move reduction) und weniger Pruning, es sich bei längeren Zeitkontrollen auszahlt.

Tja: Meine Zeitkontrolle ist schon mindestens 5 mal länger als das was sie testen, keine Engine aus meiner Liste unterscheidet sich groß von den längeren Zeitkontrollen bei SWCR/CEGT oder CCRL. Natürlich kann man immer die Hoffnung haben, aber meine Meinung zum plötzlich besseren SPiel bei längeren Zeitkontrollen ist bekannt. Aber gut vielleicht ist Stockfish 1.9 ja die erste Engine die das kann (Irgendwann kommt mal ein Programmierer und ärgert mich, er läßt siene Engine nach der Zeitkontrolle schauen, ist diese unter einem bestimmten Wert, schaltet er siene Engine 100 Elo schwächer ... )

Grundsätzlich finde ich es ja gut wenn man Code bereiningt, also unnötiges entfernt und sauber hält. Bei einer kommerziellen Enigne gäbe es dafür bestimmt kein Release. Bei so einem Projekt sieht die Sache anders aus ...

Egal, ich habe wieder was zu testen

Gruß
Ingo
Parent - By Frank Quisinsky Date 2010-10-03 12:34
Hi Ingo,

das Stockfish Team geht vorbildlich vor. Codebereinigung bevor weitere Optimierungen kommen welche eher spielstärkebeeinflussend werden. Wichtig ist bei Stockfish, dass der druckvolle Spielstil nicht verloren geht. Leider war Version 1.8.0 dahingend ein kleiner Rückschritt. Codebereinigung aber den fantastischen Spielstil beibehalten, dass wäre eine echte Aufgabe.

Immerhin spielt Stockfish alles andere als langweiliges Rybka Geschiebe. Bin schon gespannt wie es weiter geht. Auffällig ist, das die Version 1.7.1 w32 besser war als die 1.8.0 w32. Der 32Bit Zuwachs nahm bei Version 1.8.0 deutlich zu, glaube über 20 ELO. Auch das ist interessant, hoffe das Version 1.9.0 ein wenig besser auf 32bit optimiert wurde.

Wird sich im Laufe der Zeit zeigen. SF läuft auch nicht weg ...

Gruß
Frank
Parent - - By Rudolf Rohs Date 2010-10-06 09:33
Hallo.

im Moment läuft ein Test mit längeren Bedenkzeiten auf http://www.tcec-chess.org/live.php
Dort liegt Stockfish aktuell nach 11 Partien einen Punkt gegen Rybka 4 hinten. Die 12. Partie
scheint wieder Remis zu werden.
Den Test zwischen Stockfish 1.8 und Rybka 4 über 48 Partien hatte Rybka noch mit 10 Punkten
Unterschied gewonnen.

Dies ist zwar immer noch möglich, aber bisher sieht es nach einer Verbesserung aus.

Gruß

Rudolf
Parent - - By Benno Hartwig Date 2010-10-06 14:08
[quote="Rudolf Rohs"]Den Test zwischen Stockfish 1.8 und Rybka 4 über 48 Partien hatte Rybka noch mit 10 Punkten
Unterschied gewonnen. [/quote]Diese Deutlichkeit war dann vermiutlich auch der recht kleinen Partienzahl geschuldet.
Ca. 40 ELO wird R4 dem SF18 überlegen sein. Erwartungswert für die ELO-Differenz wäre dann ca. 5.5 Punkte.

CEGT 40/4 weist für die 1-Kern-32bit-Stockfish-Versionen die ELO-Werte aus:
3069   1.8
3040   1.7.1
2976   1.6
2912   1.5.1
2896   1.4
Ich finde, das ist eine beeindruckende Serie, auch wenn es auch überraschendeWerte bei mehr bit und Kernen gibt.
Weiß jemand noch die Zeiten, zu denen diese Versionen herauskamen?

Benno
Parent - - By Rudolf Rohs Date 2010-10-06 14:54
Hallo Benno,

m.E. braucht man bei solangen Bedenkzeiten deutlich weniger Partien um ein klares Bild zu erhalten. Immerhin dauert eine Partie mehrere Stunden, die 48 Partien
dürten also mindestens genausoviel Rechenzeit verschlungen haben wie z.B. 1500 Ipon-Partien. Ich gehe also von einer gewissen Aussagekraft trotz der geringen
Partienzahl aus. Eine größere Tolleranzbreite bleibt natürlich trotzdem bestehen.

Auch kommt es bei Zweikämfen nicht nur auf die reine Elozahl an, sondern auch darauf ob mir der Gegner liegt. Rybka schneidet gegenüber Stockfish besser ab als Houdini,
obwohl Rybka und Houdini ziemlich gleichstark sind. Das Stockfishergebnis gegen Houdini 1.02 auf lange Bedenkzeiten war sehr viel enger. als es der Elounterschied zwischen Rybka 4 und Houdini 1.02 vermuten lassen würde. (Naum dagegen schneidet gegen Houdini deutlich schlechter ab, als er gegen Rybka abschneidet).

Auch wenn die 10 Punkte Unterschied zu deutlich sein mögen, glaube ich doch, dass Stockfish 1.8 auf längere Zeiten weniger zulegt als Rybka 4. Aber vielleicht
schließt Stockfish 1.9 ja einen Teil der Lücke.

Gruß

Rudolf



Parent - By Benno Hartwig Date 2010-10-06 16:46
[quote="Rudolf Rohs"]Rybka schneidet gegenüber Stockfish besser ab als Houdini, obwohl Rybka und Houdini ziemlich gleichstark sind. Das Stockfishergebnis gegen Houdini 1.02 auf lange Bedenkzeiten war sehr viel enger.[/quote]Die erste Ipollit-Seite triumpfierte ganz direkt mit einem Vergleich zu Rybka.
Auf Rybka als wichtigsten Gegner hat sich diese Engine-Liene wohl direkt eingeschossen.
Benno
Parent - - By Benno Hartwig Date 2010-10-06 18:09
[quote="Rudolf Rohs"]m.E. braucht man bei solangen Bedenkzeiten deutlich weniger Partien um ein klares Bild zu erhalten. Immerhin dauert eine Partie mehrere Stunden, die 48 Partien dürten also mindestens genausoviel Rechenzeit verschlungen haben wie z.B. 1500 Ipon-Partien. [/quote] Ich habe ja die Befürchtung, dass die Fehleranfälligkeit bei der Einschätzung der relativen Spielstärke bei 50 Partien (z.B. 60 Sek/Zug) bei langen Zeiten genauso groß ist wie die bei kurzen Zeiten (z.B. 10 Sek/Zug oder sogar 3 Sek/Zug).
Hast du da tatsächlich andere Erfahrungen? Dies würde bedeuten, dass du dir zutraust, auch in einer Partie, die eine dir unbekannte Engine verloren hat, zu erkennen, dass diese Engine eigentlich die stärkere war! Kannst du das? Ich gestehe: ich nicht.
Benno
Parent - - By Rudolf Rohs Date 2010-10-06 19:10
Hallo Benno,

anhand einer Partie kann ich dies auch nicht. außer ich erkenne die Engines am Spielstil.

Ich lasse allerdings manchmal verschiedene Engines über die gleiche Stellung analysieren und lasse das Ergebnis der einen
dann von einer anderen Engine überprüfen. (Nach dem Motto Shredder spielt a3, der Zug gefällt aber Rybka nicht, mal schauen
warum, usw.) Dabei habe ich festgestellt, daß jede Engine mal danebenliegt.

Trotzdem gibt es Unterschiede.

Nimm z.B. mal eine Engine mit unterschiedlichen Settings. Fire 1.1 spielt auf Blitzstufe mit dem DW-Setting alles in Grund und Boden.
Bei Franks Test mit längeren Bedenkzeiten schneidet Fire 1.1 mit dem Setting allerdings deutlich schlechter ab. Wenn also bei einer Engine ein
Bewertungsfehler vorliegt wirkt sich dies bei kurzen Bewertungszeiten nicht unbedings negativ aus, bei langen Bedenkzeiten,
wo der Fehler dann kummuliert schon. da die eine Engine ihre Bewertung langsam immer weiter verbessert, während die andere Engine einfach
"dumm" bleibt.

Natürlich gibt es auch den anderen Weg, wo die Engine die danebenliegt ihren Fehler irgendwann erkennt und behebt. Beides ist möglich
aber beides beeinflußt das Ergebnis. So kann eine Engine mit anderer Bedenkzeit besser oder schlechter abschneiden.

2000 Partien auf Turnierstärke könnten meine These belegen oder zerstören, aber das werden wir warscheinlich nie rauskriegen, da soviel
leider niemand mehr testen kann.

Gruß

Rudolf
Parent - - By Benno Hartwig Date 2010-10-06 20:07
[quote="Rudolf Rohs"]Nimm z.B. mal eine Engine mit unterschiedlichen Settings. Fire 1.1 spielt auf Blitzstufe mit dem DW-Setting alles in Grund und Boden.
Bei Franks Test mit längeren Bedenkzeiten schneidet Fire 1.1 mit dem Setting allerdings deutlich schlechter ab.[/quote]Die Ipo-Gang spielt auf kurzen Zeiten (Blitz und am besten noch deutlich darunter, so 1 bis 2 Sekunden pro Zug!) wirklich besonders stark. Nach meinem Eindruck reduziert sich dieser Vorsprung ggü. R4 aber bei längeren Zeiten grundsätzlich und ist bei Turnierzeiten kaum noch feststellbar.
Solch ein Verhalten habe ich bei diesen Engines so extrem auch das erste Mal bei einer Engine gesehen.
Benno
Parent - - By ernst happe Date 2010-10-06 21:19
[quote="Benno Hartwig"]
...Die Ipo-Gang spielt auf kurzen Zeiten (Blitz und am besten noch deutlich darunter, so 1 bis 2 Sekunden pro Zug!) wirklich besonders stark. Nach meinem Eindruck reduziert sich dieser Vorsprung ggü. R4 aber bei längeren Zeiten grundsätzlich und ist bei Turnierzeiten kaum noch feststellbar.
Solch ein Verhalten habe ich bei diesen Engines so extrem auch das erste Mal bei einer Engine gesehen.
Benno
[/quote]

hi benno,

trifft das wirklich einzig nur für ippo`s zu?
wie war das denn als rybka herauskam, im vergleich zu den zur gleichen zeit verfügbaren engines?
was sagen die datenbanken dazu???

ernst
Parent - By Benno Hartwig Date 2010-10-07 14:42
[quote="ernst happe"]trifft das wirklich einzig nur für ippo`s zu?[/quote]'einzig' weiß ich natürlich nicht.
Obwohl ich immer viel mit sehr kurzen Zeiten experimentierte und die Ergebnisse mit den im Netz dokumentierten (bei längeren Zeiten erspielten) Ergebnissen verglich, habe ich eine so deutliche Abstufung in vielen Jahren bei keiner anderen Engine gesehen.
Benno
Parent - - By Frank Quisinsky Date 2010-10-06 22:57
Hi Benno,

so ist es.
Erinnere Dich an die Diskussionen zur Jahreswende.
Das wurde seinerzeit schon alles festgestellt aber von wenigen publiziert.

Dennoch, bei Fire 1.1 WD gibt es einen interessanten statistischen Aspekt. Die Engine hat eine sehr hohe Remisquote, schwankt dadurch selbst nach 600 Partien noch im Rating. Keinesfalls kann ich ein stabiles Rating feststellen und mithin ist fast der SWCR Rekord hinsichtlich stabiles Rating erreicht (hält Naum 4.2 mit 620 Partien). Nun bin ich davon ausgegangen, dass je höher die Remisquote desto stabiler ist das Rating. Dieser Test zeigt jetzt dummerweise das genaue Gegenteil auf. Glaube wir hatten das auch mal diskutiert (Remisquote). Und noch interessanter ist, die beiden Berechnungsprogramme gehen total auseinander. 20 ELO Differenz bei den Berechnungen von ELOstat und Bayesian nach 506 Partien.

Genauso interessant wie die ErrorBars, die bei Shredder 12 nicht stimmen können wenn denn die beiden Engines wirklich gleich sind (siehe meine Aktuell Seite). Je tiefer getestet wird desto mehr neue Fragen kommen auf, hinsichtlich der ausgegebenen Statistiken.

Also, so uninteressant sind diese Themen nicht. Du selbst zeigst Dich immer sehr interessiert und schreibst hierzu sehr gute Beiträge, interessierst Dich dafür.

Nun, nicht jede Frage kann immer direkt beantwortet werden aber hinsichtlich IPP Familie absolut die gleiche Meinung. Offenbar fehlt irgendwo Schachwissen, die Programme werden schneller abgearbeitet und sind vielleicht deswegen im Blitz bevorzugt. Eine andere Erklärung habe ich dazu nicht.

Gruß
Frank
Parent - By Rudolf Rohs Date 2010-10-07 09:05
Hallo Frank,

die besondere Blitzstärke wundert micht nicht. Hast Du mal ins Ippo-Forum gesehen? Dort wird meistens nur auf kurzen und ultrakurzen Bedenkzeiten
getestet. 10 min. Partien sind schon die rühmliche Ausnahme.

Deshalb wird jeder "Kurzzeiterfolg" bemerkt und versucht zu optimieren, während Langzeitverbesserungen unentdeckt hinten wieder runterfallen.

Gruß

Rudolf 
Parent - - By Ingo Bauer Date 2010-10-07 11:18
Hallo Frank,

[quote="Frank Quisinsky"]

Genauso interessant wie die ErrorBars, die bei Shredder 12 nicht stimmen können wenn denn die beiden Engines wirklich gleich sind (siehe meine Aktuell Seite). Je tiefer getestet wird desto mehr neue Fragen kommen auf, hinsichtlich der ausgegebenen Statistiken.
...
[/quote]

Frank, bitte ließ mal das: http://de.wikipedia.org/wiki/Ockhams_Rasiermesser

Ich zitiere das wichtigste:"Steht man vor der Wahl mehrerer Erklärungen, die sich alle auf dasselbe Phänomen beziehen, soll man diejenige bevorzugen, die mit den einfachsten bzw. der geringsten Anzahl an Annahmen auskommt."

Kurz: Die Mathematik des guten Gauss anzuzweifeln, die sich seit mehr als 200 Jahren in tausenden, wenn nicht Millionen von überaus praktischen Fällen, bewährt, um nicht zu sagen bewiesen(was es ist), hat, mußt du entweder, die Identität der beiden Shredder anzweifeln oder aktzeptieren das eben NICHT das Gleiche getestet wurde! Zweifel an der Statistik gehören in diesem Fall nicht zu den einfachen Möglichkeiten.

Für mich liegt die Ursache in Büchern, das wolltest du nicht gelten lassen. Mir ist es egal, weil du das erklären mußt nicht ich, aber zu versuchen Gauss anzuzweifeln ist auf jeden Fall -nach obigem Prinzip- der völlig falsche Weg.

Wenn du schon deine Testbedinungen als sakrosant betrachtest, ist es sinnvoller du erklärst, dass die Shredders nicht gleich sind, als wenn du Gauss anzweifelst!

Gruß
Ingo
Parent - By Benno Hartwig Date 2010-10-07 14:52
[quote="Ingo Bauer"]Kurz: Die Mathematik des guten Gauss anzuzweifeln, die sich seit mehr als 200 Jahren in tausenden, wenn nicht Millionen von überaus praktischen Fällen, bewährt, um nicht zu sagen bewiesen(was es ist), hat, mußt du entweder, die Identität der beiden Shredder anzweifeln oder aktzeptieren das eben NICHT das Gleiche getestet wurde! Zweifel an der Statistik gehören in diesem Fall nicht zu den einfachen Möglichkeiten.[/quote]Gauss anzweifeln sollte man nicht.
Aber sehr genau prüfen, wo denn tatsächlich eine Gauss-Verteilung vorliegt, hingegen schon.
Dem ELO-System liegen halt Hypothesen auch mit Blick auf Gauss zugrunde, die wenigstens genügend gut stimmen mögen. Mehr aber auch nicht. Gauss sagt zunächst mal zum Schach nichts.
Benno
Parent - By Frank Quisinsky Date 2010-10-06 15:01
Hallo Benno,

das kann +- wenigen Tagen z. B. auf meiner Startseite in der Historie der getesteten Programme entnommen werden.
Startseite auf www.amateurschach.de

Gruß
Frank
Parent - By Rudolf Rohs Date 2010-10-11 09:16
Hi,

der Test zwischen Rybka 4 und Stockfish 1,9 ging diesmal nur über 32 Partien. Das Endergebnis war 18:14.
Hochgerechnet auf 48 Partien wär dies 27:21.
Also etwas enger als das 29:19 zwischen Rybka 4 und Stockfish 1.8, aber nicht viel Unterschied.

Gruß

Rudolf Rohs
Parent - - By Peter Martan Date 2010-10-03 13:28
Hallo Stefan!

[quote="Stefan Pohl"]
Bin eben gleich nach dem Aufstehen ins Internet, weil ich so gespannt war, wie es bei Stockfish läuft.
[/quote]

Bei mir war's genauso.

Das mit der leichten Enttäuschung nicht, weil einerseits erhofft man sich immer bei einer engine, die man liebt, den großen Wurf, bei den letzten updates von SF hätte man wissen können, dass, wenn vor 2.0 noch ein 1.9 kommt, wird's der wieder nicht sein, und wie soll der überhaupt aussehen?
Rybka in Grund und Boden spielen, naja, warum grad die? Lustig find ich aber schon, dass es grad gegen die momentan 23 zu 32 aus SF- Sicht steht und gegen den ja in Ingos Liste sogar eine Spur besser gereihten Houdini 28 zu 28.

Mit den topaktuellen Neuigkeiten ist das halt auch so eine Sache, sind sie nicht von weltbewegendem Inhalt, sind sie umso schneller gegessen, je schneller man von ihnen erfahren hat, die Sache mit der Zeitung von gestern.
Fragen, die sich schnell beantworten lassen, sind meistens nicht so lang interessant, wie solche, die einem was zum Grübeln aufgeben.

So bin ich eigentlich besser dran mit meiner veralteten Neugier, bei einer neuen Version, auch wenn sie in den Ranglisten nicht den ganz großen Sprung macht, an dem, was sie einfach bei bestimmten Stellungen anders spielt, auch dann noch interessiert zu sein.
Das Fatale daran ist halt wieder, darüber kann man anders als anhand dieser einzelnen Stellungen überhaupt nicht sinnvoll diskutieren, man kann diese Änderungen nur anhand der jeweils einzelnen Stellung zeigen, die Ursachen, die dahinter stehen, sind was Anderes, das versteht der Programmierer, wenn überhaupt, und mit dem in foren darüber zu reden, geht nur so gut, wie der geduldig ist, und man ihn versteht.
Immer wieder stoße ich da an meine Grenzen, gerade löchere ich den guten Marco Costalba im talkchess, aber wenigstens hau ich ihm dort nicht gleich alle meine test positions um die Ohren, in denen mir 1.9 besser und die, in denen er mir schlechter als 1.8 vorkommt.

Allerdings wäre das, wie gesagt, halt das Einzige, was man als Schachspieler wirklich beitragen und worüber man mit solchen halt wirklich reden könnte.
Parent - - By Ingo Bauer Date 2010-10-03 13:33
Hallo Peter,

[quote="Peter Martan"]
....
Rybka in Grund und Boden spielen, naja, warum grad die? Lustig find ich aber schon, dass es grad gegen die momentan 23 zu 32 aus SF- Sicht steht und gegen den ja in Ingos Liste sogar eine Spur besser gereihten Houdini 28 zu 28.

...
[/quote]

... du hast lange nicht mehr in meine Liste geschaut scheint mir.

Gruß
Ingo
Parent - - By Peter Martan Date 2010-10-03 14:11
[quote="Ingo Bauer"]
... du hast lange nicht mehr in meine Liste geschaut scheint mir.
[/quote]

Was meinst du jetzt, dass es mittlerweile live schon 24 zu 33 oder so steht, ja wohl nicht?

Die Liste selbst, ehrlich gesagt, noch nie so ganz ganz, ich schau immer nur auf deine Top 20 engines, aber da ist doch auch nicht viel um, schreibst du?
Steh auf der Leitung vermutlich.
Übrigens dazu noch, wenn du mein letztes Antwort- posting im S12- settings- thread so stehen lässt, nehm ich das natürlich als stumme Zustimmung.
Parent - - By Ingo Bauer Date 2010-10-03 14:55
Hallo

[quote="Peter Martan"]
[quote="Ingo Bauer"]
... du hast lange nicht mehr in meine Liste geschaut scheint mir.
[/quote]

Steh auf der Leitung vermutlich.

[/quote]

In klaren Worten um Missverständnisse zu vermeiden: Houdini ist nicht vor Rybka 4 gereiht in meiner Liste. De fakto waren und sind die beiden Engines praktisch gleich stark. Daran wird übrigens auch ein mageres 100 Match, das man nie isoliert betrachten sollte, nichts ändern.

Gruß
Ingo
Parent - By Peter Martan Date 2010-10-03 17:19
[quote="Ingo Bauer"]
In klaren Worten um Missverständnisse zu vermeiden: Houdini ist nicht vor Rybka 4 gereiht in meiner Liste. De fakto waren und sind die beiden Engines praktisch gleich stark. Daran wird übrigens auch ein mageres 100 Match, das man nie isoliert betrachten sollte, nichts ändern.
[/quote]

Uups, ich hätte wirklich mal wieder nachschauen sollen, aber vor einer noch gar nicht gar so langen Weile...
Jetzt hätte ich dann nur noch die Ausrede, dass ich natürlich schon längst nicht mehr sooo genau geschaut hab, weil mir da oben 1, 2, (3,4,5,...10...20...) Elo ohnehin wurscht sind und dann natürlich auch die dadurch unterschiedenen Ränge, dagegen spricht aber halt die schon zugegebene Neugier, bei SF 1.9 jetzt dann schon ein paar Mal öfter gespechtelt zu haben.

Gewinnen und Verlieren, Erster, Zweiter, Dritter ist halt psychologisch weniger wurscht als 1,2 Elo, auch wenn's psychounlogisch ist, wenn der Unterschied zwischen den Plätzen nicht größer wird dadurch.
Merke daher: wie genau auch immer wir messen, Bedeutung beimessen bleibt subjektiv.
Parent - - By Ingo Bauer Date 2010-10-04 20:19
Hello all,

2000 games are finsihed and a proper rating list (Bayes) is online.

http://www.inwoba.de

To make it short: Minimal increase, well within the error margin.

Bye
Ingo
Parent - By Wolfgang Battig Date 2010-10-04 20:58
[quote="Ingo Bauer"]
Hello all,

2000 games are finsihed and a proper rating list (Bayes) is online.

http://www.inwoba.de

To make it short: Minimal increase, well within the error margin.

Bye
Ingo
[/quote]

Hallo Ingo,

passt sehr gut zu meinem Ergebnis mit 40/3 repeated: +8 nach 1000 Partien also keine Verbesserung!

http://cegt.foren-city.de/topic,478,-testing-stockfish-1-9.html#2660

Gruß
Wolfgang
Up Topic Hauptforen / CSS-Forum / Stockfish 1.9 live on IPON

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill