LS-Rangliste: Stockfish 140112

By Stefan Pohl Date 2014-01-16 08:22

Nun ist das nächste Teilziel von Stockfish auf seinem Weg zur absoluten Nummer 1 (unter allen Bedingungen) erreicht: Houdini 3 wurde im Bullet eingeholt (bzw. sogar um ein Elopünktchen überholt)...
Auch im Einzelvergleich gegen Houdini 4 konnte Stockfish sein Ergebnis nochmals verbessern und hat nun aus diesen 1000 Partien 48.25% geholt (Stockfish 140106 hatte 47.05% erzielt) (siehe dazu die Kreuztabellen (alt und neu) des LS-top10-tournaments).
Jetzt fehlen noch 32 Elopunkte zu Houdini 4. Wie lange wohl noch?

Seit Stockfish 131223 hat Stockfish unglaubliche +23 Elopunkte zugelegt - in nur knapp 3 Wochen. Also (mal wieder) ein durchschnittlicher Zuwachs von gut einem Elopunkt pro Tag. Unfaßbar. Bei diesem Tempo würde es nur noch einen guten Monat dauern, bis Stockfish die Nummer 1 in der LS-Rangliste wird. Aber realistisch sind wohl eher 3-4 Monate, denke ich.

Stefan

By sachista Date 2014-01-16 08:35

Tolle Neuigkeit und ein wunderbarer Start in den Tag. Danke!

By Patrick Götz Date 2014-01-16 09:26

Danke Stefan!
Stockfish vor Houdini 3 in der LS Rangliste, ich sehe es vor mir aber...irgendwie kann es immer noch nicht richtig glauben

By Stefan Pohl Date 2014-01-16 09:41

Patrick Götz schrieb:

Danke Stefan!
Stockfish vor Houdini 3 in der LS Rangliste, ich sehe es vor mir aber...irgendwie kann es immer noch nicht richtig glauben

Yep. Der Zuwachs allein in den letzten drei Wochen ist einfach der Hammer. Daß Stockfish nun im Bullet wirklich auf Houdini 3 Level liegt und gegen Houdini 4 mehr als 48% scort, ist dennoch kaum zu glauben, wenn man bedenkt, wo Stockfish vor einem Jahr stand. Das war noch bevor das Framework loslegte und da war Stockfish 2.3.1 noch die stärkste Version. Seitdem +157 Elo in ca. einem Jahr. Mir war zwar von Anfang an klar, daß das Framework eine tolle Innovation ist, und Stockfish sicher weiterhelfen würde, aber daß es in diesem unfaßbaren Ausmaß und Tempo passieren würde, hätte ich wirklich nicht gedacht.

Nun fehlen nur noch 33 Elo für die Nummer 1. Wenn man das Entwicklungstempo des letzten Jahres mittelt, dann hat Stockfish 157/365=0.43 Elo pro Tag zugelegt. Ergo sollte man erwarten können, daß die letzten 33 Elopunkte noch ca. 77 Tage (2.5 Monate) dauern sollten. Das wäre Ende März / Anfang April 2014... Mal sehen, ob das wirklich zu schaffen ist.
Ich bleibe beim Stockfish-Testen definitiv am Ball!

Stefan

By Frank Brenner Date 2014-01-16 11:11

Hi Stefan,

tolle arbeit.

Wenn du einmal Leerlauf hast dann schlage ich einen Test mit sagen wir 3xer Bedenkzeit vor. Mal gucken ob Stockfisch dann etwas mehr punktet ...

By Patrick Götz Date 2014-01-16 11:23

Was genau soll Stefan dann mit 3x Bedenkzeit testen?
Wenn Zeit frei sein sollte würde mich immer noch ein neues Match unter original LS Bedingungen Stockfish-Houdini 3 interessieren, denn Houdini 3 hat bisher immer noch jedes Match gegen Stockfish gewonnen.

By Stefan Pohl Date 2014-01-16 11:26

Patrick Götz schrieb:

Im Moment liegt ja nix an. Da kann ich ja die 1000 Partien Stockfish 140112 gegen Houdini 3 mal machen. Ergebnis morgen.

Stefan

By Frank Brenner Date 2014-01-16 14:24

Ja, einverstanden 1000 Spiele vs H3 sind auch sehr interessant, vor allem weil Stockfisch sehr lange nicht mehr gegen H3 gespielt hat unter LS Bedingungen.

3 fache Bedenkzeit weil wir so einen weiteren Beleg dafür erhalten könnten, dass Stockfisch zumindestens in den ersten Sekunden der Bedenkzeit stärker zulegt als die restlichen Engines. Natürlich geht auch 4x oder 5x oder 8x, aber 3x ist noch zeitlich so eben machbar und bei 2x könnte der Effekt vielleicht recht schwach sein. 2x wäre aber auch möglich.

By Patrick Götz Date 2014-01-16 15:12

Nochmal: Was genau soll Stefan dann mit 3x Bedenkzeit testen? Wer gegen wen?

By Frank Brenner Date 2014-01-16 17:08

gegen alle gegener, also 10.000 spiele ...

By Frank Brenner Date 2014-01-16 17:11

also um es genau zu sagen: stockfishc gegen jeden jeweils 1000 spiele, also 10.000 insgesamt, mit jew. 3x bedenkzeit.

aber nicht eine komplett neue tabelle, also kein X gegen Y.

Dann können wir gucken ob der gesamtscore in Prozent gegen die einzelnen und gegen den durchschnitt steigt und wie sehr er steigt.

Wenn er steigt dann würde das bedeuten dass stockfisch zumindestens bei bedenkzeiten von wenigen sekunden pro zug mehr von mehr zeit profitiert als die anderen engiens.

By Patrick Götz Date 2014-01-16 18:48

Frank Brenner schrieb:

Dann können wir gucken ob der gesamtscore in Prozent gegen die einzelnen und gegen den durchschnitt steigt und wie sehr er steigt.
Wenn er steigt dann würde das bedeuten dass stockfisch zumindestens bei bedenkzeiten von wenigen sekunden pro zug mehr von mehr zeit profitiert als die anderen engiens.

Insgesamt rücken die Engines bei mehr Bedenkzeit durch die höheren Remisquoten näher zusammen.
Vermutlich wird auch bei Stockfish daher der Gesamtscore in Prozent fallen, selbst dann wenn Stockfish von längerer Bedenkzeit mehr profitiert als andere Engiens.
Daher wäre irgendeine Aussage anhand der 10.000 Partien nicht möglich.

By Stefan Pohl Date 2014-01-17 04:37

Patrick Götz schrieb:

So, hier nun das Ergebnis von Stockfish 140112 gegen das "Bullet-Biest im Ruhestand" Houdini 3:

537.5-462.5 (+332 -257 =441)

Somit hat Houdini 3 nun zum ersten Mal einen 1000er-Zweikampf unter LS-Bedingungen verloren! (Nach mehr als 70 Siegen...). Und sogar relativ deutlich, allerdings lassen nur 1000 Partien natürlich auch noch reichlich Raum für den Zufall.

Stefan

By Patrick Götz Date 2014-01-17 08:51

Stefan Pohl schrieb:

Patrick Götz schrieb:

Das sind unglaubliche 53,75% und +26 ELO.
Das kann entweder der Raum für Zufall sein oder Houdini 3 bekommt durch seinen Contempt Faktor ("Überheblichkeitsfaktor") erhebliche Probleme mit stärkeren Gegnern.
Ich vermute beides.
In jedem Fall wird die Platzierung Stockfish 140112 vor Houdini 3 dadurch unterstrichen.

By docdwo Date 2014-01-16 11:32

In meinem Posting "Meine ersten Erfahrungen im Online-Schach" heute morgen hier hatte ich über 3min Online-Partien mit dem aktuellen Stockfish (Rockwood-Version) berichtet. Einen H3Pro konnte er regelrecht "zerlegen". Das liegt aber teilweise auch an handoptimierten Time-Management Parametern und am Eröffnungsbuch. Ich kann keinem empfehlen, mit den Standard-Parametern online zu gehen, einmal verlor ich auf Zeit fünf Züge bevor ich meinen Gegner Matt setzen konnte.

By Benno Hartwig Date 2014-01-16 17:22

Ich vote für normale LS-Zeit.
Womit wollte man das 3x-Zeit-Ergebnis vergleichen? Der aktuelle SF spielte ja noch nie gegen H3.
Erst wenn das normale-Zeit-Ergebnis vorliegt könnte ein 3x-Zeit-Ergebnis eine zusätzliche Erkenntnis bringen.

Benno

By Tom Paul Date 2014-01-16 17:33

Oder nur halb so viel LS Zeit.

By Stefan Schiffermüller Date 2014-01-16 13:28

Stefan Pohl schrieb:

Nun fehlen nur noch 33 Elo für die Nummer 1.

Eigentlich sind es nur 19 Punkte, wenn man Stockfish mit Houdini 4 und contempt=0 vergleicht. Das ist die objektiv stärkste Einstellung, die auch im Analysemodus verwendet wird, die aber gegen Schwächere und damit in einer Rangliste weniger punktet.

Stefan

By Patrick Götz Date 2014-01-16 14:06

Guter Hinweis.

By Stefan Pohl Date 2014-01-16 14:32

Stefan Schiffermüller schrieb:

Stefan Pohl schrieb:

Nun fehlen nur noch 33 Elo für die Nummer 1.

Ich bezweifle ernsthaft, daß contempt=0 die stärkste Einstellung ist. Zudem wird in der LS-Rangliste im Gegensatz zu anderen Ranglisten nur gegen die 10 stärksten Engines der Welt (+den Ur-Ippolit von 2009, der aber auch sehr stark ist) getestet. Und da ist contempt=0 klar schwächer gewesen...obwohl es keine wirklich schwachen Gegner gab.
Zudem darf ich nochmal an die zwei Ergebnisse gegen Stockfish und Komodo erinnern:

Houdini 4 Contempt=0 - Stockfish 131223 x64s 557.5 - 442.5 +317/=481/-202 55.75%
Houdini 4 Contempt=0 - Komodo TCECr x64 574.0 - 426.0 +318/=512/-170 57.40%

Houdini 4 x64 - Stockfish 131223 x64s 551.0 - 449.0 +341/=420/-239 55.10%
Houdini 4 x64 - Komodo TCECr x64 582.0 - 418.0 +370/=424/-206 58.20%

Also einmal minimal besser, einmal minimal schlechter. Zusammengerechnet praktisch identisches Ergebnis im Vergleich zum default-Houdini. Default: 1133 aus 2000 und Contempt=0: 1131.5 aus 2000.

Also würde ich sagen, daß Contempt=0 gegen die besten Gegner nicht besser und gegen schwächere schlechter ist. Was zusammengerechnet heißt, daß contempt=0 schlechter als default ist.

Stefan

By Stefan Schiffermüller Date 2014-01-16 15:20

Stefan Pohl schrieb:

Also würde ich sagen, daß Contempt=0 gegen die besten Gegner nicht besser und gegen schwächere schlechter ist. Was zusammengerechnet heißt, daß contempt=0 schlechter als default ist.

Stockfish ist in deinem Test gegen Houdini 4 noch deutlich schwächer. Es könnte daher sein, dass sich hier contempt=1 nicht negativ oder sogar positiv auswirkt. Das bleibt aber Spekulation, da 1000 Partien nicht genug sind. Gegen Houdini 3 dürfte contempt=1 sich bereits negativ auswirken.

Stefan

By Michael Scheidl Date 2014-01-16 16:13

Niemand spricht über Contempt = 2.

By Karl Müller Date 2014-01-22 17:44 Edited 2014-01-22 17:53

die Praxis auf dem Server sagt da was anderes:

habe schon viele "überlegene" Rechner verlieren sehen, wenn Contempt auf 1 bei Houdini steht - jüngst insbesondere in "toten Remi-Stellungen" wo dann H4 haarsträubende Fehler macht um das remi zu vermeiden. Wenn dann noch der Bug hinzukommt grauenhafte Fehler . . .

Ein Houdini 4mit Contempt 0 verliert diese Stellungen nicht, spielt Remi oder nur, wenn der Fritz GUI-Bug brutal zuschlägt.

Andere Geschichte: Wenn man gegen viele andere sowieso schwächere Engine spielt, dann ist Contempt 1 bei H4 ein Vorteil.
.

Insgesamt, für mich als Laie, gilt, Ein aussagekräftiger und neutraler Test sollt grundsätzlich nur mit Contempt 0 bei allen Engines durchgeführt werden.
Wenn man Houdini 4 aber als Sieger vorplant, dann eben C 1 wegen der klaren Überlegenheit bei den Schwachen.

Für mich sind Tests nur mit C 0 von Interesse.
Im übrigen, die "Russen" die da auch immer testen auf Immortal z. B. haben inzwischen auch festgestellt, dass H4 mit C "0" auch besser gegen Stocky ist. Z. Z. daher nur leichter Vorteil für den Stocky.
Grüße

By Andreas Aicher Date 2014-01-16 15:50

Hallo Stefan,
ich verstehe Dich jetzt wirklich nicht ganz, alle Tests, die ich bisher mit contempt 0 gesehen habe, einige habe es ja wohl getestet, waren durchweg zwar nur minimal, aber eben schwächer.
Auch beim direktem Vergleich der Top 3, einmal knapp besser, einmal knapp schwächer.
Wenn Du eine solche Behauptung aufstellst kannst Du einerseits nicht möglicherweise schreiben und andererseits eine doch wohl unerwiesene Tatsache aufstellen.
Wenn Du schreibst contempt 0 wäre die beste Einstellung, dann musst Du das schon beweisen, andererseits wirds lächerlich

Andreas

By sachista Date 2014-01-16 23:19

Stefan Pohl schrieb:

Nun fehlen nur noch 33 Elo für die Nummer 1. Wenn man das Entwicklungstempo des letzten Jahres mittelt, dann hat Stockfish 157/365=0.43 Elo pro Tag zugelegt. Ergo sollte man erwarten können, daß die letzten 33 Elopunkte noch ca. 77 Tage (2.5 Monate) dauern sollten. Das wäre Ende März / Anfang April 2014...

Da das Framework die Entwicklung maßgeblich verändert hat, macht es vielleicht Sinn, nur diesen Zeitraum zu betrachten.

Laut dem Stockfish-Blog begann die Framework-Entwicklung mit Stockfish 3:

Zitat:

This is Stockfish 3.
The big news of this version, and the reason why we have bumped version number to 3 is not due to ELO increase (that anyhow should be interesting) nor to some cool feature, but it is due to the new super awesome testing framework that Gary setup

Auf http://abrok.eu/stockfish/ steht, dass dies am 30. April 2013 war. Somit würde die Verbesserung 133 ELO in 257 Tagen betragen und somit 0,5175 ELO pro Tag, was wiederum 63,77 Tage für die restlichen 33 ELO bedeuten und sich die Zeit somit noch mal um 2 Wochen reduzieren würde... schade, dass das alles nur Kaffeesatzleserei ist

By Stefan Pohl Date 2014-01-17 04:32

sachista schrieb:

Stefan Pohl schrieb:

Da das Framework die Entwicklung maßgeblich verändert hat, macht es vielleicht Sinn, nur diesen Zeitraum zu betrachten.

Laut dem [url]Stockfish-Blog[/url] begann die Framework-Entwicklung mit Stockfish 3:

Zitat:

Auf <a class='urs' href='http://abrok.eu/stockfish/'>http://abrok.eu/stockfish/</a> steht, dass dies am 30. April 2013 war. Somit würde die Verbesserung 133 ELO in 257 Tagen betragen und somit 0,5175 ELO pro Tag, was wiederum 63,77 Tage für die restlichen 33 ELO bedeuten und sich die Zeit somit noch mal um 2 Wochen reduzieren würde... schade, dass das alles nur Kaffeesatzleserei ist

Ich dachte, das das Framework schon im Februar loslief.
Aber seis drum. Man kann natürlich auch Stockfish 3 als Startpunkt sehen, was zudem den Vorteil hat, daß ich alle Dev-Versionen seitdem mit ihren Eloergebnissen unter aborted&deleted auf meiner Website abgespeichert habe. Und Stockfish 3 kam am 30.04.2013, das ist korrekt. Dann kann man also ab Mai 2013 losrechnen für solche Eloentwicklungs-diagramme etc.

Stefan

By sachista Date 2014-01-17 07:57

Stefan Pohl schrieb:

Ich dachte, das das Framework schon im Februar loslief.

Ich hatte bisher nur auf den Blog-Eintrag geachtet, habe jetzt aber noch mal in Talkchess nachgelesen, Anfang März ist anscheinend der Start der öffentlichen Beta des Frameworks, wenn man den verlinkten Post vom 5. März 2013 als Startpunkt nimmt.

By Heinz Hagenstein Date 2014-01-16 13:17

bei mir hat Stockfish 191213 gegen Houdini 3 über 60% aus 250 Partien geholt,
Partiedauer 5min

By Tom Paul Date 2014-01-16 17:00

Glückwunsch an Stockfish.

Wir haben 5 weitere aktive Tester hinzugewonnen (insgesamt 45)

Damit fehlen noch ~35 weitere.

Es bedarf aber noch viel mehr Stockfish get involved Werbung.

Braucht hier noch jemand Hilfe um sich bei Stockfish get involved anzumelden?

By Frank Brenner Date 2014-01-16 17:23

Ich finde man kann das nicht oft genug wiederholen, am besten sollte das regelmässig mal jemand im Forum posten.

Mit Joachim Rangs tollen Installationsprogramm geht das problemlos:

Aber zuerst muss man ein Konto einrichten, also Benutzername + Passwort

http://tests.stockfishchess.org/signup

Danach das Installationsprogramm von Joachim herunterladen und ausführen.

http://www.iwanuschka.de/schutthalde/setup-fishtest.exe

Während der Installation wird fishtests.cfg (eine einfache Textdatei geöffnet)

Hier trägt man jetzt seinen Username und das Passwort ein, das sieht dann so aus zb:

[login]
username = BieneMaja
password = meinpasswort

Weiter unten kann man die Anzahl der Threads ändern (so viele cores werden dann belegt). Standardmässig sind da soviele eingetragen wie cpus im pc stecken minus 1

zb
concurrency = 3

Also es geht sehr einfach. Jeder kann das.

By Tom Paul Date 2014-01-16 17:44

Der Fishtest Installer ist doch nur für Windows oder?

Somit fehlt uns noch ein Fishtest Installer für OS X, ganz dringend da kenne ich viele Leute mit OS X die gerne bei Stockfish helfen würden aber nicht mitmachen können.
Und evtl. Linux.
Wie sieht es mit IPad/IPhone und Android Tablets / Smartphones aus?
Die Dinger liegen bei mir überwiegend nur rum, da würde ich diese Power gerne sinnvoll stiften!!!!!!

By Timo Haupt Date 2014-01-16 18:12

Hallo zusammen,

ja, auch von meiner Seite nochmals vielen Dank an Joachim Rang für seinen tollen Installer! Ich hatte vorher einfach keine Lust, mich beim Fishtest zu beteiligen, weil ich wg. chronischem Zeitmangel keine Installationsanleitung lesen wollte. Der Installer ist fix runtergeladen, die Installation dauert nicht mal eine Minute und schon kann es losgehen. Habe testweise mal einige Rechner eingebunden - nun läuft die Testqueue langsam leer...

Oh, gerade wieder aufgefüllt worden von 3 auf 7 Tests. Na dann - happy testing ....

Gruß
Timo

By Tom Paul Date 2014-01-16 20:31

Sind die Rechner gemietet oder deine eigenen?

By Tom Paul Date 2014-01-16 23:59

Das macht dann wieder + ~ 4 ELO
Oder nicht?

16-01-14 ur smaller_emergency_time diff
ELO: 3.89 +-4.6 (95%) LOS: 95.0%
Total: 10000 W: 2379 L: 2267 D: 5354
10000 @ 2+0.05 th 1 test smaller emergency time at very fast time control to see if there is better result with no loss on time.

By Patrick Götz Date 2014-01-17 01:21

Bei nur 10.000 Partien und nur 2 Sekunde/Partie, ist eher damit zu rechnen dieser Patch nicht durchkommt -> 0.00 ELO

By Timo Haupt Date 2014-01-17 02:34

Es sind eigene - das ist einer der Vorteile, wenn man wie ich in der IT-Branche tätig ist. Keine tollen Maschinen, aber für solche Zwecke reicht es. Werde die CPU Zeit aber nur vorübergehend zur Verfügung stellen können, bis das nächste Projekt in meiner Pipeline ist. Aber bis dahin beteilige ich mich gerne daran, dieses tolle Open-Source Projekt zum stärksten Schachprogramm der Welt zu machen. Fishtest ist echt ein Hammer - sowas sollten die anderen Engineautoren auch auf die Beine stellen, dann ginge es auch bei denen mit Riesenschritten voran. Ich denke allerdings, dass das Interesse, sich an Fishtest zu beteiligen, bei vielen nachlassen wird, wenn Stockfish in Zukunft die klare Nummer 1 ist. Dann müsste man mit diesem Konzept eine andere Engine pushen (vielleicht eine, die momentan so auf Rang 10-15 liegt) und schauen, ob man sich nach einer gewissen Zeit ebenfalls in diesen Spielstärkegefilden wiederfindet...

By Patrick Götz Date 2014-01-17 15:23

Im Moment schuften für Timos "Team-oh" 12 Rechner und die spielen 3035 LTC-Partien pro Stunde.
Damit stellt Timo z.Zt. mehr als 4x so viel Leistung zur Verfügung wie der zweitstärkste User "BrunoBanani".
Das ist ein wirklich starker Beitrag, Timo!

Ich glaube nicht das die Motivation nachlassen wird sobald Stockfish Nr.1 ist, denn
a) erst einmal benötigt man einen komfortablen Vorsprung (mind. +50 ELO) vor dem zweiten, damit man unangefochten das Feld dominieren kann und
b) des weiteren können sich die Konkurrenten an Stockfishs Ideen bedienen, so dass ein Houdini5 oder Komodo7 jederzeit wieder an Stockfish vorbeiziehen könnte.
Außerhalb der Schlagweite der Konkurenz sehe ich Stockfishs erst bei einem Vorsprung von ca. + 120 Elo.
Solange sollte noch genug Motivation bestehen.

By Frank Brenner Date 2014-01-22 16:07

>ich glaube nicht das die Motivation nachlassen wird sobald Stockfish Nr.1 ist, denn

Da gebe ich dir 100% recht. Wenn Stockfish nr1 ist dann ist die freude über jedes weitere Elo Pünktchen umso größer, dann geht es nicht mehr darum wer gewinnt, sondern mit welchem großen Abstand Stockfish gewinnt. Auch wenn - einmal theoretisch ausgedacht - in 1 Jahr Stockfish 200 Punkte mehr hat als die Verfolger, auch dann ist jedes weitere Elo Pünktchen noch mehr wert jedes Pünktchen davor.

Ich finde ein Turnier das 60:40 endet sehr spannend wenn der unterlegene die zweitbeste engine ist.
Ein Turnier gegen die gleiche zweitbeste engine das 97:3 endet ist nach meiner Meinung nach noch viel viel viel spannender.

Wenn ich mir aber die Änderungen bei Stockfish so angucke, so befürchte ich dass in Kürze ein Optimum erreicht wird und es dann erstmal gar nicht mehr weitergeht.

By Michael Scheidl Date 2014-01-22 16:16

Zitat:

Ein Turnier gegen die gleiche zweitbeste engine das 97:3 endet ist nach meiner Meinung nach noch viel viel viel spannender.

Also die Meinungen darüber dürften geteilt sein.

Hoffen wir daß dieser Zustand nie erreicht wird...

By Stefan Pohl Date 2014-01-17 04:49

Frank Brenner schrieb:

Ich finde man kann das nicht oft genug wiederholen, am besten sollte das regelmässig mal jemand im Forum posten.

Mit Joachim Rangs tollen Installationsprogramm geht das problemlos:

Alles richtig, aber hier im Forum sind doch viel zu wenig Leute unterwegs. Das müßte man eher in "normalen" Schachforen machen, und die Leute damit ködern, daß sie daran mitwirken können, die bald weltbeste Engine weiter zu verstärken, mit der sie dann ihre Partien analysieren können (oder was immer echte Schachspieler sonst für solche Aktionen motivieren kann)...

Stefan

By Andreas Aicher Date 2014-01-17 00:12

Hallo Stefan,
ich habe mir anhand Deiner Liste mal die Fortschritte von Stockfish 3 (Stockfish 3 ist ja, wenn ich richtig liege, ca 10 Monate alt) angesehen, 133 Elo, schon sehr enorm

Stockfish 3 x64s    3019
Stockfish 4 x64s    3068
Stockfish DD x64s    3119
Stockfish 140112 x64s 3152

By Tom Paul Date 2014-01-22 13:46 Edited 2014-01-22 13:51

Stefan Pohl schrieb:

The result of Stockfish 140112 is now online.

<a class='urs' href='http://ls-ratinglist.beepworld.de'>http://ls-ratinglist.beepworld.de</a>

Stefan

(Perhaps you have to clear your browsercache or reload the website)

Kannst du überprüfen, wie viele von den 10000 Partien durch 3-Fold Rep endeten?
Z.B. innerhalb der ersten 40 Züge?

Ich schätze mal von den 44% Remis, waren 11% unnötiges zu frühes 3-Fold Rep.
Und 10,9% davon gehen auf das Stockfish Konto.
1090 Partien.
Wie viele ELO Verlust macht das wohl?

By Stefan Pohl Date 2014-01-22 14:13

Tom Paul schrieb:

Stefan Pohl schrieb:

The result of Stockfish 140112 is now online.

<a class='urs' href='<a class='ura' href='http://ls-ratinglist.beepworld.de'>http://ls-ratinglist.beepworld.de</a>'>http://ls-ratinglist.beepworld.de</a>

Stefan

(Perhaps you have to clear your browsercache or reload the website)

Nein, das kann ich nachträglich nicht mehr prüfen, da die LittleblitzerGUI nur die Züge speichert, ohne zusätzliche Infos. Aber bei den Stockfishen sind es meist so 25-27% aller Partien, die durch 3fach-Remis enden.

Stefan

By Tom Paul Date 2014-01-22 14:30

Dann schätze ich mal 50-100 ELO Spielstärke Verlust durch unnötiges 3-Fold Rep.
Denn 3-Fold Rep innerhalb der ersten 40 Züge bei halbwegs vollem Brett bedeutet gegen gleichstarke Gegner und erst recht gegen schwächere Gegner keinesfalls, dass die Partie remis enden muss und kein anderer 0.00 Zug gespielt werden darf.
Somit hätte Stockfish an H4 ganz ohne Schwierigkeiten vorbeiziehen können.
Das Stockfish Team sollte hier dringend nachbessern.
Kann einer von euch einen Code schreiben, der 3-Fold Rep verbietet, wenn andere 0.00 Züge spielbar sind?
Z.B. wenn 3-Fold Rep erkannt wird, soll im MV Modus geschaut werden, ob es andere Züge gibt die kein 3-Fold Rep sind.

By Karl Müller Date 2014-01-22 15:01

bitte nicht, denn dann programmiert ihr ja den Bug der Fritz-GUI auch in andere GUI, bzw. direkt in die Engine ein ein - das wäre ja unglaublich und völlig daneben

Der Stocky macht das schon richtig - unter dem Strich sowieso schon die Nummer 1 - Ranglisten hin oder her

By Michael Scheidl Date 2014-01-22 15:23

Tom spricht ja über Situationen weit jenseits des Eröffnungsbuches. Für mich macht sein Vorschlag Sinn, gesetzt den Fall daß tatsächlich andere 0.00-Züge zur Verfügung stehen. Dann kann die Partie ohne "Bewertungsschaden" weitergehen und Stocki eventuell noch gewinnen.

Den diversen Postings zufolge scheint es ja derzeit so zu sein, also ob Stockfish quasi "gierig" jedes Stellungswiederholungsremis herbeiführt das er nur kann. Klingt doch wirklich verbesserungswürdig.

By Karl Müller Date 2014-01-22 15:31

Michael,
nein, denke das ist der vollkommen falsche Ansatz, wie ich in der Praxis feststellen konnte, siehe unten, auch in diesen Games waren andere 0.00 Züge vorhanden somit "erst mal" spielbar . .
Ich sehe das für eine große Gefahr an - hier was zu drehen, bitte nicht. Meine Erfahrungen zeigten jedenfalls keinen Sieg nach einer dreimaligen Stellungsverweigerung durch die GUI gesteuert, auch wenn andere 0.00 da waren, eher dann eine negative Bilanz am Ende des Tages. Deshalb bin ich erst auf den Bug gestossen, weil ich mir dachte, das kann doch nicht wahr sein, da wird die Stellungswiederholung verweigert und ab in die Niederlage . . . zwar erst im späten Mittelspiel oder Endspiel, aber das ist Wurst: Was man hat, das hat man - ein frühes Remi ist allemal besser als eine späte Niederlage

Die "dreimalige Stellungswiederholung ist für mich die Mutter des remi"

Grüße Karl

By Tom Paul Date 2014-01-22 16:22

Kannst du mal ein paar Stellungen zeigen, wo andere 0.00 Züge spielbar waren?

Woran erkennt die GUI dass andere 0.00 Züge spielbar sind?
Das kann doch nur Stockfish (eine Engine) im MV Modus erkennen oder?

Jeder erfolgreiche Test senkt automatisch mehr oder weniger die Remisquote und somit die Chance 3-Fold Rep.
Deiner Meinung nach müsste man das ganze Stockfish Testing Framework abschaffen.

Du sagst doch selbst: Niederlage zwar erst im späten Mittelspiel oder Endspiel,
wenn da jetzt zwei gleichstarke Engines spielen und dem Remis ausweichen und mit 0.00 Stellung weiter spielen und irgendwann im Endspiel gewinnt eine, dann war entweder die eine Engine besser, oder die gegnerische Hardware stärker, oder der Gegner hatte ein besseres Buch wo auch ein paar Endspielstellungen drin waren, oder der Gegner hatte mehr GB TB/Bitbases oder einfach bessere Bases.
Wenn alles gleich ist, dann muss das Ergebnis bei dir und deinem Gegner am Ende auch 5000 vs 5000 Punkte sein. Hat der Gegner etwas besseres, dann wird er am Ende mehr Punkte haben als du.
Oder wie willst du das so einstellen, dass du immer gegen Gegner die alles besser haben als du auf 3-Fold Rep spielen willst, aber wenn du mal einen schwächeren Gegner hast soll die Engine 3-Fold Rep vermeiden?
3-Fold Rep Vermeidung ist gegen schwächere Engines TOP und gegen gleichstarke gleich.
Du kannst doch den Contempt so stellen, dass Stockfish immer versucht remis zu spielen.
3-Fold Rep Vermeidung ist für die Analyse TOP.
Stockfish mit 3-Fold Rep Vermeidung und 50-100 ELO mehr ist TOP.
Du könntest später bei der Stockfish Version mit 3-Fold Rep Vermeidung unter Optionen das ausschalten und hättest das was du willst, nur wird dir das nichts bringen wenn die gegnerischen Stockfishe gegen dich 3-Fold vermeiden.

By Karl Müller Date 2014-01-22 16:44

Contempt - korrekt
und trotzdem verweigert fir Fitz GUI 13, 14 und auch frühere Versionen das Remis, wie ja nun festgestellt wurde.

Um Contempt geht es hier nicht, wäre ja Klasse, wenn nur das zu steuern wäre: Nein, die Firtz-GUI hat nun mal diesen Bug.und greift in das Spiel der Engine ein.

Ich habe viel darüber nachgedacht und auch in vielen Games mit der Fritz-GUI schon oft folgende Situationen/Stellungen immer und immer wieder beobachten können. Diese Stellungen nerven eine Schachspieler gewaltig:

Also, alles zu, kein Durchkommen irgendwelcher Figuren oder des Königs, normaler Weise spielt man dann den König oder einen Läufer nur hin und her und schwupps ist das dreimalige Remi da. Nein in der Fritz GUI wird laviert bis zum geht nicht mehr - grottenlangweilig. Hier greift mit Sicherheit auch der Remisvermeidungsbug der GUI im späteren Mittelspiel etc. ein - versaut ggf. das Game. Da bin ich mir nun sicher.

Anfangs dachte ich, da hat wieder ein Houdini-Player Contempt auf 1 oder noch "schlechter", gestellt, habe dann aber festgestellt, das auch der Stocky - trotz Contempt "0" auch diesen Mist spielt, in diesen Stellungen. Auf Arena ist mir das z.B. nie so gravierend ins Auge gefallen . . .

Denke, dass ist ein großes Problem der Fritz-GUI, auch wenn das noch keiner so richtig wahr haben will.