Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Der Lieblingsgegner von Stockfish heißt Houdini
- - By Tom Paul Date 2014-04-22 06:21
http://tcec.chessdom.com/archive.php?se=6&st=3&ga=61
Jetzt hat Stockfish in Stage 3 Houdini schon zum dritten mal hintereinander besiegt.
Stage 4 dürfte interessant werden, wenn alle Engines halbwegs normal Punkten aber Stockfish evtl. nur oder fast nur Siege gegen Houdini einfährt, dann könnte Stockfish mit sehr vielen Punkten Vorsprung der Sieger von Stage 4 werden.
Parent - - By Hauke Lutz Date 2014-04-22 06:28
Tom Paul schrieb:

<a class='ura' href='http://tcec.chessdom.com/archive.php?se=6&st=3&ga=61'>http://tcec.chessdom.com/archive.php?se=6&st=3&ga=61</a>
Jetzt hat Stockfish in Stage 3 Houdini schon zum dritten mal hintereinander besiegt.
Stage 4 dürfte interessant werden, wenn alle Engines halbwegs normal Punkten aber Stockfish evtl. nur oder fast nur Siege gegen Houdini einfährt, dann könnte Stockfish mit sehr vielen Punkten Vorsprung der Sieger von Stage 4 werden.


Nicht nur das... Houdini 4 wird sich, sollte sich das in Stage 4 bestätigen kaum Chancen haben sich für das Finale zu qualifizieren.
Das Stockfish viel besser als erwartet gegen Houdini spielt lässt sich sogar belegen, wenn man die LS-Rangliste auswertet.
Stockfish140412 hat dort gegen Houdini 4 im direkten Vergleich ganze 30 Elo ! besser gepunktet als es von der ELO her zu erwarten war.
Parent - - By Tom Paul Date 2014-04-22 07:45
Stockfish hatte schon früher (bevor Houdini im direkten Kampf in der LS besiegt werden konnte) bei langen Partien besser gespielt, sowohl gegen Houdini als auch gegen andere Engines.
Wenn Stockfish in der LS gegen Houdini 30 ELO stärker spielt, dann wäre die Spielstärke beim TCEC vielleicht ~+60 ELO stärker als Houdini, wenn nicht sogar mehr.
Parent - - By Hauke Lutz Date 2014-04-22 07:47
Bei 3 aus 3 kommst du mit den pessimistischen 60 Elo nicht weit. ^^
Parent - - By Hauke Lutz Date 2014-04-22 10:37 Edited 2014-04-22 10:39
Ich hab ja gesagt, dass Stockfish140412 in der LS-Rangliste gegen Houdini 4 ganze 30 Elo besser spielt, als er eigentlich sollte.

Unter folgendem Link ist eine Auswertung der Kreuztabelle einsehbar, welche das Ergebnis des direkten Vergleiches mit der Erwartung vom Gesamtergebnis gegenübestellt: http://s7.directupload.net/images/140422/pal4t5u3.png
Parent - - By Tom Paul Date 2014-04-22 11:07
Ist die Liste von dir?
Wenn man weitere schwache Engines dazunehmen würde, dann würde die ELO von Stockfish sinken und die von Houdini steigen.
Wenn man ein neues Turnier, die besten 5 oder 6 machen würde, dann wäre Stockfish auch im Gesamtvergleich vor Houdini.
Komodo spielt sehr solide.
Houdini (99%) Taktik stellt sehr oft taktische Fallen, sieht aber anderes nicht.
Stockfish ist eine Mischung aus allem und spielt deshalb insgesamt besser.
Damals war das taktische Niveau der ganzen Engines stärker als das positionelle Niveau, deshalb spielt Houdini gegen schwächere Engines stärker als Stockfish, weil diese Engines praktisch ihre Stärke gegen Houdini verlieren und ihre Taktik viel näher an dem Niveau von Stockfish dran liegt. Houdini neigt auch dazu den besten Zug in taktischen Stellungen viel schneller zu erkennen als Stockfish.
Darum sollte die Taktik bei Stockfish verbessert werden.
Parent - By Hauke Lutz Date 2014-04-22 11:16
Sämtliche Rohdaten stammen aus der LS-Rangliste.
Ich hab die Daten nur hübsch verpackt und beim Link den ich aufgeführt habe die Elodifferenz der Zweikampfe ausrechnen lassen und damit weitergearbeitet.

Anbei noch eine kleine Crosstable wo man alle Differenzen auf einem Blick hat.

http://s1.directupload.net/images/140422/nflmphyq.png
Parent - By Benno Hartwig Date 2014-04-22 08:20 Edited 2014-04-22 08:23

> Stockfish140412 hat dort gegen Houdini 4 im direkten Vergleich ganze 30 Elo !


Da SF gern mal gegen deutlich Schwächere mehr Punkte abgibt, als es aufgrund der SF-Gesamtstärke zu erwarten war (oft hier diskutiert), ist im Umkehrschluss  zu erwarten, dass SF gegen besonders Starke erfolgreicher ist, als es der Gesamtstärke entspricht.
Einen wie großen Teil jener 30 ELO macht denn bereits dieses grundsätzliche, Houdini-unabhängige Phänomen aus?

Benno
PS: Trotzdem sehen 3 Punkte aus 3 Partien gegen Houdini natürlich verdammt gut aus!
Die bislang 0,5 Punkte aus den beiden Partien gegen Critter glänzen allerdings weniger.
Up Topic Hauptforen / CSS-Forum / Der Lieblingsgegner von Stockfish heißt Houdini

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill