Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Mein Houdini 2.0Test
- - By Stefan Pohl Date 2011-09-06 13:33
Hallo zusammen,

Nach dem Houdini 2 in der IPON ja nicht sehr stark zugelegt hat, habe ich einen Test gegen die Top 4 Engines laufen lassen, mit dem wichtigen Unterschied, daß ich Houdini (Standardversion) maximal früh (Hard und Softprobe auf 2) auf 3-5er GTBs zugreifen ließ und zwar mit großem Cache (256MB) und die GTBs waren natürlich auf einem USB-Stick geparkt. Selbiges galt für Critter 1.2. Fire 2.2 bekam die 3-5er TripleBases, die ja komplett ins RAM geladen werden und Rybka 4.1 die 3-5er Nalimovs, die sich auf dem selben USB-Stick befinden und über die FritzGUI ebenfalls 256MB Cache. Rybka 4.1 durfte ebenfalls maximal früh auf die TBs zugreifen (Wert des Parameters 256 (statt 36 wie default)).
Gespielt wurde auf 2.83GHz Quad (Vista 64bit) mit 2'+1'' (immer abwechselnd mit allen 4 Cores). Aufgeben auf spät, Remis auf niemals.Eröffnungsvorgabe waren 60 ausgewählte Stellungen aus Frank Q.s 4.1 Opening-PGN-Sammlung (jede Stellung nur 8 Vollzüge lang und sehr neutral (keine Gamibts, nichts exotisches wie 1.d4 f5 oder so). Eigentlich wollte ich sogar 120 Stellungen durchspielen lassen, aber das Resultat hatte sich schon nach 80 der 240 geplanten Partien pro Einzelwetkampf so gut stabilisert, daß ich nach der Halbzeit aufgehört habe. 120 Partien pro Vergleich sind auch schon recht ordentlich.

Houndini 2.0 - Deep Rybka 4.1: 76-44 (+45 =62 -13) = 63.3% (IPON: 57.5% (!))
Houndini 2.0 - Critter 1.2: 69.5-50.5 (+39 =61 -20) = 57.9% (IPON: 54.5%)
Houndini 2.0 - Stockfish 2.1.1: 78-42 (+51 =54 -15) = 65% (IPON: 63.5%)
Houndini 2.0 - Fire 2.2 xTreme GH:76-44 (+42 =68 -10) = 63.3% (IPON: nicht getestest)

Gegen die 3 Gegner, die auch in der IPON gegen Houdini 2.0 angetreten sind, erreichte Houdini unter IPON-Bedingungen (nur 4-Steiner TBs, bei Houdini defaultmäßig (zu) später Zugriff auf selbige) eine durschnittliche Erfolgsquote von 58.5% (Houdini 1.5a übrigens 58.8%). Bei meinem Test (frühestmöglicher Zugriff auf 5 Steiner für alle (bis auf Stockfish versteht sich), mit großem Cache und auf schnellem Flashmemory) waren es 62.1%, also 3.6% mehr (ca.25 Elo).

Grüße an alle - Stefan
Parent - - By Stefan Pohl Date 2011-09-06 14:09
[quote="Stefan Pohl"]

Houndini 2.0 - Deep Rybka 4.1: 76-44 (+45 =62 -13) = 63.3% (IPON: 57.5% (!))
Houndini 2.0 - Critter 1.2: 69.5-50.5 (+39 =61 -20) = 57.9% (IPON: 54.5%)
Houndini 2.0 - Stockfish 2.1.1: 78-42 (+51 =54 -15) = 65% (IPON: 63.5%)
Houndini 2.0 - Fire 2.2 xTreme GH:76-44 (+42 =68 -10) = 63.3% (IPON: nicht getestest)

[/quote]

Noch ein paar kurze Anmerkungen/Analysen:
Bemerkenswert das sehr gute Abschneiden gegen Rybka 4.1. Houdini 1.5a hat bei mir nie (auch ohne TBs für beide oder TB-default-Zugriff) gegen Rybka mehr als 57-58% geholt. Hier hat m.E. auf jeden Fall eine deutlich Verbesserung stattgefunden.

Fire 2.2 hat sich mittlerweile in seinem Suchverhalten sehr weit vom Ursprung Ippolit/Robbolito entfernt. Das merkt man auch, wenn man sich im Vergleich aktuelle Ivanhoes ansieht. Fire 2.2 rechnet sehr viel selektiver, schneidet vieles früh ab und übersieht daher oft etwas, findet aber dadurch auch gelegentlich Superzüge. Die Inzestproblematik bei Vergleichen mit Ivanhoe und Houdini (der eindeutig auf einem frühen Ivanhoe aufbaut, was man bei älteren Versionen deutlich merkt, auch wenn R.Houdart das abstreitet), die Ingo immer bemängelt und die ihn davon abhält Fire/Ivanhoe in die IPON aufzunehmen ist bei Fire 2.2 m.E. eindeutig nicht mehr gegeben. Sicher basieren Houdini, Ivanhoe und Fire auf dem selben Ur-Code aber Fire 2.2 und Houdini haben sich derart weit voneinander wegentwickelt, daß Ähnlichkeiten im Such- und Ausspielverhalten nicht mehr erkennbar sind. Eine Liste, die in ihrer Testhistorie Fruit und Toga II beherbergt (siehe IPON-Seite), die sich mit Sicherheit viel ähnlicher sind als Houdini 2 und Fire 2.2, sollte auch Fire 2.2 enthalten. Fire spielt aufgrund seiner extrem selektiven Suche sehr unverhersehbar und durchaus attraktiv. Wird aber von Houdini 2 (wie alle anderen auch) total überrollt. Dennoch gehört Fire 2.2 zu den Top-Engines und spielt interessantes Schach (und läuft absolut stabil und das von mir benutzte GH-Compilat ist auch sauschnell)...

Grüße - Stefan
Parent - - By Michael Scheidl Date 2011-09-06 14:30
Fire 2.2 gehört auch zu meiner - im Lauf der Zeit immer kleiner gewordenen - Mannschaft ausgewählter Engines. Ich ergötze mich gerne an den großen Zugriffszahlen auf die Triplebases.

Es gibt übrigens eine Stockfish 2.1.1-Version welche die Gaviota-Tables benutzt, allerdings laut Ingo ~7% langsamer ist:

http://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=39705
Parent - - By Stefan Pohl Date 2011-09-07 11:33
[quote="Michael Scheidl"]

Es gibt übrigens eine Stockfish 2.1.1-Version welche die Gaviota-Tables benutzt, allerdings laut Ingo ~7% langsamer ist:

http://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=39705
[/quote]

Weiß ich, danke. Aber da wurde leider auch anderweitig dran verschlimmbessert. Jedenfalls war diese Version bei mir inSchnelltests deutlich schlechter als das Original. Schade.

Gruß - Stefan
Parent - By Frank Quisinsky Date 2011-09-07 16:30
Hi Stefan,

ja leider!
Hatte ich mir auch angesehen!

Ein schöner Test, auch gut lesbar und verständlich!
In Anbetracht das Deine Betrachtungen oft den Nagel in der Mitte treffen ist die Wahrscheinlichkeit sehr hoch das es diesmal auch so ist. Machst Dir wenigstens Mühe und versuchst mal auf eigene Faust ... immer besser als nur Worte.

Gruß
Frank
Parent - By Ernest Bonnem Date 2011-09-06 17:08
[quote="Stefan Pohl"]Houndini 2.0 - Deep Rybka 4.1: 76-44 (+45 =62 -13) = 63.3% (IPON: 57.5% (!))
Houndini 2.0 - Critter 1.2: 69.5-50.5 (+39 =61 -20) = 57.9% (IPON: 54.5%)
Houndini 2.0 - Stockfish 2.1.1: 78-42 (+51 =54 -15) = 65% (IPON: 63.5%)
[/quote]
Bei 120 Spiele bei dir, 100 Spiele bei Ingo, zeigt die Statistik kein Unterschied zwischen dein Resultat und Ingos.
Sorry! 
Und besonders dein "(!)" in "63.3% (IPON: 57.5% (!))" hat kein Sinn...
Up Topic Hauptforen / CSS-Forum / Mein Houdini 2.0Test

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill