Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Engines vs. Stockfish mit Bauernvorgabe
- - By Benno Hartwig Date 2014-08-18 10:27 Edited 2014-08-18 10:30
Ehlvest und andere hatten ja seinerzeit Bauernvorgabe-Partien gegen die damalige Spitzenengine Rybka gespielt, und Rybka hat da trotzdem meist mehr oder weniger klar gewonnen.
http://de.wikipedia.org/wiki/Rybka#Ergebnisse_gegen_menschliche_Spieler

Mich würde jetzt auch interessieren, wie die heutige Stockfish-Konkurrenz derartige Vorgaben gegen Stockfish nutzen kann.
Ob beispielsweise Komodo und Houdini mit dieser Vorgabe (ggf. sogar klar) stärker wären als Stockfish.
Und ob die anderen ggf. auch mit Bauernvorgabe an SF nicht vorbei kommen.
Wo ist die Grenze. Welche Engines benötigen 1 Mehrbauern um gegen SF ungefähr 50:50-Chancen zu bekommen?

Mal gucken, mit welchem Tool und ganz praktisch 'wie' man sowas möglichst automatisiert aufsetzen könnte.

Benno
Parent - - By Tom Paul Date 2014-08-18 10:44
Ungefähr: Komodo eher knapp darüber, Houdini ungefähr die Mitte, Gull knapp darunter.

Bei Stockfish fehlen die FM IM GM SGM usw. als kluge Köpfe bei der Verbesserung.
Parent - By Michael Scheidl Date 2014-08-18 13:57 Edited 2014-08-18 14:00
Zitat:
Bei Stockfish fehlen die FM IM GM SGM usw. als kluge Köpfe bei der Verbesserung.

Da bin ich nicht sicher wieviel das bringt, ausgenommen Larry Kaufman (vor allem Bewertung verschiedener Materialbilanzen, "Imbalancies"). Was die Meister zu sagen haben ist sicherlich schachlich wertvoll, wurde aber oft als ineffektiv und nicht 1:1 umsetzbar für die Programmierung beschrieben.

Ein Bauernvorgabe-Experiment kann man im Prinzip anhand eines Satzes von acht oder 16 Vorgabestellungen in jeder guten GUI machen, falls sich das so konfigurieren läßt daß Stocki immer das komplette Team bekommt. Mal sehen...
Parent - By Benno Hartwig Date 2014-08-20 08:26 Upvotes 1
Ich habe dann auch mal eine EPD-Datei mit 256 Startstellungen gebastelt, um praktisch zu testen, was Engines erreichen, wenn wie sie gegen Stockfish antreten, dem ein Bauer fehlt.
http://wdorf77.bplaced.net/extra/Fehlende_Bauern_FEN_sortiert_256.epd
(Bitte Bescheid sagen, wenn dort jemand einen Fehler entdeckt)
Für jeden dieser 16 fehlenden Bauern ist jeweils kein oder einer der 15 verbliebenen Bauern ein Feld vorgesetzt. 16*(1+15)=256
Der fehlende Bauer ist dort immer abwechseln bei weiss und schwarz, sodass man einfach ein Zweikampfduell damit ansetzen kann.
(Allerdings ggf. bei Arena beachten: http://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?tid=7619)

Alles läuft auf meinem Notebook mit i3-2377M, 64bit 1,5GHz mit 1core für jede Engine, ohne Pondern, bei schlanken 1m+0,5s.
Um zu sehen, was solch eine Bauernvorgabe bedeutet, habe ich erst mal Stockfish gegen sich selbst antreten lassen.

     1: Stockfish_14081001_x64_modern 203,0/256
     2: Stockfish_14081001_Fehlbauer  53,0/256 


Der unbehinderte Stockfish erreichte dabei 79,3%
159 Siege, 9 Niederlagen, 88 Remis


Im Moment tritt  gerade Houdini 4 gegen den Fehlbauer-Stockfish an, und Stockfish liegt deutlich zurück.
Vermutlich heute Abend poste ich hier das Ergebnis.

Benno
Parent - - By Benno Hartwig Date 2014-08-20 15:33 Edited 2014-08-20 15:37
Jetzt hat Houdini 4 seine 256 Partien gegen Stockfish (dieser mit einem Bauern weniger) absolviert:

     1: Houdini_4_AQ_x64B core1      196,0/256
     2: Stockfish_14081001_Fehlbauer 60,0/256 


Houdini 4 erreichte also 76,6%
162 Siege, 26 Niederlagen, 68 Remis


Houdini war gegen den geschwächten Stockfish fast so dominierend wie Stockfish selbst, aber auch nur fast.
Weniger remisträchtig war es. Der Fehlbauer-Stockfish konnte gegen Houdini deutlich mehr gewinnen, aber auch Houdini gewann mehr als der ungebremste Stockfish zuvor.
Mehr Zoff, mehr Action.

BTW: wenn sich die Bewertungen über einige Züge deutlich unterschieden (1 Bauer und mehr), dann hat nach meinem Eindruck meistens eher Houdini das dann Kommende besser vorausgesehen!

Benno
Parent - By Benno Hartwig Date 2014-08-22 06:52
Sorry, da war mit Houdini 4 versehentlich (und trotz des Engine-Namens) mit 4 Threads durch den Parcours gelaufen (auf i3 mit 2 realen Kernen und Hyperthreading)
Ich habe die Begegnung noch mal wiederholt, jetzt wirklich mit einem 1-Thread-Houdini-4:

     1: Houdini_4_AQ_x64B core1      193,0/256
     2: Stockfish_14081001_Fehlbauer 63,0/256


Houdini 4 (mit wirklich nur 1 Thread) erreichte also 75,4%
165 Siege, 35 Niederlagen, 56 Remis


Eigentlich nur sehr wenig schwächer als sein 4-Thread-Kollege und ebenfalls sehr dominierend gegen den bauerndezimierten Stockfish.
Im Moment versucht der 1-Thread-Critter-1.6a sein Glück, und auch er wird die Nase vorn behalten, denke ich...

Benno
Parent - By Benno Hartwig Date 2014-08-22 14:02
Auch Critter 1.6a ist immerhin so stark, dass Stockfish sich die Zähne daran ausbeißt, wenn er den Bauernrückstand durch Spielstärke wettmachen möchte:

     1: Critter_1.6a_64bit           153,0/256
     2: Stockfish_14081001_Fehlbauer 103,0/256


Critter erreichte 59,8%
bei 105 Siegen, 55 Niederlagen, 96 Remisen


Schon noch ein deutlicher Sieg für Critter, aber natürlich längst nicht so dominierend wie der von Houdini.

Stockfish selbst gewann gegen die bauerngeschwächte Version mit ca 79%, was so ungefähr 230 ELO entspricht.
Als nächsten Kandidaten nehme ich daher mal Rybka 2.3.2a 64bit, die zu ihrer Zeit ja durchaus das Ranking anführte (richtig?).
CCRL 40/4 führt diese Engine aber sogar 255 ELO hinter Stockfish. Mal gucken...

Benno
Parent - - By Benno Hartwig Date 2014-08-23 07:29 Edited 2014-08-23 08:09
Dass Rybka 2.3.2a schwer haben würde, den Bauernvorteil gegen Stockfish zu nutzen, hatte ich mir wegen des stattlichen ELO-Unterschiedes schon gedacht.
CCRL 40/4 nennt für die 1-Core-Versionen immerhin die Differenz 255 ELO.
Dass Rybka aber trotz Startvorteil so überhaupt kein Bein an Deck bekam, fand ich dann aber doch überraschend:

     1: Stockfish_14081001_Fehlbauer 208,0/256
     2: Rybka 2.3.2a 64 bit          48,0/256 


Rybka 2.3.2a erreichte eine magere Ausbeute von 18,8%
15 Siege, 175 Niederlagen, 66 Remisen


So ungefähr hat sich vielleicht Ehlvest seinerzeit im Spiel gegen Rybka gefühlt.
"Da habe ich nun einen Bauern mehr, und ich bekomme trotzdem Haue!"

Benno
Parent - - By Michael Scheidl Date 2014-08-23 08:24
Inzwischen hat Larry Kaufman, der ja einige Vorgabemaches Rybka vs. GMs veranstaltete, zum Thema gepostet.

http://talkchess.com/forum/viewtopic.php?p=583599#583599

Er meint daß der C-Bauer der geeignetste ist und erwäht als weitere Möglichkeit die Qualitätsvorgabe mit Ta1/Sa8 ohne langes Rochaderecht für Schwarz.
Parent - By Hauke Lutz Date 2014-08-23 15:09
Macht sinn, wenn man so drüber nachdenkt.
Parent - By Roland Riener Date 2014-08-23 18:20
Das L.K.-Posting mußte ich etwas sortieren:

Zitat:
my conclusion is that only one of the eight possible pawn handicaps (not considering color) is really suitable as a pure strength handicap


Geeignet aus der Sicht des Vorgabegebers, also das Handicap soll möglichst gering sein, oder aus der Sicht des Vorgabenehmers, der einen wirksamen Vorteil erhalten soll?

Zitat:
The edge pawns are rather small handicaps


Wenn er deren Vorgabe verwirft, will er also ein höheres Handicap.

Zitat:
the center pawns give instant compensation in the open lines for the bishops and queen


Auch hiermit will er einen größeren Vorteil für den Vorgabenehmer.

Zitat:
the "b" and "g" pawns leave the edge pawns isolated, the "g" pawn makes kingside castling (usually) bad, and the "f" pawn weakens the king


Diese Vorgaben schwächen also nach seiner Meinung den Vorgabegeber im Gegenteil wieder zuviel. So kommt er auf den Mittelweg c-Bauer als geeignetste Vorgabe. Naja, wenn das so gemeint ist. "Wasch mich, aber mach mich nicht naß".

Für mich ist neu, daß für derartige Vorgabematches auch Eröffnungsbücher bereitgestellt werden (book-preparer), dachte, die Engine spielt ohne.

Roland
Parent - By Benno Hartwig Date 2014-08-23 22:56
Der beste Gratis-Komodo konnte diese Vorgabe auch zu einem recht deutlichen Sieg nutzen:

1: Komodo-5-64bit               150,0/256
2: Stockfish_14081001_Fehlbauer 106,0/256


Komodo erreichte also 58,6%
bei 105 Siegen, 61 Niederlagen und 90 Remis


Fast so erfolgreich wie Critter 1.6a.

Benno
Up Topic Hauptforen / CSS-Forum / Engines vs. Stockfish mit Bauernvorgabe

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill