Stellungswiederholungen in Eröffnungsbüchern

By Frank Quisinsky Date 2017-08-05 17:43 Edited 2017-08-05 17:49

Hallo Thomas,

meinst Du mit Stellungswiederholung wirklich die reine Wiederholung einer Stellung, die während eines Matches über mehrere Partien schon angespielt wurde oder meinst Du mit Stellungswiederholung eine Zugkombination die zu einer dreifachen Stellungswiederholung führen könnte?

Gehe davon aus Du meinst was ich zuerst angesprochen habe.

Bin ein Fan davon nicht nach einer Buchstatistik ausspielen zu lassen, sondern eher per Zufall. Dafür muss das Buch aber stark genug sein bzw. es dürfen keine schlechten Varianten drin sein. Für Arena hatten wir daher "PGN-Random" entwickelt. Arena hatte zuerst keine Buchfunktionen, nicht zuletzt weil ich zu Martin immer sagte ... brauchen wir nicht wenn wir PGN-Random haben, Martin sollte sich auf wichtigeres konzentrieren (Engine Kompatibilitäten und perfekte Optionen für Engine Turniere und Einstellungen hierzu).

Bei PGN Random wählt die GUI eine zufällige Stellung aus einer PGN Datenbank aus und speichert im Kopf der PGN um welche Stellung aus der PGN Datenbank es sich gehandelt hat. Glaube wir hatten auch drin, dass während eines Matches doppeltes vermieden wird.

Das Problem ist eher die Größe bei den Buchformaten aufgrund der meist total unsinnigen Statistiken.

Da wird alles mögliche an Schrott reingeholt um mittels Erfolgsstatistiken zu ermitteln was spielbar ist und was nicht. Und selbst bei dem was ermittelt wird was spielbar ist wird Schrott ausgespielt. Weil ganz einfach die riesigen Datenmengen immer wieder Zeug produzieren was schon längst überholt ist aber es Unmengen an Partiematerial dazu gibt. Ich halte davon überhaupt rein gar nichts. Hat zur Folge das gar in GB Größe Bücher mit unsinnigen Statistiken angeboten werden.

Das Problem ist meines Erachtens eher ein anderes!!

Es gibt zu vielen der ECO Codes nicht ausreichend gutes Material um doppeltes zu vermeiden.
Wenn Du so vorgehst wie beschrieben ist nach wenigen C37 / C38, A64 etc. Partien Ende Gelände. Wird nichts mehr ausgespielt weil es nichts wirklich gutes was spielbar ist mehr gibt.

So produzieren viele ECO Codes Unmengen an Material was gut ist und andere kaum etwas.

Wenn Du nun sagst ...

Herauskopiert aus Deiner Message:
Wenn die Engine bzw. der Buchalgorithmus sieht, das ein Zug zu einer bereits gespielten Stellung führt wird nachgeschaut, ob es einen zweiten möglich Zug im Buch gibt.
Wenn ja wird dieser gespielt. Führt der zweite Zug auch zu einer Stellungswiederholung rechnet die Engine.

Würde ich das spezifizieren je nach ECO Code.

Haben wir einen ECO Code auf dem Brett, welcher selten ist oder besser wenig gutes Material produziert würde ich das doppelte Ausspielen in Kauf nehmen. Diesem Code aber eine kleinere Priorität geben als dem Code der beliebt ist und öfters auf Brett kommt.

Also, das wir Prioritäten in Eröffnungsbücher setzen können ist gut (aber mächtig viel Arbeit).
Das wir anhand von vorhandenes Material (Anzahl an Positionen die noch im Buch sind) ausspielen lassen ist gut und der einfachste Weg.

Die Kombination ist am Besten ... bei Programmen wie Chessbase und Shredder GUI.
So kann ich mittels der Prioritäten das Ausspielverhalten basierend auf "Spiele öfters was oft vorhanden ist" im Step 2 (Prioritäten) weiter verfeinern.

---

Wenn FEOBOS durch ist Mitte Januar 2018 haben wir ca. 33.000 Varianten die spielbar sind und fast kaum schnelle dreifache Stellungswiederholungen zulassen. Wahrscheinlich liegt dann die Quote an doppelten Varianten bei einem 1.000 Partien Match bei ca. unter 1% wenn ich die oben beschriebenen beiden Wege beim Ausspielverhalten berücksichtige.

---

Eine gute Ergänzung wäre wenn die GUI das Zepter in die Hand nimmt und darauf achtet das innerhalb von einem Match eine doppelte Variante vermieden wird. Bzw. in eine Tabelle schaut ...

Diese Tabelle zeigt uns die 500 ECO Codes und wie viel zu jedem Code enthalten ist.
Wird eine Variante ausgespielt die wie C38 ein super niedriges Ausspielverhalten hat, sollte für das Match dann generell C38 gesperrt sein wenn schon 1x ausgespielt, denn 2x C38 bei z. B. einem 1000er Match ist irrsinnig.

Eigentlich brauchen wir überhaupt keine Buch-Optionen (stehe heute noch dazu) wenn PGN-Random in einer GUI ist. Könnte heute wesentlich besser gemacht werden als seinerzeit entwickelt. Wir haben heute mehr wissen um die notwendigen Optionen hierfür zu verfeinern.

Nur für PGN-Random muss die Selektion der Daten hervorragend sein, es dürfen keine Stellungen drin sein die zu Blunder führen.

Solche Datensammlungen gibt es nicht bzw. ist mir keine wirklich gute bekannt. Ein Grund mehr das mit FEOBOS zu tun.
Denn wenn mehrere Engines solche Datenbanksammlungen untersuchen wird immer wieder etwas gefunden was eine Engine nicht gefunden hat. Selbst wenn 20 Engines analysierten ist die Datenbank nicht frei von Fehlern. Das geht einfach nicht zu 100% auf.

FEOBOS kann wenn fertig für PGN-Random eingesetzt werden.

Wichtig finde ich das jede Stellung wirklich ein eigenes Ranking erhält.
Dies ist wichtig um die besten Stellungen z. B. für einen Test-Set automatisch zu filtern.
Das haben wir bei FEOBOS schon erarbeitet, auch das Ranking System hierfür.

Hat jede Stellung ein eigenes Ranking in einem Buch benötigen wir auch nur zweitranging noch eine Ausspielpräferenz (um etwas doppeltes wie von Dir beschrieben zu vermeiden). Und den ganzen Statistik Schrott in Büchern können wir uns schenken, auf den Festplatten ist mehr Platz für sinnvollere Daten.

Da muss niemand mehr Stunden vor dem PC sitzen und irgend etwas willkürlich zusammenstellen wenn das die Engines mit hunderttausenden von Analysen schon erledigt haben.

Gruß
Frank

Hoffe verstanden!
Wenn nicht erkläre nochmal genau was Du meinst?!

By Frank Quisinsky Date 2017-08-05 18:00 Edited 2017-08-05 18:06

Hallo Thomas,

wenn eine GUI ein Buch so steuern könnte, dass immer wieder versucht wird in ein höheres Ranking (auch mit Zugumstellungen zu kommen) wäre das perfekt.

1. Zunächst Ausspielverhalten nach Beliebtheit der ECO Codes bis der ECO Code gebildet ist.

2. Dann Ausspielverhalten nach dem Ranking der Position im Buch wobei die GUI versuchen sollte immer höhere Rankings innerhalb des Buches zu erreichen. Einfach mittels Zugumstellungen, es gibt mehr Zugumstellungen als Hauptvarianten.

3. Dann einbauen das doppeltes vermieden wird und Positionen bzw. Rankings gecancelt werden wenn diese schon auf dem Brett waren (innerhalb eines Matches).

Das wäre die Perfekte Führung der ersten Züge einer Schachpartie für Engines.
Das mit einer einfachen Stellungbewertung einer Engine zu tun halte ich nicht für gut. Selbst dann nicht wenn Engines wie Booot dafür genommen werden.

Was wir heute in GUIs haben halte ich für überholt und nicht mehr sinnvoll.
Sind schon viele Jahre ein paar Steps weiter ... die Buchentwicklung hinsichtlich GUI Optionen steht seit Jahren.

Gruß
Frank

By Thomas Zipproth Date 2017-08-05 18:54

Hallo Frank,

ja ich denke ich verstehe was du mit PGN Random und dem Ranking meinst.
Das könnte eine interessante Option sein für allgemeine Engine Turniere etc.

In Engine Turnieren wo es um den Sieg als solchen geht, will man natürlich meistens alles kontrollieren, dann gibt es nur den besten Zug als solchen.
Und evtl. auch noch Book Learning, das gibt es ja auch noch.

Dein FEOBOS Set wird sicherlich hervorragend zum Engine Testing geeignet sein.
Bei dem Hert Set ging es darum ein halbwegs gutes Abbild dessen zu haben, was jeden Monat Tausende von Malen in den Turnieren auf Playchess und Infinity sowie in GM Turnieren vorkommt.
Also ein etwas anderer Anwendungsfall, ein Set dessen was in den Eröffnungsbüchern bzw. im Kopf derjenigen vorhanden ist die täglich Turniere spielen und dort gewinnen wollen.

Grüße,
Thomas

By Frank Quisinsky Date 2017-08-05 19:24

Hallo Thomas,

Cerebellum macht das übrigens richtig gut (Kontrolle und stark überwiegend dann der Beste Zug). Nicht einfach eine positive Eval zu bei Buch - Buch zu erhalten wenn ich FEOBOS mit Stockfish einsetze.
Leider kann ich FEOBOS mit Cerebellum auch nicht richtig vergleichen weil Cerebellum viel tiefer geht, was bei FEOBOS nicht passieren darf (Engines sollen früh rechnen, die Vorgabe muss gut und variabel, fehlerfrei sein).

Nutze übrigens Deine Arbeit selbst neben dem Hiarcs und einem älteren Junior Buch.
Im Hiarcs Buch steckt die meiste Handarbeit von allen die ich bislang gesehen / getestet habe. Der Autor selbst ist vielleicht eher ein passiver Spieler aber das Buch ist gut.
Im Junior Buch steckt tiefes Wissen (der Autor ist aggressiver bei der Auswahl der Varianten und oft ist es ihm auch egal was Junior selbst hierzu ausgibt) und in Deinem Buch steckt die pure Rechengewalt. Das Buch ist sehr aggressive.

Können ja später mal die Test-Sets ein wenig miteinander vergleichen.
Das dauert aber noch bis Mitte Januar 2018 bis ich mal soweit bin das ich den Test-Set wieder angehen kann.
Will es perfekt bevor ich den nächsten veröffentliche.

Die Version 5.06 war zwar gut aber total verfrüht und viele enthaltene Stellungen waren nicht die Besten.

Gruß
Frank

OK, Hert-Set nun verstanden!

By Thomas Zipproth Date 2017-08-05 18:19

Hallo Frank,

danke für die ausführliche Anwort. Ich meinte tatsächlich die zweite Variante, d.h. die dreifache Stellungwiederholung innerhalb einer einzigen Partie, aber was du geschrieben hast ist natürlich auch von Bedeutung.

Ich war damit bei der Erstellung des Hert - Sets (Human and Engine relevant Theory) für Stefan konfroniert.
Da es dort "nur" um 500 Positionen ging konnte ich Transpositionen anhand der gespielten Partien aussortieren, wenn ich auch einige wenige mögliche in Kauf genommen habe.
Die Idee war in einem Set mit 500 Partien mal tatsächlich alles abzubilden was in Engine und GM Turnieren hauptsächlich gespielt wird.
Dafür wurde geringfügige Kompromisse hinsichtlich der Vielfalt der Positionen oder des Scores gemacht.
z.B. ist es relativ schwer Königsindisch das sowohl in GM als auch in Engine Turnieren gespielt wird innerhalb einer Score Bandbreite von sagen wir 0.2 - 0.5 abzubilden.
In vielen Stellungen liegt Schwarz eher unterhalb -0.5, trotzdem sind Gewinnpartien mit Schwarz möglich.
Bei Gelegenheit schreibe ich noch näheres dazu, es wird auch eine kurze Doku geben.

Worum es bei meiner Frage ging war wie es bei den Standarderöffnungsbüchern verhindert wird das das Buch innerhalb einer Turnierpartie eine bzw. dreifache Zugwiederholung spielt.
Vielleicht wird es auch gar nicht verhindert sondern tritt nur aufgrund der statistischen Zugauswahl selten auf.
In Cerebellum muss ich es konkret verhindern, weil dort aufgrund der berechneten Zugfolgen gleiche Scores relativ häufig auftreten.

Die Frage hat sich gestellt weil der ehemalige AsmFish Programmierer eine Konvertierung von Cerebellum nach Polyglot .bin geschrieben hat.
Wenn es bei Polyglot keinen allgemeinen Mechanismus zum Verhindern von Zugwiederholungen gibt, könnte dieses Buch unter Umständen wesentlich schwächer spielen als Cerebellum.

Grüße,
Thomas

By Frank Quisinsky Date 2017-08-05 18:59 Edited 2017-08-05 19:08

Hallo Thomas,

hatte mich vor ca. 2 Monaten damit beschäftigt.
FEOBOS Test-Set v5.06 ...
http://www.amateurschach.de/download/book/feobos%20v5.06%20test-set.zip

Zu jedem ECO Code 1 Stellung mit einem Stockfish-Komodo Match mit Farbvertauschung = 1.000 Partien. Das stoß auf viel Gefallen, habe sehr viele eMails hierzu erhalten. Sensationell war die geringe Remisquote für ein solches Match. Bestätigt auch die Arbeit die wir bei Feobos machen, aber es geht noch deutlich besser !!!

Das Problem bei mir war nur ...
FEOBOS ist noch nicht so weit um genau das zu tun.
Mit einem Update müssen wir nachbessern, versuchen mehr Positionen zu seltenen Varianten zu finden um diesen Test-Set deutlich zu verbessern. Feobos errechnet mit der Excel von Klaus auch die besten 500 Stellungen nach einer Berechnungsgrundlage die Klaus sehr schön entwickelt hat. Jede Stellung im Buch hat also ein eigenes Ranking. Später werde ich die Ranking Information ins PGN bringen, besser als 10 Evals ins PGN zu bringen.

Insofern muss ich selbst den Test-Set 1 (zu jedem ECO Code die Stellung mit dem höchsten Ranking) und Test-Set 2 ... die 500 Stellungen mit dem höchsten Ranking zurückstellen bis das Projekt beendet ist. Sonst habe ich im Test-Set nicht die besten Positionen drin, welche ja 10 Engines berechnen.

---

Ja, Königsindisch ist schwierig ... noch schwieriger die vielen Königsgambit Codes. Die A6er Codes ... etc..
Bin seit Wochen Positionen am suchen die sich eigenen könnten zu seltenen Eröffnungen. Siehe Basic Download. Morgen starte ich erneut eine Fehleranalyse mit Komodo und Stockfish für 8.229 neue Stellungen zu seltenen Codes. Wir brauchen einfach mehr, sonst sind viele Stats in der Excel von Klaus nicht so gut weil die Codes nicht mehr gute Stellungen zulassen.

Bei FEOBOS wird innerhalb der Codes alles berechnet, das Ranking Feature funktioniert sehr gut.
Je mehr verschiedene Best-Moves von 10 Engines ausgegeben werden, desto höher das Ranking. Dahinter stehen noch weitere 4 Kriterien die ein Ranking bestimmen.

Führt auch dazu das innerhalb von einem Test-Set der Baum von A00-E99 stark erweitert wird (3 Züge nach ECO Code Bildung) und mithin ein solcher Test-Set auch für eine Ratingliste perfekt ist.

Schaue mir Deine Doku dazu später an, wenn fertig. Bin immer neugierig was andere so entwickeln. Wir haben zwar ein klares Konzept und ich habe während der FCP Rating Liste vieles ausprobiert aber selbst heute noch kommen immer weitere Ideen die wir in Excel dann auch veröffentlichen.

Wie gesagt, Klaus und ich sind durch mit dem Test-Set Thema.
Wir müssen nur die Analysen der Engine abwarten und haben den meines Erachtens perfekten Test-Set.

Zu sagen ein Test-Set für Menschen und für Engines ... ist für uns nicht interessant genug.
Soll alles mathematisch für Engines berechnet werden.

---

Verhindern von 3-facher ...

Wir sagten bei FEOBOS wenn 3 von 10 Engines 0,00 ausgeben ist die Wahrscheinlichkeit hoch das es zu einer dreifachen kommt. Dann wird die Stellung aussortiert. Dann verlieren wir aber ca. 8% aller Stellungen. Das hatten wir in den letzten Tagen geändert.

Sagen nun ...
Wenn die Zugtiefe 04-07 dann wird aussortiert wenn 5 von 10 Engines 0,00 ausgeben. Wenn Zugtiefe 08-11 dann wird aussortiert wenn 4 von 10 Engines 0,00 ausgeben. Wenn die Zugtiefe 12-17 ist wird aussortiert wenn 3 von 10 Engines 0,00 ausgeben. Damit konnten wir 25% der Positionen retten (im Vergleich zu vorher wenn generell unabhängig der Zugtiefe gesagt wird wenn 3 von 10 Engines ...).

Ich teste das immer mit Wasp Test-Runs parallel.
Beim laufenden Test-Run mit FEOBOS v7 (pauschal bei 30%) ist noch keine einzige schnelle Remispartie dabei (unter 20 Zügen) nach jetzt über 900 Partien. Das funktioniert aber ...

Wir verlieren auch einige gute Varianten im Buch.

Hatte heute noch in TalkChess hierzu geschrieben.
Hätten wir eine Engine die speziell nach 3-facher sucht und mögliches wo die Gefahr einer 3-fachen droht auswirft könnte das Problem eleganter gelöst werden.

Schaue mal hier ...
http://www.amateurschach.de/common/feobos/excel/eval%20exp.%201.png

Sensationell was Andscacs macht.
Da gibt es kaum 0,00er Bewertungen.
Der hat schon einiges hierzu im Programm drin.

Die perfekte Engine um auf die Suche zu gehen!!?

Wenn Andscacs eine UCI Option hätte die 3fache schon in der Stellungsbewertung markieren könnte wäre das Problem gelöst.
Also Stellungsbewertung 0,0d oder 0,003 ... dann könnten die Positionen selektiert werden und zumindest würden wir bei FEOBOS nichts unnötig verlieren.

Auf der anderen Seiten.
Bei 33.000 ausgeglichenen Stellungen ist immer noch genug im Buch vorhanden. Wenn wir ca. immer noch 500 Positionen durch unsere Vorgehensweise verlieren ist das nicht so schlimm.

Das Problem ist ja das Buchende.
Der Baum wird immer größer und je nach Engine die das Buch nutzt steigt dann mit jedem Halbzug auch wieder die Gefahr der frühen dreifachen. Im Grunde können wir das bei FEOBOS nur vernünftig optimieren bei Varianten die tief sind. Die gibt es aber nicht weil wir pauschal sagen ... 3 Züge nach ECO Code Bildung endet das Buch (meist mindestens 6, ist nur 1 ECO Code mit 4, 2 mit 5 Züge bei uns drin).

Habe mich mit Polyglot auch schon beschäftigt.
Zu wenig enthalten um professioneller das Thema Bücher anzugehen.

Erneut, uns fehlt so viel beim Thema Eröffnungsbücher. Hatte Stefan Meyer-Kahlen mal gefragt ob er Zeit hat das zu verändern. Das war vor ca. 2 Jahren aber da steckte er in anderen Arbeiten fest, verstand glaube ich auch nicht richtig was ich ihm geschrieben hatte zu PGN-Random oder Buchoptimierungen um die Funktionen in Shredder stärker zu machen.

Gruß
Frank

By Peter Martan Date 2017-08-05 18:05

Hallo Thomas!

Thomas Zipproth schrieb:

Wenn die Engine bzw. der Buchalgorithmus sieht, das ein Zug zu einer bereits gespielten Stellung führt wird nachgeschaut, ob es einen zweiten möglich Zug im Buch gibt.
Wenn ja wird dieser gespielt. Führt der zweite Zug auch zu einer Stellungswiederholung rechnet die Engine.
Gibt es keinen zweiten Zug wird der erste/einzige Zug aus dem Buch wiederholt, in der Annahme das es in diesem Fall wirklich keine Alternativen gibt.

Heißt also, wenn Cerebellum die Zugwiederholung gegen sich selbst ausspielt, ist für beide Seiten jeweils nur der einzige Zug bzw. Antwortzug gespeichert.
Dafür ist das relativ häufig so am Ende von Lines, scheint mir, aber vielleicht bin ich bisher zufällig über viele solche Enden gestolpert.
Auch wäre es ja nicht gut, nur damit die 3fold vermieden wird, zweitbeste Züge als aktiv auszuspielende zu speichern, die dann zum Nachteil gereichen.
In den meisten der von mir häufig verwendeten Eröffnungsbüchern (Noomen und Hiarcs online) kommt das meinem Gefühl nach seltener vor als im Cerebellum, mag aber daran liegen, dass nicht viele so dichte lange Variantenbäume haben.
In allen, bei denen ich mich an solche Stellungen erinnere, ist es so, dass es darauf ankommt, wie die Schleifenzüge editiert sind und wie die Ausspielwahrscheinlichkeit des Buches eingestellt ist, ob die Wiederholungen zum Partieende führen oder nicht.

By Thomas Zipproth Date 2017-08-05 18:40

Ja stimmt, wenn Cerebellum gegen sich selbst Zugwiederholungen spielt muss es so sein das nur eine einzige Variante existiert die dann auch noch zufälligerweise in einer Zugwiederholung mündet.
Vielleicht solllte ich einen Parameter einbauen, der in jedem Fall die Engine rechnen läßt wenn dieser Fall auftritt.
Das könnte zwar in schwierigen Stellungen für Schwarz riskant sein, in denen es nur eine Remisvariante gibt.
Aber mit schnellen Rechnern oder wenn dieser Fall mit Weiß auftritt könnte es von Vorteil ein.

Evtl. noch zusätzlich einen Parameter der die maximale Anzahl von Zügen aus dem Buch vorgibt.

Danke für die Info zu den Büchern, das bedeutet also das es von Einstellungen und manuellen Eingaben abhängt,
aber die GUI wohl keine Standard Vorgehensweise besitzt um diesen Fall zu behandeln.

Grüße,
Thomas

By Peter Martan Date 2017-08-05 18:53

Thomas Zipproth schrieb:

...
Vielleicht solllte ich einen Parameter einbauen, der in jedem Fall die Engine rechnen läßt wenn dieser Fall auftritt.
Das könnte zwar in schwierigen Stellungen für Schwarz riskant sein, in denen es nur eine Remisvariante gibt.
Aber mit schnellen Rechnern oder wenn dieser Fall mit Weiß auftritt könnte es von Vorteil ein.

Evtl. noch zusätzlich einen Parameter der die maximale Anzahl von Zügen aus dem Buch vorgibt.

Danke für die Info zu den Büchern, das bedeutet also das es von Einstellungen und manuellen Eingaben abhängt,
aber die GUI wohl keine Standard Vorgehensweise besitzt um diesen Fall zu behandeln.

You're welcome

Ganz genau genommen sind es ja allerdings bei den Büchern, die ich außer Cerebellum so verwende, schon GUI- Einstellungen, wie das jeweils geladene Buch von der Engine verwendet wird.

Und da sind wir bei der wirklich interessanten Frage: wann werden wir denn das GUI wenigstens mal in einer Beta- Version zu sehen bekommen, Thomas?
Könnte man nämlich das Cerebellum (ruhig auch noch das Light) damit editieren, nämlich auch für den jeweiligen Match- Anlassfall, wären die Fragen, die du hast, ja wohl an den User delegiert, oder?

By Thomas Zipproth Date 2017-08-05 19:32

Das ist richtig, mit der Veröffentlichung wären diese Fragen zum Teil an den User delegiert.

Es gab leider Verzögerungen, die aber alle gar nichts mit der Software zu tun hatten, sondern rein aufgrund mangelnder Zeit wegen aller möglichen Umstände entstanden.
Momentan bin ich wieder an der Software dran und hoffe demnächst mal einen Termin nennen zu können, ich will bloß vermeiden den dann nicht einhalten zu können.
Die private Beta Version mit der ich Cerebellum_light mache existiert ja schon seit fast zwei Jahren.
Nur die notwendige Umstellung auf mehr Benutzerfreundlichkeit und Flexibiltät sowie Stabilität zieht sich momentan noch.

Grüße,
Thomas