Hallo zusammen,
fassen wir die Überlegungen zusammen:
Zunächst: Die Dia-Show unter:
http://www.amateurschach.de/main/_new-opening-book.htmwurde komplett auf einen aktuellen Stand gebracht.
Alle Tabellenblätter werden hier grafisch dargestellt ... wer sich schnell einen Überblick verschaffen möchte.
---
1. Die FEOBOS Basisdatenbank produziert bei enthaltenen 26.146 Positionen 998 Positionen mit unterschiedliche Zugtiefen. Diese kommen durch die Kürzung der ECO Codes auf 3 Züge nach ECO Code Bildung zu Stande. Durch die Kürzung werden dann andere ECO Codes erkannt (mögliche Zugumstellungen nach Variantenende). Das ist dumm und war mir immer ein Dorn im Auge weil die 998 Positionen dann zu weit über 95% doppelte Postionen innerhalb der 26.146 Basic Datenbank aber mit unterschiedlicher Zuglänge sind.
Insofern müssen diese ja irgendwann mal rausgeholt werden, was wir hiermit gemacht haben.
2. Da eh nun kräftig gewirbelt wurde, berichtigte ich direkt einen zweiten Schwachpunkt. Bei Houdini und zwei anderen Engines waren die Settings nicht optimal. Houdini sortierte über 400 Stellungen eher zu Unrecht aus. Unnötig möchte ich keine Stellungen verlieren. Insofern wurden die Settings neu ausgerichtet. Bedeutet ich muss die Datenbanken für die Erstellung der späteren Bücher komplett neu überarbeiten bzw. Engine für Engine die gefunden Stellungen per Hand rausholen. Da schon 7 Engines durch sind ist das Arbeit. Hinzukommt ja auch noch die Datenbank mit den Zugumstellungen ... also 2x. Das kann dauern und insofern folgt das nächste FEOBOS Buchupdate erst wenn alle 10 Engines die 26.146 Stellungen durch haben, ca. in 1 1/2 Monaten.
3. Es gibt Situationen im Leben einer "EPD", die für Kopfschmerzen sorgen. Rein theoretisch könnte mit einem Editor eine EPD um gewünschte Informationen leicht ergänzt werden. Da ich die Tools von Norm Pollock für das Erstellen der EPD Dateien anwende, sorgt das aber auch nur für ein wenig durcheinander und die EPD Dateien werden viel zu lang ... muss sich sein.
Das Thema ist:
ECO und Zuglänge setzen.
So hat Klaus nun ein neues Datenbank kreiert. Hier können manuelle Eingaben erfolgen. Für jede der 26.146 Stellungen setze ich also den ECO Code und "neu" die Zuglänge der Positionen. Hört sich nach einer Kleinigkeit an oder warum notwendig!? Ich arbeite derzeit parallel an weitere Updates (Update 1b / 1c). Benötige viele der Informationen die nun neu sind für eine bessere Selektion bzw. um selbst mehr zu sehen was nicht gut ist. Update 1a steht mit 12.185 Stellungen (wurde von Stockfish und Komodo) auf Fehler schon analysiert. Update 1b nimmt sich speziell die 53 ECO Codes vor, zu dem wenig in der 26.146 - 12.185 Datenbanken sind. Diese neu gefunden Positionen (Datenbank mit über 5.000 Positionen) wird in Kürze auch von Stockfish und Komodo auf Fehlern untersucht. Geplant ist noch ein Update 1c. Hier konzentriere ich mich auf ECO Codes, bei denen bislang ziemlich viel aussortiert wurde bzw. versuche neue ungeprüfte Positionen zu finden.
Die Updates 1a, 1b und 1c werden dann zusammen das Upd. 1 bilden auf dem die 10 Engines dann erneut losgelassen werden. Die Excel wird dann um die Anzahl der Stellungen vom Upd. 1 ergänzt. Mit diesem Upd. 1 versuchen wir dann gleichzeitig alle Schwachpunkte zu beheben und vor allem das Niveau vom Buch weiter zu steigern, natürlich auch die Stats innerhalb der Excel Dateien von Klaus.
4. Aber zur wichtigsten Änderung:
Wir können beim Aussortieren der 0,00 Bewertungen nicht hingehen und Stellungen "Buch-Ende 4 Züge" mit Stellungen "Buch-Ende 17 Züge" gleich behandeln.
Das heißt, bei einem ECO Code endet das Buch nach 4 Zügen, bei einem ECO Code nach 17 Züge. Die restlichen ECO Codes dann logischer Weise dazwischen.
Die Wahrscheinlichkeit ist deutlich höher, dass es zu einer schnellen 3-fachen Stellungswiederholung kommt mit mehr Zügen im Buch als bei weniger Züger im Buch bzw. ist dann das Buch dafür nicht verantwortlich (bei schnelle Dreifache wenn die Zuglänge im Buch z. B. nur 4 Züge ist).
Würden wir alles gleich behandeln hätten wir beim Setting wenn 30% der 10 Engines 0,00 ausgeben (3 von 10) 2.050 0,00 Positionen aus der Datenbank zu entfernen. Das ist schlecht, geht einfach zu viel was gut ist über den Jordan.
Wir haben nun eine Abstufung eingearbeitet, welche 0,00 aussortiert abhängig von der Zuglänge innerhalb der ECO Codes.
Durch diese Änderung werden wie erhofft dann auch 600 Stellungen weniger gelöscht, also noch ca. 1.400 anstatt vorher ca. 2.000.
Ganz sicher nicht zu Lasten von mehr Remis Partien beim fertigen FEOBOS Buch.
Sehr schwierig zu verstehen, eine komplett neue Idee bei der Selektion.
Allerdings gibt mir die Überlegung Recht ... 600 Positionen gerettet.
---
Letztendlich verlieren wir ... ca. 1.000 Stellungen wegen unterschiedliche Zuglänge innerhalb der ECO codes.
Letztendlich gewinnen wir ... ca. 400 Stellungen (zu Unrecht von Houdini aussortiert) und ca. 600 Stellungen durch die Abstufung beim Löschen der 0,00 Bewertungen.
Mittels dem Löschen der 0,00 Bewertungen sorgen wir für einen hohen Contempt innerhalb des Buches bzw. sorgen wir dafür das es zu deutlich weniger schnellen Remispartien bei Eng-Eng Matches kommt.
---
Durch die vielen Änderungen und auch dem Upd. 1 werden die KECR Ratings von Klaus noch besser.
Das Buch wird ein noch höheres Niveau an den Tag legen (wenn fertig).
---
Und ich bin zufrieden. Die beiden Probleme, die in den letzten Monaten aufgefallen sind bzw. mir größte Kopfschmerzen gemacht haben sind raus. Klaus hat mal wieder ganze Arbeit geleistet und genauso wie ich unzählige Stunden in diese Änderungen investiert.
Diese Tabelle und der Arbeitsaufwand der mittlerweile betrieben wurde ist gar nicht zu bezahlen und sprengt deutlich eigentlich das was ich machen wollte.
Aber da nun mitten drin ...
Auf dem Weg zum "perfekten Buch" fürs Engine rein mit mathematischen Formeln in Kombination mit Engine-Power aus dem Jahr 2017 ...
Gruß
Frank
PS 1: Beim Update 1a, 1b und 1c also später dem Upd. 1 berücksichtige ich jetzt aber die unterschiedliche Zuglänge und filtere das unnütze Zeug vorher aus. Das hatte ich beim Projekt-Start nicht bedacht. Auf der anderen Seite, hierdurch gibt es in der Excel eine schöne neue Funktion fürs manuelle herausnehmen von Stellungen.
PS 2: Bedeutet auch, wer die Excel von Klaus selbst für eigene Datenbanken anwenden möchte muss dann die ECO Codes und die Zuglänge selbst manuell in der Excel einfügen (sonst gibt es keine Stats zu den Themen). Wir haben noch ein paar Ideen Statistiken für die Zuglänge hinzuzufügen. Bei den meisten Datenbanken mit Positionen wird leider immer der selbe Denkfehler begangen. Pauschal wird gesagt, die Datenbank geht 10 oder 8 Züge tief. Das bedeutet, das viele ECO Codes dann gar nicht enthalten sind, oder zu ECO Codes die sich schnell bilden (B06, B07 etc.) dann viel zu viel in der Datenbank ist. Bedeutet das alles nicht mehr ausgeglichen ist und Engines die mit ECO Codes Vorteile oder Nachteile haben benachteiligt oder bevorteilt werden.
Die optimale Lösung ist einfach die ECO Codes auf eine passende Zuglänge zu kürzen oder die ganze Arbeit erscheint fragwürdig. Gibt glaube ich auch nur einen Code bei dem selbst die Kürzung auf 3-Züge nach Bildung fragwürdig ist (unserer Vorgehensweise). Glaube das ist B85 aus dem Kopf, oder war es D85 ... B86 oder D86. Weiß nicht mehr ... hier werden nach dem Ende des ECO Codes mindestens drei logische Züge gespielt, so dass es zu Unmengen Zugumstellungen kommt aber letztendlich nur wenige in der Datenbank verbleiben.
Genug, hätte ich diese und viele andere schon erarbeitete Infos vorher gehabt.
Wem jetzt der Kopf qualmt ... vergisst das hier alles und schaut sich mal die folgende Grafik an ...
http://www.amateurschach.de/common/feobos/excel/eval%20exp.%202.pngSchaut mal auf Andscacs ... genial was diese Engine macht was alle anderen bislang getestete Engines nicht machen ... Kurve komplett entgegengesetzt zu allen anderen Engines, irre!
Eine extrem niedrige 0,00 Statistik ... werden kaum 0,00er ausgegeben ... BRAVO ... verhindert auch ohne Contempt die schnellen Remise.
Ich bin der Meinung das ist "Spitze" ...
Mittels FEOBOS mehr zu den Engines herausfinden.
Auch das ist ein schöner Nebeneffekt wenn die Schablone auf 26.146 Stellungen mittels Excel gelegt wird.
Und entgegen was Klaus geschrieben hat.
Online ist die Version 07.44-79 ... also nach 44% der Andscacs Analysen (hatte die aktuellen Analysen noch eingefügt).