Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / FEOBOS v20 contempt 5 Praxistest
- - By Stefan Pohl Date 2018-02-01 13:21 Edited 2018-02-01 13:30
Nachdem nun der offizielle FEOBOS Release efolgt ist, habe ich einen Praxistest gemacht, mit den identischen Bedingungen, unter denen ich auch meine SALC Eröffnungen seit längerer Zeit teste (daher die etwas veralteten Engines) und als Referenzwert auch das Standard 8-Züge Eröffnungsset aus dem Stockfish-Framework, das nun in keiner Weise was besonderes ist - eine 0815 Stellungssammlung mit 8 Züge tiefen Eröffnungslinien. Alle Ergebnisse gibt es auch auf meiner Website unter SALC openings (etwas runterscrollen).
Testbedingungen: 1000 Partien, 5'+3'', singlecore, kein pondern, keine Endspieldatenbanken, LittleBlitzerGUI, beide Engines mit Contempt=+15, asmFish 170426 gegen Komodo 10.4

Bei FEOBOS kam das Contempt 5 EPD Stellungsset zum Einsatz, welches die niedrigsten Remsiqouten bringen soll. Das enthält 23055 Stellungen. Nachdem ein erster Versuch im RoundRobin-Mode der LittleBlitzerGUI (in diesem wird für jede Partie eine der Stellungen vollkommen zufällig ausgewählt) nach einem Drittel der zu spielenden Partien sehr enttäuschend verlief, klärte mich Frank darüber auf, daß die Stellungen im EPD nach Qualität (möglicher Remisgefahr) sortiert seien und die besten Stellungen am Anfang stünden. Daher hab ich den Testrun dann noch mal neu gestartet, diesmal im Gauntlet-Modus der LBG, indem die Vorgabestellungen sequentiell (von Anfang des Files an) abgespielt und mit vertauschten Farben wiederholt werden. Es wurden also in diesem 1000er Testrun die besten 500 FEOBOS-Stellungen durchgespielt (doppelt).

Hier das Ergebnis und zum Vergleich darunter das Ergebnis der Standard 8-Züge Eröffnungen aus dem Stockfish Framework:

FEOBOS v20 Contempt 5 - Top500 Stellungen:
Games Completed = 1000 of 1000 (Avg game length = 1019.828 sec)
Settings = Gauntlet/256MB/300000ms+3000ms/M 450cp for 4 moves, D 120 moves/EPD:C:\LittleBlitzer\feobos_v20-contempt-5.epd(23055)
1.  asmFish 170426 x64  586.5/1000    266-93-draws: 641 (L: m=0 t=0 i=0 a=93)    (D: r=156 i=256 f=44 s=1 a=184)
2.  Komodo 10.4 x64  413.5/1000    93-266-641 (L: m=1 t=0 i=0 a=265)    (D: r=156 i=256 f=44 s=1 a=184)


Stockfish framework openings:
Games Completed = 1000 of 1000 (Avg game length = 1036.164 sec)
Settings = RR/256MB/300000ms+3000ms/M 450cp for 4 moves, D 120 moves/EPD:C:\LittleBlitzer3\34700_ok.epd(32000)
1. asmFish 170426 x64 603.0/1000 286-80-draws: 634 (L: m=0 t=0 i=0 a=80) (D: r=148 i=232 f=39 s=1 a=214)
2. Komodo 10.4 x64 397.0/1000 80-286-634 (L: m=0 t=2 i=0 a=284) (D: r=148 i=232 f=39 s=1 a=214)

SALC V5 10 moves half-closed openings (nur mal als Beispiel, was bzgl. Remsiqoute möglich ist (und das mit verbesserter Ergebnisspreizung)):
Games Completed = 1000 of 1000 (Avg game length = 925.121 sec)
Settings = RR/256MB/300000ms+3000ms/M 450cp for 4 moves, D 120 moves/EPD:C:\LittleBlitzer\SALC_V5_hc_10m.epd(25000)
1. asmFish 170426 x64 616.0/1000 370-138-draws: 492 (L: m=0 t=0 i=0 a=138)(D: r=133 i=200 f=29 s=0 a=130)
2. Komodo 10.4 x64 384.0/1000 138-370-492 (L: m=0 t=0 i=0 a=370)(D: r=133 i=200 f=29 s=0 a=130)

Tja, was soll man nun dazu sagen? Das Ergebnis von FEOBOS ist durchweg schlechter, als das des 0815-Standard Vorgabesets (von den SALC V5 Ergebnissen will ich hier gar nicht reden, die sind in einer anderen Liga): Die Remisqoute ist höher (64.1% zu 63.4%). Die Zahl der 3fach-Remisen (die ja FEOBOS angeblich bekämpfen soll) ist ebenfalls höher (15.6% zu 14.8%) und - das ist am Schlimmsten - die Ergebnisspreizung ist geringer (58.7% zu 60.3%)(je näher die Ergebnisse/Erfolgsscores an der 50%-Marke liegen, desto geringer wären die ELO-Abstände in einer Rangliste oder Turniertabelle und desto wahrscheinlicher wäre es, daß Ergebnisse innerhalb der Errorbar liegen). Selbst, wenn man zugunsten von FEOBOS annähme, daß die statistische Restungenauigkeit bei "nur" 1000 Partien für FEOBOS hier unglücklich verlief, kann man doch sehr sicher sagen, daß FEOBOS auf keinen Fall bessere Ergebnisse liefert, als das Standard 8-Züge Vorgabeset aus dem Stockfsh Framework. Und daß, obwohl es sich um die Contempt 5 -Stellungssammlung von FEOBOS handelt und auch nur die besten 500 Stellungen abgespielt wurden - also das Beste vom Besten bzgl. Remisqoute, was FEOBOS zu bieten hat.

Ich habe immer bezweifelt, daß das Konzept von FEOBOS, nämlich viele Engines in der Schlußsstellung einer Eröffnungslinie eine Minute rechnen zu lassen und dann anhand von Filterungen dieser Stellungsbewertungen Stellungen qualitativ zu bewerten, funktionieren kann. Dafür sind diese Berechnungen auch auf einem schnellen PC viel zu flach und die Stellungsbewertungen schwanken viel zu stark. Würde man das Ganze mit etwas mehr oder weniger Bedenkzeit oder anderen Engines oder anderer Hardware neu durchrechnen, kämen völlig andere Bewertungen heraus, zumindest, wenn man so streng filtert (im Zehntel und Hundertstel Bereich) wie bei FEOBOS. Insofern filtert FEOBOS defacto Zufallsfluktuationen. Das kann nichts bringen. Nur eine Rückwärtsanalyse von Eröffnungen wie bei Cerebellum oder eine MonteCarlo-Ausspielung der Stellungen mit 1000 oder mehr Partien pro Stellung könnte wirklich verläßliche Werte ergeben. Meine ich zumindest. Und dieses desaströse Testergebnis bestätigt das leider auch - wobei ich nicht erwartet hätte, daß es so schlecht ausfallen würde.

Ich für meinen Teil schließe damit mit FEOBOS ab - der Praxistest ist grandios gescheitert. Schade um die viele Arbeit, die investiert wurde, aber wenn man während der Entwicklungsphase nie Praxistests macht, weil man überzeugt ist, auf dem richtigen Weg zu sein, dann kann so ein Desaster eben passieren. Das Gute ist, daß, wenn es mal einige Engines geben sollte, die MonteCarlo-Analysen erlauben, dann könnte man diese Daten in das excel-Tool von Klaus einspeisen und dann wäre wenigstens die Arbeit von Klaus nicht umsonst gewesen. Mit solchen MonteCarlo- Ausspielungs-Daten könnte dieses Tool noch sehr nützlich sein. Hoffe ich.

Auf meiner Website (Rubrik SALC openings) kann man sich die Partien des FEOBOS Testruns und beider SALC V5 Testruns runterladen (der Link ist gleich unter der Zusammenfassung der Ergebnisse). Die vom Framework Testrun und die vom älteren SALC V2 hab ich nicht mehr, da sich eine externe Festplatte leider vor einigen Monaten verabschiedet hat.

http://www.sp-cc.de/salc-openings.htm
Parent - - By Frank Quisinsky Date 2018-02-01 14:06 Edited 2018-02-01 14:11
Hallo Stefan,

na dann hast Du ja jetzt alles gegeben die Analysen von 10 Engines in die Tonne zu klopfen!
Nur damit greifst Du nicht uns an, sondern die 10 Engines die in Teamwork das FEOBOS Buch erstellen.

Stefan Pohl sagt also:
Stockfish, Komodo, Houdini, Fire, Shredder, Wasp, Chrion, Texel, Andscacs und Booot ... alles nicht zu gebrauchen.
Aber mein Buch ist das Beste und mithin setzt sich Stefan Pohl über 3.000 Elo!

BRAVO Stefan, Du bist ein Held!

Denn wir überlassen den Engines, durch mögliche Settings, alles vollautomatisch zu konstruieren.
Wir sehen uns nicht mehr in der Lage selbst ein Eröffnungsbuch zu erstellen, weil mit meinen vielleicht 2.100 liege ich über 1.000 Elo hinter den besten Engines.
Das überlassen wir dann mal schön den Engines selbst und genau dafür wurde FEOBOS entwickelt.

FEOBOS Contempt 5 basiert auf Analysen von 10 Engines die 0,00 bei einer Minute pro Zug bei 10 Threads nicht ausgeben dürfen.
Das ist das maximal beste Ergebnis was erzeugt werden kann.

Es würde nur besser gehen wenn die Hardware eine bessere wäre oder die Bedenkzeit höher wäre.
Würde ich die Bedenkzeit verdoppelt hätte das Projekt 1 Jahr länger gedauert und macht auch überhaupt keinen Sinn.

Das überprüfst Du dann mit 5+3 also auf einem Core, also ca. mit 30fach niedrigerer Bedenkzeit und deutlich geringerer MHz Zahl unser FEOBOS Ergebnis bei über 300 Billionen untersuchten Stellungen bei ca. 500.000 erfolgten Analysen. Ich bin restlos begeistert.

Insofern ist es doch nicht wirklich Dein Ernst mit welchen aggressiven Erläuterungen Du hier um die Ecke kommst um Dein Buch in den Vordergrund zu stellen.

Wird schwierig gegen 10 Analysen der besten Engines zu wettern wenn diese offen liegen. Aber es steht Dir frei genau das zu tun mit Stellungen aus Deiner Datenbank bei denen der Vorteil schon so groß ist, dass allein schon deswegen mehr Gewinn oder Verlustpartien erzeugt werden. Von den ersten 1.000 Salc Stellungen die ich überprüft haben würden 600 durch das FEOBOS Netz fallen ohne das ich jetzt die 0,00 rausgeholt habe.

Bedenken solltest Du immer:
Vermeidung von Remis aufgrund Buchvorgaben ist nur möglich hinsichtlich schneller dreifacher Stellungswiederholung.
Genau das versuchen wir bei FEOBOS.

Wir können natürlich bei allen 500 ECO Codes die verwendet werden, durch eine Vorgabe nur 3 Züge nach ECO Code Bildung nicht ein spätes Remis bei Eng-Eng vermeiden. Das wäre völliger Unsinn. Einzig wie Remis durch Eröffnungsvorgaben vermieden werden kann ist, wenn nur Ultra scharfe Varianten aufs Brett kommen und die gibt es nicht zu allen der 500 ECO Codes.

Auch hat FEOBOS beim Rankingsystem in erster Linie das Ziel, dass sich durch die Vorgaben der Baum so weit als möglich spreizt.
Auf Platz 1 im FEOBOS Ranking System ist daher eine Stellung bei dem 10 Engines 9 unterschiedlich beste Züge ausgegeben haben.

Das sind die Stellungen die unseres Erachtens perfekt für Test-Set Konstellationen eignen weil:

1. Abwechslungsreicher für Beobachter die diesen Test-Set nutzen.
2. Auch die Engines durch mehr Möglichkeiten vor größeren Herausforderungen gestellt werden.

Gruß
Frank

Übrigens, ich hatte bei 40 in 10 mit den TOP-15.000 der FEOBOS Stellungen eine Remisquote von 54% bei einem Match Stockfish - Komodo. Dieses Ergebnis hatte ich schon bei einem Test-Set der besten A00-E99 Stellungen bei einem Komodo - Stockfish Wettkampf und FEOBOS v7. Die Ergebnisse lagen offen, ich berichtete in TalkChess.
Parent - By Frank Quisinsky Date 2018-02-01 14:27 Edited 2018-02-01 14:44
Stefan,

sage mal so ...
Es ehrt Dich ja, dass Du mit Deinen Mitteln versucht Computerschach interessant zu gestalten, indem Du Stellungen versuchst zu finden bei dem spielstarke Engines dann eine geringe Remisquote erzeugen.

Aber bei aller Liebe zum Detail.
Wir haben 500 ECO Codes und nicht 200 oder 300.
Mit allen ECO Codes müssen und sollen Engines in einen Zweikampf gehen. Nicht nur mit unterschiedlichen Rochaden, Damen auf dem Brett etc..

Du kannst nicht die Hälfte der ECO Codes auf einem Sockel stellen mit ausgewählten ECO Codes bei denen "für uns Menschen" interessante Extremsituationen entstehen. Auch ein Shirov muss sich in geschlossenen System messen, so auch ein Tal. Tal hätte immer versucht in ein taktisches System abzuleiten aber das ist ihm nicht immer gelungen.

Spielstärke korrekt zu messen bedeutet alles zu berücksichtigen.
Positionsspiel, Taktik als auch Strategie.

Wenn ich so auf die FEOBOS Daten schauen, speziell auf die Statistiken zu den ECO Codes fällt uns natürlich auch auf, dass viele ECO Codes zu sehr vielen Remis Partien führen. Wir gehen deswegen aber nicht hin und killen die Codes.

Unser FEOBOS System funktioniert sehr wohl wenn Du im Detail schaust was die Engines auch zu den ECO Codes ausgeben. Klar könnten wir hingehen und folgendes tun:

Wir löschen einfach die 200 ECO Codes bei den Positionen zu ausgeglichen sind.
Und natürlich würden wird dann ein deutlich besseres Ergebnis "aus Deiner Sichtweise" produzieren.

Wir machen das aber nicht, weil es Unfug ist und dann nicht wirklich etwas mit Schach zu tun hat bzw. erst Recht mit dem korrekten Messen von Spielstärke.

In erster Linie liegt es nicht an den Bucherstellern für niedrige Remisquoten zu sorgen, sondern an den Programmierern der Engines. Bei Stockfish passiert ja endlich mal was um die unnötigen 0,00er nach unten zu treiben. Interessant ist bei einem Vergleich zwischen Stockfish und Komodo wie viele Postionen beide bei FEOBOS als 0,00 ausgeben während das dann keine andere Engine bei 41.614 Vorgabepositionen macht. Die beiden Engines sind sich nun wirklich sehr ähnlich und das geht aus vielen FEOBOS Stats hervor. Klar wenn auf 41.614 Positionen die Schablone gelegt wird, alles, wirklich alles wird im Detail ersichtlich.

Durch das studieren der FEOBOS Excel wird Wissen erzeugt!!
Wissen das wir nicht haben können beim Betrachten von purer Elo.
Klaus und ich sind selbst immer wieder überrascht welches Wissen uns fehlte beim Erstellen der Excel.

Gruß
Frank

FEOBOS heißt ...
Frank's Encyclopaedia of Balanced Opening Systems
Wobei Ecyclopaedia für 500 ECO codes steht.

Und nicht ...

Frank's selected database of aggressive positions from 2.100 Elo human perception
Parent - - By Frank Quisinsky Date 2018-02-01 16:01
Hallo Stefan,

hast doch noch nicht alles gegeben.
Stimmt, fehlte noch der Beitrag in TalkChess.

BRAVO!

Werden sich die Engine Programmierer freuen, denn auf dessen Analysen beruht FEOBOS.
Hast Dich damit herausragend qualifiziert, aber ich hätte von Dir auch nichts anderes erwartet.

Gruß
Frank
Parent - - By Guenter Stertenbrink Date 2018-02-01 16:43
ihr koenntet doch just so nebenbei mal versuchen die Stellungen rauszupicken die wenige Remisen ergeben,
als Nebenprodukt ?!
Parent - - By Frank Quisinsky Date 2018-02-01 17:03 Edited 2018-02-01 17:36
Hallo Guenter,

das ist nicht wirklich möglich.

Drei Züge nach ECO Code Bildung, mindestens haben wir 5, glaube zu einem ECO Code nur 4 im System.
Maximal sind es 14, also 17.

Wir haben in FEOBOS zu diesem Thema maßgeblich zwei Dinge entwickelt.

Datenbank ohne Zugumstellungen beruht auf Contempt 1-5 Stufen.

Für die Datenbank mit Zugumstellungen (derzeit überlegen wir ob wir überhaupt ein Buch generieren, hatte berichtet ... Ferdinand lotet Möglichkeiten aus ... meines Erachtens müsste David Barnes bei PGN Extract noch eine wichtige Option hinzufügen ... stehen ja mit den Tool Programmierern sehr eng in Verbindung) haben wir ein anderes System entwickelt. Bei Zuglänge 4-7 ist es 4 von 10 Engines erlaubt 0,00 auszugeben. Bei Zuglänge 8-11 ist es 3 von 10 Engines erlaubt 0,00 auszugeben und bei Zuglänge 12-17 ist es 2 von 10 Engines erlaubt 0,00 auszugeben. Ist aus unserer Settings Seite ersichtlich. Je niedriger die Zuglänge desto unwahrscheinlicher ein frühes Remis. Aber egal wie wir auch trixen ... es geht dennoch immer mal wieder schnelle dreifache unter 20 Zügen durch. Nur haben wir diese dumme Situation drastisch minimiert. Diese Settings setzen wir ein wenn wir das Buch mit Zugumstellungen zum Abschluss bringen.

Bei diesen Zuglängen:
4-17 Züge können wir nur schnelles Remis vermeiden wenn bzw. ...

Es ist unmöglich ein Remis einer Partie durch die Eröffnungsvorgabe zu vermeiden, wenn die Partie durchschnittlich ohne Aufgabefaktor 68 Züge lang ist. Würde ja bedeuten wir könnten durch die Eröffnungsvorgabe bis zum Partieende das Ergebnis simulieren. Davon sind wir noch sehr weit entfernt ... Lichtjahre entfernt!!

Absolut unlogischer Ansatzpunkt, durch eine Eröffnungsvorgabe zu versuchen Remis bei einem total unbestimmten Fortgang der Partie zu vermeiden.

Es geht nur ansatzweise dann wenn folgendes gemacht wird:

- die Vorgaben sind nicht ausgeglichen genug. Klar das kleine Vorteile von TOP-Engines auf höchsten Niveau durchgezogen werden bzw. ist die Wahrscheinlichkeit hoch. Klar das dann die Remisquote sinkt.
- wir schauen uns Statistiken zwischen Partien der TOP - Engines an und filtern die ECO Codes mit den geringsten Remisquoten. Basteln aus diesen ECO Codes ein Buch. Das ist stark zweifelhaft, weil durch unterschiedliche Engine Konstellationen beim Eng-Eng Match entstehen hierzu unterschiedliche Statistiken, es sein denn die Engines sind sich sehr ähnlich bei den Spieleigenschaften, sprich den Stärken und Schwächen. Alles Thema von FEOBOS und belegt mit vielen Statistiken. Remis Vermeidung ist nur ein Thema von FEOBOS und bei weitem nicht das Hauptthema.

Aber welchen Sinn macht das?
Das ist eine hochgradige Beeinflussung von Endresultaten und statistisch gesehen wertlos.
Alles andere als wertlos wenn es um den Fun beim Beobachten von Engine-Engine Partien geht (dafür richtig gut).

Was ich z. B. sehr gut an der Arbeit von Stefan finde, ist die Tatsache, das er versucht für Menschen interessante Brettkombinationen zu finden (Damen müssen auf dem Brett sein, offene Linien, unterschiedliche Rochaden etc..). Ein paar dieser Ideen haben wir als Ranking Kriterium auch drin bzw. ziehen innerhalb der jeweiligen Contempt 1-5 Stufen. Nur das ist ein Bruchteil dessen, was im Schach in der Theorie in Wirklichkeit passiert und steht bei FEOBOS nicht im Vordergrund, ist nur innerhalb der Ranking Kriterien ein Punkt um die Rankings genauer zu gestalten.

Ist doch gut wenn Stefan das macht, wir haben kein Interesse daran diese Daten zu filtern.
Wir haben ein Interesse daran, aus den spielbaren Endstellungen der 500 ECO Codes unsinniges herauszunehmen (Thema: Das zunächst fehlerfreie Buch) bzw. schnelles Remis zu vermeiden. Wir möchten möglich viele Vorgabestellungen filtern, um Engines mit denen auf die Reise zu schicken. Aus den Vorgabestellungen basteln wir das Buch. Bzw. nicht wir, sondern die Engines in Teamwork.

Also:
Wenn Engines auf höchsten Niveau mit unserem Buch (besser dem selbst generierten Engine Buch mit der Möglichkeit durch Settings Engines auf den richtigen Weg zu bringen) 55%, oder 60% oder sonst was an Remisquoten basteln, entspricht das der aktuellen Eröffnungstheorie. Das möchten wir nicht beeinflussen. Wir möchten lediglich Varianten draußen haben, die zu einer sehr schnellen dreifachen Stellungswiederholung führen. Hier arbeiten wir mit vielen Tricks innerhalb der entwickelten Contempt Stufen.

Für Stefan ist Remisvermeidung offenbar sehr wichtig. Denke er ist ein wenig gefangen in seinem SALC Projekt mit seinem Projektziel ... so wie wir mit unserem beim FEOBOS.
Für uns ist Remis eine Tatsache, die nicht übermäßig simuliert negativ beeinflusst werden sollte.

500 ECO Codes sind fakt.
Fakt ist das es welche mit vielen und weniger vielen Varianten gibt.
Das wäre noch wichtig bei den Ausspielpräferenzen.
Wir wollen ja auch nicht, dass seltene ECO Codes mit wenigen Varianten öfters aufs Brett kommen als beliebte mit vielen Varianten.

Macht keinen Sinn das zu tun was Du möchtest.
Möchtest Du allerdings genau das ... dafür gibt es doch Salc!

Ist nicht unser Thema!

Gruß
Frank

Wer das Ranking System versteht kann es sich zu nutze machen.
Contempt 5: Keine Engine darf 0,00 ausgeben, keine Engine darf einen Bad Move ausgeben. Oben stehen die Stellungen bei denen die 10 FEOBOS Standard Engines viele gute unterschiedliche Züge erarbeitet haben. Dahinter kommen die Remisvermeidenden Faktoren. Am Ende der Contempt 5 Datenbank stehen die durch Rescue zurückgeholten.

Schneiden wir die 33.009 Contempt 5 Partien an der nach Ranking gewünschten Stelle der weiteren Ranking Kriterien ab können wir vermuten, dass hierdurch die Remiswahrscheinlichkeit nach unten geht.

z. B. unterschiedliche Rochade, Damen auf dem Brett, je weniger Bauern auf dem Brett desto offener die Stellungen etc..
Das haben wir alls drin.

Also am Ende der 33.009 die zurückgeholten, davor die ohne Damen auf dem Brett ... die wahrscheinlich remis fördernden Varianten.

Aber jetzt alles herauszuziehen was Remis vermeidet ist nicht im Sinne einer Encyclopaedia.
Das wäre so als wenn Du ein Buch über die Geschichte von Deutschland schreibst und lässt alles weg was Du als für langweilig empfindest.

Nicht unser Ding und schon mal gar nicht unser Projektziel.
Parent - - By Guenter Stertenbrink Date 2018-02-01 17:52 Edited 2018-02-01 18:01
ihr habt diese Datenbank, die kann nach allen moeglichen Kriterien gefiltert werden

die Eroeffnung gibt eine Remiswahrscheinlichkeit

und eine Wahrscheinlichkeit fuer interessante Partien

-----------------------------------

https://sites.google.com/site/computerschess/scct-book-cs-17

1 InfiPlayX                 : 3476.5     237.0     438   54.1%
2 Cerebellum 130118.bin     : 3476.2     334.0     594   56.2%
113 Feobos v10 C5             : 3396.4     193.5     420   46.1%
130 Feobos v8                 : 3381.1      90.5     210   43.1%
131 SPCC                      : 3381.0     179.0     408   43.9%
138 No Book                   : 3372.6     181.0     414   43.7%
140 SALC V3 10moves           : 3370.8     177.5     408   43.5%
143 TopGM_8move               : 3351.6     160.0     414   38.6%
146 SALC V5 hc 10m            : 3327.2     154.0     414   37.2%

-------------------------------------

Daten zur Computeranalyse ohne Excel :
http://magictour.free.fr/feobos.ope
as,ko,ho,fi,sh,an,bo,ch,te,wa

--------------------------------------------

derzeit beste Eroeffnung bzgl. Ergebnisspreizung:
1.e4 e5 2.Nc3 Nf6 3.Bc4 Nxe4 4.Qh5 Nd6 5.Bb3 Nc6 6.Nb5 g6 7.Qf3 f5 8.Qd5 Qf6 9.Nxc7+ Kd8 10.Nxa8 b6
Parent - By Frank Quisinsky Date 2018-02-01 18:06 Edited 2018-02-01 18:13
Hi Günther,

wobei wir bei Buchervergleichen nicht gut aussehen.
Weil unser Buch nur 3 Züge nach ECO Code Bildung geht und eher im Vordergrund steht, Vorgabestellungen für Eng-Eng zu ermitteln, wobei alle 500 ECO Codes ausgespielt werden sollen. Richtig gute Eröffnungsbücher gehen viel weiter als 3 Züge nach ECO Code Bildung und haben unendlich viele Engine-Engine Partien drin. Nur damit kann ich dann auch wieder nicht forschen ob Engines interessante Wendungen finden, wenn die Partie gerade erst begonnen hat bzw. die Variante eingeleitet wurde. Ein tiefes Buch geht ja über alles hinweg was möglich wäre weil dies gar nicht drin ist.

Würden wir als z. B. 1 Million Partien mit FEOBOS erzeugen und dann mittels den Daten von 3 auf 6 Züge nach ECO Code Bildung hochgehen, würde bei Buchvergleichen FEOBOS immer besser abschneiden. Das hatte ich schon beim FCP Live Buch gesehen und festgestellt. Aber das FCP Live Buch erfüllte einfach nicht gezielt den Zweck den ich für Eng-Eng Vergleiche viel dringender benötige.

Finde das immer lustig wie unsere Arbeit eingesetzt wird und das gar nicht im Sinne der eigentlichen Ziele liegt. Stefan der unser Buch vergleicht mit seinem Anliegen, Buchersteller die vergleichen mit sehr tiefen Büchern.

Jede Engine soll mit FEOBOS klar kommen!
Jeder ECO Code muss drin sein etc..

Habe selbst Millionen von Eng-Eng Partien erzeugen lassen. Und so oft habe ich mich darüber geärgert, dass eine Variante das Resultat beeinflusst hat weil zu lang oder zu kurz oder mit zu großen Vorteilen versehen. Genau das versuche ich zu optimieren bzw. möchte das von Engines selbst optimieren lassen.

Wenn denn alle ECO Codes gleich behandelt werden, kann ich Statistiken zu den Codes selbst erzeugen. Wenn alle Engines gleiches untersuchen, kann ich Statistiken zu den Engines erzeugen ... sehe welche Engines sich für die Eröffnungsanalysen am Besten eignen. Das ist alles Wissen was aus tiefen Büchern, die bei Buchvergleichen antreten nicht gezogen werden können. Im Grunde für statische Zwecke auch keinen sonderlichen Wert haben. Eher ein Wert für die nächste Ebene (frühes Mittelspiel bilden).

Einfach aufgrund der Erfahrung heraus bin ich mir sicher mit FEOBOS den richtigen Weg zu gehen um aus Engine-Engine Vergleichen den Beeinflussungsfaktor Buch herauszubekommen. Ergebnisse werden genauer. Schwächere Engines haben keine Chance durch Buchvorteile Remise zu erhaschen.

Ein wirklich guter und sinnvoller Test für FEOBOS wäre eher:
Super stark gegen 300 ELO weniger und dann schauen ob die Remisquote bei 300 Elo weniger zurück geht.
Das wäre der gebührende Test für unsere Arbeit.

Und am besten Engines einsetzen die nicht zu schnellen Remis neigen.
Also Andscacs gegen 300 Elo schwächer antreten lassen ... (teste das gerade, wollte später dazu schreiben).

Gruß
Frank
Parent - By Frank Quisinsky Date 2018-02-01 17:57
Arbeite ja an der Doku ...
Wird sicherlich Ende Februar fertig sein.
Parent - - By Tommy Tulpe Date 2018-02-01 18:11
Hallo Frank,

ein ganz klein wenig überheblich könnte dem neutralen Leser dein Posting schon vorkommen...

Ulrich
Parent - By Frank Quisinsky Date 2018-02-01 18:19
Hi Tommy, Ulrich oder wer auch immer,

wenn der Leser mir ein vergleichbares Ergebnis nach 4 Jahren Arbeit präsentiert, würde ich mir das zunächst mal in Ruhe ansehen und dann urteilen.

Wäre der Leser mit einer solchen Arbeit dann zu Diskussionen bereit, würde ich diesen niemals als überheblich sehen nur weil er davon überzeugt ist (sollte der Leser dann auch wenn 4 Jahre drin stecken und vor allem wenn die Ergebnisse von den besten Engines generiert wurden sind). Ganz im Gegenteil, ich würde mich freuen wenn er mir sein Wissen schenkt bzw. das Wissen was er generieren konnte. Würde mich freuen wenn sich überhaupt jemand eine solche Arbeit macht und es wäre ein Event für mich wenn er bereit wäre darüber zu diskutieren.

Kann ja nicht sagen die besten 10 Engines sind überheblich.
Kann sagen, das ist das Resultat von 10 Engines mit unterschiedlichen Spielstilen.

Eine überhebliche Engines gibt es nicht ... die rechnen mit purer Rechengewalt.

Wir fügen zusammen und sind eher die Sklaven der Engines, die das als Vorarbeit generieren was Engines aus der Grundstellung nicht errechnen können.

Gruß
Frank

Und insofern ... wer das als überheblich wertet was wir feststellen ist vielleicht oberflächlich unterwegs?
Wissen macht stark ... Doku ist noch nicht fertig.
Up Topic Hauptforen / CSS-Forum / FEOBOS v20 contempt 5 Praxistest

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill