Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Vorgehensweise von ICE nach Eröffnungszügen revolutionär?
- - By Frank Qy. Date 2016-02-08 22:46
Hallo zusammen,

ICE macht mir das Leben hinsichtlich Optimierung von meinem Buch auf der einen Seite besonders schwer, auf der anderen Seite besonders einfach. Frage mich ob die Vorgehensweise gar als revolutionär zu betrachten ist oder vielleicht auch nur als einfache Idee durchgehen sollte.

Kurz:
Schon ICE 2.0 bewerte die ersten berechneten Züge nach dem Buch teils deutlich höher oder niedriger als andere Engines. OK, SmarThink und Fizbo gehen offenbar ein wenig vergleichbar vor, bewerten diverse Varianten auch deutlich höher / niedriger, wobei SmarThink hier noch etwas krasser vorgeht als Fizbo. Aber ICE 2.0, besonders die 3.0, ist hier extrem. Das macht das herausfiltern von vielleicht ungeeigneten Varianten für mich besonders schwierig wenn z. ICE 2.0 nach den Eröffnungszügen +1.5 ausgibt und die Gegner dann meist bei 0.0 oder vielleicht +0.4 liegen.

Nun gut ... bei ICE 2.0 hielt sich alles noch in na ja ... Grenzen. Wenn ich weiß, dass die Engine so vorgeht weiß ich auch das ich die Varianten natürlich nicht direkt aus dem Buch holen sollte, sondern genauer prüfen muss. Aber was nun ICE 3.0 so fabriziert ist ja nochmal ne Schippe drauf. z. B. nach wenigen Zügen nach der Eröffnung +2.0 wenn der Gegner noch bei 0.0 steht. Betroffen sind ca. 8% der kompletten Züge die ich im Buch habe. Das Problem ist nun das ICE 3.0 stärker geworden ist und mithin schon allein deswegen öfters Recht behält als noch die Version 2.0. Dennoch so rein gefühlsmäßig packte der Programmierer noch ne Schippe drauf und alles wirkt noch extremer als bei ICE 2.0.

Es sind nun über 1.600 in meinem Test-Run gespielt und ich habe sage und schreibe 48 Varianten aus dem Buch geholt bzw. die Partien nachspielen lassen. Natürlich nicht immer der Fall das ICE sich deutlich im Plus sieht sondern auch deutlich im Minus. Und wenige Züge später haben sich dann auch die Gegner so langsam an die Bewertung von ICE angenähert.

Sprich, ich bin mir sowohl unsicher als auch sicher die Varianten herauszuholen. In ca. 180 Fällen habe ich mich jedoch entschieden die Varianten im Buch zu belassen weil wenn längere Zeit der Gegner immer noch ausgeglichen ist und ICE aber beständig ein +1.0 anzeigt mache ich hier nichts ... sonst hätte ich nach 40.000 ICE Partien 5.000 Varianten oder mehr weniger im Buch.

Die Frage ist nun ...
Was macht ICE im Detail anders denn was dieses Programm macht ist definitiv nicht nur gut sondern wahrscheinlich genial.

Ich führe eine Statistik hierzu und schaut selbst ...
Bewertungen die innerhalb von 1-5 Zügen nach dem Buch um 1.5 Bauerneinheiten von dem Gegner abweichen ...

In 62% der Fälle behält Eis recht und es kommt dann zur Niederlage oder zum Sieg.
In 24% der Fälle dann doch zum Remis
und nur in 14% aller Fälle kommt es nicht wirklich zu dem angezeigten Nachteil oder Vorteil und das Blatt wendet sich ...

Statistik von ICE 3.0.
Bei ICE 2.0 war diese auch sehr gut aber nicht so gut und nach 3.000 der fast 7.000 gespielten ICE Partien hatte die Statistik abgebrochen.

Das ist definitiv genial bzw. scheint an der Idee vom ICE Programmierer etwas dran zu sein.

Hätte gerne mehr Details hierzu, nicht zuletzt um zu wissen wie oder was muss ich bei der Optimierung beachten.
Denn 48 von 1630 Partien bzw. hier Varianten aus dem Buch zu holen ist echt krass denn das sind fast 3%. Nach so langer Zeit der Optimierung ist mein Buch nicht so schlecht. Bei jedem anderen Testlauf finde ich vielleicht maximal 10-15 Varianten die raus müssen und dabei habe ich noch bei ca. 50% Bauchschmerzen und nehme aber dennoch raus.

Können sicherlich viele nicht nachvollziehen was ich schreibe aber testet das selbst mal aus.
Nimmt drei beliebige Engines (vielleicht jetzt nicht SmarThink und Fizbo) und ICE in einer vierer Engine 1-Core Analyse. Dann geht mal ein paar Eröffnungsvarianten durch und beobachtet wie z. B. Junior, Hakkapeliitta, Komodo bewertet und schaut Euch im Vergleich die Bewertung von ICE an. Oder die Tester der nur besten Engines nach Elo ... nimmt Stockfish, Komodo, Houdini und ICE.

Ach ja ...
Im Spiel schaut es nicht anders aus.
Morgen Abend endet mein Test-Run und dann ladet Euch mal die 2050 Partien herunter und analysiert ein bissel. Finde das alles sehr aufregend und wirklich revolutionär denn das ist etwas neues und sollte zumindest auch mal im Kreis der User unter die Lupe genommen werden weil definitiv interessant. Auch wenn ich durch ICE selbst eine Höllenarbeit aufgrund stetiger Verunsicherung bei den produzierten Partien habe (prüfe jede gespielte Partien auf schlechte Buchvarianten durch).

Viele Grüße
Frank
Parent - - By Walter Eigenmann Date 2016-02-09 09:35
Hallo Frank

Merci für deine Untersuchungen.

Frank Qy. schrieb:

... wenige Züge später haben sich dann auch die Gegner so langsam an die Bewertung von ICE angenähert...

... nehmt Stockfish, Komodo, Houdini...

... Die Frage ist nun ...
Was macht ICE im Detail anders denn was dieses Programm macht ist definitiv nicht nur gut sondern wahrscheinlich genial....


Bleibt aber auch die Frage, warum iCE3 in seinen praktischen Partien bei derart "genialer" Stellungsbewertung dann so viel schlechter spielt als viele andere?!?

Denn sooo hermetische Bereiche sind Bewertung-Suche-Evaluation denn auch wieder nicht...

Gruss: Walter

.
Parent - By Frank Qy. Date 2016-02-09 12:07
Hallo Walter,

bei den Herren Stellungstester sollte zunächst mal das Interesse geweckt sein.
ICE liegt ca. 250 Elo hinter Stockfish und Komodo ist derzeit auf bei mir auf Platz 12 ca. 30 Elo hinter der ehemaligen und noch vor kurzer Zeit hochgelobten Engine Rybka.

So viele stärkere Engines gibt es nicht und das sollte niemals die Frage sein wenn wir uns ein Programm näher ansehen.
Das ist langweilig und führt zur Computerschachblindheit.

Die Frage sollte immer sein, was macht denn ein Programm besonders gut und was macht es vielleicht nicht gut.
Nur so werden wir in die Geheimnisse einsteigen, nicht wenn wir auf Ratinglisten blicken und feststellen wie groß die Unterschiede in der Gesamtspielstärke sind.

Das haben viele der Ratinglistenbetreiber schon längst verstanden, denn sie testen so einiges und sich auch begeistert wenn ein 2.400 Elo Programm spielt und testen das aus. Derzeit so der kleine aber feine Unterschied zu Stellungstestern, die es meines Erachtens auch noch gar nicht so richtig verstanden haben und daher auch keinen wirklich guten Test auf die Reihe bekommen, sondern eher quälen mit oft zwar logischen Kommentaren aber dann doch wieder in alte Muster verfallen und sich selbst im Wege stehen. Nicht zuletzt aufgrund solcher Kommentare die ich spitzfindig geschrieben nicht anders vermutete.

Mal schauen ob der ICE Programmierer den Thread findet und etwas hierzu schreibt.

Und ein Absatz zu Peter:
Theorie und Praxis ... zum Thema Eröffnungsbücher erstellen ... auch hinter den ersten Bewertungen einer Variante schauen.
Da hattest doch gerade Du schon so viele Kommentare in der Vergangenheit los gelassen. Wenn Du dich mit der Engine Vielfalt beschäftigt endet viel in Theorie und Praxis. Das liegt einfach daran, weil wir unterschiedliche Programme haben die vieles unterschiedlich tun. Wir neigen dazu alles über einen Kamm ziehen zu wollen weil es dann einfacher zu verstehen ist. Hierfür benötigen wir die Grundaussage Leistung in Elo. Diese Grundaussage benötigen wir nicht um Stärken und Schwächen zu beurteilen weil wir diese mit einer Elo nicht sehen können.

Warum findet Hakkapliitta als Angreifer oft andere Züge als Stockfish oder Komodo.
Warum dann ein oder zwei (nach Betrachtungweise) Spielstärkeklassen darunter Rodent wieder andere Züge als Hakkapeliitta (nicht minder uninteressant, gar interessanter als der Vergleich von Hakkapeliitta zu SF und Komodo), die aber dennoch zum Vorteil führen. Auch wenn Rodent dann aufgrund der Gesamtspieltstärke die Vorteile im weiteren Verlauf nicht halten kann gegen stärkere Konkurrenz. Genau das interessiert mich persönlich eigentlich recht wenig, eher warum hat das Programm überhaupt den richtigen Zug gefunden. Von Zufällen können wir nicht sprechen wenn es wiederholt passiert.

Bin auch einseitig unterwegs.
Mich interessieren die Stärken ... ganz ehrlich ... die Schwächen interessieren mich einen Schei...
Ich denke ich bin es der lenkt und die Stärken zusammenziehen könnte.

Die Kunst ist die Kunst zu erkennen!
Die Kunst ist nicht abzuurteilen so banal wie es oft Redakteure tun um das zu schreiben was das gemeine Volk lesen will. Damit werden sie zwar in einem Tagesblättchen bejubelt aber keinesfalls in einem Fachmagazin denn dort werden ganz andere Fragen gestellt.

Wer sich nur mit Rembrandt beschäftigt wird einen anderen Künstler nur schwierig erkennen können.

Finde wir haben ein wirklich schönes Hobby, finde wir könnten mehr daraus machen!
Finde wir benötigen wirklich einen richtig guten Stellungstest und ich finde es wird hierfür langsam auch mal Zeit.
Wir haben ein paar gute Ideen hierzu aus der Vergangenheit aber nach wie vor ... ich sehe keinen Test der wirklich tiefer in die Geheimnisse einsteigt um dann zu interessanten Teilaussagen zu kommen.

Mit ICE haben wir ein Werkzeug für die Erstellung.
Wir haben ein Werkzeug mit SmarThink, mit Hakkapelliita ... mit Scorpio oder Tornado im Endspiel.
Wir haben ein ultimativ einsetzbares Werkzeug mit Stockfish und Komodo!
Werkzeuge sind dazu da um sie nutzen.

Gruß
Frank
Parent - - By Peter Martan Date 2016-02-09 10:54 Edited 2016-02-09 11:01
Frag doch mal Thomas Petzke, Frank, ich glaube nicht, dass er streng geheime Interna verraten müsste, um dir Evalunterschiede in bestimmten Partiephasen so weit zu erklären, dass du mehr Anhaltspunkte hättest, und nicht mehr nur beliebige Stellungen wild drauflos testen müsstest.
Oder, wenn du schon selber einen Überlick hast, was für Stellungen das hauptsächlich sind, in denen es sich besonders krass zeigt, gib ein paar Beispiele.
Parent - - By Chess Player Date 2016-02-09 11:45
Ja, hurra!!! will ich auch sehen...
Parent - By Frank Qy. Date 2016-02-09 12:15
Hurra, ich will sehen was andere feststellen und eigenes nicht pausenlos selbst präsentieren.
Finde es reicht Hinweise zu geben ... wer sich das was ICE macht selbst mal in Ruhe anschaut, vielleicht gar mit seinen favorisierten Eröffnungen, dem wird das Analysefieber packen. Wer sich das nicht anschaut hat vielleicht mal wieder irgend etwas verpasst. Auf der anderen Seite wir können nicht alles aufnehmen was interessant ist (spreche nicht nur vom Schach).
Parent - By Frank Qy. Date 2016-02-09 12:31
Noch ein kleiner TIPP ...

Universal PGN / EPD Tool von Ferdinand (findet sich auf meiner Webseite). Hatte Ferdinand darum gebeten mir das zu Programmierern. Tool sucht drei Züge nach den Eröffnungsbuchzügen nach selbst zu konfigurierenden Vorgaben.

zum Beispiel.
high-score 1.pgn (1.pgn Name vom PGN file).
80 enter (weiß Bewertung) -60 enter (schwarz Bewertung) ... und es werden alle Partien aus einer PGN herausgefischt welche eine von diesen beiden Vorgaben entsprechen (natürlich müssen die Partiekommentare in der Datenbank sein). So sehe ich sehr schnell bei komplexen Daten ob sich z. B. schlechte Varianten darunter befinden bzw. habe es einfacher diese zunächst mal herauszufischen. Muss natürlich immer betrachtet werden wie eine Engine mit der Eval umgeht (Eval ist logischer Weise nicht gleich für jedes Schachprogramm). Siehe Beispiel ICE, SmarThink oder Fizbo. Gibt so ein paar Engines, auch bewertet sich im Einzelfall schon Spike deutlich besser oder schlechter. Das war eigentlich die erste Engine wo es ein wenig aufgefallen ist. Zumindest die erste die mir aufgefallen ist da es. Spike ist aber kein gutes Beispiel denn es passiert im Vergleich zu Fizbo seltener. Bei Smarthink wie beschrieben dann deutlich öfters als bei Fizbo und ICE ist extrem.

Gibt auch Gegenbeispiele:
Die Rybka Stellungsbewertung ist nach den Eröffnungszügen absolut neutral. Gefühlsmäßig nach den mehr als insgesamt hunderttausend Partien die ich so schon geprüft habe am neutralsten von allen. Schlechte Varianten mittels Rybka - Rybka herauszufinden ist echt eine Aufgabe denn so viele wird Rybka gar nicht aufspüren können bzw. Rybka bewertet mehr Eröffnungsvarianten als ausgeglichen als andere Engines.

Mal ein paar Tipps um selbst auf die Suche zu gehen.
Aber richtig gut wäre ein Quad Rechner. Wie beschrieben Eröffnungen durchforsten und ICE mit drei anderen im 1-Core Analysemode laufen lassen und sich wundern.

Gruß
Frank
Parent - - By Ludwig Buergin Date 2016-02-09 12:54
Hallo Frank

  Deine Arbeiten an Deinem Buch verfolge ich schon lange mit großem Interesse.Dein Bestreben ,alle jemals gespielten Varianten von A1 bis E99 in einem Buch unterzubringen und darüber hinaus , dass dieses Buch  dann auch noch für viele (alle) Engine beim spielen Vorteile erbringen soll, halte ich für nicht möglich.
 
       Da trifft das alte Sprichwort:Allen Enginen recht getan ist eine Kunst,das ein einzelnes Buch nicht kann.
.Wie  Du ja selber schreibst,dass Du unterschiedliche Stärken im Ablauf eines Spieles bei einer Engines feststellen kannst ist es deshalb um so wichtiger,Dieser Engine  ein Buch mit passenden Anfangszügen zur Verfügung zu stellen.
 
    OK wir haben verschiedene Ansätze .Du testest Engine und benennst  die gefundenen unterschiedlichen Stärken. Mein Spielfeld sind Maschinenraum und InfinityChess und da gilt es halt mit einer Engine und passenden Buch das Beste rauszuholen.

  Gruß Ludwig

   PS.Dass Du unser Hobby schon viel länger betreibst  als ich,weiß ich schon und mein Schreiben ist deshalb in keinster Weise als Kritik  aufzufassen.
Parent - - By Frank Qy. Date 2016-02-09 13:02
Hallo Ludwig,

es ist eine Kunst mittels ICE dann wirklich schlechte Varianten herauszufiltern.
Doch ich bin beim Bestreben genau das was Du beschrieben hast zu tun schon mit einer Selbstzufriedenheit von 90% gesegnet.
Also verdammt nahe dran das zu erschaffen was ich möchte. Sitze auch schon sehr lange daran und bin sehr zufrieden.

Nur bei den extremen Engines wie ICE muss ich genau schauen.

Mit dem beschriebenen Tool von Ferdinand hier mal ein Ergebnis als Beispiel:
Aus den letzten 270 Partien (laufender Test-Run von ICE) werden 48 Partien ausgespuckt bei der Vorgabe "Weiß = 0.80 und Schwarz -0.60".
Diese Partien prüfe ich gerade ... sind Varianten drin die raus müssen.

Wenn das jetzt jemand machen würde der die Engines nicht alles kennt würde er wahrscheinlich 40 der Varianten aus dem Buch herausholen.
Bei ca. 300 Partien erhalte ich vielleicht 10 die zu prüfen sind wenn ich das mit anderen Engines mache.

Das Auge muss wirklich geschult sein aber die vielen Analysen die ich tun muss um wirklich zu entscheiden raus oder drin lassen sind heftig.
Verrate Dir das Ergebnis ... von den 48 Partien müssen tatsächlich 6 Varianten rausgenommen werden, es sind nicht mehr.

Gruß
Frank

http://www.amateurschach.de/download/test.zip (prüfe die 48 Varianten ohne jetzt Engines wie Stockfish oder Komodo zu bemühen).
Dein Ergebnis wird sein ... 40 Varianten sind nicht gut.
Die Realität sieht anders aus aber interessant ist das was ich beschrieben habe ... wie oft behält ICE Recht und das ist spektakulär ... nur sind deswegen die Varianten nicht schlecht und absolut spielbar.
Parent - By Frank Qy. Date 2016-02-09 13:36
Korrektur, bin durch ...
Es sind 9 die aus dem Buch müssen.
Und solche finde ich mit ICE schneller als mit anderen Engines.

Wenn ich schreibe Rybka ist z. B. sehr neutral ... heißt das auch nicht anders dass Rybka einfach nicht die Power hat viele schnelle Gewinne zu produzieren wenn die Stellungsbewertung neutrales ausgiebt. Nicht zuletzt ist Rybka daher auch so schlecht hinsichtlich schnellen Gewinnen und im Grunde für Eröffnungsanalysen gar nicht zu gebrauchen bzw. auch nicht im Fernschach nach der Eröffnung.

Egal ...

Es war eine Hedenarbeit das herauszufinden was ich bislang herausgefunden habe auch wenn es im Ergebnis wenig ist.

Gruß
Frank
Parent - By Frank Qy. Date 2016-02-09 13:48
Wenn ICE sagt 3% der kompletten Eröffnungstheorie ist schei...
7% sind spielbar aber OK, ich gewinne ja eh ... und das nach den Buchzügen und dabei auch noch zu über 80% recht behält.

Der Programmierer muss etwas geniales entwickelt haben.
Das ist einfach zu sehen wenn im Detail geschaut wird.

Tja, die vielen kleinen Geheimnisse die sich in den Ideen der Entwickler befinden und darauf warten erobert zu werden.

Gruß
Frank
Parent - - By Andreas Wutzke Date 2016-02-11 16:17
Servus,

mhhh +2.00 wenn der Gegner noch 0.00 anzeigt und dann auch noch recht behält....?
und das in Eröffnungen die fast alle Engines als ausgeglichen sehen?
hab ich das richtig verstanden?
klingt interessant für mich, ich werde mich mal damit beschäftigen, hoffe das klappt auch bei langen Bedenkzeiten....

Grüße
Andreas
Parent - - By Frank Qy. Date 2016-02-11 22:58
Hallo Andreas,

in der Regel sind es eher so 1.0 - 1.2 Bauerneinheiten Unterschied bei ca. 8% der Eröffnungen. Aber teils habe ich auch bis zu 2.0 Bauerneinheiten gesehen. Muss nun beim Vergleich zur Version 2.0 berücksichtigen das ICE um 160 Elo zugelegt hat und insofern natürlich auch öfters Recht behält. Zumal das große ICE 2.0 Problem das Endspiel war und ich rein gefühlsmäßig sagen würde hier hat ICE enorm zugelegt bzw. liegt hier die eigentliche Verbesserung.

Allerdings ...
Auch so rein gefühlsmäßig würde ich sagen der Programmierer hat nicht nur im Endspiel gearbeitet denn ich glaube das ICE das mit den höheren Bewertungen noch einen Tick mehr krasser treibt als die Version 2.0 und auch unter Berücksichtigung der höheren Elo bzw. im Verhältnis gestellt unter Berücksichtigung der Endspielschwäche noch öfters Recht behält.

Das ist eine Engine ganz nach meinem Geschmack weil durch diese Geschichte allein erhält ICE ein eigenes Gesicht und sticht im Vergleich zu anderen Engines hervor. Ich finde Engine Vielfalt bedeutet genau das und macht ICE dann ganz besonders interessant für Analysen, gerade wenn es darum geht Eröffnungssysteme und dessen Chancen zu bewerten.

Von meiner Seite also ein ganz großes Lob an den Programmierer der dazu beiträgt das trotz Komodo und Stockfish für Alternativen hinsichtlich "besonderes" gesorgt wird.

Viel Spaß mit Deinen Untersuchungen!

Gruß
Frank

Tolles Kino was ICE abgeliefert hat.
Möchte mich damit auch ganz besonders bei dem Programmierer bedanken ...
Er sorgt nicht zuletzt dafür das ich in einer etwas müden Zeit (glaube das war zu viel Schach in den letzten Monaten für mich) dennoch motiviert bleibe.
Dieser Schelm ...
Parent - - By Thomas Müller Date 2016-02-12 07:02
Im Gegensatz zu mach anderen schreibt er sehr ausführlich über seine Engine....
http://macechess.blogspot.de/
http://www.fam-petzke.de/chess_home_en.shtml
Evtl. kann er es am Besten erklären was es damit so auf sich hätte ?!?

gruß
thomas
Parent - By Frank Qy. Date 2016-02-13 12:25
Hallo Thomas,

ja, seine Doku ist gut.
Muss mich mal mehr damit beschäftigen wenn meine Statistiken aktuell sind.
Nun ist WE und ich habe keine Lust die Stats zu erstellen, nächste Woche ...

Gruß
Frank
Parent - - By Kurt Utzinger Date 2016-02-12 00:03
Hallo Frank

Ich versteh Dein Problem nicht. Wenn fast alle Engines andere Bewertungen zeigen, dann liegt eben ICE vermutlich falsch. Und nachdem der jeweilige Partieausgang meistens wenig bis gar nichts mit der Bewertung in der Eröffnung zu tun hat - weil ICE eben Fehler macht, die andere Engines vermeiden - sehe ich keinen Anlass, Dein Buch wegen ICE anzupassen.

Mfg
Kurt
Parent - - By Frank Qy. Date 2016-02-13 12:21
Hi Kurt,

das Problem ist aber ... wenn denn ICE eine Eröffnungsposition besser bewertet und in so vielen Fällen (immer im Verhältnis Spielstärke zum Gegner) Recht behält muss etwas dran sein. Das passiert ja nicht permanent aber in ca. 8% der gängigen Eröffnungssysteme.

Da ich ja mein Buch auf alle Engines optimiere stellt mich das echt vor eine Herausforderung hinsichtlich der Abwägung was muss ich nach einem ICE Test-Run deaktivieren oder eher nicht. Grundsätzlich deutlich mehr zu deaktivieren als wenn eine andere Engine dann die 2050 Partien spielt.

Ich denke es ist etwas dran an der ICE Bewertung und mithin wird mein Buch besser wenn ich vorsichtig bin und nicht grundsätzlich alles deaktiviere was von ICE direkt mit teils mehr als +1.0 ausgeworfen wird. Insofern bin ich dankbar für diese Engine.

Etwas anders tun als es andere tun ist bekanntlich nicht grundsätzlich schlecht. Eher verdient es wirklich Aufmerksamkeit und genaue Analysen.

Viele Grüße
Frank
Parent - By Kurt Utzinger Date 2016-02-13 13:53
Hallo Frank

Werde mir spasseshalber ICE mal herunterladen, um die von anderen
Engines in der Eröffnungsphase so stark abweichenden ICE-Bewertungen
zu Gemüte führen.

Mfg
Kurt
Parent - - By Tom Paul Date 2016-02-12 15:44
Frank Qy. schrieb:

Hallo zusammen,

ICE macht mir das Leben hinsichtlich Optimierung von meinem Buch auf der einen Seite besonders schwer, auf der anderen Seite besonders einfach. Frage mich ob die Vorgehensweise gar als revolutionär zu betrachten ist oder vielleicht auch nur als einfache Idee durchgehen sollte.

Kurz:
Schon ICE 2.0 bewerte die ersten berechneten Züge nach dem Buch teils deutlich höher oder niedriger als andere Engines. OK, SmarThink und Fizbo gehen offenbar ein wenig vergleichbar vor, bewerten diverse Varianten auch deutlich höher / niedriger, wobei SmarThink hier noch etwas krasser vorgeht als Fizbo. Aber ICE 2.0, besonders die 3.0, ist hier extrem. Das macht das herausfiltern von vielleicht ungeeigneten Varianten für mich besonders schwierig wenn z. ICE 2.0 nach den Eröffnungszügen +1.5 ausgibt und die Gegner dann meist bei 0.0 oder vielleicht +0.4 liegen.

Nun gut ... bei ICE 2.0 hielt sich alles noch in na ja ... Grenzen. Wenn ich weiß, dass die Engine so vorgeht weiß ich auch das ich die Varianten natürlich nicht direkt aus dem Buch holen sollte, sondern genauer prüfen muss. Aber was nun ICE 3.0 so fabriziert ist ja nochmal ne Schippe drauf. z. B. nach wenigen Zügen nach der Eröffnung +2.0 wenn der Gegner noch bei 0.0 steht. Betroffen sind ca. 8% der kompletten Züge die ich im Buch habe. Das Problem ist nun das ICE 3.0 stärker geworden ist und mithin schon allein deswegen öfters Recht behält als noch die Version 2.0. Dennoch so rein gefühlsmäßig packte der Programmierer noch ne Schippe drauf und alles wirkt noch extremer als bei ICE 2.0.

Es sind nun über 1.600 in meinem Test-Run gespielt und ich habe sage und schreibe 48 Varianten aus dem Buch geholt bzw. die Partien nachspielen lassen. Natürlich nicht immer der Fall das ICE sich deutlich im Plus sieht sondern auch deutlich im Minus. Und wenige Züge später haben sich dann auch die Gegner so langsam an die Bewertung von ICE angenähert.

Sprich, ich bin mir sowohl unsicher als auch sicher die Varianten herauszuholen. In ca. 180 Fällen habe ich mich jedoch entschieden die Varianten im Buch zu belassen weil wenn längere Zeit der Gegner immer noch ausgeglichen ist und ICE aber beständig ein +1.0 anzeigt mache ich hier nichts ... sonst hätte ich nach 40.000 ICE Partien 5.000 Varianten oder mehr weniger im Buch.

Die Frage ist nun ...
Was macht ICE im Detail anders denn was dieses Programm macht ist definitiv nicht nur gut sondern wahrscheinlich genial.

Ich führe eine Statistik hierzu und schaut selbst ...
Bewertungen die innerhalb von 1-5 Zügen nach dem Buch um 1.5 Bauerneinheiten von dem Gegner abweichen ...

In 62% der Fälle behält Eis recht und es kommt dann zur Niederlage oder zum Sieg.
In 24% der Fälle dann doch zum Remis
und nur in 14% aller Fälle kommt es nicht wirklich zu dem angezeigten Nachteil oder Vorteil und das Blatt wendet sich ...

Statistik von ICE 3.0.
Bei ICE 2.0 war diese auch sehr gut aber nicht so gut und nach 3.000 der fast 7.000 gespielten ICE Partien hatte die Statistik abgebrochen.

Das ist definitiv genial bzw. scheint an der Idee vom ICE Programmierer etwas dran zu sein.

Hätte gerne mehr Details hierzu, nicht zuletzt um zu wissen wie oder was muss ich bei der Optimierung beachten.
Denn 48 von 1630 Partien bzw. hier Varianten aus dem Buch zu holen ist echt krass denn das sind fast 3%. Nach so langer Zeit der Optimierung ist mein Buch nicht so schlecht. Bei jedem anderen Testlauf finde ich vielleicht maximal 10-15 Varianten die raus müssen und dabei habe ich noch bei ca. 50% Bauchschmerzen und nehme aber dennoch raus.

Können sicherlich viele nicht nachvollziehen was ich schreibe aber testet das selbst mal aus.
Nimmt drei beliebige Engines (vielleicht jetzt nicht SmarThink und Fizbo) und ICE in einer vierer Engine 1-Core Analyse. Dann geht mal ein paar Eröffnungsvarianten durch und beobachtet wie z. B. Junior, Hakkapeliitta, Komodo bewertet und schaut Euch im Vergleich die Bewertung von ICE an. Oder die Tester der nur besten Engines nach Elo ... nimmt Stockfish, Komodo, Houdini und ICE.

Ach ja ...
Im Spiel schaut es nicht anders aus.
Morgen Abend endet mein Test-Run und dann ladet Euch mal die 2050 Partien herunter und analysiert ein bissel. Finde das alles sehr aufregend und wirklich revolutionär denn das ist etwas neues und sollte zumindest auch mal im Kreis der User unter die Lupe genommen werden weil definitiv interessant. Auch wenn ich durch ICE selbst eine Höllenarbeit aufgrund stetiger Verunsicherung bei den produzierten Partien habe (prüfe jede gespielte Partien auf schlechte Buchvarianten durch).

Viele Grüße
Frank


Wieso testest du nicht mal die Engine mit den 20 möglichen Eröffnungszüge? Wenn sie wirklich so außergewöhnlich ist, dann müsste sich das dort bestätigen lassen mit 40 Partien gegen jeweils 1 Gegner.
Parent - By Frank Qy. Date 2016-02-13 12:23
Hallo,

ich habe zu viel in meiner ToDo Liste an aktuellen Engines die ich zu testen habe.
Insofern kann ich solche Experimente nicht durchführen.

Aber es hindert dich niemand daran es zu tun.
Letztendlich möchte ich mit dem was ich herausfinden eher anregen.
Was ich letztendlich wissen will finde ich immer heraus ... früher oder später auch wenn es dann letztendlich nicht immer so genau ist wie ich es mir wünsche.

Gruß
Frank
Parent - By Thorsten Czub Date 2016-02-12 16:47
ice3 in meinem turnier:

Code:
    Motor                           Punkte        Ko     St     St     Ko     Ho     Gu     St     St     DO     Eq     Cr     De     De     De     Ic     Te     En     Cr     Za     Pr     Ni     Ar     Sm     Fr     Pr     Ro     Rh     Co    S-B
01: Komodo-9.3-64bit [t2]           138,5/162 ······ ==011= 1=0=0= ====== 0=111= ==1=11 1==1=1 1111=1 111=11 =1111= =1=11= =11==1 =11==1 11=111 111111 111111 111111 11=111 111111 1=111= 111111 1=1111 111111 111111 111111 111=11 111111 111111  10204,
02: Stockfish-6-64 [t2]             131,0/162 ==100= ······ =====1 ==1=1= =1=1=1 ==1=0= =111=0 1011== =1111= 1111=1 11==== 11=111 =1011= 11==== =11111 1=1111 =11111 11111= 111=11 11111= 1111=1 1=1111 1=1111 111=11 11=111 11=111 11111= 111111  9671,2
03: Stockfish 7 x64 [t2]            129,5/162 0=1=1= =====0 ······ 100=11 11=1== 1=1011 ===1=1 1=1==1 =11=== 1=1=10 1=1=== =1==11 ==1=11 111101 11=111 1111=1 1111== 101111 11=111 111=11 111111 =1=1=1 101111 111111 111111 110111 111111 111111  9543,5
04: Komodo-8-64bit [t2]             127,5/162 ====== ==0=0= 011=00 ······ =10100 ==11== ==0=1= 1=1==1 11===1 1=11== 1==1=1 ===11= ==1=11 1=11== =11111 ===111 111==1 1=1111 111111 111111 1111=1 111111 111111 111111 111111 11111= 111111 111111  9075,7
05: Houdini_4_x64A [t2]             120,0/162 1=000= =0=0=0 00=0== =01011 ······ 0==011 11==1= 0=10== 010101 =01=11 1==011 1111=1 0111== 011=1= =01110 =1111= =11=11 111111 =1=1=1 111111 =1111= 111111 111111 111111 111111 111111 111111 111111  8309,7
06: Gull 3 x64 [t2]                 116,0/162 ==0=00 ==0=1= 0=0100 ==00== 1==100 ······ ===0== 01==1= ====== ==0=11 ===0=1 =11=1= 001110 11=011 011111 111111 1111=1 1111=1 =11111 1=11=1 011111 011111 111111 =11111 111111 111111 11111= 111111  7942,5
07: Stockfish-dd-64-modern [t2]     115,0/162 0==0=0 =000=1 ===0=0 ==1=0= 00==0= ===1== ······ =1==11 111==0 =1==01 =110== 1=1=00 ===1=1 =10111 =1111= ===101 1=11== 11=111 111111 11==1= =111== =11111 111111 11=111 111111 111111 111111 111111  7920,7
08: Strelka6                        108,0/162 0000=0 0100== 0=0==0 0=0==0 1=01== 10==0= =0==00 ······ 1====0 =====1 =1110= ====1= =0110= =111=0 11=111 011=11 1111== 1111=1 111111 1=1=11 111=10 =11=1= 111=01 111==1 111111 111111 111111 111111  7207,7
09: DON 1 300514 x64 SSE4.2 [t2]    106,5/162 000=00 =0000= =00=== 00===0 101010 ====== 000==1 0====1 ······ 1===0= 1====1 101=== 01=001 ==111= ====11 =0111= 11=110 =111== 11=1=1 11==01 111111 =11=11 111111 111111 111111 111111 111111 111111  7016,2
10: Equinox 3.30-x64 [t2]           103,0/162 =0000= 0000=0 0=0=01 0=00== =10=00 ==1=00 =0==10 =====0 0===1= ······ ===11= =1=1=0 10==11 0===1= 1=01=1 =1111= ===11= 111==1 011=11 ==11== 1=1=1= ==1111 =11111 11=111 111111 111111 111111 111111  6766,5
11: Critter_1.6a_64bit [t2]         102,5/162 =0=00= 00==== 0=0=== 0==0=0 0==100 ===1=0 =001== =0001= 0====0 ===00= ······ ==1=0= =11==1 ===11= 1111== 1=1=11 ===111 =11111 11011= ==1111 =10=== =1111= =1111= =11111 =111=1 111111 111111 111=11  6873,7
12: DeepSaros_5eXp-pop-w64 [t2]     95,0/162  =00==0 00=000 =0==00 ===00= 0000=0 =00=0= 0=0=11 ====0= 010=== =0=0=1 ==0=1= ······ 01==00 =0=01= =1=1== =1=1=1 10=1=1 =1=111 ==1111 1===1= =111=1 ====11 111111 11111= 111111 011111 111111 11=111  6102,5
13: DeepHiarcs14WCSC [t2]           94,5/162  =00==0 =0100= ==0=00 ==0=00 1000== 110001 ===0=0 =1001= 10=110 01==00 =00==0 10==11 ······ 100=11 1==10= =11=0= 1110=1 111111 10=11= 011110 1=100= =11=== =1=111 10=10= 111111 111111 111==1 111111  6339,7
14: Deep Rybka 4.1 x64 [t2]         86,5/162  00=000 00==== 000010 0=00== 100=0= 00=100 =01000 =000=1 ==000= 1===0= ===00= =1=10= 011=00 ······ 10===1 =1=001 01011= =1110= 0=11== 0101== =11=11 =1101= =1=1=1 11=111 111111 1111=1 111011 111111  5511,7
15: Ice3-x64-modern                 81,5/162  000000 =00000 00=000 =00000 =10001 100000 =0000= 00=000 ====00 0=10=0 0000== =0=0== 0==01= 01===0 ······ =00=== 111011 1=1110 1111=1 11=101 10==11 1=11=0 11110= ==1111 111111 111111 111111 111111  4686,7
16: Texel1.04_64 [t2]               72,5/162  000000 0=0000 0000=0 ===000 =0000= 000000 ===010 100=00 =1000= =0000= 0=0=00 =0=0=0 =00=1= =0=110 =11=== ······ 01==11 111=00 1101== 0010=0 =1=0=0 011111 ==00=1 111=00 111111 111111 11111= 111111  4244,5
17: EngineDeepShredder12UCIx64 [t2] 64,5/162  000000 =00000 0000== 000==0 =00=00 0000=0 0=00== 0000== 00=001 ===00= ===000 01=0=0 0001=0 10100= 000100 10==00 ······ 100=01 ==1=0= =0=011 0==010 =10110 01111= 001011 111111 11111= 111011 111111  3703,5
18: Crafty-25-64-uci-ja             63,0/162  00=000 00000= 010000 0=0000 000000 0000=0 00=000 0000=0 =000== 000==0 =00000 =0=000 000000 =0001= 0=0001 000=11 011=10 ······ ==1111 1==11= 011=01 1=110= =11001 1=00=1 111110 111111 111111 111101  3356,5
19: Zappa Mexico II x64 [t2]        62,0/162  000000 000=00 00=000 000000 =0=0=0 =00000 000000 000000 00=0=0 100=00 00100= ==0000 01=00= 1=00== 0000=0 0010== ==0=1= ==0000 ······ 1=1011 1==110 1010=1 1111== 101011 1=11=1 111111 111==1 111111  3289,2
20: Protector_1.6.0.Win64 [t2]      61,5/162  0=000= 00000= 000=00 000000 000000 0=00=0 00==0= 0=0=00 00==10 ==00== ==0000 0===0= 100001 1010== 00=010 1101=1 =1=100 0==00= 0=0100 ······ 1=1101 001011 0=0=00 =10110 11111= =1110= 11011= 111111  3669,5
21: Nirvanachess 2.0 [t2]           61,0/162  000000 0000=0 000000 0000=0 =0000= 100000 =000== 000=01 000000 0=0=0= =01=== =000=0 0=011= =00=00 01==00 =0=1=1 1==101 100=10 0==001 0=0010 ······ 00=1== 0==1=1 01==11 111==1 1=1111 =111=1 1111=0  3553,2
22: Arasanx17.2-64 [t2]             56,0/162  0=0000 0=0000 =0=0=0 000000 000000 100000 =00000 =00=0= =00=00 ==0000 =0000= ====00 =00=== =0010= 0=00=1 100000 =01001 0=001= 0101=0 110100 11=0== ······ 010101 ==101= 1==11= 111111 =0=011 111101  3262,7
23: SmarThink_v170_x64_intel_SSE3   53,0/162  000000 0=0000 010000 000000 000000 000000 000000 000=10 000000 =00000 =0000= 000000 =0=000 =0=0=0 00001= ==11=0 10000= =00110 0000== 1=1=11 1==0=0 101010 ······ 1=110= 10=11= =11111 111111 111111  2624,5
24: Fruit278_64 [t2]                48,5/162  000000 000=00 000000 000000 000000 =00000 00=000 000==0 000000 00=000 =00000 00000= 01=01= 00=000 ==0000 000=11 110100 0=11=0 010100 =01001 10==00 ==010= 0=001= ······ 111=11 111==1 110111 111110  2422,2
25: ProDeo 1.84                     20,5/162  000000 00=000 000000 000000 000000 000000 000000 000000 000000 000000 =000=0 000000 000000 000000 000000 000000 000000 000001 0=00=0 00000= 000==0 0==00= 01=00= 000=00 ······ 01=101 1=111= 010101  795,50
26: Rodinv70                        20,0/162  000=00 00=000 001000 00000= 000000 000000 000000 000000 000000 000000 000000 100000 000000 0000=0 000000 000000 00000= 000000 000000 =0001= 0=0000 000000 =00000 000==0 10=010 ······ 11011= 11=110  915,50
27: Rhetoric_x64                    17,5/162  000000 00000= 000000 000000 000000 00000= 000000 000000 000000 000000 000000 000000 000==0 000100 000000 00000= 000100 000000 000==0 00100= =000=0 =1=100 000000 001000 0=000= 00100= ······ 11=0=0  926,50
28: Colossus2008b                   13,0/162  000000 000000 000000 000000 000000 000000 000000 000000 000000 000000 000=00 00=000 000000 000000 000000 000000 000000 000010 000000 000000 0000=1 000010 000000 000001 101010 00=001 00=1=1 ······  501,75

2268 Partien gespielt / Turnier beendet
Up Topic Hauptforen / CSS-Forum / Vorgehensweise von ICE nach Eröffnungszügen revolutionär?

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill