Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / einige Statistiken , CCRL,TCEC..
1 2 Previous Next  
Parent - - By Guenter Stertenbrink Date 2016-09-20 03:54
es geht doch in erster Linie ums Durchrechnen. Wer tiefer rechnet und realistischere
Bewertungen hat, der ist im Vorteil. Selber mitdenken ? Das hab ich mir bei diesem
Niveau abgewoehnt, da bin ich klar im Nachteil.
Ich teste hoechstens mal Ideen an und lass die nachrechnen. Manchmal hilft das
und Stockfish findet so die wichtigen Varianten eher.
Aber, ob ein Angriff durchschlaegt, so wie hier nach 17.h5 - das kann ich nicht
so einfach beurteilen, da ist Stockfish klar ueberlegen. Er wechselt dann nach
anfaenglichem +0.60 bald zu 17.e3 mit +0.20.
Dass 17.h5,c5 richtig schlecht ist, merkt er erst auf Stufe 24 (-0.62), davor 0.00.
Schon moeglich, dass Fizbo hier schneller ist, aber weiss man's vorher,
in welcher Stellung Fizbo besser ist ? Insgesamt hat Stockfish die bessere Elo.
Und der Zufall spielt auch eine Rolle. In derselben Stellung, mit leerem Hash
findet Stockfish den guten Zug manchmal eher,manchmal spaeter
Parent - - By Frank Quisinsky Date 2016-09-20 12:08
Hallo Günter,

was bedeutet "realistische Bewertungen". Wir sind weit weg vom verstehen mit mehr als 1.000 Elo weniger. Und tiefer rechnen bedeutet nicht immer mehr sehen, sondern oftmals übersehen! Die Eröffnungsphase ist noch die einzige Partiephase bei dem wir Menschen überhaupt durch Ideen so in etwa auf sehr hohem Niveau dagegen halten können. Die Gesamtspielstärke einer Engine dann auf die wenige Züge der Eröffnungsphase drüber zu spiegeln macht auch überhaupt keinen Sinn bzw. zu sagen eine Engine die teils um 200 Elo mehr im späten Mittelspiel bzw. Übergang Endspiel auf den sowieso Vorteil stärker ist muss auch in der Eröffnungsphase stärker sein? So grundsätzlich passt das nicht.

Kannst nicht sagen Borussia Mönchengladbach hat einen sehr guten Sturm und von daher ist auch die Abwehr sehr gut (Gegenteil ist der Fall).

Kann von mir aus und nach der ganzen Arbeit an dem Buch nicht behaupten Stockfish ist klar überlegen in der Eröffnungsphase weil ich das nicht sehen kann und gar andere Engines (auch wenn wenige) teils bessere Ergebnisse bringen. Es kommt auch immer auf die Stellung selbst an. In sehr ruhigen Varianten spielen viele Engines den Umgruppierungszug für eine langfristig bessere Stellung, Stockfish hingegen sucht die Öffnung. Je nach Eröffnungssystem gibt es teils völlig verschiedene Ideen.

Nochmals:
Möchte nicht komplett widersprechen weil Stockfish sehr viel sieht und auch in der Eröffnungsphase sehr gut spielt aber nicht übermächtig und schon mal gar nicht perfekt. Engine die z. B. wie Fizbo noch sehr viel offener zu spielen zu sagen ... diese Varianten darfst Du nicht mehr spielen weil Stockfish diese für schlecht hällt ... oder irgend einer anderen Engines macht überhaupt keinen Sinn.

Es ist mir völlig klar, dass niemals das perfekte ausgeglichene Eröffnungsbuch erstellt werden kann, wenn denn 50 Engines an einem Buch rum optimieren. Ich sehe das ja, wenn Junior Züge hinzukommen und Rodent alles wieder über Board schmeißt oder wenn Komodo Züge hinzukommen und ICE es wieder über Board schmeißt. Bei dieser Art der Optimierung bleibt auch einiges auf der Strecke aber wir sprechen hier immer nur von geringen Prozentzahlen an Zügen. In ca. 375 der ECO Codes herrscht große Einigkeit zwischen den 50 Engines und wie gesagt, es sind meist immer die gleichen Systemen die dann verschiedene Engine verschieden beurteilen. Und selbst bei den verschiedenen Beurteilungen kommt es 4-5 Züge später wieder zur großen Einigkeit. Heißt das die Anfangsstellung eher kritisch betrachtet wird und ganz sicher mit mehr Zeit der Engine die kritisch betrachtet würde dann langfristig viele früher die große Einigkeit herrschen.

Schaue ich mir also im Detail an das von den Einst ca. 50.000 Zügen 10% herausgeflogen sind nach Varianten es bei 85.000 sicherlich auch wieder so um 10% werden. Derzeit stehe ich bei ca. 7.5% . Ich gehe davon aus, dass in meinem Buch also noch von den ausgespielten Varianten ca. 2.000 Varianten drin sind, das Engines die stark unterschiedlich bewerten diese mit der Zeit raus werfen. Von den 2.000 sind ca. 1.500 enthalten die nach dem Update von 50.000 auf 85.000 hinzugekommen sind. Das sind so meine Stats von dem eigenen Buch. Das hört sich viel an ist es aber nicht.

Würde z. B. Rybka gegen Hannibal permanent spielen würden von den 2.000 Varianten maximal vielleicht 200 auffallen.
Würde z. B. Stockfish gegen Komodo permanent spielen würden vielleicht von den 2.000 Varianten maximal vielleicht 300 auffallen ... wenn ich das hochrechne nach dem was diese Engines herausgeworfen haben.

Das Problem hierbei ist für mich ...
Viele der kritischen Varianten werden selten ausgespielt. C30-C39 hat eine niedrige Priorität weil in der GM-Praxis selten. Und insofern auch selten von meinem Buch ausgespielt. Hier stecken noch einige Variante drin die nicht gut sind bzw. viele Engines ganz große Probleme mit der korrekten Bewertung haben ... für solche kritischen Varianten oder auch Gambit-Linien eignet sich Fizbo dann wieder ganz gut weil der von Dir angesprochene Raumvorteil extrrem bewertet wird und wie gesagt Fizbo hält in 8 von 10 Bewertungen Stand bzw. hat Recht.

Wenn denn wirklich der Anspruch gehegt wird ... ich optimiere ein Buch wirklich total ausgeglichen dann alle ECO-Codes untereinander schreiben. Verschiedene Engines darauf ansetzen und prüfen ob sie damit gut umgehen können oder eher nicht. Mit diesen Engines dann zu den jeweiligen Varianten prüfen ob diese im Buch verbleibt oder nicht.

Nehmen wir an ... wir würden sagen ...
500 ECO Codes und zu jedem der Codes suche ich mir 4 Engines aus, die nach Stichproben verstehen und vernünftig bewerten.
Wahrscheinlich würde Stockfish in ca. 375 der ECO Codes, vielleicht gar in 400 der ECO Codes unter den 4 sein.

Und Du wirst Dich wundern wenn ein Nemo auf Platz 46 glaube ich in meiner Liste in einer solchen Liste zum optimieren der ECO Codes plötzlich 20x dabei ist. Engine spielt einiges sehr interessant!

So eine Idee, welche ich mal zur Buchoptimierung verfolgen möchte.

Müsste mit kurzen Zeiten ca. 75.000 Varianten mit 50 Engines berechnen lassen.
Dann die Ergebnisse im Detail schauen.
Dann schauen wer kann und wer kann nicht ...

Dann gleiches nochmals tiefer mit je 4 zu den jeweiligen Varianten.

Wobei Du von den 50 Engines im Grunde ca. 30 aus selektieren kannst für diese Aktion.
Mit Engines wie Naum, Murka, Zappa etc.. kannst Du kein Buch optimieren.

Gruß
Frank
Parent - - By Guenter Stertenbrink Date 2016-09-20 12:21
hallo Frank,

wir naehern uns doch dem Punkt, wo nach oben nicht mehr viel geht.
z.B. wenn drudru mit stockfish auf 80 prozessoren im TCEC-chat
die laufenden Partien kommentiert ... das ist schon ziemlich realistisch.
Und der haette dann vielleicht 95% Remisquote in Partien gegen sich selbst.
Oder die Fernschach Weltmeisterschaften (obere Haelfte der Spieler)
Das erachte ich dann als so eine Art ultimative Wahrheit, realistische Bewertung
(oder jedenfalls nah dran, mit hinreichender Wahrscheinlichkeit)
Parent - By Frank Quisinsky Date 2016-09-20 12:51 Edited 2016-09-20 12:57
Mit 80 Threads hast Du vielleicht Faktor 15 wenn überhaupt.
Schade um die vielen Threads wenn so viel verpufft.

Mit Faktor 15 wird eine Engine in der Eröffnung auch nicht ultimativ alles sehen wenn die Idee nicht verstanden wird.
Die Engine wird den entscheidenden Zug ... wenn es den denn gibt ... sehen ... klar hat sehr viel Power.

Aber die entscheidenden Züge gibt es nicht in 990 von 1.000 Fällen nach den Eröffnungszügen.

Die hohen Remisquoten haben stark überwiegend nichts mit der Eröffnung zu tun wenn denn die Eröffnung ausgeglichen ist.

Und die obere Hälfte der Fernschachspieler ...
Ich habe 20.000 Fernschachpartien ausgewählt die bis Zug 6, 8, 10 in mein Buch in Anfangszeiten eingeflossen sind.
Nach Abzug der doppelten Varianten aus der Endstellung heraus gesehen blieben ca. 12.000 übrig.

Das war vor ca. 2 Jahren.

Von den 12.000 sind mittlerweile schon 1.800 Varianten raus geflogen weil die Engines nicht damit klar gekommen sind.

Musst immer alles in einem Verhältnis sehen:
Ich erspiele eine Ratingliste mit Niveau 40 Züge in 10 Minuten auf 4Ghz i7 Hardware und versuche alle Beeinflussungsfaktoren auszuschalten, siehe Konditionen zu der Liste.
Es werden 45-Minuten Partien gespielt und im Durchschnitt erreichen die TOP 50 ... 2.850 realistische Elo (CCRL ist z. B. ca. 200 zu hoch). Auf diesem Niveau wird das Buch optimiert damit ich einen Vergleich zwischen den TOP-50 starten kann.

Ich schrieb ja schon ...
Würde ich jede Engine auf z. B. 80 Cores mehr Zeit geben würde mein Buch natürlich auch anders aussehen, würde sehr viel besser sein.

Aber kein Mensch auf dieser Welt kann 272.000 Partien auf 80 Cores und langen Bedenkzeiten anbieten ... dafür müssten ein paar Millionen investiert werden.

Für mich ist also wichtig ...
Ich befindet mich ca. bei 2.850 Elo im Durchschnitt meiner Liste 650-750 unter diesem Level.
Und insofern ist es mir völlig egal ob ich mit 80 Cores sprich 15x mehr ... vielleicht 1.000 unter diesem Level liegen würde.

Ganz im Gegenteil, warum soll ich mir immer mehr Remisschleifen ansehen.
Hobby wird ja immer uninteressanter.

Halte noch nicht mal was davon 2 Cores einzusetzen.
Was schon bei 2 Cores passiert ... Stockfish Interview lesen.

Ist ja gar nichts mehr zu reproduzieren und mich interessiert im Grunde nur eines ...

Wie stark ist die Leistung auf einem Core ... die Leistung auf 2, 4, 8, 16 oder Hunderttausend .... kann ich hochrechnen dafür muss niemand auch nur 1 EUR an Strom verschwenden.
Wirklich ...

Bei einer Ratingliste geht es darum die wirkliche Leistung zu messen ... jeder Beeinflussungsfaktor muss raus oder es wird ungenau!

---

Kann ja verstehend das viele Spaß an Turnieren wie TCEC haben.
Ultimatives sehen möchte ohne mehr zu verstehen ...

Wenn morgen die Außerirdischen eine Sitzung zur neuen Platanura Lichtgeschwindigkeits Theorie im schwarzen Loch halten würden, würden im Internet auch 10 Milliarden Menschen zusehen ohne jemals zu verstehen was die dort bequatschen ... der Mensch!

Ist nichts für mich!
Kann ja noch nicht mal folgen was hier auf 14 Rechner in den Partien abläuft und bin bei jeder Partie mindestens 3x erstaunt und frage mich warum ...
Könnte mich auch 6x innerhalb der 45 Minuten fragen warum ...

Ganz ehrlich ... 3x reicht mir und ist mir schon zu viel!
Parent - - By Frank Quisinsky Date 2016-09-20 12:26 Edited 2016-09-20 12:29
Vergessen,

ich meine Du brauchst schon die Engines die stark unterschiedlich sind und finden was andere nicht sehen.
Machst Du das nicht und denkst ... ich nehme Engines für die Buchoptmierung die sehr verhalten mit den Bewertungen sind und vieles direkt ausgeglichen sehen hast Du folgendes Problem bei einem Test-Lauf mit 50 verschiedenen Engines.

Ca. 10% der 2.450 Partien ...
Engines bewerten sich mit -1.0 und verlieren sehr schnell die Partie.

Und nun?

Zu sagen ich starte mit einem ausgeglichen Buch aus der Sicht von Stockfish heißt nicht ich starte mit einem ausgeglichen Buch aus der Sicht von SmarThink. Und SmarThink wird stark benachteiligt und verliert mal locker 30 Elo im Test-Lauf, während Stockfish vielleicht 20 Elo gewinnt.

Was machst Du nun mit dem Ergebnis?
Nichts, weil alles innerhalt der Liste verzerrt wird.

Da ich jede Partie aus meiner Ratingliste prüfe und alles was von einer Engine kritisch betrachtet wird und auch zum Verlust führt deaktiviere habe ich das Problem nicht.
Wie gesagt, dass könnte ein Grund sein warum Stockfish und Komodo in meiner Liste nicht so hohe Ratings haben.

Also, die Frage ...
Was ist besser ... ein zu hohes Stockfish Rating oder realistische Ratings aller anderen ... wenn ich denn ein Buch benutzen würde was auf Stockfish optimiert wurde.

Ich finde mein Konzept geht auf aber es ist wie gesagt sehr viel Arbeit.
Und von daher brauche ich für einen Test-Lauf ca. 20 Stunden ... bzw. habe ca. 15-20 Stunden Arbeit, je nachdem was für eine Engine spielt.
Bei Fizbo denke ich gut und gerne 30 Stunden.

Gruß
Frank

OK, Dein Kommentar ... dann für jede Engine ein Buch.
Wofür?
Für die 125 auffallenden ECO Codes die hier und da mit mehr Energie bearbeitet werden müssen.
Denn nochmals in ca. 375 ECO Codes herrscht große Einigkeit was ausgeglichen ist und was nicht.
Parent - - By Guenter Stertenbrink Date 2016-09-20 13:25
du beziehst alles auf dein eroeffnungsbuch ...
btw. warum nimmst du nicht einfach die CCRL Partien
anstatt die eigenen partien zu spielen ?
Parent - By Frank Quisinsky Date 2016-09-20 13:36 Edited 2016-09-20 13:44
Hallo Günther,

weil ich es vorziehe immer eigenes Material zu erstellen und es mir abgewöhnt habe Stichproben bei anderen zu machen.
Habe sehr hohe eigene Ansprüche und die versuche ich immer selbst umzusetzen, auch wenn es oft nicht funktioniert und ich unzufrieden bin.
War noch nie zufrieden mit der eigenen Arbeit und versuche zu verbessern. Bin es auch mit der Liste die ich erstelle nicht aber ich weiß, mehr geht nicht und ich gebe das was ich geben kann.

Und hinsichtlich CCRL ... dies Liste erfüllt noch nicht mal zu 20% meinen eigenen Ansprüchen.
Die einzige die dem nahe kommt ist die CEGT 5+3, die finde ich gut.

Außerdem hat selbst die Kombination von CEGT und CCRL zusammen nicht das Partiematerial unter den Voraussetzungen mit der Anzahl der Gegner und den TOP-50 die mich interessieren.
Schaue natürlich, auch auf andern Listen ... klar mache ich das wenn ich Zeit habe und in vielen Listen ist hinsichtlich Voraussetzungen einiges drin was reizvoll ist ... anders ist ... aber letztendlich interessiert mich maßgebend das was ich mache, weil es das ist was ich sehen will und mir das kein anderer bieten kann.

Außerdem ist es ganz nett 14 zusätzliche Fernsehprogramme zu haben wenn ich die Partien auf meinen großen TV beame und dann zusehen kann wenn ich Lust habe. Denke mir dann, der der möchte kann dann das Material haben und mache mir die Mühe und setze das auf meinen Seiten. Aber wie gesagt, lange läuft die Liste nicht mehr. Ist eine Liste mal in ein gewisses Alter gekommen und immer wieder fließen für die Berechnung der Ergebnisse ältere Partien ein ist das nicht gut weil sich die Programmierung verändert, Zappa Beispiel ... gleiche Engine aber wird gegen neuere Engines merkwürdiger Weise immer spielstärker. Dann stimmt irgendwann nichts mehr und es wird Zeit zu beenden. Unabhängig davon das dies nicht der Grund ist warum ich beende.

Viele Grüße
Frank
Parent - - By Peter Martan Date 2016-09-20 17:07 Edited 2016-09-20 17:23
Weil das schon Ed Schröder macht.
http://rebel13.nl/download/books.html
(Third step, fast ganz unten auf der site.)
Was ich gerne mal wieder hätte, wäre eine eigene Datenbank online für die weltweiten High Class Fernschachspiele allein, damit man nicht immer manuell die ganze Spreu aussortieren muss für das (relativ ) kleine bisschen Weizen. Z.B. die chessbase .corr- Sammlungen auf CD sind überholt, (auch seit 2013 nichts mehr nachgekommen, oder hab ich's verpasst?) bis die gepresst und im Handel sind, ist die Aktualität schon wieder dahin.
Hiarcs CE online-Buch-Abo ist ja wirklich auch nicht schlecht, aber es fehlen bei allen Büchern immer die Quellenangaben, und die gehören einfach dazu, um einen sinnvollen Primärfilter zu haben, da kann man Buchautoren wie Jeroen Noomen noch so sehr trauen, Eigenbewertung bleibt einem nicht erspart und natürlich nur mit engine- Unterstützung heutzutage, aber die Reihenfolge der Varianten, die es zu sichten gilt, hängt von der Quantität des Materials und der Qualität der Quellen ab.
Ob z.B. Cerebellum etwas daran ändern wird, wenn es für den einzelne User bearbeitbar sein wird und engine- unabhängig, wird man sehen, dass einem rein engine- basierte Bücher wirklich Arbeit mit den Datenbanken auf die Dauer ersparen werden, wage ich zu bezweifeln.
Retroanalyse großer Bäume mit eigenem Algorithmus, wie das Thomas Zipproth macht, gut und schön, wenn ich nicht wenigstens meine eigenen Edits habe , bleibt es das Buch eines (oder einer) Anderen, sei's Mensch oder Maschine, da kann ich das Buch dann mit den engines auch gleich allein spielen lassen, und das ist nicht der Sinn des Schachs.
Wenn es der Sinn des Computerschachs ist, ist das dann halt vollends ein anderes Spiel.
Ceterum censeo: der Waschmaschine beim Wäschewaschen zuschauen (c Chrilly Donninger) oder die Maschine die Kartoffeln anbauen, ernten, schälen, kochen und aufessen lassen (c Ephraim Kishon, der war übrigens auch ein Schachbuchautor)
Parent - - By Guenter Stertenbrink Date 2016-09-20 17:24
hmm, die muessen auch die CCRL-Partien gefiltert,verbessert,konvertiert haben.
Ist es verfuegbar ? Ich habe 541715 Partien konvertieren koennen,
88430 davon mit beiden Spielern ueber 3000 (218MB). 1391750 Turmendspielhalbzuege.
Man koennte das auch nach Eroeffnungen auswerten ...
Parent - - By Peter Martan Date 2016-09-20 17:46
Schröder hat ein Polyglot- Buch draus gemacht, Rebel YAT verwendet es mir scheint sogar engine- kodiert. Ganz unten auf der site hast du dann noch ein Tool zum Konvertieren ins chessbase- Format. (Last step)
Mangel an Büchern haben wir eigentlich wirklich keinen momentan.
Jeroen Noomen aktualisisert übrigens sein hervorragendes Buch auch durch Spielenlassen gegen Brainfish+Cerebellum angeblich, was ich von ihm mal im CCC gelesen habe.
Parent - - By Guenter Stertenbrink Date 2016-09-20 17:54
gibt es auch "Buecher", ganz normal und leicht computerlesbar im ASCII Format ?
Kurznotation von CCRL,FCP sollte auch gehen.
Oder Stellungen als FEN oder 64-byte-Tabelle
Oder gibt es da konvertierungsprogramme ?

viele gruesse, Guenter
Parent - By Peter Martan Date 2016-09-20 19:31 Edited 2016-09-20 19:36
Ich nehme mal an, Günter, dass ein halbwegs breites tiefes Buch wie das von Noomen, das im sparsamen .ctg- Format schon ein gutes GB hat, als Textfile etwas explodieren würde.
Auch müsstest du dabei die Zugumstellungen alle als einzelne Varianten ausschreiben, so werden ja Stellungen gespeichert, und alternativ die alle nur als FEN- Strings, abgesehen davon, dass das erst recht viel Text würde, du müsstest da dann im Interface wieder die möglichen Züge dorthin eigens lesbar machen, denke ich.
Außer den chessbase- GUIs kenne ich kein Interface, das Text überhaupt "lesen" kann als Schachzug, du schon?
Parent - - By Frank Quisinsky Date 2016-09-20 23:16
EPD mit den Tools von Norm.

1. Alles in eine Datenbank
2. Alle Partien ein Spielername (Comp)
3. Dann schneiden ... alles weg bis Zugtiefe x

Problem 1
Viele Eco Code Zuordnungen enden sehr spät.
Zu sagen ich schneide alles weg ab Zug 9 ... und Bingo 30 Codes werden nicht mehr aufs Brett kommen.
Schneiden ab Zug 14 auch wieder schlecht weil dann viele Codes die schnell zugeordnet werden zu tief gehen.

Ich habe daher die langen Codes in meinem Buch von Hand eingepickt bzw. die ganzen Varianten selbst eingegeben.

Dann doppelte raus ...

Und Bingo ...

Problem 2
Die vielen Zugumstellungen, die müssen dann wenn die Tools von Norm das EPD hat auch von Hand herausgenommen werden.
Manche Varianten sind dann bis zu 13x durch Zugumstellungen im EPD und die Dublettensuche hat es nicht gefunden.

Dann die Endstellungen analysieren lassen ...

Problem 3
Ich schaue eher nach der Bewertung von 3-4 Zügen nach den Buchzügen und dann nach der Entwicklung der Partie bevor ich etwas herausnehme.

Im Grunde muss ich zwei EPDs haben ...
1x einen Zug nach dem Buch und 1x 3 Züge nach dem Buch (meine eine EPD Datenbank der Endstellungen).

Alles ist eine Wahnsinnsarbeit ...
Im Grunde habe ich ja alles schon gemacht mit dem Buch was steht.
Die Varianten wurden durch die Partien der Datenbank schon x mal von den Engines geprüft und dennoch fliegen immer wieder welche raus.

Sagte ja, dass was ich habe ist nach 3 Jahren auf einem enorm hohen Level aber noch lange nicht perfekt.

Gruß
Frank
Parent - By Guenter Stertenbrink Date 2016-09-21 07:59
http://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=103479

am besten alles Automatisieren. Eroeffnungsbuch-Software.

Zugumstellungen muesste ich jetzt eigentlich leicht finden koennen -
Zuege ausfuehren und dann die Stellung suchen.

Man koennte auch ein neuses System machen, indem man die Partien z.B.
in >= Hundertergruppen buendelt, startend mit identischen Stellungen nach
20,19,...Zuegen. Jeweils die Gruppe mit maximaler Zugzahl rausfiltern
und dann erneut suchen ... dauert voraussichtlich einige Tage, schaetz ich mal.

das Analysieren und Testen und Rausschmeissen ueberlass ich dann dir ...

Aber erstmal versuch ich's mit den Endspielen.

Ein besserer Zeitpunkt dafuer ist, wenn der Fortschritt in Hardware und Software
sich verlangsamt.

Gruss,Guenter
Parent - By Roland Riener Date 2016-09-18 22:25
Danke Frank. Dein weiterer Hinweis auf Fizbo hat mich veranlaßt, ihm bei ein paar Partien zuzusehen. Zu wenig, um Aussagen über den Stil zu machen, aber er hielt sich ansprechend:

Fizbo-Test ws7  2016

Fizbo 1.8   - Andscacs 0.872            1.0 - 1.0    +1/=0/-1    50.00%
Fizbo 1.8   - Hakkapeliitta 3.0 x64     2.0 - 0.0    +2/=0/-0    100.00%
Fizbo 1.8   - Protector 1.9.0           1.0 - 1.0    +0/=2/-0    50.00%
Fizbo 1.8   - Senpai 1.0                1.0 - 1.0    +0/=2/-0    50.00%
Fizbo 1.8   - SugaR SE                  0.5 - 1.5    +0/=1/-1    25.00%
Parent - - By Guenter Stertenbrink Date 2016-09-20 17:29 Edited 2016-09-20 17:48
auffaellig, dass just diese Engines eine ueberoptimistische, abweichende Bewertung haben
und eine geringere Elozahl. Deren Kriterien moegen in einigen Faellen (welchen ?) von Vorteil
sein, im Durchschnitt scheint es aber eher nachteilig zu sein.

durchschnittliche Bewertungsdifferenz
der 2 spielenden Engines im 30.Zug

  w   s
-----------------------------------
04  21 Fire 4 x64
17  25 Critter 1.6a x64
18  29 EXchess 7.88b x64
21  17 Arasan 18.3 POP x64
22  31 Houdini 4 STD B x64
24  30 Naum 4.6 x64
24  31 Fritz 15 x64
25  30 Nirvanachess 2.2 POP x64
25  31 GullChess 3.0 BMI2 x64
26  31 Stockfish 24Apr2016 BMI2 x64
29  32 Sjeng c't 2010 w32
29  38 Komodo 10 x64
30  30 Senpai 1.0 SSE42 x64
30  31 DiscoCheck 5.2.1 x64
30  31 Hannibal 1.5 x64
30  31 Protector 1.9.0 x64
30  33 Booot 5.2.0 x64
30  36 Nemo 1.01 Beta POP x64
30  37 Murka 3 x64
31  32 Chiron 3 x64
31  32 Pedone 1.2 BMI2 x64
31  35 TogaII 280513 Intel w32
32  29 Octochess r5190 SSE4 x64
32  32 Hiarcs 14 WCSC w32
33  30 Doch 1.3.4 JA x64
34  32 Tornado 5.0 SSE4 x64
35  30 Andscacs 0.86 POP x64
35  30 Deuterium 14.3.34.130 POP x64
35  30 DisasterArea 1.54 x64
35  30 Shredder 12 x64
35  31 Spark 1.0 x64
35  33 Cheng 4.39 x64
35  33 Laser 1.1 POP x64
35  35 Zappa Mexico II x64
35  37 Atlas 3.80 x64
36  31 Bobcat 7.1 x64
36  37 Vajolet2 2.1 POP x64
37  35 Rodent II 0.8.7 x64
38  29 Rhetoric 1.4.3 POP x64
38  31 The Baron 3.29 x64
38  33 Spike 1.4 Leiden w32
39  35 Gaviota 1.0 AVX x64
39  38 Scorpio 2.77 JA POP x64
40  34 Dirty 03NOV2015 POP x64
40  37 Equinox 3.30 x64
40  40 Junior 13.3.00 x64
42  34 Glaurung 2.2 JA x64
43  35 Texel 1.05 x64
43  38 GNU Chess5 5.60 x64
43  41 Crafty 25.0.1 JA POP x64
43  44 BugChess2 1.9 POP x64
45  33 Fizbo 1.6 x64
49  42 Hakkapeliitta 3.0 x64
50  37 SmarThink 1.80 AVX x64
52  45 Quazar 0.4 x64
58  48 iCE 3.0 v658 POP x64

fuer Thinker ist keine Bewertung verfuegbar
12  50 Thinker 5.4d Inert x64

---------edit------------
[Antwort auf die Post
Von Frank Quisinsky Datum 2016-09-18 11:19 Editiert 2016-09-18 11:30 :

> Wenn z. B. ein Buch bzw. die Endstellungen mit Stockfish überprüft wurden,
> dann erst Recht die folgenden Engines folgen lassen:
> 1. Komodo
> 2. Hakkapelliita
> 3. Fizbo
> 4. Spark
> 5. Junior
> 6. ICE
> Und wenn dann fertig am besten mal SmarThink drüber laufen lassen

Seite 1 hier im thread ]

--------edit---------------
ein weiteres Extrembeispiel mit hoher Bewertungsdifferenz eigene Bewertung minus Gegner-Bewertung
ist Jonny 8  mit Weiss  (TCEC)
Parent - - By Frank Quisinsky Date 2016-09-20 23:02
Hallo Günther,

wie geil ...
Bist du auch so ein Zauberer?
Nur ganz wenige Fehler drin wenn ich vergleiche mit welchen Engines ich am meisten Arbeit bei der Buchoptimierung habe.

Stimmt wirklich fast alles in der Reihenfolge von unten nach oben bis auf ...

Die Engines unten in leicht unterschiedliche Reihenfolge.
Am Ende steht SmarThink ... jetzt sehr wahrscheinlich Fizbo (sehe ich nach dem Testlauf).
Texel unten und natürlich ICE ganz unten auch Quazar, BugChess ... wundervoll.

Einzig ...
Equinox eigentlich klar weiter oben, EXchess mehr unten, Nemo mehr unten und Murka weiter oben, Disaster weiter unten.
Aber so im groben stimmt diese Auflistung dahingend ...

Welche Engines kommen mit grob unterschiedlichen Stats daher und aufgrund dessen bei welchen Round-Robin habe ich am meisten Arbeit mit bestehenden Varianten prüfen.

Unglaublich ... denn Du hast nur einen Zug ausgewertet wenn ich das richtig verstanden habe.

Und genau das meine ich.
Alles was total ausgeglichen ist eignet sich kaum für die Optimierung von einem Buch.

Die starken Engines natürlich rein wie Stockfish und Komodo, Fire zeigt oft schöne Wendungen ist auch taktisch stark ... natürlich rein.
Nemo, Chiron, Hiarcs, Andscacs, Spark, Cheng, Vajolet, Rodent, Spike, Dirty, Junior, Spark, Texel, Glaurung, Fizbo, Hakkapeliitta, ice, Smarthink, Fizbo und auch Wasp.

Mit den 20 Analysen zu allen 500 ECO Codes, prüfen etc..

Aber so viel Rechenzeit ist notwendig ...
Wie gesagt, ich werde ein neues Buch kreieren, habe genug Material und das wird definitiv gut.
Ich weiß was ich wissen muss, selbst erarbeitet und wenn ich jetzt neu beginne wird es besser als alles andere was ich hier gemacht habe.

Nächstes Jahr ...
Habe ich mir vorgenommen!
Und möchte das irgendwie auch noch so gut es geht umsetzen.

Viele Grüße
Frank
Parent - By Guenter Stertenbrink Date 2016-09-21 09:16
ich hatte mir die eval-charts angeguckt  http://magictour.free.fr/fcpeval.7z
and dann sah es so aus, als ob der Trend bei Zug etwa 30 am klarsten war.
Bei manchen engines geht blau-rot im Endspie(Zug 50) weiter auseinander,
bei TCEC konnte man hier auch das Fehlen der tablebases bei Gull,Rybka erkennen

Die optimale Bewertung, ist das wohl ein Mix mit verschiedener Gewichtung
aus den vorhandenen Bewertungen ?

Die optimale Bewertung sollte nicht die typische Ueberbewertung der eigenen Stellung
enthalten.
- - By Guenter Stertenbrink Date 2016-10-18 14:11
Stockfish at depth 15 rating the moves 3-30 of the engines
in the 784 first games of TCEC9-rapids
(only moves with -1<eval<1)

A=name
B=white rating
C=black rating
D=B+C

A   B   C   D
--------------
St, 28  35  31
Ho, 28  35  31
Ry, 41  22  31
Ni, 38  32  34
Ko, 41  34  37
An, 43  33  37
Cr, 42  38  39
Ar, 35  46  40
Pr, 32  51  41
Ch, 41  41  41
Jo, 54  33  43
Fi, 46  44  44
Te, 41  48  44
Gi, 49  39  44
Gu, 56  35  45
Ba, 44  49  46
Ha, 41  54  47
Va, 45  50  47
Fr, 45  49  47
Fz, 46  51  48
Ra, 49  49  49
Na, 52  51  51
Hk, 45  60  52
La, 61  43  52
Bo, 55  52  53
Ga, 49  69  58
Di, 53  63  58
Je, 84  64  73
My, 74  76  75
De, 70  88  78
Fd, 84  87  85
Ff, 89  90  89

Differenz der evals vor und nach dem Zug

Tiefe 15 ist natuerlich laecherlich niedrig.
Die Idee ist, diese Methode zu benutzen, um Menschen-Elos abzuschaetzen,
wenn nur die Zuege aus Partien bekannt sind.
Und auch, um auf diese Weise Menschen-und Computer-Elos zu vergleichen
Parent - - By Guenter Stertenbrink Date 2016-10-20 06:20
Tabelle, wie aehnlich der Spilstil im Mittelspiel dem von Stockfish ist

stockfish evaluation at depth=15
of moves 15-40 in games with Kasparov

a low value indicates that the moves made
were close to stockfish's best move
depth 15 is low, so the tactics is not much
evaluated, just the positional evaluation as compared
to Stockfish's eval

A:average evaluation of the position after the move
minus ecvaluation of the position before the move , [if < 1.00]
B:number of evaluated moves
C:name of player

    A     B      C
---------------------------------
  673 , 138 ,Radjabov,Teimour
  738 , 808 ,Karpov,Anatoly
  747 ,6966 ,Kasparov,Gary
  829 , 263 ,Adams,Michael
  851 , 336 ,Anand,Viswanathan
  865 , 365 ,Leko,Peter
  933 , 235 ,Ivanchuk,Vassily
  935 , 108 ,Short,Nigel,D
  946 , 138 ,Piket,Jeroen
  954 ,1189 ,Kramnik,Vladimir
  981 , 117 ,Van,Wely,Loek
1038 , 137 ,Morozevich,Alexander
1053 , 117 ,Svidler,Peter
1113 , 197 ,Grischuk,Alexander
1188 , 171 ,Vallejo,Pons,Francisco
1222 , 138 ,Timman,Jan,H
1272 , 233 ,Shirov,Alexei,D
1437 , 130 ,Topalov,Veselin
1475 , 110 ,Polgar,Judit
Parent - By Guenter Stertenbrink Date 2016-10-22 14:55 Edited 2016-10-22 15:15
stockfish rating der 684 WM Partien 1886-1985,
Zuege 15-40  Durchschnitt der depths 13,14,15

A:sf-rating (je niedriger je mehr sf-aehnich
B:WM Nummer
C:Name

   A  B     C
------------------------------
731,13,Alekhine,Alexander,A
738,12,Capablanca,Jose,Raul
764,13,Capablanca,Jose,Raul
833,07,Lasker,Emanuel
849,28,Fischer,Robert,J
854,25,Petrosian,Tigran,V
901,31,Karpov,Anatoly
926,31,Kasparov,Gary
938,10,Lasker,Emanuel
947,12,Lasker,Emanuel
961,29,Korchnoi,Viktor,L
965,25,Botvinnik,Mikhail,M
966,10,Schlechter,Carl
968,08,Lasker,Emanuel
973,28,Spassky,Boris,V
980,21,Botvinnik,Mikhail,M
986,29,Karpov,Anatoly
989,09,Lasker,Emanuel
989,27,Spassky,Boris,V
996,23,Tal,Mikhail,N
1000,20,Smyslov,Vassily,V
1023,30,Karpov,Anatoly
1028,20,Botvinnik,Mikhail,M
1066,30,Korchnoi,Viktor,L
1068,18,Keres,Paul
1094,21,Smyslov,Vassily,V
1094,24,Botvinnik,Mikhail,M
1101,23,Botvinnik,Mikhail,M
1122,22,Botvinnik,Mikhail,M
1128,19,Bronstein,David,I
1131,18,Smyslov,Vassily,V
1157,16,Alekhine,Alexander,A
1166,26,Petrosian,Tigran,V
1166,22,Smyslov,Vassily,V
1183,27,Petrosian,Tigran,V
1183,26,Spassky,Boris,V
1185,19,Botvinnik,Mikhail,M
1215,18,Botvinnik,Mikhail,M
1225,09,Janowski,Dawid,M
1230,16,Euwe,Max
1305,17,Alekhine,Alexander,A
1327,18,Reshevsky,Samuel,H
1360,14,Alekhine,Alexander,A
1362,07,Marshall,Frank,J
1372,01,Steinitz,Wilhelm
1380,11,Lasker,Emanuel
1381,08,Tarrasch,Siegbert
1390,17,Euwe,Max
1409,15,Bogoljubow,Efim,D
1427,05,Lasker,Emanuel
1429,15,Alekhine,Alexander,A
1472,03,Steinitz,Wilhelm
1538,24,Tal,Mikhail,N
1556,05,Steinitz,Wilhelm
1574,02,Chigorin,Mikhail,I
1591,02,Steinitz,Wilhelm
1591,14,Bogoljubow,Efim,D
1645,18,Euwe,Max
1742,03,Gunsberg,Isidor,A
1777,01,Zukertort,Johannes,H
1834,04,Chigorin,Mikhail,I
1893,11,Janowski,Dawid,M
1935,04,Steinitz,Wilhelm

[mit 600 kn/s , also depth 25 dauert ~20M sec = 230 Tage
oder ~2,5 Tage auf einem Server mit 60Mn/s
stockfish auf TCEC hat ~ depth=27
- By Guenter Stertenbrink Date 2016-10-24 17:41
TCEC9-rapid eval-charts :  http://magictour.free.fr/rapg1.GIF
Up Topic Hauptforen / CSS-Forum / einige Statistiken , CCRL,TCEC..
1 2 Previous Next  

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill