Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Kampf um Platz 1, Stockfish vs. Komodo am 11. Dezember!
1 2 Previous Next  
- - By Frank Qy. Date 2015-12-07 23:08
Hallo zusammen,

mein drittes Event "Kampf um Platz 1" zwischen Stockfish und Komodo startet am 11. Dezember nach dem laufenden TogaII test-run.
Übrigens schlägt sich die w32 Version von TogaII wirklich gut und wird locker in Liga 2 spielen können. Das hätte ich nicht gedacht.
Auch ein komplett anderer Stil als Fruit oder Senpai hat. Von der Schwäche dieser Engines viele Partien schnell zu verlieren ist nichts zu sehen ganz im Gegenteil.
Gab schon ein paar schöne taktische Kombinationen im Mittelspiel. Aber mal abwarten und nicht Thema.

Also 2.100 Partien für SF und Komodo = 4.200 Partien bei ca. 425 Partien pro Tag ... wird dann wieder 10 Tage laufen.
Beide spielen zeitgleich auf 7 Cores, also 7 Partien gleichzeitig.

Werde die Grundeinstellungen beider Versionen nicht verändern. Zuletzt setzte ich bei Stockfish den Contemp auf 15 (wollte den gleichen wie bei Komodo 9.2) und vielleicht war die Entscheidung nicht gut. Der Zügedurchschnitt ging drastisch nach oben auch wenn weniger kurze Remispartien erspielt wurden bei Stockfish.

Glaube nicht das beide über 3.200 Elo in meiner Ratingliste gehen und wenn +15 z. B. bei Komodo angekündigt sind muss bei mir wieder ca. 33% abgezogen werden (sind komischer Weise bei mir beständig immer zu anderen Listen ca. 30% weniger an Zuwachs in Elo).

Also +10 wäre aber messbar und bei Stockfish wird es wahrscheinlich um +20 nach oben gehen (mein Tipp).
Beide dann wieder auf Augenhöhe bei ca. 3.185 Elo.

Wir werden es sehen.

Viele Grüße
Frank

Blende ich dann auf meinen Webseiten ein, meine die Live Tabellen.
Parent - - By Tom Paul Date 2015-12-08 08:52
Frank Qy. schrieb:

Hallo zusammen,

mein drittes Event "Kampf um Platz 1" zwischen Stockfish und Komodo startet am 11. Dezember nach dem laufenden TogaII test-run.
Übrigens schlägt sich die w32 Version von TogaII wirklich gut und wird locker in Liga 2 spielen können. Das hätte ich nicht gedacht.
Auch ein komplett anderer Stil als Fruit oder Senpai hat. Von der Schwäche dieser Engines viele Partien schnell zu verlieren ist nichts zu sehen ganz im Gegenteil.
Gab schon ein paar schöne taktische Kombinationen im Mittelspiel. Aber mal abwarten und nicht Thema.

Also 2.100 Partien für SF und Komodo = 4.200 Partien bei ca. 425 Partien pro Tag ... wird dann wieder 10 Tage laufen.
Beide spielen zeitgleich auf 7 Cores, also 7 Partien gleichzeitig.

Werde die Grundeinstellungen beider Versionen nicht verändern. Zuletzt setzte ich bei Stockfish den Contemp auf 15 (wollte den gleichen wie bei Komodo 9.2) und vielleicht war die Entscheidung nicht gut. Der Zügedurchschnitt ging drastisch nach oben auch wenn weniger kurze Remispartien erspielt wurden bei Stockfish.

Glaube nicht das beide über 3.200 Elo in meiner Ratingliste gehen und wenn +15 z. B. bei Komodo angekündigt sind muss bei mir wieder ca. 33% abgezogen werden (sind komischer Weise bei mir beständig immer zu anderen Listen ca. 30% weniger an Zuwachs in Elo).

Also +10 wäre aber messbar und bei Stockfish wird es wahrscheinlich um +20 nach oben gehen (mein Tipp).
Beide dann wieder auf Augenhöhe bei ca. 3.185 Elo.

Wir werden es sehen.

Viele Grüße
Frank

Blende ich dann auf meinen Webseiten ein, meine die Live Tabellen.


Es gibt keinen Kampf um Platz 1, jeder weiß das Stockfish der beste ist
Parent - - By Frank Qy. Date 2015-12-11 11:05
Hallo,

der dritte Zweikampf wurde gestartet.
Setze beide auf 3185 Elo in der Test-Run Tabelle.

Beide spielen in jedem Test-Run gegeneinander.
Also 2050 Partien (gegen je 41 Gegner und dann die +50 weil beide je Test-Run gegeneinander spielen).
Mache ich damit für die zukünftige Testerei beide wieder wie gehabt synchron sind.

Wer die nächsten 10 Tage verfolgen möchte:
http://www.amateurschach.de

Gruß
Frank
Parent - - By Benno Hartwig Date 2015-12-11 12:40

> der dritte Zweikampf wurde gestartet.


Super!
Ich werde gern immer mal wieder hereinschauen!
Benno
Parent - - By Frank Qy. Date 2015-12-11 13:14
Hallo Benno,

und diesmal wie beschrieben ändere ich nichts an den Grundeinstellungen bzw. nur Verzeichnis zu den 4-Steinern.
Beim zweiten Vergleich hatte ich bei SF den Contemp auf 15 gesetzt, wollte gleiche Einstellungen wie bei Komodo 9.2.
Ist auf Kritik gestoßen zumal der Zügedurchschnitt bei SF drastisch nach oben ging auch wenn die vielen schnellen Remispartien im Vergleich zu den Vorgängerversionen deutlich weniger wurden.

Also, mal schauen ...
Komodo 9.3 x64 legt los wie ein Weltmeister ... na ja, ist er ja irgendwie auch.

Gruß
Frank
Parent - By Tom Paul Date 2015-12-11 15:40
Frank Qy. schrieb:

Hallo Benno,

und diesmal wie beschrieben ändere ich nichts an den Grundeinstellungen bzw. nur Verzeichnis zu den 4-Steinern.
Beim zweiten Vergleich hatte ich bei SF den Contemp auf 15 gesetzt, wollte gleiche Einstellungen wie bei Komodo 9.2.
Ist auf Kritik gestoßen zumal der Zügedurchschnitt bei SF drastisch nach oben ging auch wenn die vielen schnellen Remispartien im Vergleich zu den Vorgängerversionen deutlich weniger wurden.

Also, mal schauen ...
Komodo 9.3 x64 legt los wie ein Weltmeister ... na ja, ist er ja irgendwie auch.

Gruß
Frank


Natürlich bist du damit auf Kritik gestoßen.
Alle wussten schon davor was passieren wird, wenn du das machst.
Nur eben du nicht.

Ja genau Komodo der Weltmeister^^
Komodo 9.3 x64               48.0  -  10.0    82.76%    Perf=3034
Stockfish 02Dec2015 BMI2 x64 44.0  -  11.0    80.00%    Perf=3081
Parent - - By Clemens Keck Date 2015-12-11 13:19
Danke Frank für den "Kampf um Platz 1"
Voll der Honig,  

Mal sehen wer die besseren karten hat. Ich tippe auf Komodo 9.3.
Es dürfte trotzdem aber sehr eng werden.
Es fällt auf, das die neueren SF Versionen öfters mal remis abgeben als früher.

Bei mir läuft seit 3 Dez ein 8cpu Turnier mit 30+15 BZ. Komodo liegt 4 Punkte vor dem Rest (SF an 2, Shredder XP an 3, dann Gull , Houdini, Fritz15, Protektor und Hannibal.)

Gruß, Clemens
Parent - - By Tom Paul Date 2015-12-11 15:34
Dann solltet ihr beide mal deutlich kürzere Vorgabestellungen wählen, wo auch die Eröffnungsphase gespielt wird, da wird Komodo von Stockfish regelrecht kastriert.
Parent - - By Clemens Keck Date 2015-12-11 19:08
Tom Paul schrieb:

Dann solltet ihr beide mal deutlich kürzere Vorgabestellungen wählen, wo auch die Eröffnungsphase gespielt wird, da wird Komodo von Stockfish regelrecht kastriert.


Ein paar Beispielpartien mit brauchbarer Bedenkzeit wären nett von Dir.
Parent - By Tom Paul Date 2015-12-11 20:32
Clemens Keck schrieb:

Tom Paul schrieb:

Dann solltet ihr beide mal deutlich kürzere Vorgabestellungen wählen, wo auch die Eröffnungsphase gespielt wird, da wird Komodo von Stockfish regelrecht kastriert.


Ein paar Beispielpartien mit brauchbarer Bedenkzeit wären nett von Dir.


Partien sind nicht von mir aber meine Ergebnisse sind sehr identisch:
https://groups.google.com/forum/#!topic/fishcooking/kSh9shHjxRY
http://www.mediafire.com/download/tc9whbyjfdo1im6/Stockfish+251115+vs+Komodo+9.3+40+games+Result++11+%3D23+-6.pgn
Parent - - By Marcel Kowolik Date 2015-12-11 19:47
Hallo Tom,
habe sehr viele Partien zwischen Komodo 9....9.3 und der jeweils aktuellen Stockfish Version auch mit dem 5ctg oder 7ctg Buch gespielt,aber da war nichts von kastriert.Und besonders auf der Turnierstufe 40/120 20/60 bezieht Stockfisch auf dem i7 Prügel!!

MfG Marcel
Parent - By Benno Hartwig Date 2015-12-11 20:31
Kannst du die Ergebnisse genauer angeben?
Benno
Parent - - By Tom Paul Date 2015-12-11 20:39
Marcel Kowolik schrieb:

Hallo Tom,
habe sehr viele Partien zwischen Komodo 9....9.3 und der jeweils aktuellen Stockfish Version auch mit dem 5ctg oder 7ctg Buch gespielt,aber da war nichts von kastriert.Und besonders auf der Turnierstufe 40/120 20/60 bezieht Stockfisch auf dem i7 Prügel!!

MfG Marcel


Das kennt man doch, da wird entweder mit ponder on gespielt oder eigener Contempt eingestellt oder die Eröffnungsphase wird übersprungen usw. und dann wundern sich einige das Komodo leicht besser aussieht und glauben wirklich das er stärker als Stockfish ist.     
Parent - - By Benno Hartwig Date 2015-12-11 21:04 Upvotes 1
Das kennt man doch, du bist verliebt. 
Parent - - By Frank Qy. Date 2015-12-12 01:06
Hallo Benno,

Stockfish ist schlechter gestartet.
Aber so richtig gut abzulesen sind die Ergebnisse eh erst wenn alle Gegner der beiden mal gepunktet haben.

Bei den ersten ca. 150 Partien ...

Komodo:
2x Remis unter 20 Zügen von Komodo die gerade wiederholt werden.
2 schlechte Varianten die ich aus dem Buch genommen haben, Partien werden derzeit wiederholt (waren 2 Siege von Komodo).

Stockfish:
3 schlechte Varianten eine führte gegen Shredder direkt zur schnellen Niederlage, 2 äußerst kritisch ... habe ich auch rausgenommen.
Zwei Partien von einer anderen Engine auf Zeit verloren ... werden bei mir stets wiederholt wenn Partieausgang nicht absolut klar.

Mist ... 5 schlechte Varianten bei ca. 300 Partien.
Aber bei den super starken Engines fallen diese Varianten auch noch schneller auf.

1.6% ... eigentlich habe ich bei dem Buch derzeit ein Schnitt von 0.65%.
Sollten doch nun langsam mal alle raus sein ... aber bei 40.000 ... gerade Varianten von Eröffnungen die selten aufs Brett kommen ... da sind einfach noch einige drin.

Fazit ...
Stockfish startet verhalten ... hat 84 Züge Durchschnitt
Komodo startete stark ... hat 80 Züge Durchschnitt und scheint im späten Mittelspiel die Gegner schneller an die Wand zu spielen.

Gruß
Frank

Bei einem der beiden Test-Runs startete Stockfish - Komodo mit 0:3 ... alle Partien OK und alle wurden im späten Mittelspiel entschieden und endeten mit Matt zwischen 80-90 Zügen. Mal schauen wie das weiter geht, schaut irgendwie so nach allem was ich nach wenigen Partien auswerten kann einfach danach aus das Komodo am Ende wahrscheinlich auch vorne bleibt. Die Engine spielt das späte Mittelspiel einfach abgeklärter und druckvoller. Muss mal mehr Partien nachspielen.
Parent - - By Benno Hartwig Date 2015-12-12 06:45 Edited 2015-12-12 06:52

> ...werden derzeit wiederholt...


Das ist natürlich schon ein Vorgehen, bei dem du äußerst kritisch mit dir selbst umgehen musst.
Nicht das ganz unbewusst(!), vielleicht verleitet durch Spielart oder andere Engine- oder Partie-Eigenarten, doch häufiger z.B. Verlustpartien von "Engine A" zur Wiederholung gegeben werden.

Wiederholte Remis-Partien halte ich hingegen für völlig ungefährlich, da hierschlimmstenfalls die Remisquote minimal gesenkt wird.

Benno

PS:
Nach jeweils gut 200 Partien hat Komodo immer noch eine Quote, die 5 Prozentpunkte vor der von Stockfish liegt. (86,87% und 81,86%)
Mal schauen, ab sich dieses Bild bis zum Ende so halten kann.
Parent - By ? Date 2015-12-12 07:35
Hallo Benno,

ja, wenn ich die "schlechten Varianten" nicht aus dem Buch hole werden zu viele Partien durch Buch entschieden und das ist schlecht für alle anderen Engines. Von den 50.000 die im Buch sind, sind derzeit ca. 3.400 deaktiviert mit "F" und dennoch werden alle ECO Codes ausgespielt. Am Ende dieser Buchoptimierung verbleibt ein Buch welches im Grunde ein Test-Set bildet bzw. haben die Engines selbst Ihren Test-Set gebildet.

z. B. die Shredder Partie ...
Shredder startet mit +0.8 ...im nächsten Zug +0.91 und nach 5 Zügen schon bei 1.24 und behält den Vorteil im Mittelspiel und gewinnt.
Während SF ca. gleiche Bewertungen hatte.

Wie gesagt, solche Varianten habe ich eigentlich nur noch bei Systemen die selten sind oder bei generell kritischen Eröffnungen wie z. B. Benoni, Holländisch, B01 oder C30-C39 etc. einige aus Königsindisch E99 oder auch E61 ... die kritischen halt.

E99 z. B. ...
Du kannst als Mensch eine Engine die 500 Elo stärker ist mit E99 überrollen. Dafür muss der Mensch kein GM sein.

Bleiben wir mal bei den ECO Codes ...
Mein derzeitiges Lieblingsthema ...

Wenn denn 35 der ECO Codes für Programme kritisch sind, sind es über 150 die für Menschen kritisch sind. Kommt ein starkes Programm mit einem für ein Programm starken ECO Code daher hat der Mensch im Grunde schon nach der Eröffnung keine Chance mehr. Das ist in etwas das was ich versuche herauszufinden ... der Vorteil bei der Eröffnungstheorie ist 4:1:9 (in 35iger Schritten bei 500 ECO Codes).

Also 4 Einheiten ... Vorteil Programm
1 Einheit ... Vorteil Mensch
9 Einheiten ... startet für beide ausgeglichen (meine Menschen starten mit ca. 315 ECO Codes mit ausgeglichenen Chancen).

So denn wenn ich mir ansehen wie sicher Engines mit der von Menschenhand erarbeiten Eröffnungsvarianten umgeht.

Und wenn Du jetzt die eine Einheit nimmst und einen GM darauf ansetzt, wird dieser versuchen gegen Engines diese 35 Codes aufs Brett zu bringen damit seine Chancen steigen ... wenn das z. B. ein GM mit 2.700 schafft gegen Engine mit 3.100 Elo wird die Engine auch unter Turnierbedingungen wahrscheinlich froh sein ein 50:50 Ergebnis zu erreichen.

Soweit zur Eröffnungsvorbereitung und wie wichtig ...

Bei meinem Buch muss ich schauen das ich bei den für Engines kritischen ECO Codes zumindest alles deaktiviere was gefährlich ist ... dann kann ich einfach die Spielstärke der Engines selbst besser messen wenn denn mal Engines dabei sind die wahrscheinlich rein zufällig bei kritischen ECO Codes auch noch die richtigen Züge spielen ... wie z. B. oft Spark, Junior oder auch ICE, Rodent, Hakkapellitta, natürlich auch Stockfish oder Komodo.

Gruß
Frank

Meine Einschätzung hierzu wobei ich die Weisheit nicht gefressen habe, sondern einfach nur Statistiken anhand der eigenen Partien auswerte. Das hierbei auch gutes unter dem Tisch fällt liegt dann einfach nur noch daran das ich kein GM bin und mein Schachwissen natürlich auch nur als Normal betrachtet werden kann. Aber jeglicher Versuch auch hier etwas zu  tun ist besser als keiner!
Parent - - By Frank Qy. Date 2015-12-12 08:28
So gerade mal die letzten fast 200 Partien durchgeschaut.
Da waren bei Komodo 2x andere Engine auf Zeit verloren (gibt da so 2-3 Kandidaten da kommt das vor) und eine schlechte Variante drin.
Bei Stockfish war alles Ok.

Das schaut doch schon wieder normal aus

War eine Variante aus B47 sagt Shredder GUI, B49 sagt ChessBase 13 GUI (passiert oft, beide Programme sind hier fehlerhaft, glaube ChessBase bei der Eröffnungszuordnung mehr als Shredder GUi ... ist mir schon 2x aufgefallen und ich hatte die im Buch gelassen). SCID macht das gut ... korrekte ECO Zuordnung. Da ich alle GUIs offen habe wenn ich korrigiere fällt das natürlich immer direkt auf. Da starteten zwei andere Engines (Partien die schon vorliegen) mit je knapp unter +0.7 und kamen beide schnell in Vorteil. Komodo startete direkt mit 0.74 und dann zwei Züge später schon bei 0.98 und gewonnen nach 58 Zügen. War ein Komodo Sieg gegen Shredder 12, wobei die B47 - B49 Statistiken bei Shredder 12 OK sind.

Das ist das was ich überprüfe wenn ich Varianten aus dem Buch entferne (also kein wildes entfernen, es sei denn eindeutig). Habe also auch eine Datenbank von gespielten FCT Partien die ich für kritisch befinde aber nicht aus dem Buch gebracht habe weil ich mir nicht sicher bin. Da sind ca. 800 von den insgesamt 50.000. Wie gesagt ca. 3.500 sind deaktiviert.
Parent - - By Frank Qy. Date 2015-12-13 15:36
Hallo zusammen,

war nicht zu Hause und sah das Fizbo beim Stockfish Test-run 3x auf Zeit verlor und jeweils die GUI hing.
Neu gestartet und korrigiert.

Allerdings war dann Komodo hierdurch schon 60 Partien weiter ...
Derzeit spielt nur Stockfish damit wieder beide hinsichtlich der Anzahl der Partien synchron laufen.
Alles nicht so einfach ...

Ansonsten habe ich bislang alle Partien geprüft.

Insgesamt leider mit den 3x Fizbo schon 8 Zeitüberschreitungen (alle wiederholt) ... bekannte Kandidaten, also nicht aufgrund Stockfish oder Komodo Fehlern ... 5x Remis unter 20 Zügen (alle wiederholt) und leider sah ich auch das bei den ca. bislang gespielten 1000 Partien ca. 14 schlechte Buchvarianten drin waren. Bei so starken Engines fällt das natürlich schneller auf. Auch diese Partien wurden wiederholt. Habe gerade eine neue Buchversion, Version 2.59 hochgeladen.

Wie dem auch ist ...
Zügedurchschnitt bei Komodo bei 82 und bei Stockfish 83 Züge.
14 Gewinnpartien unter 50 Zügen bei Stockfish und 11 bei Komodo. Komodo gewinnt deutlich mehr Partien im späten Mittelspiel als Stockfish und deutlich weniger Partien gehen über 120 Züge. Im direkten Vergleich zwischen den Beiden führt Komodo mit 15:11 wenn ich richtig zusammen gerechnet habe. Sieht alles danach aus das Komodo einen Tick besser ist und sich Stockfish zu der letzten Version, die ich vor ca. 4 Monaten getestet habe, kaum spürbar verbessert hat.

Werde heute Abend mal eine erste Auswertung machen, wird dann auf der Startseite zu sehen sein (Link zu Complete Ratings after x games ... dicke Zahl in Pink, Anzahl der Partien).
Schauen wir dann mal aber ich kann mir nicht vorstellen trotz offenbaren schlechten Start vom Stockfish, dass Stockfish die derzeit noch über 3% Rückstand aufholt. Vielleicht noch auf 2% verringert ... was bedeuten würde (2%) das zwischen beiden ca. 15-20 Elo liegen).

Gruß
Frank
Parent - - By Frank Qy. Date 2015-12-14 11:28
Code:
3rd Fight for Place 1
---------------------

Still running: Komodo 9.3 x64
Still running: Stockfish 02Dec2015 BMI2 x64

After  20% (Round 10/50)
   1 Komodo 9.3 x64                   : 3183.5   34.7    355.5     420   84.6%  + 9,9 Elo
   2 Komodo 9.2 x64                   : 3173.6   13.8   2018.5    2400   84.1%
   3 Stockfish 20Aug2015 BMI2 x64 C15 : 3162.5   13.9   1998.0    2400   83.3%
   6 Stockfish 02Dec2015 BMI2 x64     : 3143.1   32.8    342.0     420   81.4%  -19,4 Elo

After  40% (Round 20/50) ... soon
After  60% (Round 30/50) ... soon
After  80% (Round 40/50) ... soon
After 100% (Round 50/50) ... soon


So schaute es also nach 10 von 50 Runden aus. Klar zu sehen das Stockfish schlecht gestartet ist. Mittlerweile ja auch schon 2% zugelegt und ca. das Level der letzten getesteten Version vom 20Aug2015 erreicht. Im direkten Vergleich schaut es auch nicht mehr so krass aus. Steht da jetzt 19:17 für Komodo.

Unterschied derzeit:
Komodo: 608.5 - 98.5  86.07%  Perf=3163 nach 707 Partien
Stockfish: 588.5 - 118.5  83.24%  Perf=3127 nach 707 Partien

Also 2.83% Differenz (macht Sinn danach zu schauen) oder Komodo hat 20 Punkte nach 707 weniger abgegeben.

Tendenz: Stockfish steigt langsam und Komodo hält die ca. 86%.
Wahrscheinlich werden 2% Unterschied rauskommen was ca. 16 Elo entspricht, so dass dann eine leichte Steigerung bei Stockfish zu sehen ist und die wahrscheinlich angekündigten 15 Elo Steigerung bei Komodo. Hätte Stockfish nach den vielen Updates für stärker eingeschätzt aber mal schauen ...

Erfreulich bei Stockfish ist, dass sich derzeit die vielen Remispartien ohne Veränderung von Contemp in Grenzen halten. Beide haben einen Zügedurchschnitt von 82! Komodo hat 16x unter 50 Züge gewonnen (nach 707 Partien) und Stockfish bei gleicher Partieanzahl dann 20x.

Remispartien unter 40 Zügen bei Stockfish = 25 und bei Komodo nach jeweils 707 Partien = 11. Differenz 14 was 7 Punkte ausmachen könnte wenn denn Stockfish besser gekämpft hätte. Aber das sah bei den Vorgängerversionen viel heftiger aus ohne Contemp bzw. Stockfish mit Standardeinstellungen.

Ansonsten alles Normal zum jetzigen Zeitpunkt.
Auffällig ist das im späten Mittelspiel Komodo mehr Punkte einfährt. Denke zum Übergang Endspiel wird der Unterschied zwischen den beiden deutlicher wie bislang ... oder Stockfish legt weiter zu. Das ist die Frage ... kann Stockfish zulegen oder nicht?

Gruß
Frank
Parent - By Frank Qy. Date 2015-12-15 02:34
Code:
December 15th, 2015 (02:15)
... after 151.290 games!

3rd Fight for Place 1
---------------------

Still running: Komodo 9.3 x64
Still running: Stockfish 02Dec2015 BMI2 x64

After  20% (Round 10/50)
   1 Komodo 9.3 x64                   : 3183.5   34.7    355.5     420   84.6%  + 9,9 Elo
   2 Komodo 9.2 x64                   : 3173.6   13.8   2018.5    2400   84.1%
   3 Stockfish 20Aug2015 BMI2 x64 C15 : 3162.5   13.9   1998.0    2400   83.3%
   6 Stockfish 02Dec2015 BMI2 x64     : 3143.1   32.8    342.0     420   81.4%  -19,4 Elo

After  40% (Round 20/50)
   1 Komodo 9.3 x64                   : 3193.1   25.4    716.0     840   85.2%  +19,8 Elo
   2 Komodo 9.2 x64                   : 3173.3   14.4   2018.5    2400   84.1%
   3 Stockfish 20Aug2015 BMI2 x64 C15 : 3162.2   14.4   1998.0    2400   83.3%
   6 Stockfish 02Dec2015 BMI2 x64     : 3152.2   23.3    689.5     840   82.1%  -10,0 Elo

After  60% (Round 30/50) ... soon
After  80% (Round 40/50) ... soon
After 100% (Round 50/50) ... soon


Tja, es sind wahrscheinlich doch wieder die vielen Remis Partien in der Grundeinstellung von Stockfish ohne Contemp.
Zwar konnte sich Stockfish ein wenig verbessern aber bislang ist nicht unbedingt ein Fortschritt gegen viele Gegner unter meinen Bedingungen spürbar.

Hier wieder die restlichen Informationen:

Nach je 840 Partien:

Zügedurchschnitt:
Stockfish = 82 Züge
Komodo = 81 Züge

Schnelle Gewinnpartien nach ausgeglichener Eröffnung unter 50 Züge:
Stockfish = 25 und 0 verloren
Komodo = 23 und 0 verloren
Hier hat Komodo etwas aufgeholt

Und zum fortwährenden Stockfish Problem:
Schnelle Remispartien unter 40 Züge:
Stockfish = 34 Partien
Komodo = 13 Partien

21 Partien Unterschied ... "könnte max. 10.5 Punkte mehr ausmachen.

Das Problem bei dieser Betrachtung ist folgendes:
Nun hat Komodo 9.3 ja einen Contemp in der Grundeinstellung von 10. Der Wert ist hervorragend und besser als 15 bei Komodo 9.2. Und trotz Contemp ist der Zügedurchschnitt nur 81. Wenn denn bei Stockfish der Contemp eingesetzt wird steigt der Zügedurchschnitt überproportional an. Das zeigt die letzte Version die ich getestet habe deutlich auf, siehe Statistiken zum 2nd Fight for Place 1 auf meinen Webseiten. Stockfish würde zwar gegen schwächere Gegnerschaft ein wenig besser punkten aber die Partielänge schießt nach oben, während das bei Komodo nicht zu sehen ist. Klasse Zügedurchschnitt bei schwächerer Gegnerschaft und Contemp = 10.

Letztendlich ist klar wo der Unterschied zwischen den beiden liegt. Komodo gewinnt im direkten Vergleich mehr Partien im späten Mittelspiel / Übergang Endspiel und es entsteht der Eindruck das die Engine hier einfach abgeklärter und auch besser optimiert ist als Stockfish. Was dann auch natürlich wieder bedeutet, dass dies im Blitz nicht so gut zu sehen ist. Meine bei schnellen Bedenkzeiten werden mehr wichtige Züge in dieser wichtigen Partiephase Übergang Endspiel / Ende Mittelspiel nicht gesehen. Das führt dazu das unter sehr schnellen Bedingungen Stockfish wahrscheinlich die Nase vor hat und je mehr Zeit die Kontrahenten haben desto spielstärker Komodo im direkten Vergleich wird.

Kann zu keinem anderen Ergebnis kommen, zumal das Spielverhalten der beiden im Vergleich durch die anderen Vergleiche von mir im Grunde gleich ist und sich bei jedem Fight um Platz 1 immer mehr festigt und verstärkt.

Bislang aber ein großes Kompliment an das Komodo Team.
Von Version zu Version wird Komodo nicht nur wesentlich interessanter hinsichtlich Spielstil sondern auch in den wichtigen Partiephasen spielt die Engine immer aufregender.

Gruß
Frank

PS: Jetzt beginnt der Kampf um Platz 1 eigentlich ...
Zwischen 40 und 60 bildet sich das voraussichtliche Endergebnis, denn nach dann ca. 1200 Partien und 60% wird sich kaum noch etwas regen im Vergleich zu 2000 Partien. Stockfish braucht ca. einen Prozent mehr damit mal das Ergebnis der August Version erreicht wird.
Parent - - By Frank Qy. Date 2015-12-12 01:10
Hallo Clemens,

ich tippe auch auf Komodo 9.3 auch wenn es eng wird. Schrieb es schon ... Komodo spielt irgendwie druckvoller und überragender im späten Mittelspiel. Aber bislang nur ein Eindruck.

Poste Deine Endergebnisse mal ... bei wie vielen gespielten Partien 4 Punkte Vorsprung?

Übrigens, bei Hannibal bin ich mal gespannt, zwar nicht eine meine Lieblings Engines aber hatte irgendwo gelesen, dass die Engine deutlich zugelegt hat.
Bin mal auf das Update gespannt ... kommt bestimmt auch bald.

Gruß
Frank
Parent - - By Clemens Keck Date 2015-12-12 08:40 Upvotes 1
Frank Qy. schrieb:

Hallo Clemens,

ich tippe auch auf Komodo 9.3 auch wenn es eng wird. Schrieb es schon ... Komodo spielt irgendwie druckvoller und überragender im späten Mittelspiel. Aber bislang nur ein Eindruck.

Poste Deine Endergebnisse mal ... bei wie vielen gespielten Partien 4 Punkte Vorsprung?

Übrigens, bei Hannibal bin ich mal gespannt, zwar nicht eine meine Lieblings Engines aber hatte irgendwo gelesen, dass die Engine deutlich zugelegt hat.
Bin mal auf das Update gespannt ... kommt bestimmt auch bald.

Gruß
Frank


Nur für dich Frank

mitten raus aus dem laufenden Turnier (280 Spiele zu absolvieren)
Die partien laufen auf 8 x 4100 MHz
alle engines natürlich 8 cpu (kein HT)
5men TBs
Fritz 15 Buch 8 Züge max.

Parent - - By Thomas Müller Date 2015-12-12 09:24
sehr schön!
Engine_27 =   
Reihenfolge normal, wobei K9 deutlich vorne ist oder eben SF zu "schwach"
Egal...läuft ja noch!

gruß
thomas
Parent - By Frank Qy. Date 2015-12-12 09:46
Hallo,

Bei diesem hohen Niveau mit 8-Cores ...
Da fallen natürlich auch die vielen Remis Partien ins Auge.
Aber das ist schon krass was Komodo 9.3 abzieht mit dem Vorsprung der erzielt wurde.

Und auf die neue Engine 27 freuen wir uns sicherlich alle.
Würde ungemein beleben ...

Vielleicht ja auch Ginko anbieten über die Shredder Seite wie einst Zappa.
Dann würde die deutsche Flagge bei den Ratinglisten wieder stolz vor sich her wehen wobei Protector derzeit auch ein sehr starker Vertreter ist.

Viele Grüße
Frank

Bei mir dann weniger Remispartien bei schnelleren Bedenkzeiten wobei 40 in 10 und eine Partie dauert 45 auf 4Ghz auch sicherlich sehr gut ist.
Aber was Komodo 9.3 gegen schwächere bei mir abzieht ... beim Zusehen irgendwie so ... der langsame Tod kommt von Zug zu Zug egal gegen welche Gegnerschaft.
War mir gerade sicher das Deuterium das Remisstellung (ist stark im Endspiel) gegen Komodo hält. Aber Komodo erspielt kleine Vorteile die dann so gewaltig werden ... Züge die ich niemals gesehen hätte.
Parent - - By ? Date 2015-12-15 05:30
Clemens Keck schrieb:

Frank Qy. schrieb:

Hallo Clemens,

ich tippe auch auf Komodo 9.3 auch wenn es eng wird. Schrieb es schon ... Komodo spielt irgendwie druckvoller und überragender im späten Mittelspiel. Aber bislang nur ein Eindruck.

Poste Deine Endergebnisse mal ... bei wie vielen gespielten Partien 4 Punkte Vorsprung?

Übrigens, bei Hannibal bin ich mal gespannt, zwar nicht eine meine Lieblings Engines aber hatte irgendwo gelesen, dass die Engine deutlich zugelegt hat.
Bin mal auf das Update gespannt ... kommt bestimmt auch bald.

Gruß
Frank


Nur für dich Frank

mitten raus aus dem laufenden Turnier (280 Spiele zu absolvieren)
Die partien laufen auf 8 x 4100 MHz
alle engines natürlich 8 cpu (kein HT)
5men TBs
Fritz 15 Buch 8 Züge max.




Hallo Allerseits,

also wenn sich hinter der Engine_27 64 Bit eine Beta Version von Shredder verbirgt, würde mich dass sehr freuen


Mit freundlichen Grüßen
Egbert Rapp
Parent - - By Andreas Aicher Date 2015-12-16 11:35
Hallo Egbert,
ich denke, da liegst Du richtig, weiter oben schrieb nämlich Clemens, ich zitiere

Bei mir läuft seit 3 Dez ein 8cpu Turnier mit 30+15 BZ. Komodo liegt 4 Punkte vor dem Rest (SF an 2, Shredder XP an 3, dann Gull , Houdini, Fritz15, Protektor und Hannibal.)

mfG
Andreas
Parent - By Egbert Date 2015-12-16 12:33
Hallo Andreas,

dass wäre in der Tat sehr erfreulich, zumal das Ergebnis darauf hindeutet, dass Stefan Mayer Kahlen die Engine erheblich verbessert hat 

Gruß
Egbert Rapp
- By Benno Hartwig Date 2015-12-14 12:40 Edited 2015-12-14 12:45
Ungefähr 1/3 der Parcours ist absolviert.
Komodo macht hier bislang schon einen besonders überzeugenen Eindruck:

    Komodo       620.0 -  99.0   86.23%  Perf=3165
    Stockfish    599.5 - 120.5   83.26%  Perf=3127


Im direkten Vergleich hat Komodo dabei übrigens im Augenblick auch die Nase vorn behalten können:
    Komodo vs. Stockfish:   19,0 - 17,0

Benno
- - By Benno Hartwig Date 2015-12-14 21:34
Hallo Frank,

wenn ich jetzt auf das Stockfish-Zwischenergebnis schaue, finde ich da 3122 ELO, Komodo hat mit 3164 ELO etwas mehr.
Stockfish und Komodo werden in diesen Listen aber mit der Einschätzung 3185 ELO geführt.
Wo kommen eigentlich diese stattlichen  3185-ELO-Enschätzungen her?

Benno
Parent - By Frank Qy. Date 2015-12-14 23:44
Hi Benno,

ein paar Minuten vor Deinem Posting habe ich etwas weiter oben im Thread auch die erste Berechnung gepostet.

1. Die Elo Zahlen die Shredder berechnet entsprechen ca. denen die EloStat berechnet (fast vergleichbar hinsichtlich der Ausgaben in Elo). Ordo berechnet ein wenig anders.
2. Natürlich nicht enthalten in der Ausgabe beim Round-Robin sind ja noch die Anzahl der Partien aus dem zweiten Round-Robin im direkten Vergleich.

Letztendlich habe ich es mir einfach gemacht.
Ich musste ja ein Pseudo Zahl setzen für Stockfish und Komodo in beiden Round Robins und richtete mich bei Komodo an die Angaben vom Komodo Team (+15) und bei Stockfish war ich mir nicht sicher. Da überall zu lesen ist das hier in den letzten Monaten einiges an + erzielt wurde nahm ich einfach den gleichen Wert. So wie es ausschaut gibt es bei Stockfish aber unter meinen Bedingungen gegen viele Gegner kaum einen spürbaren Fortschritt in Elo. Kann vielleicht auch daran liegen, weil dann vielleicht doch die Einstellung von Contemp 15 bei der Version vom 20Aug2015 gut war. Die aktuelle Version spielt ja mit Standardeinstellung. Ich weiß es nicht.

Aber siehe einfach mein letztes Posting mit den ersten Berechnungen im gleichen Thread. Werde gleich wenn, die letzten Partien OK waren eine Berechnung nach 20% durchführen.

Kann dann auch wenn verfügbar auf meiner Startseite direkt gesehen werden.

Gruß
Frank
- - By Benno Hartwig Date 2015-12-16 10:21
Und Stockfish holt auf!
Jetzt nach gut der Hälfte des Spiele liegt Komodo nur noch um 2 Prozentpunkte vorn.
Die Wahrscheinlichkeit dafür, dass bei gleichstarken Engines irgendeine davon solch einen Vorsprung erarbeitet, ist ggf. auch gar nicht so klein.

Komodo     1016.0 - 172.0   85.52%   Perf=3156
Stockfish   990.5 - 195.5   83.52%   Perf=3128


Benno
Parent - By Tom Paul Date 2015-12-16 11:29
Benno Hartwig schrieb:

Und Stockfish holt auf!
Jetzt nach gut der Hälfte des Spiele liegt Komodo nur noch um 2 Prozentpunkte vorn.
Die Wahrscheinlichkeit dafür, dass bei gleichstarken Engines irgendeine davon solch einen Vorsprung erarbeitet, ist ggf. auch gar nicht so klein.

<code>Komodo     1016.0 - 172.0   85.52%   Perf=3156
Stockfish   990.5 - 195.5   83.52%   Perf=3128</code>

Benno


Stockfishs Schwäche sind nun einmal geschlossene Stellungen.
Solche wo Stockfish selbst nichts öffnen kann, der Gegner aber schon.
Da kann Stockfish nur abwarten, während Komodo seine Stellung verbessert und die Brettstellung dann öffnet.
Ein Bonus für die Seite welche die Stellung öffnen kann ohne das die Evaluation schlechter wird oder wenigstens nicht ins Minus geht wäre gut.
Und wann wurde das letzte mal versucht anhand einer geschlossenen Stellung eine neue Idee/Wissen in Stockfish zu implementieren?
Parent - - By Frank Qy. Date 2015-12-16 11:53
Hi Benno,

denke mir das zwischen den beiden beim Endergebnis ca. 2% liegen. Im direkten Vergleich steht es 30:30!
Sagte ja, wird sich zwischen 40 und 60% einpendeln, eigentlich wie immer. Vielleicht werden es 1.5% Abstand.

Stockfish sollte nun ohne Contemp ca. das Niveau von der vorher getesteten 20Aug2015 Version haben. Also wäre eine kleine Verbesserung bei Stockfish zu erkennen, denn mit Contemp wäre das Ergebnis sicherlich besser. Die Frage ist immer wie hoch Contemp sein sollte. Contemp = 15 verursachte einen zu hohen Zügedurchschnitt. Wahrscheinlich muss der Contemp ein wenig kleiner als Contemp 10 bei Komodo 9.3 sein, vielleicht Contemp 6 oder 8. Damit könnte Stockfish dann vielleicht 0.5 - 1.0% aufholen. Habe aber keine Lust das jetzt mit gleicher Version auszutesten, stehen zu viele Updates an bzw. Programme die ich aufnehmen will.

Gegen Mitternacht werde ich dann mal die Auswertung nach 60% vornehmen.

Kurz noch zu den Partiewiederholungen:

6x unter 20 Züge Remis, wiederholt
3x Partie endet mit 300 Zügen, wiederholt (die wiederhole ich auch weil Shredder bei 300 Zügen abbricht).
Bei ca. 2.400 Partien habe ich 18 "kritische Varianten" aus dem Buch herausnehmen müssen, Partien wiederholt ... sind 0.75%, Schnitt der ja immer geringer wird lag vor dem Match bei 0.65%.
8 Zeitüberschreitungen anderer Engines wie Atlas, Booot, Fizbo ... die üblichen, Partien wiederholt.

Also, Datenbank ist - Stand jetzt - sauber ...
Stockfish kämpft sich heran, wirklich deutlich zu sehen!

Bei 60% wird Komodo auch verlieren zu der Auswertung nach 40%.
Sind derzeit ca. bei Komodo +15 und bei Stockfish -2

Gruß
Frank
Parent - - By Frank Qy. Date 2015-12-17 02:29
Hallo die Herren,

Stand nach 60%!
Nun wird sich kaum noch was regen, sind 1260 Partien gespielt (alles überprüft).
Vielleicht noch Korrekturen um 5 Elo wenn überhaupt bis Partienummer 2100.

Code:

After  60% (Round 30/50)
   1 Komodo 9.3 x64                   : 3184.2   20.1   1065.5    1260   84.6%  +10.7 Elo
   2 Komodo 9.2 x64                   : 3173.5   14.0   2018.5    2400   84.1%
   3 Stockfish 02Dec2015 BMI2 x64     : 3162.6   19.6   1044.5    1260   82.9%  + 0,2 Elo
   4 Stockfish 20Aug2015 BMI2 x64     : 3162.4   14.5   1998.0    2400   83.3%


Denke interessant wie immer die Stats aus welchen so einiges ablesbar ist:

Partiedurchschnitt:
Komodo = 82 (Contemp = 10, Standard Setting)
Stockfish = 81 (Contemp = 0, Standard Setting)

Kurze Gewinnpartien unter 50 Zügen
Komodo = 29, verloren 1 (siehe am Ende vom Posting)
Stockfish = 33, verloren 0

Kurze Remispartien unter 40 Zügen
Komodo = 22
Stockfish = 41

Stockfish holt also nicht nur auf, sondern verbessert hier ein wenig zu den ersten Auswertungen.

Verlustpartien insgesamt:
Komodo = 10x mit weiß, 17x mit schwarz ... ups 1x gegen Arasan
Stockfish = 6x mit weiß, 17x mit schwarz ... ups 1x gegen MinkoChess

Überhaupt fällt oft auf, das Stockfish mit weiß verhältnismäßig wenige Verlustpartien hat.
In der Tat auch schon beim ersten Vergleich bzw. ersten Fight um Platz 1 aufgefallen.

Im Grunde bekannte Stats, vergleichbar zu den anderen 2 Wettkämpfen die ich bislang durchgeführt habe. Sicherlich ist Stockfish auch leicht verbessert aber die letzte Vergleichsversion spielte mit Contemp = 15 was einige Punkte gegen die Schwächeren bringt. Insofern würde ein gleiches Ergebnis, wie zu der August Version, ca. + 10 bedeuten. Aber mal schauen, vielleicht geht es für beide noch ein wenig nach oben.

So noch 4 Tage und der Spuk ist endlich wieder vorbei. Ganz ehrlich, im Grunde reicht es bei diesem Niveau einen Wettkampf 1x im Jahr zu starten. Die Verbesserungen sind zwar für das Niveau auf den sich beide bewegen immer verhältnismäßig hoch aber letztendlich im Vergleich zu anderen Engines eher gering.

Nächste Auswertung dann nach 80%.

Ach ja die schnelle Verlustpartie von Komodo. Gegner war Andscacs 0.83 POP x64 nach nur 43 Zügen in A97 (von meiner 135.000 starken GM Vergleichsdatenbank wurde dieser Code 10x gespielt, sehr seltenes System daher auch nicht oft bei mir auf dem Brett, aber halt in diesem Wettkampf vorgekommen). Wer die Partie so nachspielt denkt das ist niemals Komodo ... auch eine Engine auf diesem Niveau kann es schlimm ergehen ... das beruhigt - denke ich mal - die Menschheit enorm.

Wer Lust hat nachzuspielen:

Event:
Ort:
Datum:

Weiss:
Schwarz:

Ergebnis
Board


Code:
[Event "40 Züge in 10 min"]
[Site "komodo_93-x64, FCP-2"]
[Date "2015.12.16"]
[Round "29.11"]
[White "Komodo 9.3 x64"]
[Black "Andscacs 0.83 POP x64"]
[Result "0-1"]

1. d4 {Buch 0s} d6 {Buch 0s} 2. c4 {Buch 0s} f5 {Buch 0s}
3. g3 {Buch 0s} Nf6 {Buch 0s} 4. Nf3 {Buch 0s} e6 {Buch 0s}
5. Bg2 {Buch 0s} Be7 {Buch 0s} 6. O-O {Buch 0s} O-O {Buch
0s} 7. Nc3 {Buch 0s} Qe8 {Buch 0s} 8. Re1 {Buch 0s} Qg6
{Buch 0s} 9. Bf4 {Buch 0s} Nh5 {Buch 0s} 10. Bd2 {Buch 0s}
Nf6 {Buch 0s} 11. Be3 {+0.81/20 25s} Nbd7 {Buch 0s (h6)}
12. Nb5 {Buch 0s} Bd8 {Buch 0s} 13. Qc2 {Buch 0s} Qh5 {Buch
0s} 14. h3 {Buch 0s} Ne4 {Buch 0s} 15. Rad1 {+0.65/21 26s}
Ndf6 {+0.27/21 15s (c6)} 16. Nd2 {+0.65/23 28s (Sc3)} a6
{+0.27/23 21s (Sxd2)} 17. Nxe4 {+0.61/24 21s (Sc3)} fxe4
{+0.19/25 17s (Sxe4)} 18. Nc3 {+0.70/21 9s} d5 {+0.24/25
36s} 19. Bf4 {+0.63/21 15s} c6 {+0.38/20 17s (Dg6)} 20. Bd6
{+0.68/24 25s (c5)} Rf7 {+0.01/21 23s} 21. c5 {+0.69/25 20s
(b3)} e5 {-0.15/21 13s (Le7)} 22. dxe5 {+0.92/21 11s} Ne8
{0.00/22 15s} 23. h4 {+0.31/22 38s (Sxd5)} g5 {-0.42/22 51s
(Sxd6)} 24. hxg5 {+0.56/21 31s} Bxg5 {-0.52/21 15s (Dxg5)}
25. Qb3 {+0.33/22 37s} Qh6 {-0.79/23 30s (Sxd6)} 26. e3
{+0.22/20 20s} Be6 {-0.91/25 14s (Sxd6)} 27. Qb4 {0.00/21
16s} Ng7 {-1.04/24 19s (Sxd6)} 28. Rd2 {0.00/21 20s (Se2)}
Nf5 {-1.75/23 37s (Lh3)} 29. Rde2 {-0.51/24 51s} Kh8
{-1.74/24 14s (a5)} 30. a3 {-1.01/20 46s (Sb1)} Bh4
{-4.40/21 19s (Tg8)} 31. Rc2 {-4.72/20 42s (Tf1)} Nxg3
{-7.18/18 24s (a5)} 32. b3 {-6.81/20 30s (Db6)} Rg8
{-11.69/19 19s} 33. Bf8 {-12.54/19 7s} Rgxf8 {-14.02/20 19s
(Dxf8)} 34. Rd2 {-13.22/19 19s (Sd1)} Nh1 {-29.49/18 26s
(Sf5)} 35. Nxe4 {-24.60/17 11s (Sd1)} dxe4 {-M13/17 31s}
36. Qxe4 {-33.10/18 12s} Bxf2+ {-M10/18 26s (Sxf2)}
37. Rxf2 {-M9/16 0s} Rxf2 {-M9/18 14s (Sxf2)} 38. Rf1
{-M8/16 0s (Td1)} Qg7 {-M6/18 11s (Txf1+)} 39. Rxf2 {-M5/16
0s} Rxf2 {-M5/19 13s} 40. Kxh1 {-M4/48 0s} Bd5 {-M4/19 10s}
41. a4 {-M3/99 0s (Df3)} Bxe4 {-M3/18 11s} 42. Bxe4 {-M2/99
0s} Qh6+ {-M2/19 8s} 43. Kg1 {0.00/5 0s} Qh2# {-M1/1 0s} 0-1
Parent - - By Frank Qy. Date 2015-12-17 08:50
Code:
Komodo 9.3 x64                =  1194.0 - 205.0  85.35%  Perf=3154
Stockfish 02Dec2015 BMI2 x64  =  1170.5 - 228.5  83.67%  Perf=3131


Also nur noch 23.5 Punkte Differenz nach je 1399 Partien oder "nur" noch ... 1,68%
Stockfish mit unglaublicher Aufholjagd und das trotz der vielen schnellen Remispartien mehr.

Sind noch je ca. 665 Partien, da 1.68% aufzuholen eigentlich sehr unwahrscheinlich.
Aber vielleicht noch 0.68%?

Gruß
Frank
Parent - - By Benno Hartwig Date 2015-12-17 11:24
"ungefähr gleich stark" ist eine Einschätzung, die seit längerer Zeit passt.
Und die wohl auch heute noch nicht falsch ist.

Interessant finde ich aber nach wie vor die Frage, ob Stockfish oder Komodo ggf. bei bestimmten Rahmenbedingungen (Zeit, Anzahl Kerne, Hash-Größe, Tablebase-Verfügbarkeit, Art der Eröffnungsvorgabe) tendentiell stärker sind.

Benno
Parent - By Tom Paul Date 2015-12-17 21:32
Fishtest ELO Zuwachs : 10 = TCEC ELO Zuwachs.
Wird das Stockfish Team noch irgendwann eine einfache Möglichkeit zum get involved anbieten?
Bevor Komodo in deiner Liste noch stärker wird und den Fish abhängt.
Parent - - By Frank Qy. Date 2015-12-17 21:34
Hi Benno,

die spielstärkesteigernden Faktoren interessieren mich weniger (mehrere Cores, Hash-Größe, Zeit, Ponder etc.). Sollte nach so vielen Jahren aufgebautes Schachwissen klar sein. Für mich eher kein Thema mehr. Das Eröffnungsvorgaben dann maßgeblich für die Beeinflussung der Ergebnisse sind glaube ich nicht sofern ausgeglichene Varianten aufs Brett kommen.

Für mich gibt es nur noch eine einzige Spannungskomponente und das ist der Spielstil.
Natürlich macht zusehen Spaß, mir ist es egal wer gegen wen gewinnt, Hauptsache die Partie ist spannend.

Etwas neues herauszufinden ist spannend.
Wie verhalten sich unterschiedlich agierende Programme bei Mix im Dreihirn gegen deutlich stärker ...
Sind eher die Themen die nicht schon Jahre Thema sind die mich reizen.

Denke nach so vielen Jahren auch für andere verständlich.
Die meisten Computerschachthemen sind für mich ehrlich gesagt ausgelutscht.
Neues ist viel reizvoller als ständig gleiche Fragen in den Raum zu werfen zu denen schon x tausend Eindrücke vorliegen.

Finde zwar auch eine neue Engine in meiner Ratingliste reizvoller als Komodo gegen Stockfish aber vielleicht gibt es etwas bei den beiden was ich noch nicht herausgefunden habe. Daher reizt mich das schon immer mal wieder mittels den Partien den Forscherdrang auszupacken.

Vorsprung ist wieder geschmolzen, ca. noch 1.4%.

Weiterhin viel Spaß beim beobachten, bin aber ehrlich gesagt froh wenn endlich Rhetoric läuft.

Gruß
Frank
Parent - - By Tom Paul Date 2015-12-18 09:12
Und Stockfish führt im direkten Vergleich:
Komodo 9.3 x64 - Stockfish 02Dec2015 BMI2 x64 (3185)    21.0  -  20.0    51.22%    Perf=3193
Stockfish 02Dec2015 BMI2 x64 - Komodo 9.3 x64 (3185)    21.5  -  19.5    52.44%    Perf=3201
Parent - By Frank Qy. Date 2015-12-18 11:15
Hallo,

mal ohne die begleitenden Stats ... habe kaum Zeit dafür.
Aber SF rückt immer näher ... nur wird es nach jetzt noch 410 offenen Partien für jede Engine nicht mehr reichen um zu überholen.
Aber vielleicht noch ein paar Elo Pünktchen weiter gut machen.

Die vielen schnellen Remispartien gegen die Schwächeren ...
Denke mit Contemp 6 oder Contemp 8 bei SF wären beide fast auf einem Level.

Gruß
Frank

Code:
December 18th, 2015 (11:00)
... after 152.930 games!

3rd Fight for Place 1
---------------------

Still running: Komodo 9.3 x64
Still running: Stockfish 02Dec2015 BMI2 x64

After  80% (Round 40/50)
   1 Komodo 9.3 x64                   : 3182.5   17.8   1418.0    1680   84.4%  +8,8
   2 Komodo 9.2 x64                   : 3173.7   14.1   2018.5    2400   84.1%
   3 Stockfish 02Dec2015 BMI2 x64     : 3167.0   16.6   1398.0    1680   83.2%  +4,4
   4 Stockfish 20Aug2015 BMI2 x64 C15 : 3162.6   14.4   1998.0    2400   83.3%
Parent - - By Peter Martan Date 2015-12-18 11:16
Frank Qy. schrieb:

Das Eröffnungsvorgaben dann maßgeblich für die Beeinflussung der Ergebnisse sind glaube ich nicht sofern ausgeglichene Varianten aufs Brett kommen.

Entweder es spielt keine maßgebliche Rolle, dass sie ausgeglichen sind, dann würde das aber bedeuten, dass sie ruhig auch unausgeglichen sein dürften, oder es spielt schon eine Rolle, dann würde ich vermuten die, dass die Ergebnisse dadurch ausgeglichener werden.
Der Witz ist der, Frank: die Grundstellung ist nicht ausgeglichen, du greifst also mit allem, was du dann noch an Varianten abschneidest (etwas anderes kann kein Buch, relativ zur Grundstellung bewirken) auf jeden Fall in den weiteren Spielverlauf ein, entweder ausgleichend, wenn deine Teststellungen, in die du die engines entlässt, ausgeglichener sind als die Grundstellung, oder kontra-ausgleichend.
Nun könnte deine Hoffnung sein, das gleicht sich bei einer großen Zahl von Stellungen wieder gegenseitig aus, woher nimmst du die aber eigentlich, diese Hoffnung, von den Evals der engines? Von deiner persönlichen schachlichen Einsschätzung? Von einer menschlichen Turnierstatistik? Von einer eng-eng-Statistik, die das Ergebnis dessen, was du damit abfragst, vorwegnimmt?

Ich hab immer irgendwie ein déjà vu bei diesem Thema, aber vielleicht könnte es irgendwann mal irgendwer einsehen, dass eine "overall playing strength" nicht testbar ist, es gibt sie daher auch nicht als Ergebnis, sie ist eine Illusion oder Elosion, spielte man nur von der Grundstellung aus, wäre es ebenso eine, nur eine andere.

Schöne Weihnachten allerseits, für mich ist jetzt dann endlich wieder die stille Zeit da!
Parent - - By ? Date 2015-12-18 11:37
Hi,

natürlich greife ich ein, will doch ein Buch mit dem alle Engines klar kommen.

Den weiß Vorteil berücksichtige ich natürlich.

Aber wie gesagt, ich nehme eh nur Varianten raus bei denen ich sehe wie der Spielverlauf ist.
Wenn Engine mit -0.5 startet und hält zunächst die Stellung bleibt die Variante drin (als schwarzer), wenn denn aber sehr schnell auf -1.0 dann analysiere ich ein wenig.
Berücksichtige natürlich dabei auch welche Engine die Variante aus gibt, kenne die ja alle mittlerweile. Fizbo und ice geben eh Vorteil, Smarthink, Gaviota andere auch aber nur minimal.

Ein 0.7 bei Fizbo ist im Grunde ein 0.2 wenn die Stellung offen ist.
Etc..

Das mir dabei natürlich auch Fehler unterlaufen ist klar, aber ich stehe immer auf den Standpunkt ...
Nur wer etwas macht erzielt ein Resultat.

Und das Resultat nach so vielen Jahren wo ich jetzt optimiere ... ist einfach ... GEIL.
Sehe die Früchte der Arbeit so langsam, wollte aufgrund der Vielzahl der zu optmierenden Varianten schon oft hinschmeißen, bin froh das ich das nicht gemacht habe. Sehe anhand der Auswertungen das die Abweichungen meiner Liste, egal wie ich die zusammensetze sehr schlüssig ist. Eine solch schlüssige Liste hatte ich noch nicht ins Leben gerufen.

Gruß
Frank

Peter, mit ein wenig mehr Power ran an die Aufgaben anstatt zu reden.
Du wirst verblüffendes feststellen.
Parent - By Peter Martan Date 2015-12-18 13:08 Upvotes 1
Zitat:

Peter, mit ein wenig mehr Power ran an die Aufgaben anstatt zu reden.
Du wirst verblüffendes feststellen.

Hab ich schon, Frank, hab ich schon, es würde allerdings nur dich verblüffen, Frank, ich kenn ja meine Ergebnisse schon lange. Der Unterschied zwischen deinen und meinen ist davon abgesehen aber vor allem der: dich interessieren meine nicht wirklich, mich deine schon, drum ist es gut, dass du deine veröffentlichst und ich meine nicht.
Parent - - By Tom Paul Date 2015-12-18 11:57
Peter Martan schrieb:

Frank Qy. schrieb:

Das Eröffnungsvorgaben dann maßgeblich für die Beeinflussung der Ergebnisse sind glaube ich nicht sofern ausgeglichene Varianten aufs Brett kommen.

Entweder es spielt keine maßgebliche Rolle, dass sie ausgeglichen sind, dann würde das aber bedeuten, dass sie ruhig auch unausgeglichen sein dürften, oder es spielt schon eine Rolle, dann würde ich vermuten die, dass die Ergebnisse dadurch ausgeglichener werden.
Der Witz ist der, Frank: die Grundstellung ist nicht ausgeglichen, du greifst also mit allem, was du dann noch an Varianten abschneidest (etwas anderes kann kein Buch, relativ zur Grundstellung bewirken) auf jeden Fall in den weiteren Spielverlauf ein, entweder ausgleichend, wenn deine Teststellungen, in die du die engines entlässt, ausgeglichener sind als die Grundstellung, oder kontra-ausgleichend.
Nun könnte deine Hoffnung sein, das gleicht sich bei einer großen Zahl von Stellungen wieder gegenseitig aus, woher nimmst du die aber eigentlich, diese Hoffnung, von den Evals der engines? Von deiner persönlichen schachlichen Einsschätzung? Von einer menschlichen Turnierstatistik? Von einer eng-eng-Statistik, die das Ergebnis dessen, was du damit abfragst, vorwegnimmt?

Ich hab immer irgendwie ein déjà vu bei diesem Thema, aber vielleicht könnte es irgendwann mal irgendwer einsehen, dass eine "overall playing strength" nicht testbar ist, es gibt sie daher auch nicht als Ergebnis, sie ist eine Illusion oder Elosion, spielte man nur von der Grundstellung aus, wäre es ebenso eine, nur eine andere.

Schöne Weihnachten allerseits, für mich ist jetzt dann endlich wieder die stille Zeit da!


Die Grundstellung ist ausgeglichen.
Nur die Gewinnwahrscheinlichkeit für weiß und schwarz ist nicht gleich.
Parent - By Peter Martan Date 2015-12-18 12:51
Tom Paul schrieb:

Die Grundstellung ist ausgeglichen.
Nur die Gewinnwahrscheinlichkeit für weiß und schwarz ist nicht gleich.

Parent - - By Benno Hartwig Date 2015-12-19 16:45
Inzwischen ist der Komodo-Vorsprung sogar unter 1% gerutscht!

Komodo      1660.0 - 294.0  84.95%  Perf=3148
Stockfish   1643.0 - 312.0  84.04%  Perf=3136


Wenn man so sieht, wie eine Engine im Laufe solch eines Events aufholt, dann ist man ja manchmal versucht zu glauben, dass das vermutlich so weitergehen würde, wenn man z.B. das ganze auf 4000 Partien jeweils erweitern würde.
Aber das ist wohl Tinnef. Zu jedem Zeitpunkt ist das aktuelle Ergebnis die Beste Schätzung für die jeweilige Spielstärke. Die Reihenfolge der Siege, Remisen und Niederlagen spielt keine Rolle.
Vorausgesetzt, die Spielverhältnisse hätten sich nicht irgendwie geändert.

Benno
Parent - - By Frank Qy. Date 2015-12-19 20:00
Hallo Benno,

ja, der Wettkampf nahm eine verblüffende Wende.
Das Stockfish schlecht startete war schon klar nach wenigen Partien.

Werde das alles noch in Ruhe auswerten wenn der Kampf zu Ende ist.

Wahrscheinlich kompensieren weniger Verlustpartien die vielen schnellen Gewinnpartien bei Stockfish. Auch im Endspiel scheint Stockfish die Nase vor zu haben. Im Übergang zum Endspiel bin ich nach wie vor der Meinung das Komodo abgeklärter spielt und hier seinen Vorteil hat.

Letztendlich stimmt es aber dann doch wieder das die beiden einfach weiterhin gleichauf sind. Wenn SF einen kleinen Contemp gehabt hätte wären die beiden Engines wahrscheinlich wirklich fast genau gleich stark.

Drängt sich natürlich der Verdacht auf ... was würde passieren wenn das jetzt nochmals 2.000 Partien so weiter läuft?
Statistisch wie Du es beschreibst ... mal schauen wenn ich die Auswertung der Spiele nur unter den TOP-21 vornehme. Könnte gar sein das Stockfish da gar besser ist.

Nehme wie in den anderen beiden Test-Runs hierfür dann die ersten 25 Partien aus Test-Run 1 und 2 (die haben ja insgesamt 100x gegeneinander gespielt).

Gruß
Frank
Parent - - By Frank Qy. Date 2015-12-20 08:12
Hallo zusammen,

die finalen Ergebnisse und übliche Statistiken finden sich in meiner News 240.
Die Partien je Engine können unter: Download games by Players heruntergeladen werden.
Die komplette Datenbank zur Ratingliste in meiner Download Rubrik.

Ferner ist das Eröffnungsbuch und natürlich die Ratingliste upgedatet.

Es fehlen noch die Statistiken zu Mittelspiel, Übergang Endspiel und Endspiel.
Die folgen dann im Laufe des Tages.

Frank's Chess Page
http://www.amateurschach.de

Gruß
Frank

PS: Keine Lust über das ganze Zeug hier jetzt auch noch in Detail ins Forum zu setzen.
Einfach die News 240 lesen und gut ist.
Parent - - By Peter Martan Date 2015-12-20 12:40
Danke, Frank.
Up Topic Hauptforen / CSS-Forum / Kampf um Platz 1, Stockfish vs. Komodo am 11. Dezember!
1 2 Previous Next  

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill