Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / "The Fight for Place 1" ... K9 vs. SFdev.
1 2 Previous Next  
Parent - By 2phil4u Date 2015-05-13 18:57
Stimmt, was Fernschach betrifft gibt es noch keine engine, die wirklich dafür gemacht ist.
In Turnieren wie word against werden dann händisch verschiedene Züge ausprobiert, was auch bei der Mattsuche häufig schneller ist durch backwardsolving (was eigentlich nicht sein sollte).
Ein +0.6 kann halt auch mal totenremis sein, während ein + 0.2 noch voller Möglichkeiten steckt.
Ganz von den unzähligen +1.3 remis Stellungen.
Hier sind die engines noch dumm, sie rechnen tiefer, die Bewertung  bleibt gleich, es werden nur Zugumstellungen gespielt etc pp.
Klar würde eine engine zumindest 5 Züge vorher diese Stellung anstreben, obwohl eventuell mit weniger Figurentausch und niedriger Bewertung langfristig ein Sieg möglich wäre.
Irgendwelche Tabellen  und Ranglisten sind ja eher ne Art Wetten, die engines wetten auf  einen Zug, lassen Züge aus und durch die  höhere Tiefe haben sie so quasi im Durchschnitt mehr Punkte, sind dafür aber halt dann auch blind in der ein oder anderen Situation (Hier wird halt Geschwindigkeit erkauft), für Fernschach aber dann wohl zu viel.
Vielleicht kann man ja etwas an  den engine Parametern drehen für das Fernschach, oder man  muss halt  selbst ein paar Züge vorspielen und das jeweils durchrechnen lassen und sich die Endstellung anschauen und dann  je  nach dem auch genau die Stellung wieder engine gegen engine testen, ob das gewonnen wird oft oder nicht.
Gruß Philipp
Parent - By Frank Qy. Date 2015-05-12 00:50
Hi,

jo, so wird es wohl sein ...
Für den Fernschachspieler wird Stockfish interessanter sein.

Für den GM und seinen Analysen aber eher Komodo.
Der ist auf gute Eröffnungsanalysen fixiert und die meisten Partien enden beim GM-Schach eher im späten Mittelspiel vor der Phase "Übergang Endspiel".

Und gerade mit vielen Figuren in den Eröffnungen wird viel analysiert.
Da wird der GM eher Komodo nehmen weil Stockfish zu gern in Remisvarianten einfädelt.

Fast 3x mehr kurze Remispartien bis Zug 50 produziert Stockfish im Vergleich zu Komodo.
Das ist wirklich ziemlich heftig und viele Punkte werden hier verschenkt.

Glaube im Übergang zum Endspiel liegen zwischen den beiden ca. 30-40 Elo.
Stockfish ist hier deutlich voraus aber die Frage ist ob wir dieses deutlich, meine was die Stats aussagen, überhaupt noch wahr nehmen können.
Liegt über unseren Horizont und selbst starke Fernschachspieler werden das auch nur mit sehr genauen und langwierigen Analysen ... wenn überhaupt ... herausfinden.

Alles nicht so einfach ...

Gruß
Frank

PS: Bin kein Experte und behelfe mir selbst mit Büchern, Stats etc.. geht ja gar nicht mehr anders.
Und dennoch ... wenn etwas so meilenweit entfernt von der eigenen Logik liegt, reizt es erst Recht.
Im Computerschach haben wir uns schon in Urzeiten über Dinge unterhalten von denen wir eigentlich keine Ahnung haben.
Mit anderen Worten fachsimplen und hinterfragen gehört beim Computerschach einfach dazu.
Parent - By Kurt Utzinger Date 2015-05-08 13:13
Benno Hartwig schrieb:

Ist Stockfish deiner Meinung häufig die "blindere" Engine von den beiden?
Oder lassen sich eventuell ca. gleich häufig für beide Engines Stellungen finden, für die sie "blind" sind?

Benno


Hallo Benno

Ohne umfangreiche weitere Tests wage ich keine abschliessende Prognose. Rein intuitiv würde
ich meinen, dass Stockfish mit seiner bedeutend tieferen und somit selektiveren Suche logisch
eher dazu neigen müsste, irgend welche Züge zu übersehen. Bei einer Testpartie zwischen
Komodo 9 64-bit und Stockfish 6 64-bit auf meinem Schach-Notebook i7-4710HQ bei einer
Bedenkzeit 40/120' ist mir aufgefallen, dass Stockfish bis ins späte Mittelspiel stets eine um
5 - 8 höhere ST aufweist, die Differenz der ST jedoch bei weniger Figuren auf dem Brett
rapid abgenommen hat. Ob dieses Verhalten allenfalls im Zusammenhang mit der pro
Zug jeweils verwendeten Bedenkzeit zusammenhängt, habe ich noch nicht untersucht.

Mfg
Kurt
Parent - By Jörg Oster Date 2015-05-08 14:19
Benno Hartwig schrieb:

Ist Stockfish deiner Meinung häufig die "blindere" Engine von den beiden?

Meine unmaßgeblichen Meinung nach: ja!
- - By Benno Hartwig Date 2015-05-08 09:11 Edited 2015-05-08 09:16
Oh, so dicht wie jetzt (1300 von 1600 Partien) war Komodo dem Stockfish in diesem Event bislang noch nie auf den Fersen:

Stockfish 26.04.15 BMI2 x64      1094.5 - 208.5    84.00%    Perf=3121
Komodo 9 x64                     1090.5 - 209.5    83.88%    Perf=3120


Auch im direkten Vergleich ist es ziemlich ausgeglichen.
Hier führt Stockfish knapp mit 41,5 - 40,5.

Benno
Parent - - By Frank Qy. Date 2015-05-08 12:30
Hi Benno,

nur bei den Statistiken nicht ...

Code:
Stockfish 26.04.15 BMI2 x64 nach 1280 Partien / Runde 40 / 50:
gewonnen unter 50 Zügen = 34 Partien
verloren unter 50 Zügen =  0 Partien
Remis unter 50 Zügen    = 89 Partien !!!!!
Zügedurchschnitt        = 80 Züge

Komodo 9 x64 nach 1280 Partien / Ruinde 40 / 50:
gewonnen unter 50 Zügen = 27 Partien
verloren unter 50 Zügen =  2 Partien
Remis unter 50 Zügen    = 33 Partien
Zügedurchschnitt        = 84 Züge


Bin nicht davon überzeugt das der Contemp bei Faktor wirklich gute Einflüsse zeigt.
Es werden ziemlich viele Punkte bei Stockfish verschenkt.
Das macht ca. 15 Elo aus und nach wie vor ...

Würde ein Großmeister eher Stockfish oder Komodo für die Analyse nach den Eröffnungszügen einsetzen.
Wohl kaum würde seine Entscheidung für Stockfish ausfallen wenn er oft damit rechnen muss das Stockfish nach den Eröffnungszügen eher Remis sucht wenn nicht gleich irgend einer kleiner Vorteil gewittert wird.

Das ist das was mich bei Stockfish stört und deswegen mag ich die Engine heute nicht mehr und setze Stockfish im Grunde auch nicht mehr ein für Buchanalysen.
Das kann ich mir schenken.

Da ist die vierer Kombination (auf Quad mit vier Cores):
Komodo 9, Spark 1.0, Junior 13.0.0.0 und ICE interessanter!
Produziert in Combi unglaubliche Analysen!

Gruß
Frank

Aber ansonsten ja ...
Komodo hat sich herangekämpft ...
Das wird wirklich unglaublich knapp!
Parent - - By Tom Paul Date 2015-05-09 10:57
Wo wir schon dabei sind, hier gibt es auch noch ein interessantes Ergebnis 60%

http://www.talkchess.com/forum/viewtopic.php?t=56267
Parent - - By Frank Qy. Date 2015-05-09 19:09
Hier der Zwischenstand kurz vor Ende ...
Ist aber hinsichtlich wer macht Platz 1 immer noch spannend.
Es sind derzeit ...

Code:
Stockfish 26.04.15 BMI2 x64  = 1252.0 - 234.0  84.25%  Perf=3125
Komodo 9 x64                 = 1248.5 - 237.5  84.02%  Perf=3122


NUR 3.5 Punkte Differenz bei noch 114 zu spielende Partien.
In der letzten 165er Runde spielt Stockfish offenbar auch noch eine Super Serie, beide Engines werden offenbar noch 1-3 Punkte zulegen.

Mal schauen!
Wäre der Hammer wenn erst in Runde 10 von 10 (10 165er Partien Runde) Komodo 9 noch vorbeizieht nachdem Stockfish die ganze Zeit vorne lag.

Aber sehr schön auch hier zu sehen ist, dass bei vielen Gegner schon 165 Partien Ergebnisse sehr zuverlässig sind, denn davon haben wir direkt 20 und ihr könnt ja mal vergleichen wie eng diese 20 Ergebnisse zusammen liegen. Das wird immer genauer bei gleicher Anzahl an Partien aber mehr Gegner.

Gruß
Frank

Code:
FCP version     : 2.07.1485.s7+s8
Time            : April 28th 2015 - May 11th, 2015
Games           : after 2880 of 3.200 (4.357Mb)
Performance     : Stockfish 26.04.15 BMI2 x64 = +13 Elo
Performance     : Komodo 9 x64                = +41 Elo

Calculated with Ordo 1.0
Stats after 100, 200 ... games!       Elo   Games  Score  Draws   White Black Points   w/ d/ l
01. Stockfish 6 BMI2 x64              3135  1.700  Predecessor
--. Stockfish 260415 BMI2 x64         ----  1.650  --.-%  --.-%   --,-  --,-  ---,-   ---/--/--
01. Stockfish 260415 BMI2 x64         3148  1.485  83.0%  30.5%   70,0  67,5  137,5   114/47/04
01. Stockfish 260415 BMI2 x64         3147  1.320  83.0%  30.8%   70,5  57,0  137,5   112/51/02
01. Stockfish 260415 BMI2 x64         3146  1.155  82.9%  30.7%   70,0  64,5  134,5   106/57/02
01. Stockfish 260415 BMI2 x64         3150    990  83.1%  30.1%   70,0  66,5  136,5   110/53/02
01. Stockfish 260415 BMI2 x64         3150    825  83.2%  29.7%   72,0  65,5  137,5   116/43/06
01. Stockfish 260415 BMI2 x64         3150    660  83.2%  30.6%   72,5  64,0  136,5   110/53/02
01. Stockfish 260415 BMI2 x64         3152    495  83.3%  30.1%   71,5  66,5  138,0   114/48/03
01. Stockfish 260415 BMI2 x64         3150    330  83.2%  30.6%   73,5  63,5  137,0   111/52/02
01. Stockfish 260415 BMI2 x64         3150    165  83.3%  29.7%   73,5  64,0  137,5   113/49/03

Calculated with Ordo 1.0
Stats after 100, 200 ... games!       Elo   Games  Score  Draws   White Black Points   w/ d/ l
02. Komodo 8 x64                      3105  1.700  Predecessor
--. Komodo 9 x64                      ----  1.650  --.-%  --.-%   --,-  --,-  ---,-   ---/--/--
01. Komodo 9 x64                      3145  1.485  82.8%  29.2%   72,5  64,0  136,5   111/51/03
02. Komodo 9 x64                      3145  1.320  82.8%  29.0%   73,0  67,5  140,5   121/39/05
02. Komodo 9 x64                      3141  1.155  82.4%  29.8%   70,5  64,0  134,5   108/53/04
02. Komodo 9 x64                      3143    990  82.6%  29.4%   72,0  68,0  140,0   118/44/03
02. Komodo 9 x64                      3137    825  82.1%  29.9%   73,5  61,5  135,5   110/50/05
02. Komodo 9 x64                      3138    660  82.2%  29.8%   72,5  65,5  138,0   112/52/01
02. Komodo 9 x64                      3132    495  81.7%  29.3%   71,0  62,5  133,5   110/47/08
02. Komodo 9 x64                      3137    330  82.1%  29.7%   73,5  65,0  138,5   115/47/03
02. Komodo 9 x64                      3114    165  80.3%  30.9%   73,5  59,0  132,5   107/51/07
 

     Program                           Elo    +    -  Games   Score  Av.Op.  Draw
01. Stockfish 26.04.15 BMI2 x64       3148   18   18  1485   83.0%   2842   30.5%
02. Komodo 9 x64                      3145   17   17  1485   82.8%   2842   29.2%
--. Stockfish 6 BMI2 x64              3135   16   16  1700   83.8%   2823   28.9%
--. Komodo 8 x64                      3104   16   16  1700   80.9%   2830   31.6%
03. Fire 4 x64                        3045   14   14  1940   74.6%   2833   34.6%
04. GullChess 3.0 BMI2 x64            3039   14   14  1790   72.8%   2847   40.1%
05. Equinox 3.30 x64                  2991   12   12  1940   69.0%   2835   41.5%
06. Sting SF 4.8.4 x64                2933   12   12  1840   61.5%   2844   44.6%
07. Protector 1.7.0 x64               2910   13   13  1640   56.3%   2865   44.9%
08. Critter 0.90 SSE4 x64             2899   13   13  1740   56.1%   2854   45.2%
09. Hannibal 1.5 x64                  2896   12   12  1790   56.9%   2846   45.0%
09. Texel 1.05 x64                    2896   12   12  1840   57.0%   2844   43.2%
11. Chiron 2.0 x64                    2895   10   10  2890   61.7%   2806   40.4%
12. Naum 4.6 x64                      2884   12   12  2090   58.0%   2824   42.8%
--. Hannibal 1.4b x64                 2862   10   10  2500   59.2%   2794   43.3%
--. Texel 1.04 x64                    2847   11   11  2300   57.5%   2793   42.4%
13. Nirvanachess 2.0a x64             2837   11   11  2140   52.4%   2823   45.2%
14. Senpai 1.0 SSE42 x64              2829    9    9  2890   53.3%   2808   42.4%
15. Hiarcs 14 WCSC w32                2825   10   10  2890   52.7%   2809   43.0%
16. Andscacs 0.72 POP x64             2813   11   11  2090   49.1%   2826   42.7%
17. Sjeng c't 2010 w32                2796   12   12  1990   46.4%   2830   42.2%
18. Shredder 12 x64                   2794   12   12  1790   43.0%   2854   42.3%
19. Junior 13.3.00 x64                2783   10   10  2740   46.4%   2816   40.2%
20. Spike 1.4 Leiden w32              2773   12   12  1690   39.3%   2863   41.9%
21. Quazar 0.4 x64                    2758   14   14  1590   38.1%   2859   39.9%
Parent - By Frank Qy. Date 2015-05-09 23:07
Code:
Stockfish 26.04.15 BMI2 x64  = 1269.0 - 238.0  84.21%  Perf=3123
Komodo 9 x64                 = 1267.5 - 239.5  84.11%  Perf=3122


Nur noch 1.5 Punkte und noch 93 Partien für jede Engine zu spielen.
Und am Ende gewinnt Komodo 9?

Gruß
Frank
- - By Benno Hartwig Date 2015-05-11 08:22
SF hat ganz knapp die Nase vorn behalten.
Thanx für dieses Event, Frank!

                                    Übersicht                                         Einzeltabellen
                                    ELO    +    -          Score   Av.Op  Draw     
---------------------------------------------------------------------------------------------------------------------------
01. Stockfish 26.04.15 BMI2 x64     3149   16   16  1650   83.1%   2842   30.5%       1347.5 - 252.5    84.22%    Perf=3123
02. Komodo 9 x64                    3146   16   16  1650   82.8%   2842   29.2%       1344.5 - 255.5    84.03%    Perf=3121


Ich habe hier mal die Angaben aus der Übersicht und den beiden Einzeltabellen zusammengefasst.
Wie erklären sich eigentlich die Unterschiede, die bei der ELO-Schätzung und besonders auch z.B. bem Score?

Benno
Parent - - By Frank Qy. Date 2015-05-11 09:36
Hallo Benno,

mache die Stats etwas später, habe im Moment gar keine Zeit.
Versuche aber in den nächsten beiden Stunden noch die Partien hoch zu laden.

Interessant ist ...
Bei den Stats zu Mittelspiel / Endspiel / Übergang Endspiel werte ich ja nur 1.000 Partien aus (also die TOP-21 je 50 Partien gegeneinander).
Hierfür nehme ich dann die ersten 25 Partien aus Round-Robin 1 und 2 (Komodo - Stockfish sind ja 100 Partien). Hier gewann Komodo dann mit einem Punkt im direkten Vergleich, bei 100 Partien verlor Komodo mit 2 Punkten Differenz).

Aber ...
Gegen die TOP-21 machte Komodo insgesamt 7 Punkte mehr und liegt auf Platz 1.
Was auch klar ist, denn Stockfish verschenkt zu viele Punkte gegen schwächere Gegner durch die vielen Remispartien.

Die Datenbankauswertungen werden immer komplexer je mehr Partien ich habe.
Es war schon wieder eine doppelte Partie (Remis nach 20 Zügen) in der 78900 Datenbank. So mussten beide Partien nachgespielt werden.

Die neue Buchversion ist schon Online.
Konnte mein Buch drastisch verbessern durch die 3.200 neuen Partien.

Später dann mehr wenn ich die Stats habe.

Gruß
Frank

PS: Machst Du noch die grafische Auswertung mit der Du begonnen hattest.
Würde die gerne mal sehen ... wenn Du Zeit hast.
Parent - - By Benno Hartwig Date 2015-05-11 20:58
Klar mache ich. Im Moment kann ich aber deine beiden Ergebnisseiten mit den erspielten ELO-Werten nicht erreichen.
(Klick auf Live mode führt nur zu HOSTIX-Seite)
Den Rest deiner Site erreiche ich aber schon. Auch die Seite mit den aktuellen Nemo-Ergebnissen.


Benno
Parent - By Frank Qy. Date 2015-05-11 21:53
Hallo Benno,

ich komme auf alle Seiten von meinem PC.
Allerdings seit ca. 2 Wochen komme ich von meinem Handy von unterwegs nicht mehr auf meine Seite und sehe auch immer eine Hostix Seite.

Habe deswegen schon 2x den Support angeschrieben aber die finden nichts.

Nun ja, habe gerade nochmals eine eMail gesendet.
Keine Ahnung was die geändert haben, bzw. ist vor ca. 3 Wochen ein Server ausgefallen und auch meine Seite war betroffen.
Seit der neue Server steht besteht das Problem offenbar.

Gruß
Frank
Parent - - By Benno Hartwig Date 2015-05-11 22:56
Putzig, wenn ich
http://amateurschach.de/_start-2900+.htm
direkt in der Adresszeile eingeben, klappt es.
Der Link auf deiner Seite und auch mein Favoriteneintrag führt mich immer noch nur zu HOSTIX.

Egal, nun kam ich an die ELO-Werte, und die Grafik sieht nun so aus:


Die von Excel gezeichneten Trendlinien beschreibt, dass nun gerade Komodo besonders stark gegen die starken Gegner spielt, gegen die schwächeren eher schwächelt.
Stockfish, dem eben dies gern nachgesagt wird, wird hingegen eine sehr ausgeglichene Performance bescheinigt.


Benno
Parent - By Frank Qy. Date 2015-05-12 00:26
Hi Benno,

genauso ist es ...
Wobei ...
Komodo schwächelt gegen die schwächeren im Endspiel bzw. Übergang zum Endspiel.
Dies liegt daran, weil einige der deutlich schwächeren extrem gut Leistungen im Endspiel bringen und hier deutlich aus der Reihe tanzen.

Stockfish schwächelt im Grunde nur durch die vielen schnellen Remispartien.

Das sagte ich einleitend zum Thread, dass genau das die Probleme der beiden Engines sind (war auch so bei den Vorgängerversionen).

Schaue mal unter:
http://www.amateurschach.de/ftptrigger/fct0-2015.html

Das ist die Turniertabelle der TOP-21 (wobei ich jetzt keine Lust habe DiscoCheck wieder raus zu nehmen und Deuterium wieder rein ... die tauschen laufend Platz 21).
Hier kannst Du sehen, dass es so ist wie Du auch festgestellt hast.
Komodo liegt hier auf Platz 1 mit deutlichen Vorsprung nach Punkten gegen die Stärkeren.

Diese Turniertabelle (FCT0) wird simuliert aus den vorhandenen Ergebnissen.
Bin gerade dabei die Auswertungen für Endspiel, Übergang Endspiel und Mittelspiel zu erstellen.
Dann wird es richtig gut zu sehen sein.
Dauert aber noch etwas.

Die FCT0 Turniertabelle wird auch immer aktuell gehalten und ist im Menüsystem unter Special 2900+ / FCT0 zu finden.

Du kannst solche Stats auch erstellen mit den Partiedaten ...
Im download finden sich hierfür alle Dateien (meine Ratingliste wird komplett dokumentiert, siehst Du wenn Du in die ZIP Datei schaust), allerdings schon 125Mb.

Gruß
Frank

PS: Interessant an Deiner Kurve ist wie Komodo im Verlaufe der 1.650 Partien zugelegt hat, obwohl nach den 10 165 Partien Auswertungen die Unterschiede in Punkten immer sehr minimal waren.
Stockfish hingegen drehte beständiger seine 165 Partien Runden.

Hostix (mein Provider schrieb mir gerade):
"Es kann im Prinzip nur sein, dass irgendwo noch die alte IP in einem DNS-Cache hängt."
Parent - - By Tom Paul Date 2015-05-12 07:09
Wie kann das eigentlich sein wenn:

1.Stockfish 26.04.15 BMI2 x64 - Komodo 9 x64 (3146)                   27.5  -  22.5    55.00%    Perf=3180
2.Stockfish 26.04.15 BMI2 x64 - Fire 4 x64 (3046)                          34.0  -  16.0    68.00%    Perf=3176
3.Stockfish 26.04.15 BMI2 x64 - GullChess 3.0 BMI2 x64 (3038)    31.0  -  19.0    62.00%    Perf=3123
4.Stockfish 26.04.15 BMI2 x64 - Equinox 3.30 x64 (2994)               39.0  -  11.0    78.00%    Perf=3213

1.Komodo 9 x64 - Stockfish 26.04.15 BMI2 x64 (3149)    26.5  -  23.5    53.00%    Perf=3169
2.Komodo 9 x64 - Fire 4 x64 (3046)                                  31.5  -  18.5    63.00%    Perf=3138
3.Komodo 9 x64 - GullChess 3.0 BMI2 x64 (3038)           34.0  -  16.0    68.00%    Perf=3168
4.Komodo 9 x64 - Equinox 3.30 x64 (2994)                      36.0  -  14.0    72.00%    Perf=3158

1.Stockfish gewinnt mit +1 Punkt.
2.Stockfish gewinnt mit +2,5 Punkten.
3.Stockfish verliert mit 3 Punkten.
4.Stockfish gewinnt mit 3 Punkten.

=Stockfish gewinnt mit ganzen +3,5 Punkten.
Parent - By Benno Hartwig Date 2015-05-12 09:26 Edited 2015-05-12 09:30
Jetzt ist mir nicht klar geworden, worüber du dich ggf. wunderst.
Ja, SF holte aus diesen 4 Begegnungen 3,5 Punkte mehr als Komodo.

Die Schräglage, die Excel für die Komodo-Trendlinie errechnete, entsteht wohl vor allem wegen der Vielzahl der vglw. schlechten Ergebnisse gegen die Schwächeren. Dann kippt die Linie wohl einfach ein Stück um ihren "Schwerpunkt". Ein direkte Anheben auf der Top-Seite ist wohl nicht erforderlich.

Benno
Up Topic Hauptforen / CSS-Forum / "The Fight for Place 1" ... K9 vs. SFdev.
1 2 Previous Next  

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill