komodo MP 51

By Ingo Bauer Date 2013-06-19 19:09

Hmm, im "Quick and dirty test" kann ich nichts finden:

Jeweils Grundstellung und MP nur einmal laufen lassen ...

Intel i5:

Engine: Komodo CCT 64-bit (1024 MB)
by Don Dailey, Larry Kaufman

23.01  2:43   +0.25    1.d4 d5 2.c4 c6 3.cxd5 cxd5 4.Nc3 Nf6 
                       5.Qb3 Nc6 6.Nf3 e6 7.Bf4 Be7 8.e3 O-O 
                       9.Be2 a6 10.O-O Nh5 11.Bg3 Nxg3 
                       12.hxg3 b5 13.a3 Bb7 14.Rac1 (265.809.110) 1624 

Engine: Komodo 5.1 64-bit (1024 MB) 1 core
by Don Dailey, Larry Kaufman

23.01  2:06   +0.22    1.d4 d5 2.c4 c6 3.cxd5 cxd5 4.Nc3 Nf6 
                       5.Nf3 Nc6 6.Bf4 a6 7.Qb3 Bf5 8.e3 Na5 
                       9.Qd1 Qb6 10.Qd2 e6 11.Be2 Be7 
                       12.O-O O-O (199.428.337) 1581 

Engine: Komodo 5.1 64-bit (1024 MB) 4 core
by Don Dailey, Larry Kaufman

23.01  1:24   +0.22    1.d4 d5 2.c4 c6 3.Nf3 Nf6 4.cxd5 cxd5 
                       5.Qb3 e6 6.Bf4 Be7 7.Nc3 O-O 8.e3 Nc6 
                       9.Be2 a6 10.Rc1 b5 11.O-O Bd7 12.a3 Nh5 
                       13.Bg3 Nxg3 (520.262.707) 6137 

AMD Phenom 2:

Engine: Komodo CCT (1024 MB)
by Don Dailey, Larry Kaufman

23.01  4:11   +0.25    1.d4 d5 2.c4 c6 3.cxd5 cxd5 4.Nc3 Nf6 
                       5.Qb3 Nc6 6.Nf3 e6 7.Bf4 Be7 8.e3 O-O 
                       9.Be2 a6 10.O-O Nh5 11.Bg3 Nxg3 
                       12.hxg3 b5 13.a3 Bb7 14.Rac1 (265.809.110) 1055 

Engine: Komodo 5.1 (1024 MB) 1 core
by Don Dailey, Larry Kaufman

23.01  3:02   +0.18    1.e4 e5 2.Nf3 Nc6 3.Bc4 Nf6 4.d3 Bc5 
                       5.O-O O-O 6.Nc3 d6 7.Bg5 Bg4 8.Nd5 Nd4 
                       9.b4 c6 10.Bxf6 gxf6 11.bxc5 cxd5 
                       12.Bxd5 dxc5 13.c3 Nxf3+ 14.gxf3 (180.074.764) 986 
 

Engine: Komodo 5.1 (1024 MB)
by Don Dailey, Larry Kaufman

23.01  2:27   +0.19    1.d4 d5 2.c4 dxc4 3.e3 Be6 4.Nf3 Nf6 
                       5.Nc3 h6 6.Be2 c6 7.O-O g6 8.Ne5 Bg7 
                       9.Bxc4 Bxc4 10.Nxc4 Nbd7 11.Qb3 Qc7 
                       12.e4 O-O 13.e5 Nd5 14.Nxd5 (567.901.854) 3863

Alles as expected - oder übersehe ich etwas?

Gruß
Ingo

By Thomas Müller Date 2013-06-19 19:16

ja hast recht...bisher jedenfalls.
Muss das nochmal mit der stellung anschauen.

Engine: Komodo CCT 64-bit (512 MB)
von Don Dailey, Larry Kaufman

K/s: 722.664
TotTime: 9:38m SolTime: 9:38m
:
Ply:23 Positions: 1 Avg Nodes:166475946 Branching = 2.41
----------------------

Engine: Komodo 5.1 64-bit (512 MB)
von Don Dailey, Larry Kaufman

K/s: 2.590.192
TotTime: 8:24m SolTime: 8:24m
:
Ply:23 Positions: 1 Avg Nodes:841282737 Branching = 2.66

By Ingo Bauer Date 2013-06-19 19:39

[quote="Thomas Müller"]
ja hast recht...bisher jedenfalls.
Muss das nochmal mit der stellung anschauen.

Engine: Komodo CCT 64-bit (512 MB)
von Don Dailey, Larry Kaufman

K/s: 722.664
TotTime: 9:38m SolTime: 9:38m
:
Ply:23 Positions: 1 Avg Nodes:166475946 Branching = 2.41
----------------------

Engine: Komodo 5.1 64-bit (512 MB)
von Don Dailey, Larry Kaufman

K/s: 2.590.192
TotTime: 8:24m SolTime: 8:24m
:
Ply:23 Positions: 1 Avg Nodes:841282737 Branching = 2.66
[/quote]

Leider fehlt die Stellung.

Aber, das untere is nur minimal schneller, hat aber 5 mal mehr Stellungen berechnet (deswegen auch der schlechte BF, ist gerade BF Mode

)
Ich nehme an du beziehst dich darauf. Diskutiert wird das gerade auch auf CCC. Aber wichtig ist was hintern raus kommt. Vielleicht durchsucht Don den Baum breiter, vielleicht zählt er auch nur bei MP ganz anders ... Du wirst CCT 1 Kern und 5.1 x-Kern nicht ordentlich vergleichen können, das kann wahrscheinlich nur der Autor.

Am Ende zählen nur die Elo

Gruß
Ingo

By Thomas Müller Date 2013-06-19 19:46

nee das BF oder ELO ist mir vollkommen wurscht grad.
Im MV-modus sieht man es deutlich an den plys wie langsam da die MP vorwärts kommt.
Das hat mich gerade sehr überrascht bei 4-threads, damit habe ich nicht gerechnet

By Ingo Bauer Date 2013-06-19 20:02

[quote="Thomas Müller"]
nee das BF oder ELO ist mir vollkommen wurscht grad.
Im MV-modus sieht man es deutlich an den plys wie langsam da die MP vorwärts kommt.
Das hat mich gerade sehr überrascht bei 4-threads, damit habe ich nicht gerechnet

[/quote]

Na ja, im CCC wird gerade diskutiert das Komodo sein MP ganz anders macht als andere (breiter aber weniger tief). Da es aussieht als ob die MP Implementierung ganz gut ist, hat sie vielleicht woanders einen Pferdefuß. Mal sehen was Don dazu sagt.

Gruß
Inog

By Thomas Müller Date 2013-06-19 20:52

ich les mich mal durch.....
Dachte eigentlich ich hätte einen account dort ?!
beim registrieren kam die meldung das meine @web.de adresse "banned" sei ?!
Ich habe aber nix angestellt !! *ichschwör*
Ich hab noch nie was gepostet dort....wie auch ?!

Mit einer anderen ging es wohl dann ?!

aha...muss noch aktiviert werden.
HA....die mail kenne ich...ich glaube mein damaliger antrag wurde nie aktviert oder so.
Also wenn das jetzt wieder nix wird, dann können die mich .....

By Ingo Bauer Date 2013-06-20 04:48

[quote="Thomas Müller"]
...
beim registrieren kam die meldung das meine @web.de adresse "banned" sei ?!
...
[/quote]

*Kleine Randbemerkung: Wer Massenemailern vertraut ist selber schuld.

Hier http://www.talkchess.com/forum/viewtopic.php?topic_view=threads&p=521918&t=48339 hat Don mal kurz angerissen warum sein Konzept anders ist als andere.
ANsonsten ist das von dir beschriebene MV Verhalten normal.

Gruß
Ingo

By Peter Martan Date 2013-06-20 12:46 Edited 2013-06-20 12:50

Hallo Thomas!

Der Succus im allgemeinen Forum ist für mich das von heute zwischen Bob Hyatt, Uri Blass,

http://www.talkchess.com/forum/viewtopic.php?topic_view=threads&p=521985&t=48339
und Don Dailey.
http://www.talkchess.com/forum/viewtopic.php?topic_view=threads&p=522051&t=48339

Da geht's für mich auch wieder um die alte Frage, was bringt etwas, wenn es keine Elo bringt, und die simple Antwort ist, man weiß es nicht. (Kommentar dazu von mir: woher auch, wenn man's nicht probiert und auch gar nicht erst drüber nachdenkt

)
Den Spielbaum zu verbreitern, bevor man ihn weiter vertieft, zumindest mit MP, kann taktisch helfen, tut es aber meistens kaum noch bei den heutigen pruning Techniken, von Studien und anderen Ausnahmsstellungen abgesehen im leicht nachweisbaren Bereich.
Soll heißen, es zeigt sich nicht bei durchschnittlicher Hardware und Bedenkzeiten in Stellungen, die die engines gerade durch ihr niedriges Branching selbst in der Partie herbeiführen.

Bei taktischen Stellungen lässt es sich wenigstens durch Time to Solution zeigen, das ist nur auf MP wieder schlecht reproduzierbar, gar nicht stimmt natürlich auch gar nicht, sonst ist die Statistik unser liebstes Kind, bei Stellungstests tun wir uns die Arbeit dazu einfach nicht an.

Nun ist mir Komodo vielleicht nur auf den ersten taktiklastigen Blick zu sehr als me to engine vorgekommen, der Witz ist ja vor allem der, dass sich ein breiterer Spielbaum meiner Meinung nach vor Allem bei positionellen Stellungen auswirken könnte, bei cleverer Erweiterung durchaus auch positiv (

) natürlich auch nicht in solchen, die ohnehin am Rande des Remis dümpeln, sondern in solchen, die langfristige Kombinationen zum Erreichen anderer Stellungen, in denen wieder mehr Taktik drinsteckt und damit erst viel später durchrechenbare Vorteilsnahme einer Seite (oder der anderen

), ich möchte sagen, wo es darauf ankommt, weniger auf save draw als auf possible win zu spielen.
So könnte "positionelles Verständnis" von engines vielleicht unter höherem Branching sogar eher zu erreichen sein, als wesentliche taktische Aufwertung, weil letztere beim Stand der taktischen Fähigkeiten der engines nur mit sehr viel mehr Rechenaufwand erreichbar sein dürfte, es müsste vor Allem auch im Mittelspiel teilweise auf Nullzug verzichtet werden, das kostet natürlich.

Kurzum, ich muss mir die engine natürlich auch erst mal selber etwas gründlicher ansehen, was sie wirklich kann, das ist nur im Positionsspiel um Einiges schwerer in Stellungstests zu sehen, ich behaupte aber bei der Gelegenheit einfach wieder einmal, in Kurzpartien von grundstellungsnahen ausgeglichenen Stellungen aus, in denen man in absehbarer Zeit Partiezahlen zusammenbringt mit begrenzter Hardware, gar nicht, was die Elo angeht.
Es ist nicht diese unschuldige Maßzahl als solche mein Problem, es ist die Art, wie sie verheizt wird, wie man mit ihr Schindluder treibt, um damit alles beweisen zu können, was man sich selber und den anderen einreden will, nur um sich ein Mehr an selber denken und spielen, von mir aus auch spielen lassen, zu ersparen.
Sie werden zu billig gehandelt, die armen Elo.

By Michael Scheidl Date 2013-06-20 17:19 Edited 2013-06-20 17:23

Dieses ganze komplexe Geflecht, um nicht zu sagen der Sumpf aus Suchtiefen, Suchbreiten, Pruning, Extensions & Reductions usw.usf. wird für den Fan sofern er nicht selbst kundiger Schachprogrammierer ist, immer schwieriger zu interpretieren. Am besten man sagt dazu gar nichts mehr (aber wer kann das schon

), und hält sich nur an konkrete Resultate, welcher Art auch immer.

Es ist stets nützlich zu wissen welche Engine(s) jeweils kombinatorisch am besten sind, sei es nur um eine zweite Meinung in der Analyse zu erhalten. Zum Beispiel ist es derzeit völlig normal im allgemeinen Houdini zu befragen, aber wenn es scheint daß es eine scharfe Position mit eventuellen taktischen Überraschungen ist, so wird man gerne Spark 1.0 oder sogar Pro Deo Q3 heranziehen. Schaden wird's nicht, und mitunter sogar etwas besseres zu Tage fördern als Houdini es tat.

(Zu Zeiten von Shredder 9 waren das Hiarcs 9 und The King 3.x, ebenfalls von der Gesamtspielstärke her unterlegen.)

In Endspielstellungen bietet sich ComStock 3 in derselben Weise an. - Wobei ich zugebe, für keines dieser Beispiele könnte ich ad hok konkrete Testresultate vorlegen welche diese Empfehlungen untermauern...

Was das positionelle Können betrifft, so denke ich daß dieses Element in Engines heutzutage ebenso sehr auf den typischen großen Suchtiefen beruht, als auf einer möglichst guten Bewertungsfunktion. Letztere bleibt natürlich von hoher Bedeutung, denn irgendwo muß ja immer aufgehört werden weiterzusuchen - die selektiven Tiefen sind allerdings enorm und wie mir gesagt würde, auch treffsicherer als früher.

Aber ich denke, bei 20+ Tiefe kommt der konkrete Nutzen eines guten positionellen Zuges, sei er nun materiell oder "sehr deutlich" positionell, bereits oft in den Suchhorizont heutiger Engines. Und bei nTCEC sahen wir nicht selten 30er-Tiefen und auch da kommen die Extensions noch hinzu. "Positionell" ist eben nur ein menschliches, und zwar sehr mächtiges Hilfskonstrukt als Ersatz für sehr genaue tiefe Suche, zu der wir eben nicht so im Stande sind wie Engines.

Es gibt mindestens eine große Testsuite die sich mit positionellen Problemen befaßt:

https://sites.google.com/site/strategictestsuite/

1.400 Positionen! Ich habe ihn noch nie ausprobiert; besonders populär scheint er nicht zu sein denn man sieht fast nie Resultate.

Die pragmatische Idee wäre selbstverständlich: Man sucht alle möglichen Testsuites und kombiniert sie thematisch zu den drei Bereichen: Taktisch, positionell, Endspiel. Je mehr Stellungen desto besser, dann können ein paar inkorrekte ignoriert werden weil sie statistisch erschlagen werden. Dann kann man ein paar (Top-)Engines testen und sehen was herauskommt. Stimmt es mit dem Stil überein, nach allgemeiner Wahrnehmung? Sind die Stärkeprofile die sich abzeichnen, anhand praktischer Partien bisher so erkannt worden? Welche Engine soll ich, zumindest als kompetente zweite Meinung, für Stellungen des jeweiligen Typs in der Analyse heranziehen...?

Eine Titanenaufgabe!

By Peter Martan Date 2013-06-21 09:28 Edited 2013-06-21 09:38

[quote="Michael Scheidl"]
Was das positionelle Können betrifft, so denke ich daß dieses Element in Engines heutzutage ebenso sehr auf den typischen großen Suchtiefen beruht, als auf einer möglichst guten Bewertungsfunktion. Letztere bleibt natürlich von hoher Bedeutung, denn irgendwo muß ja immer aufgehört werden weiterzusuchen - die selektiven Tiefen sind allerdings enorm und wie mir gesagt würde, auch treffsicherer als früher.
[/quote]

Schon klar, Michael, der Mensch stellt sich "positionell" halt so vor, dass es um Pläne geht, die zu weit reichen, dass man sie im Kopf Zug um Zug durchrechnen kann.
Auch dabei gibt's aber solche und solche Pläne, wie man spätestens weiß, wenn man mal wieder eine Plan gemacht hat und einen zweiten und ein großes Licht war...du kennst den Spruch.

[quote="Michael Scheidl"]
Aber ich denke, bei 20+ Tiefe kommt der konkrete Nutzen eines guten positionellen Zuges, sei er nun materiell oder "sehr deutlich" positionell, bereits oft in den Suchhorizont heutiger Engines. Und bei nTCEC sahen wir nicht selten 30er-Tiefen und auch da kommen die Extensions noch hinzu. "Positionell" ist eben nur ein menschliches, und zwar sehr mächtiges Hilfskonstrukt als Ersatz für sehr genaue tiefe Suche, zu der wir eben nicht so im Stande sind wie Engines.
[/quote]

Gesagt, getan, gescheitert oder gescheiter geworden, auch durch den engine- Einsatz.
Wären aber die engines in ihren hohen Suchtiefen wirklich so treffsicher in der einen tiefen tiefen HV, die sie am weitesten berechnen, dass sie keine taktische Wendung und keine positionelle Alternativvariante übersähen, würden sie nur mehr Remisen gegeneinander schieben und es gelänge guten Fernschachspielern nicht immer wieder, den gegnerischen engine- Varianten Überraschungen zu bieten.
Wenn du mit guter engine- Unterstützung und großem eigenen Zeitaufwand den engines immer wieder Alternativvarianten in Eröffnung, Mittelspiel und Endspiel (dort sollten sie doch eigentlich mit ihren tollen Suchstrategien fehlerlos sein, wenn es nur mehr wenige Steine sind, aber schau dir doch mal an, was da mit und ohne tbs von engines zussammengespielt und fehlevaluiert wird, dort wird's einfach erst für den Menschen wieder sichtbar, weil er selber mehr Einsicht gewinnt mit der ansonsten lückenhaften Strategie- Krücke) manuell eingibst, siehst du immer wieder, wie die evals im Vor und Zurück beeinflussbar sind mit dem Anfüttern vom hash, da wird einfach immer wieder dies und das erst durchs Ausprobieren so richtig berechnet.
Die Wahrscheinlichkeit spricht mir einfach sehr dafür, dass die Ökonomie des möglichst schnell in die Tiefe Rechnens links und rechts des Hauptweges sehr viel stehen lässt, weil es einfach zunächst nicht so sicher berechenbar ist, zu weit weg führt vom sichersten Weg, und dann auch nicht mehr zum Zug kommt, weil auch die MP- Hardware- Nutzung und der zeitliche Mehraufwand ab einer gewissen Grenze das einmal Verworfene nicht mehr nachrechnet.
Ferner liegt auch einfach die Vermutung nahe, das sei zunächst öfter "nur" "positionell", was da unbemerkt bleibt, und werde erst durch Verschieben des Horizonts dann wieder taktisch, weil naheliegende taktische Hotshots von den engines auf guter Hardware einfach nur mehr selten übersehen werden.

[quote="Michael Scheidl"]
Es gibt mindestens eine große Testsuite die sich mit positionellen Problemen befaßt:

https://sites.google.com/site/strategictestsuite/

1.400 Positionen! Ich habe ihn noch nie ausprobiert; besonders populär scheint er nicht zu sein denn man sieht fast nie Resultate.
[/quote]

Swaminathan und Corbit.
An sich tolle Idee und große Leistung, das Alles so zusammenzutragen.
Ich habe mich mit den ersten paar Versionen, als es noch so 10, 11 Suites waren, eine Weile beschäftigt, auch mit der Umrechnung in Elo davon, da gibt's ein Hilfsprogramm dazu.
Dann schien mir aber der Anspruch, der dahinter steckt, auf diese Art eine positionelle over all playing strenght zu bestimmen, überzogen für den Aufwand, der ja doch auch damit verbunden ist.
Wohl sagt dieser STS etwas aus, so schnell, wie er abgearbeitet werden soll, fehlt mir aber doch wieder irgendwie das Zusammenwirken von eval und Suche mit entsprechendem Zeitaufwand, und in der Realität ist der Zusammenhang zwischen "Strategie" und Taktik, zwischen eval und Suche einfach nicht trennbar, was die Frage aufwirft, ob man das wirklich getrennt voneinander testen soll und kann, und was dann wirklich dabei herauskommt.
Bosheit am Rande: Elo, wie sie jetzt bestimmt werden, haben meiner Meinung nach aber genau so viel oder wenig Berechtigung, als Maß der Dinge herzuhalten, wie wenn man sie durch derartige Stellungstests bestimmte, positionelle mit taktischen kombiniert.

[quote="Michael Scheidl"]
Die pragmatische Idee wäre selbstverständlich: Man sucht alle möglichen Testsuites und kombiniert sie thematisch zu den drei Bereichen: Taktisch, positionell, Endspiel. Je mehr Stellungen desto besser, dann können ein paar inkorrekte ignoriert werden weil sie statistisch erschlagen werden. Dann kann man ein paar (Top-)Engines testen und sehen was herauskommt. Stimmt es mit dem Stil überein, nach allgemeiner Wahrnehmung? Sind die Stärkeprofile die sich abzeichnen, anhand praktischer Partien bisher so erkannt worden? Welche Engine soll ich, zumindest als kompetente zweite Meinung, für Stellungen des jeweiligen Typs in der Analyse heranziehen...?

Eine Titanenaufgabe!

[/quote]

Genau, persönlich glaube ich allerdings nicht, dass der menschliche Zeitaufwand, bis der Test steht, gemeinsam mit dem danach und dem Hardware- Strom- Zeiteinsatz nach einer Weile des Einlaufens, auch nur größenordungsmäßig mit dem vergleichbar wäre, was jetzt schon an Partiezahlen notwendig ist, um auch nur Houdini, Critter, Stockfish, Komodo , Ivan und Rybka (wird die dann denn auch irgendwann wieder weiterentwickelt, ansonsten setzen wir statt ihr einfach willkürlich einen der anderen Hoffnungsträger ein, die sie jetzt schon überholen und auch irgend einen Namen haben dürfen) auf die Dauer weiter voneinander zu unterscheiden, wenn man sie nur immer weiter grundstellungsnahe ausgeglichene Eröffnungen gegeneinander ausspielen lässt.
Diese Elo sind keine Zählos mehr, du kannst dir nix mehr drum kaufen, sie dienen nur noch dem automatischen Tuning der einander ohnehin immer ähnlicher werdenden Weiterentwicklungen, so werden mit ihnen die Entwicklungen und die derartigen Elo immer weniger wert.

Allein durch das Zugrundelegen von Stellungen, wie sie dir für den Stellungstest vorschweben und sonst den gleichen Ausspielregeln wie jetzt für die Ranglisten, hättest du mit sehr viel weniger Stellungen als du sie für den Stellungstest brauchst (der müsste ja schon deshalb sehr sehr umfangreich sein, damit das direkte Tunen der engines nicht auf einzelne erfolgen könnte, ein Problem, das die Veröffentlichung von handverlesenen Eröffnungsstellungen für Ranglisten ja aber jetzt auch schon verbietet) sofort eine viel geringere Remisquote, eine wieder viel höhere Merkmalsdifferenz und bräuchtest sofort wieder viel weniger Partien, um zur selben Signifikanz zu kommen, wie jetzt mit den grundstellungsnahen ausgeglichenen Stellungen allein.

Witz am Rande: keine Ahnung, ob z.B. Ingos Ausgangsstellungen nicht ohnehin einen guten Schritt weit in diese Richtung gehen, er kann sie ja nicht herzeigen, ebenso wenig wie die Partien.
Ich hab kein Problem damit, ich mutmaße nur einfach, es wären mir persönlich einfach zu wenige und zu wenig bunt gestreute und an die auch viel verwendete Alternative des breiten Kurzbuches glaube ich in Zeiten, in denen 5 Züge der gängigen Eröffnungen von den meisten engines in Sekunden von der Grundstellung aus im hash sind, ebenso wenig.
Das beste, was ich im Ansatz in die geschilderte Richtung sehe, ist Frank Quisinskys Datenbank, auch da finde ich aber die kategorische Beschränkung auf 8 Züge zu knapp und das Prinzip, die Auswahl einer bestimmten eval einer einzelnen engine zu überlassen, ist für mich auch kontraproduktiv, vor Allem das verfluchte "Ausgeglichen", Schach ist ohnehin schon halb remistod, da muss man doch nicht ständig mit den engines an nichts anderem arbeiten, als jede Spannung weiter herauszunehmen, indem man nur win or save draw mit den entsprechend möglichst restrikiven Testmethoden zu belohnt.
Nicht deine und meine Ideen sind willkürliche Selektion pur, die gängigen Testmethoden sind es.

By Thomas Müller Date 2013-06-19 19:36

kannst du mal was im MV=2 modus laufen lassen?
Da ist was komisch....
die CCT ist nach ca. 2min bei 22 plys und die MP nach >5min noch bei 21 plys ?!