Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Wieviel Züge brauchen gute Engines bis zum Matt?
1 2 Previous Next  
Parent - - By Ingo Althöfer Date 2014-10-23 19:18
Lieber Herr Jenkner,

Olaf Jenkner schrieb:

Das weiße Spiel gefällt mir nicht. Er läßt sich viel zu sehr Zeit
und achtet sorgsam darauf, seinen hohen Materialvorteil zu behalten.


es spricht ja nichts dagegen, an passenden Stellen einen
"menschlichen" Zug einzufügen und zu schauen, wie
sich das auswirkt.

Viele Grüsse, Ingo Althöfer.
Parent - - By Olaf Jenkner Date 2014-10-24 12:27
Lieber Herr Althöfer,

das würde ich gerne machen. Ich habe leider kein Schachprogramm.

Ein schönes Wochenende
Olaf Jenkner
Parent - - By Dithyrambus Date 2014-10-24 12:45
Hallo Olaf,

glückwunsch!
Dadurch sparst du viel zeit für viele andere wichtige dinge im leben. 

Viele grüße
Horst

PS.
Wie hältst du das durch?
Parent - By Olaf Jenkner Date 2014-10-24 14:45
Dithyrambus schrieb:

Wie hältst du das durch?

Das ist nicht schwer, weil ich mich nur wenig für Partieschach interessiere.
Bei unserer Extremstellung sieht es anders aus, sowas interessiert mich.
Parent - By Ingo Althöfer Date 2014-10-24 15:50
Lieber Herr Jenkner, liebe Motorensammler,

Olaf Jenkner schrieb:

das würde ich gerne machen. Ich habe leider kein Schachprogramm.


ich oute ich mal. Zwar habe ich einige lauffähige Programme.
Das aktuellste davon ist allerdings ChessTiger 15 aus dem Jahr
2002. Für meine bescheidenen Zwecke reicht das noch.

Ingo Althöfer.
Parent - - By Horst Sikorsky Date 2014-10-23 21:18
<er> ist nur ein Motor und kein Michael Tal
ein Problem ist, auf Arena rochieren die Motoren nicht.
Horst
Parent - - By Michael Scheidl Date 2014-10-23 21:59
Zitat:
ein Problem ist, auf Arena rochieren die Motoren nicht.

Wahrscheinlich stimmt die FEN f.d. Startposition nicht. Mit weißen Rochaderechten wäre korrekt:

1nb1kbn1/pppppppp/8/8/8/8/PPPPPPPP/RNBQKBNR w KQ - 0 1
Parent - By Horst Sikorsky Date 2014-10-23 22:02
aha muss ich ändern
Danke
Parent - - By Peter Martan Date 2014-10-24 05:50 Edited 2014-10-24 06:39
Vielleicht gefällt dir die dann besser, Olaf.

[Event "240m+30s"]
[Site "Dort"]
[Date "2014.10.24"]
[Round "1"]
[White "Zappa Mexico II x64 Aggressor Dissident"]
[Black "Stockfish 231014 64 SSE4.2"]
[Result "1-0"]
[Annotator "12 threads each, ponder on"]
[SetUp "1"]
[FEN "1nb1kbn1/pppppppp/8/8/8/8/PPPPPPPP/RNBQKBNR w KQ - 0 1"]
[PlyCount "45"]

1. d4 d6 2. Qd3 Nf6 3. e4 a6 4. e5 Nfd7 5. Qxh7 dxe5 6. dxe5 Nxe5 7. Nf3 Nxf3+
8. gxf3 Nc6 9. Rg1 Nd4 10. Rxg7 Bf5 11. Qh8 Nxc2+ 12. Kd1 Nd4 13. Rg8 Bc2+ 14.
Kd2 Nc6 15. Rxf8+ Kd7 16. Kxc2 f6 17. Be3 a5 18. Bh3+ f5 19. Bxf5+ e6 20. Qf6
Nb4+ 21. Kd1 c5 22. Qxe6+ Kc7 23. Rc8# 1-0

Auch in dieser reinen engine- Partie verschenkt Schwarz zumindest bei 11...Sxc2+ zwei Züge, 11...Sxf3+ macht wieder einen 25- Züger draus:



Analysis by Zappa Mexico II x64:

11...Sxf3+ 12.Kd1 Se5 13.Lf4 Sd7 14.Lc4 b5 15.Lxf7+ Kd8 16.Tg8 Lg4+ 17.Kd2 e5 18.Txf8+ Ke7 19.Te8+ Kd6 20.Dh6+ Sf6 21.Dxf6+ Le6 22.Txe6+ Kc5 23.c3 Kc4 24.Txe5#
  +-  (#13)   Tiefe: 24   00:00:01  0kN

Dem Weißen mit 7...Sxf3+ die g-Linie zu öffnen, wirkt wohl auch verdächtig, hingegen diesen Springer nicht zu nehmen, hat natürlich auch Folgen:



Analysis by Zappa Mexico II x64:

7...Sbc6 8.Sxe5 Sxe5 9.Sc3 c6 10.Dh5 Sd7 11.Lc4 g6 12.Lxf7+ Kxf7 13.Dh7+ Ke8 14.Lg5 Sc5 15.Dxg6+ Kd8 16.0-0-0+ Sd7 17.Lxe7+ Lxe7 18.The1
  +-  (16.58)   Tiefe: 21/61   00:03:43  2380MN

Und dann fragt man sich, ob es von Schwarz überhaupt gut ist, Sf6 in der Eröffnung zu ziehen wie hier schon bei 2...

P.S. Der Name Aggressor Dissident stammt von Robert Flesher für sein Zappa- Setting, ich hätte ihn hier eigentlich nicht wirklich verwenden dürfen, weil Fleshers Evals originärer Weise die Bauern- und Freibauern- Bewertung auch verändert haben, das beizubehalten war zunächst bei dieser Stellung ein Fehler, scheint mir jetzt, hätte mir eigentlich klar sein sollen, ich dachte aber halt, den Figurenwert relativ dazu geringer zu achten, hätte vielleicht auch was für sich.
Außerdem bin ich mir nicht mehr sicher, wie hoch welche Parameter bei Flesher genau eingestellt waren.
Parent - - By Peter Martan Date 2014-10-24 07:16 Edited 2014-10-24 07:28
Peter Martan schrieb:

Auch in dieser reinen engine- Partie verschenkt Schwarz zumindest bei 11...Sxc2+ zwei Züge, 11...Sxf3+ macht wieder einen 25- Züger draus:
...
11...Sxf3+ 12.Kd1 Se5 13.Lf4 Sd7 14.Lc4 b5 15.Lxf7+ Kd8 16.Tg8 Lg4+ 17.Kd2 e5 18.Txf8+ Ke7 19.Te8+ Kd6 20.Dh6+ Sf6 21.Dxf6+ Le6 22.Txe6+ Kc5 23.c3 Kc4 24.Txe5#
  +-  (#13)   Tiefe: 24   00:00:01  0kN


Das war natürlich übertrieben, wie man am Output sieht, ist es nur ein verschenkter Zug und 24 Züge bis zum Matt sind es insgesamt.
Immerhin ist das auch die erste Variante, bei der es gelingt, die Mattansage beim backward solving bis vor den 10. Zug im hash mitzunehmen:



Analysis by Zappa Mexico II x64:

10.Txg7 Sxf3+ 11.Kd1
  +-  (#15)   Tiefe: 20/55   00:00:45  34929kN

Leider ist die HV dann nur noch kurz, aber gibt man noch einen ganzen Zug davon wieder ein,sind die 24 wieder komplett da:

2b1kb2/1pp1ppRQ/p7/8/8/5n2/PPP2P1P/RNB1KB2 w Q - 0 1

Analysis by Zappa Mexico II x64:

11.Kd1 Lxg7 12.Dxg7 Lf5 13.Lg2 Lxc2+ 14.Kxc2 Se1+ 15.Kb3 Sxg2 16.Dxg2 f6 17.Dg8+ Kd7 18.Le3 b5 19.Sc3 c5 20.Td1+ Kc7 21.Dd8+ Kc6 22.Dc8+ Kb6 23.Lxc5+ Ka5 24.Dc7#
  +-  (#14)   Tiefe: 20   00:00:01  0kN

Was ich noch erwähnen wollte: das 9...Sd4 unmittelbar vor der letzten Output- Stellung könnte natürlich auch ein Fehler gewesen sein von Stockfish. (Mit 9...g6 anstatt dessen halte mich mittlerweile z.B. wieder bei 26 Zügen.) Aber man beachte, dass das die Version ist, die jetzt im TCEC spielt und für Stage 2 eigens aufgerüstet wurde, und dass die Bedenkzeit nicht gerade kurz war für die Hardware, beide engines hatten je 8G hash zur Verfügung.
Parent - - By Horst Sikorsky Date 2014-10-24 09:42
(Mit 9...g6 anstatt dessen halte mich mittlerweile z.B. wieder bei 26 Zügen.)
Sehr gut!! deine Analysen-ein Meilenstein in Richtung Wahrheit
Parent - - By Peter Martan Date 2014-10-24 10:05 Edited 2014-10-24 10:26
Junger Schelm!

Man könnte auch eine Rangliste anhand der besagten Ausgangsstellung erstellen, endlich einmal eine genaue stellungsabhängige Spielstärkenmessung:
Es zählen nicht nur die ganzen und die halben (gäb's hier ja wohl eh nicht viele ) Punkte, sondern auch der Durchschnitt der Partielänge mit Weiß und mit Schwarz für die Elo.

P.S. Warum macht man das nicht schon längst auch so von der normalen Grundstellung aus, wär doch mit viel weniger Partien zur gleichen Errorbar machbar, weil die Merkmalsdifferenz der statistischen Messwerte viel größer wäre als bei ausschließlich 1, 0, 1/2, vor allem, wenn man bei den Remis auch die Zahl der Züge mitentscheiden ließe. Längeres Remis wird bei Weiß abgezogen und bei Schwarz dazugezählt.
Stellungsabhängige Spielstärkenmessung von der Grundstellung aus inform eines exakten, auf single core vielleicht sogar halbwegs reproduzierbaren und jedenfalls Partiezahl sparenden ausgespielten Stellungstests. Und anhand der Dubletten könnte man auch gleich die similarity zwischen verschiedenen engines ablesen.
Parent - - By Kurt Utzinger Date 2014-10-24 13:37
Interessanter Thread, aber als Pragmatiker ist es mir völlig wurst, in wievielen
Zügen es Matt wird; Matt ist Matt. Und wenn der Computer ein Matt in
22 Zügen schneller findet als das ebenfalls möglich Matt in 15 Zügen, dann
müsste die schnellste Mattanzeige bei der Elo-Berechnung berücksichtigt
werden, oder
Mfg
Kurt
     
Parent - By Peter Martan Date 2014-10-24 14:05 Edited 2014-10-24 14:08
Kurt Utzinger schrieb:

Und wenn der Computer ein Matt in
22 Zügen schneller findet als das ebenfalls möglich Matt in 15 Zügen, dann
müsste die schnellste Mattanzeige bei der Elo-Berechnung berücksichtigt
werden, oder


Naja, Kurt, Ansichtssache.
Bei der Mattsuche einer Aufgabe #in-soundsoviel Zügen gälte ja alles außer der korrekten Lösung gar nicht.
Hast du hingegen eine Bedenkzeitvorgabe bei einer Partie und die engine findet in der Zeit, die ihr zur Verfügung steht, nur irgendein Mattbild, fände ich es auch noch löblicher von ihr, wenn der Weg zum Matt dann noch ein möglichst kurzer wäre.
Würde man wirklich in eng-eng-games die Partielänge für die Elo mitzählen, könnte es sich je nach GUI- Einstellungen ja aber ohnehin nur um wenige Züge Unterschied handeln und statistisch über mehrere Hin- und Rückpartien wohl keine entscheidende Rolle spielen.
Parent - - By Ingo Althöfer Date 2014-10-24 15:47
Hallo,

Peter Martan schrieb:

Man könnte auch eine Rangliste anhand der besagten Ausgangsstellung erstellen,
endlich einmal eine genaue stellungsabhängige Spielstärkenmessung:
Es zählen nicht nur die ganzen und die halben (gäb's hier ja wohl eh nicht viele )
Punkte, sondern auch der Durchschnitt der Partielänge mit Weiß und mit Schwarz
für die Elo.


ein sehr interessanter Vorschlag.

Frage zur konkreten Umsetzung:
Wie wollen wir Partielängen (für diese einseitige Startstellung)
in Wertungszahlen umsetzen?

Gruss, Ingo Althöfer.

PS. Diese Wertungszahlen müssten ja nicht unbedingt eng an
den klassischen Elo-Zahlen hängen.
Parent - - By Michael Scheidl Date 2014-10-24 16:04
Die Anzahl der Züge selbst genügt. Wir könnten ein gleichbleibendes solides Gegnerfeld definieren, nicht notwendigerweise aus einer Handvoll allerstärkster sondern eventuell auch gemischt, gegen die jeder Testkandidat antritt, fünfmal oder so. Der Durchschnitt der Zügezahl bis zum Matt ist das Rating.

Zu den sonstigen Bedingungen würde ich keine ultralangen Zeiten und/oder -zig Cores usw. vorschlagen, eher im Gegenteil, aber das ist vermutlich nicht mehrheitsfähig.

Gute Reise!
Parent - By Ralf Mueller Date 2014-10-24 17:08
Dann wäre ich aber dafür, dass auch Settings zugelassen sind (spezielle Stellung --> spezielles Setting).
Parent - - By Peter Martan Date 2014-10-24 16:46 Edited 2014-10-24 16:55
Schließe mich Michael Scheidl an, vorausgesetzt, die Unterschiede in den Zugzahlen wären groß genug, dass sich allein aus der durchschnittlichen Partielänge schon eine eindeutige Rangliste ergäbe. Soviele Züge, wie eine engine in einem bestimmten Kollektiv für die weiße Seite durchschnittlich braucht, werden von derjenigen Zugzahl, die sie für die schwarze Seite durchhält, abgezogen.
Verliert sie meistens schneller als die anderen und oder braucht sie länger zum Gewinn, ist sie je nachdem mehr im Minus oder im Plus, die Wertungszahl selbst hängt damit einfach vom Teilnehmerfeld ab.

Was halten Sie eigentlich davon, das auch mit der normalen Grundstellung so zu versuchen?
Um Dubletten müsste man sich ja nicht kümmern, bzw. könnte sie auch einfach zur Kenntnis nehmen, bei unserer besonderen Ausgangsstellung ja erst recht, Ähnlichkeit im Spiel verschiedener engines je nach Zahl und Länge der Dubletten- Varianten wäre eventuell , was die Ähnlichkeit der Programmstrukturen angeht, durchaus auch nicht ganz uninteressant.

Bei der normalen Grundstellung könnte man den Remis hingegen z.B. einen Schlüssel von einem halbem Wertungspunkt als Plus pro Zug für Schwarz und als Minus für Weiß anschreiben, beim Gewinn oder Verlust wiederum einen ganzen oder ev. auch mehr, wenn man die entschiedenen Partien stärker werten wollte als die unentschiedenen.
Parent - - By Michael Scheidl Date 2014-10-24 16:58
Ich sehe nicht warum wir die Verteidigungsleistung einbeziehen sollten. Hängt natürlich von der angestrebten Aussage des Experimentes ab... Bei "Wer ist der schnellste Killer" interessiert das Durchhaltevermögen mit Schwarz nicht, und würde auch die ganze Sache vereinfachen/verkürzen.

Man muß nicht alles komplizierter machen als es ohnehin schon ist. KISS, sagen die Programmierer gerne.
Parent - By Peter Martan Date 2014-10-24 17:21
Wenn es dich nur interessiert, wie gut eine engine in einer bestimmten Stellung als Killer ist, musst du dich natürlich um die Verteidigungsleistung nicht kümmern, aber selbst wenn du nur die weißen Züge zählst, hängen die ja auch davon ab, gegen welche wie gut verteidigenden engines du antreten lässt.
Mich würde prinzipiell schon auch immer interessieren, ist eine engine nur gut im Angriff, z.B. auch, weil ich ihr in der Anlassstellung ruhig den Contempt auf maximal stellen kann, oder geht das dann für die schwarze Seite doch auch gleich messbar in die Hose.
Und soo viel weniger simpel (im Sinne von KISS) ist es ja auch nicht, wenn du schon beim Züge- sprich Punktezählen bist, wenn du dieselben Züge, die du für Weiß zählst, für Schwarz gleich mitaufschreibst (in unserem Fall, wo's keine Remis geben wirst, müsstest du sie gar nicht extra zählen ).
Ein weiterer großer Vorteil wäre auch, dass sich das Gegenrechnen für die schwarze Seite in einer Verdopplung der Merkmalsdifferenz auswirkte, du bräuchtest, wolltest du einfach nur die Partienzahlen für eine Rangliste relativ zum Teilnehmerfeld vom Statistiker wissen, zwar vielleicht nicht nur die Hälfte Partien, aber sicher um einiges weniger für die gleiche Power der Statistik. (Dazu bin dich diesbezüglich zu wenig gebildet, das war auch bei den wenigen Statistiken, an denen ich mitmachen musste, immer das, was ich mindestens den Statistiker fragen musste, wie große Datenmengen brauchen wir für welche Errorbar.)
Also simpel würde ich sagen gleichermaßen so oder so gerechnet, und viel weniger stupid mit Schwarz und Weiß extra wohl auch nicht.
Parent - - By Olaf Jenkner Date 2014-10-24 17:32
Natürlich muß Schwarz optimal verteidigen.
Man könnte mit dieser Stellung die aggressivste Maschine und auch den zähesten Verteidiger ermitteln.
Wer startet ein Turnier?
Parent - - By Michael Scheidl Date 2014-10-24 19:06
Zitat:
Wer startet ein Turnier?

Niemand, herumreden ist einfacher
Parent - By Horst Sikorsky Date 2014-10-24 22:21
Michael Scheidl schrieb:

Zitat:
Wer startet ein Turnier?

Niemand, herumreden ist einfacher

gute Analysen gehören auch dazu.
das Allen reicht aber nicht! Turniere sind wichtig!

ich mache erst einmal 10 Tage Urlaub 
Horst
Parent - By Peter Martan Date 2014-10-24 23:16 Edited 2014-10-24 23:34
Olaf Jenkner schrieb:

Wer startet ein Turnier?


Andreas Strangmüller hat schon ein sehr umfangreiches dazu abgewickelt, Olaf.
Das sind halt nur Stockfish und Komodo, glaube ich, aber wenn du jetzt zwischen den beiden einen bestimmten Abstand an durchschnittlicher Zugzahl für Schwarz minus der von Weiß hast, kannst du den wohl auch in Elo ausdrücken, sozusagen als Matchperformance, wenn du ihre Werte, die sie sonst in den Ranglisten haben, zugrunde legst.
Aber was dann weiter?
Du kannst beliebig viele engines deines Interesses dazu nehmen, es bleiben immer nur Relationen zwischen den teilnehmenden engines, das Umrechnen in Elo wäre also völlig sinnlos, auch wenn es im Grunde dasselbe Prinzip wie bei allen anderen Ranglisten wäre.

Der Frage, wieviele Züge die Stellung bei optimalem Spiel hergibt, käme man damit nicht näher und wie sehr die Ergebnisse immer noch Interpretationssache wären, sehen wir gerade an den letzten postings.

Als Stellung um mithilfe von Partielängen die Spielstärkerelationen in Abhängikeit von ihr (der Stellung) festzustellen, ist sie mir zu ausgerissen, wenngleich das wahrscheinlich gerade das ist, was dich an ihr interessiert. Wenn, würden bei mir wieder einmal vor allem Settings mitspielen, und die interessieren wieder sonst niemanden, weil sie in den Ranglisten, die allgemeine Spielstärke abbilden sollen, nicht vorkommen.
Will ich hingegen wieder in erster Linie deren stellungsabhängige relative Leistung sehen, mache ich das anhand von Output- Varianten und -Evals, dazu muss ich nicht die ganzen Partien ausspielen.
Das war ja hier auch irgendwie das besondere an der Stellung, noch nicht beweisbar in einer bestimmten Zugzahl gewonnen, aber nahe dran.


Wenn ich so ein Turnier starte, dann von der normalen Grundstellung aus, dass ich die Ergebnisse dann allerdings veröffentliche, glaube ich eher nicht, es sei denn, sie unterscheiden sich wirklich erstaunlich von dem der "normalen" Ranglisten, was ich nicht glaube.
Sind sie sehr ähnlich, bräuchte ich dennoch einen Statistiker, der mir sagt, wie groß die Partiezahlen sein müssten, um Errorbars zu erreichen, wie sie ohne Berücksichtigung der Zugzahlen gefragt sind.
Gäbe es wirklich größere Unterschiede von der Grundstellung aus zu den gängigen Ranglisten, könnte man das auch als Indiz dafür sehen, dass die engines, die durch Einrechnen der Partielängen stärker gewännen, mehr Stärken in der Eröffnung und im frühen Mittelspiel haben.
Das wieder würde bedeuten, die, die nur durch ganze und halbe Punkte stärker dominieren (so es denn wirklich andere wären), müssten dafür im späteren Mittelspiel und im Endspiel stärker sein.
Parent - - By Dithyrambus Date 2014-10-24 19:12 Edited 2014-10-24 19:15
Hallo Michael,

das ganze erinnert stark an den sogenannten Initiativtest aus den späten siebziger, frühen achtziger jahren.
Hans-Peter Ketterling nahm ihn als ein kriterium für die beurteilung der damaligen ersten schachcomputer.
Dabei sollten die rechner mit schwarz aus der grundstellung heraus mattsetzen, während weiß gar nichts tat.
Es gab damals tatsächlich viele schachcomputer, die es erlaubten, immer wieder die seite zu wechseln, ohne selbst gezogen zu haben. Oder solche, die nullzüge a1-a1 akzeptierten. Ersatzweise zog man mit weiß Sa3 - Sc1 - Sa3 immer hin und her. Abweichend war bei einem schachgebot ein abwehrzug durchzuführen.
Ich zitiere aus Ketterling, Schwenkel, Weiner: Schach dem Computer (München, 1980): "Setzt er in deutlich weniger als zehn Zügen matt, ist das ein Zeichen für Aggressivität; initiativ, aber nicht halsbrecherisch spielende Geräte benötigen etwa zehn Züge. Bis zu zwanzig Züge deuten auf Zurückhaltung und Sicherheitsbedürfnis, bei über dreißig Zügen kann man jedoch getrost von einem Mangel an Initiative sprechen."
Es ging dabei also keinesfalls um die spielstärke des programms, sondern um seinen spielstil, wie der name sagt, um die initiative.

Und mehr würde eine partienserie aus der "Althöfer-Stellung" (Der begriff hat hiermit einzug in die fachliteratur gefunden!  ) heraus meiner meinung nach auch nicht nachweisen, als die unterschiedlichen "temperamente" der programme.

Viele grüße
Horst
Parent - - By Michael Scheidl Date 2014-10-24 19:41 Edited 2014-10-24 19:46
Der Initiativtest hatte ausgedient, sobald die Engines oder Programme gute Gegenzüge ordentlich in Betracht zogen, also nicht mehr so agierten als würde der Gegner zwischendurch nicht auch hin und wieder ziehen dürfen... Natürlich konnte eine Engine mit überagressiven aber blöden Zügen schneller mattsetzen als bessere, aber das hat dann nichts sinnvolles mehr ausgesagt. Außer vielleicht daß eine Engine zu blind für Gegenzüge war.

Dann war's nur noch "ein Schas mit Quasteln" wie wir in Wien sagen.

P.S. Für die norddeutschen, "ein geschmückter Furz" quasi.
Parent - - By Peter Martan Date 2014-10-24 20:28 Edited 2014-10-24 20:36
Michael Scheidl schrieb:

Dann war's nur noch "ein Schas mit Quasteln" wie wir in Wien sagen.

P.S. Für die norddeutschen, "ein geschmückter Furz" quasi.


Du bist mir immer wieder, auch und gerade in dunklen Stunden wie dieser, eine Quelle der tröstlichen Erheiterung.

So pointiert wie du das nennst, hätte ich nicht besser sagen können, wie sehr mir das vollkommen anders vorkommt, was Ralf Müller und Horst als scheinbar ähnlichen Ansatz meinen, zu dem, was ich einfach immer wieder mit Stellungsabhängigkeit von jeder Art gemessener Spielstärke meine.
Ich will nicht wissen, wie schnell eine engine einen inferioren Gegner fertig macht, der im Extremfall gar nix macht oder noch besser (schlechter) möglichst böde Fehler, ich will einfach wissen, wie lang oder kurz sie braucht bis zum Partieende im direkten Vergleich gegen eine andere engine, die ansonsten in nichts gehandicapt wird, als durch eine schlechtere Ausgangspostion, oder auch nicht einmal dadurch.

Auch von der normalen Grundstellung aus habe ich keine Möglichkeit, Spielstärke zu messen anders als durch den Vergleich mit anderen engines, seit die Menschen nicht mehr gegen engines antreten .
So wie die Ergebnisse davon abhängen, welche engines ich aussuche, hängen sie davon ab, was für Ausgangsstellungen ich vorgebe.
Was liegt näher, als das für einzelne Stellungen einzeln zu untersuchen, ich müsste mir dann nur noch im Klaren sein, dass auch diese Rangliste immer noch nur für das jeweilige einzelne Teinehmerfeld gilt.
Ich müsste mich von der Elosion befreien, was herauskommt, wäre irgendwie mit dem vergleichbar, was herauskäme, wenn Menschen mitspielten, wenn ich nicht nur Eröffnungs- sondern auch Mittelspiel- und Endspielstellungen als Ausgangsstellungen nähme, wenn ich mich nicht auf annähernd ausgeglichene Stellungen beschränkte, und wenn ich einfach ganz andere Teilnehmer nähme.

Und weil du meinst, reden ist einfacher und beliebter als machen, wundert dich wirklich, wenn ich da nicht gleich weiter loslege mit einem Turnier, wenn ich schon vorher genau weiß, das Ergebnis dieser einen Stellung, um die's jetzt gerade geht, interessiert mich selbst nicht mehr wirklich?
Von der weiß ich ohnehin schon jetzt genauer, wieviele Züge es in gewissen Grenzen dauert, wenn da annähernd fehlerfrei gespielt wird, als ich das in halbwegs kurzen Bedenkzeiten statistisch herausfinden werde. Darum ging's Prof. Althöfer ursprünglich, das haben wir, vor allem Horst Sikorsky und ich, bin ich mir ziemlich sicher, so genau festgelegt, wie man das heutzutage kann.
Ein Rating, wie ich es gerade für die Grundstellung überlege, interessiert ja doch keinen.

Umso weniger fühle ich mich persönlich da zu irgendwelchen weiteren Großtaten motiviert, wenn gleich mal wieder an der einfachen Idee von Prof. Althöfer, bei einer Stellung nicht nur drauflos spielen zu lassen, sondern auch zu schauen, wie viele Züge lang wird das wohl dauern, 10 verschieden Leute gleich mal wieder 10 völlig verschiedene eigene Ideen haben, was daraus praktisch zu machen wäre und was es bedeutete?

Hast du dir irgendeine der Varianten, die ich da in den letzten Tagen gepostet habe, angeschaut?
Hast du eine Idee, was mich das an Hardware- Zeitleistung gekostet hat und an Zeit, die ich selber vor dem PC gesessen bin?

Bezeichnend finde ich vor allem, dass der einzige, der da einfach mal weiter etwas machen würde, Olaf Jenkner ist, der kein Schachprogramm hat.
Parent - - By Olaf Jenkner Date 2014-10-24 23:46
Peter Martan schrieb:

Bezeichnend finde ich vor allem, dass der einzige, der da einfach mal weiter etwas machen würde, Olaf Jenkner ist, der kein Schachprogramm hat.


Ja, das ist leider so.
Ich habe aber den Gustav modifiziert, damit er außer dem Matt auch einen Figurengewinn als Matt ansieht.
Jetzt laufen zwei Versionen seit 25 Sunden und sind bei elf Zügen Tiefe und haben den Figurengewinn immer noch nicht. Es ist deprimierend...
Parent - By Peter Martan Date 2014-10-24 23:58
Olaf Jenkner schrieb:

Es ist deprimierend...


Ich hab mir schon gedacht, dass es dir um Gustav geht, man hat halt bei dem Ungleichgewicht das Gefühl, da müsste sich der Gewinn in Varianten zeigen lassen, die so wenige und so kurz sind, dass man einen Überblick über die Gewinnführung bekommen könnte, dieses Gefühl trügt aber im Schach immer wieder und an und für sich.

Ich persönlich will jetzt eigentlich schon eine Weile in erster Linie meine Ruhe haben von der Stellung.
Parent - By Ingo Althöfer Date 2014-10-26 16:56
Lieber Herr Jenkner,

Olaf Jenkner schrieb:

Ich habe aber den Gustav modifiziert, damit er außer dem Matt auch
einen Figurengewinn als Matt ansieht.


sehr interessant. Wie haben Sie da die Ruhesuche organisiert,
damit nicht irgendeine Fehlinterpretationen von ungeklärten
Stellungen passiert?

Viele Grüsse, Ihr
Ingo Althöfer.
Parent - - By Dithyrambus Date 2014-10-25 00:07 Edited 2014-10-25 00:11
Michael Scheidl schrieb:

Natürlich konnte eine Engine mit überagressiven aber blöden Zügen schneller mattsetzen als bessere, [...]


Ich bleibe bei meiner vermutung, dass weiß das kürzeste matt erzwingt, wenn es aggressiv abtauscht und sogar figuren gegen bauern opfert.

http://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=87524#pid87524
Parent - By Olaf Jenkner Date 2014-10-25 00:46
Das denke ich auch. Man kann wahrscheinlich einige Züge eher zum Matt kommen, als der Durchschnitt von 27-28 Zügen vermuten läßt.
Aber wie kann das bewiesen werden, zumal die wenigsten Foristen an diesem Thema interessiert sind?
Parent - - By Ralf Mueller Date 2014-10-24 17:10
Peter Martan schrieb:

Was halten Sie eigentlich davon, das auch mit der normalen Grundstellung so zu versuchen?

Ich hatte vor gar nicht allzu langer Zeit die Idee, die Aggressivität einer Engine zu bestimmen, indem ich gemessen habe, wieviel Züge sie durchschnittlich gegen eine rein zufällig agierende Engine aus der Grundstellung heraus bis zum Matt benötigt. Nach über 100 Partien pro Engine lag unerwartet "The Crazy Bishop" vorne (u.a. vor diversen supperaggressiven Sparksettings), was mich an der Methodik hat zweifeln lassen.
Parent - - By Peter Martan Date 2014-10-24 17:25
Na, das scheint mir aber schon eine etwas andere Untersuchung zu sein, so wie ich das verstehe, Ralf. Klingt nach der Frage, wie gut nutzt die engine die Blunders des Gegners, mag ja auch ein interessanter Messwert sein, aber mit eng-eng im Allgemeinen, so wie's normaler Weise gemacht wir, und woran ich ja gar nichts ändern will, von der der einzelnen Ausgangsstellung abgesehen, scheint's mir doch nicht viel zu tun zu haben.
Parent - - By Ralf Mueller Date 2014-10-24 18:44
Na dir ging es doch mit der Idee um die Frage, welche Engine am schnellsten eine schwächere Engine matt setzt, oder? Meine Idee ist identisch, nur konsequenter, indem sie als schwächere Engine eine zufällig agierende Engine. Ansonsten misst man nie nur die Aggressivität, sondern auch immer die Spielstärke mit.
Parent - - By Frank Brenner Date 2014-10-24 19:39
Ich stimme mit dir überein, dass man wenn man die Initiative einer Engine messen will viele Stellungen zugrunde legen sollte aus denen heraus gespielt wird und nicht nur eine.

Anstatt Zufallszüge würde ich eventuell zb einen Stockfish nehmen mit Suchtiefe 1

Auf Suchtiefe  1 sind das etwa 1400 ELO (ins blaue geraten). davon ausgehend kann man dann meinetwegen ein paar hundert vorgabestellungen wählen.

Gibt es eine GUI die Engine Turniere durchführt mit unterschiedlichen Bedenkzeitvorgaben?
Parent - By Ralf Mueller Date 2014-10-24 20:40
Die Chessbase GUI kann es, Arena kann es meines Wissens nach nicht.
Parent - By Peter Martan Date 2014-10-24 20:01
Ralf Mueller schrieb:

Ansonsten misst man nie nur die Aggressivität, sondern auch immer die Spielstärke mit.

Und genau das will ich auch, nämlich die stellungsabhängige solche (Spielstärke). Diese (auch die sogenannte allgemeine) Spielstärke kannst du eigentlich auch immer nur anhand bestimmter einzelner (seien es auch noch so viele) Stellungen und anhand des Vergleichs mit bestimmten anderen Gegnern (engines oder auch Menschen) messen.
Die Art von "Aggressivität", die du mit deiner Anordnung misst, ist die Fähigkeit, Fehler auszunutzen, dabei kannst du allerdings die Art der Fehler auch nur dadurch genau kontrollieren, dass du bestimmte Fehler in den Stellungen vorgibst, jeder Versuch, den Zufall regieren zu lassen, verwässert die Fragestellung nur.
So ist genau genommen auch jeder Versuch, eine "allgemeine Spielstärke" durch Simulation von möglichst unterschiedlichen, möglichst vielen Spielsituationen durch ein möglichst breites Eröffnungsset herbeizuführen und die Gegnerspielstärke durch ein möglichst buntes Teilnehmerfeld, nur ein Verwässern der einzelnen Fragestellungen und stellungs- und gegnerabhängigen Teilgebieten von Spielstärke.
Du musst einfach immer möglichst genau unterscheiden zwischen verschiedenen Fragestellungen und den dementsprechend möglichst genauen Testanordnungen, wenn du möglichst genaue Antworten willst mit möglichst kleinen Datenmengen.
Die Zügezahl als Kriterium aller möglicher Ergebnisse von Schachpartien heranzuziehen, ist ein von all diesen Überlegungen völlig unabhängiger Ansatz.
Parent - - By Horst Sikorsky Date 2014-10-23 19:13
Aus vielen Partien wird ein Eröffnungsbaum.
Horst
Parent - By Horst,S Date 2014-10-24 15:54
Kaffeehausschach mit drei Schwerfiguren mehr 
[Event "?"]
[Site "?"]
[Date "2014.10.24"]
[Round "?"]
[White "Peter, M."]
[Black "Analyse"]
[Result "*"]
[Annotator "Horst"]
[SetUp "1"]
[FEN "1nb1kbn1/pppppppp/8/8/8/8/PPPPPPPP/RNBQKBNR w KQ - 0 1"]
[PlyCount "51"]
[EventDate "2014.10.24"]

1. d4 d6 2. Qd3 Nd7 (2... Nf6 3. e4 a6 4. e5 Nfd7 5. Qxh7 dxe5 6. dxe5 Nxe5 7.
Nf3 Nxf3+ (7... Nbc6 8. Nxe5 Nxe5 9. Nc3 c6 10. Qh5 Nd7 11. Bc4 g6 12. Bxf7+
Kxf7 13. Qh7+ Ke8 14. Qxg6+ Kd8 15. Be3 b6 16. O-O-O Kc7 17. Rxd7+ Bxd7 18. Rd1
Bc8 19. Qe8 Kb7 20. Bf4 b5 21. Rd7+ Kb6 22. Qd8+ Kc5 23. Ne4+ Kc4 24. Rd4#) 8.
gxf3 Nc6 9. Rg1 Nd4 (9... g6 10. Qh8 Bf5 11. Bh6 Ne5 12. Qxf8+ Kd7 13. Nd2 Bd3
14. Bxd3 f6 15. Rxg6 Nxg6 16. Bxg6 Kc6 17. Qe8+ Kd5 18. Qd7+ Kc5 19. Be3+ Kb4
20. c3+ Ka5 21. b4#) 10. Rxg7 Nxf3+ (10... Bf5 11. Qh8 Nxc2+ (11... Nxf3+ 12.
Kd1 Ne5 13. Bf4 Nd7 14. Bc4 b5 15. Bxf7+ Kd8 16. Rg8 Bg4+ 17. Kd2 e5 18. Rxf8+
Ke7 19. Re8+ Kd6 20. Qh6+ Nf6 21. Qxf6+ Be6 22. Rxe6+ Kc5 23. c3 Kc4 24. Rxe5#)
12. Kd1 Nd4 13. Rg8 Bc2+ 14. Kd2 Nc6 15. Rxf8+ Kd7 16. Kxc2 f6 17. Be3 a5 18.
Bh3+ f5 19. Bxf5+ e6 20. Qf6 Nb4+ 21. Kd1 c5 22. Qxe6+ Kc7 23. Rc8#) 11. Kd1
Bxg7 12. Qxg7 Bf5 13. Bg2 (13. Qg8+) 13... Bxc2+ (13... Be4) 14. Kxc2 Ne1+ 15.
Kb3 Nxg2 16. Qxg2 f6 17. Qg8+ Kd7 18. Be3 b5 19. Nc3 c5 20. Rd1+ Kc7 21. Qd8+
Kc6 22. Qc8+ Kb6 23. Bxc5+ Ka5 24. Qc7#) 3. Qxh7 Ngf6 4. Qh8 b6 (4... c5) 5. e4
(5. Nc3 Bb7) 5... Nxe4 6. h4 Nef6 7. h5 Bb7 8. h6 gxh6 9. Rxh6 a6 10. Rxf6 (10.
g4) 10... Nxf6 11. Bh6 Nd7 12. c4 Bc6 13. d5 Bb7 14. Nf3 b5 15. Bxf8 Nxf8 16.
Ng5 bxc4 17. Nh7 Bxd5 18. Nc3 c6 19. Qxf8+ Kd7 20. O-O-O f6 21. Nxf6+ exf6 22.
Qg7+ Ke6 23. Re1+ Kf5 24. g3 Be4 25. Bh3+ Ke5 26. Rxe4# *
Parent - - By Peter Martan Date 2014-10-23 21:46 Edited 2014-10-23 22:15
23...Sexg6 verschenkt 2 Züge, ...Sfxg6 oder...c5 ist erst im 28. Zug Matt.
Hingegen ist 20....Kd7 schon ein direkt grober Fehler (), der gleich ganze 6 (4, wenn man den bei 23. vermieden hätte) Züge kostet:



Analysis by Zappa Mexico II x64:

20...Sd7 21.Dd6 Sf5 22.Sxf7 Sxd6 23.Sxd6+ Ke7 24.Txg6 Sxe5 25.Lf8+ Kxf8 26.dxe5 Lxh4 27.h6 Lg5+ 28.Txg5 d4 29.h7 dxc3+ 30.Kxc3 b5 31.h8D+ Ke7 32.De8#
  +-  (#12)   Tiefe: 23/65   00:01:55  1626MN

Und siehst du, Horst, schwupps hast du auch mal eine über 30 gebaut, mit 18...Le7 statt Se7 wird's noch länger.
Parent - - By Horst Sikorsky Date 2014-10-23 22:31
ich bin unschuldig   
das sind Motoren Partien  
Parent - - By Peter Martan Date 2014-10-23 23:27
Ach ja, es ging Herrn Professor Althöfer ja auch nur um solche.
Parent - - By Ingo Althöfer Date 2014-10-24 15:45
Lieber Herr Martan, lieber Herr Sikorsky,

Peter Martan schrieb:

Ach ja, es ging Herrn Professor Althöfer ja auch nur um solche.



das war zumindest meine ursprüngliche Frage. Aber jetzt,
wo wir durch die Motoren wissen, was der grobe Rahmen ist,
sind meine Ansprüche gewachsen, und ich würde schon etwas
mehr von der ganzen Wahrheit wissen wollen.

Frage: Können wir durch Mensch-Computer-Analyse herausfinden,
was die wahrscheinliche Zugzahl bis zum Matt ist, wenn beide
Seiten optimal spielen?

Viele Grüsse (von jemandem, der in ein paar Minuten in
einen Zug steigt),
Ingo Althöfer.
Parent - By Peter Martan Date 2014-10-24 16:27
Ingo Althöfer schrieb:

Frage: Können wir durch Mensch-Computer-Analyse herausfinden,
was die wahrscheinliche Zugzahl bis zum Matt ist, wenn beide
Seiten optimal spielen?


Naja, Herr Professor, genauer als wir es schon wissen, wohl nicht leicht. Man könnte natürlich eine Serie von Fernschachpartien daraus machen, um es weiter einzugrenzen, dazu fänden wir aber wohl nicht leicht gute Fernschachspieler, denen das die Zeit wert wäre, (selbst mir reicht's jetzt auch schon schön langsam )und der einzig echte Beweis für optimales Spiel wäre ein durchrechenbares Matt in einer bestimmten Zugzahl, das kann mit den derzeitigen Mitteln nicht erreicht werden, so wie es sich mir darstellt.
Parent - By Benno Hartwig Date 2014-10-24 17:09

> Frage: Können wir durch Mensch-Computer-Analyse herausfinden,
> was die wahrscheinliche Zugzahl bis zum Matt ist, wenn beide
> Seiten optimal spielen?


Solch eine Zugzahl bis zum Matt bei optimalem Spiel beider Seiten ist eine feststehende Zahl.
Und sie hat nichts Zufälliges an sich.
Nur kennen wir diese Zahl nicht.

Wahrscheinlichkeitsaussagen lassen sich dann bestenfalls zu den fehlerbehafteten Schätzungen der Menschen geben,
wobei diese ggf. schwer zu machen sind, wenn wir diese Zahl ja gar nicht kennen.
Aussagen, die z.B folgende Frage beantworten:
"Wie groß ist die Wahrscheinlichkeit, das der Mittelwert der menschlichen Schätzwerte sich um höchstens 5 von der unbekannten tatsächlichen Zugzahl unterscheidet?"
oder so.

Benno
Parent - - By Andreas Strangmüller Date 2014-10-23 22:44
Auch bei 1920 Sekunden (=32 Min.) + 0,05 Sekunden pro Partie ändert sich nichts:
70 Partien, durchschnittliche Partielänge: 27 Züge

Zusätzlich habe ich noch 60 Partien bei der Turnierbedenkzeit von 2 Stunden für 40 Züge durchgeführt.
60 Partien, durchschnittliche Partielänge: 28 Züge

Hardware war ein AMD FX-8350 @ 4.5 GHz auf einem Kern, Default Einstellungen, jeweils 512 MB Hash.

Für Interessierte hier die Turnierpartien zum Download:
http://www.fastgm.de/schach/SF5_141015-Ko8_40_7200.pgn
Parent - - By Benno Hartwig Date 2014-10-24 21:46
Wie hast du das eigentlich angestellt, dass bei 70 Partien bei immer derselben Zeit (und ja derselben Ausgangsstellung) unterschiedliche Partieverläufe entstanden?
Oder geschah das ausreichen früh ganz von allein?
Gab es auch identische Partien?
Benno
Parent - By Andreas Strangmüller Date 2014-10-24 22:12
Das geschah frühzeitig von ganz allein.
Die längste identische Zugfolge betrug 12 Halbzüge!

Andreas
Up Topic Hauptforen / CSS-Forum / Wieviel Züge brauchen gute Engines bis zum Matt?
1 2 Previous Next  

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill