Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Schachprogramm Spark im Fernschach
1 2 Previous Next  
- - By marsell Date 2011-12-04 19:56
Das Schachprogramm Spark im Fernschach ist völlig unbrauchbar
1. Bewertung der Engine völlig daneben, viel zu hoch, wie bei Stockfish. Zwei Züge später  sieht z.b. Houdini/Rybka nur mehr +0,10, obwohl Spark zuvor noch + 0,80 gab, aber da ist es schon oftmals zu spät um noch einen entscheidenden Vorteil herauszuholen.  Eine engine welche als Analyseengine im Fernschach nicht zu gebrauchen ist.
Obwohl Frank Quisinsky diese als seine Lieblingsengine bezeichnet. Benutzt man mehrere Engines zur Analyse kann Spark getrost in der Schublade bleiben.
  Ein ambitionierter Fernschachspieler:-(
Parent - - By Michael Scheidl Date 2011-12-04 20:11
Anscheinend ist Spark 1.0 kombinatorisch recht stark, siehe z.B.

http://rybkaforum.net/cgi-bin/rybkaforum/topic_show.pl?tid=23267

Beim Beobachten der TCEC-Partien sah ich andererseits "furchtbare" Endspielleistungen trotz ausgezeichneter techn. Bedingungen, dafür dürfte es an Wissen fehlen. Es gibt aber schon eine neue Version welche unlängst im Leidener Turnier Zweite wurde, jedoch leider noch nicht released wurde. Ich sehe öfters nach, aber es tut sich nichts.
Parent - By Frank Quisinsky Date 2011-12-04 20:44
Hallo Michael,

wenn ich Allard richtig verstanden habe, wollte er um Weihnachten releasen. Hoffe nur das Spark seine Stärke beibehält und mehr ELO nicht auf Kosten der hervorragenden Eigenschafften geht. Diese Gefahr besteht immer! Aber, ist dem so haben wir ja die Vorgängerversionen!

Gruß
Frank
Parent - - By Frank Quisinsky Date 2011-12-04 20:24 Edited 2011-12-04 20:32
Hallo,

Spark liegt in der SWCR bei kurzen Remispartien unter 56 Züge derzeit glaube ich auf Platz 2.
Hinsichtlich Verlustpartien unter 56 Zügen liegt Spark glaube ich derzeit auf Platz 2.

Von derzeit genau 200 getesteten Engine Versionen.
Wird schön ersichtlich in der SWCR, da bis zum Ende gespielt wird (ohne Aufgabefaktoren).

Das deutet darauf hin, dass die Engine nach den Eröffnungszügen nicht anfällig für Königsangriffe ist bzw. selbst sehr aggressiv spielt. Wer viel für sich sieht, sollte auch viel gegen sich sehen und von daher ist das Verhältnis eigentlich normal (Verlust- Gewinnpartien). Im Verlauf vom Mittelspiel selbst erarbeiten die TOP-7 gegen Spark dann Ihre Vorteile. Spark baut leider auch im Endspiel sehr deutlich im Vergleich zu anderen Engines ab aber ist immer noch in der Lage sehr viele Endspiele Remis zu halten. Dies zeigt z. B. die sehr hohe Remisquote.

Selbst setze ich für Analysen nach dem Eröffnungszügen sehr gerne Junior und Spark ein. Junior weil viele merkwürdigen Züge gespielt werden die sich als gut erweisen. Wer also wirklich auf der Suche nach Neuerungen zu Eröffnungssystemen mit einer Engine unterwegs ist, wird bei Junior z. B. zumindest Ideen finden. Spark hingegen wird taktische Angriffe aufspühren.

Das Geheimnis beim Einsatz von Engines, z. B. Fernschach ... ist die Stärken und die Schwächen aller Engines zu nutzen. Meine Ausführungen sind Erfahrungswerte beim Betreiben der SWCR die ich gerne weitergebe. Es kann auch leicht nachvollzogen werden, denn die SWCR Partien liegen komplett zum Download.

Problematisch ist aber, dass es dennoch subjektive Meinungen sind und bleiben, mit oder ohne Statsitiken. Diese sollen der Animation dienen sich mit Engines zu beschäftigen denn bekanntlich spielen nicht alle Engines das gleiche Schach. Herauszufiltern wo hat denn Engine X oder Y eine Stärke oder Schwäche ist nicht einfach und sehr zeitaufwendig. Dennoch nicht hoffnungslos wenn viele Partien zur Verfügung stehen, denn nur mittels Statistik ist das bei den sehr hohen Spielstärken überhaupt noch zu erkennen ... zumindest ist es überwiegend so.

Viele Grüße
ob mit Spark oder ohne!

Frank

Meine Lieblingsengines sind unter anderem auch:
AnMon, Phalanx, Zarkov, Spark wie angesprochen, Junior (geworden), Hiarcs und Stockfish. Chiron und Hannibal finde ich sehr interessant. Smarthink kann Partien gestalten wie keine andere Engine und spielt oftmals weltmeisterlich wenn mal etwas aufgespührt wurde. Komodo mag ich für Analysen bei ruhigen Stellungen und für Endspielanalysen. So hat jeder seine Favoriten ... wohl auch immer in Anbetracht welche Erinnerungen mit den Engines bzw. den Programmierern verbunden ist. Ohne AnMon hätte ich niemals meine WB Aktivitäten gestartet, was bedeuten würde das 35 Millionen Webseitenzugriffe nicht erfolgt wären. AnMon begeistert mich persönlich aber sicherlich nicht einen Fernschachspieler der das maximale an Power haben möchte. AnMon liegt ca. bei 2.375 ELO und ich kenne keine Engine bei dem es mir persönlich mehr Spass macht als gegen AnMon selbst zu spielen. Wie gesagt, jeder hat so seine Favoriten und das ist gut so!
Parent - - By Frank Quisinsky Date 2011-12-04 20:37 Edited 2011-12-04 20:41
Event:
Ort:
Datum:

Weiss:
Schwarz:

Ergebnis
Board


Hier mal ein nettes Beispiel.
Eröffnungsvorteile werden sehr schön genutzt.
Gar in Eröffnungen die eigentlich fürs Computerschach als kritisch anzusehen sind.

Diese Partie lief gerade zu Ende, verfolgte LIVE und war mal wieder begeistert.
Solche Comp-Comp Partien sind selten und entstehen vielleicht mit einer Wahrscheinlichkeit von 1:20. Bei Spark heit öfters und das macht diese Engine interessant!

Gruß
Frank
Parent - - By Frank Quisinsky Date 2011-12-04 21:02
Hi,

übrigens steht es gegen Chiron 1.1 w32 im laufenden Spießroutenlauf gerade:
Code:
Chiron 1.1 w32 - Spark 1.0 w32 (2716)    16.5  -  8.5    66.00%    Perf=2831


Code:
59 Chiron 1.1 w32                 2787   21   20   825   57%  2732   35%
84 Spark 1.0 w32                  2716   13   13  2222   54%  2689   35%


Also, schaut nicht so gut aus für Spark 1.0 w32.
Chiron 1.1 w32 punktet derzeit ca. 44 ELO besser als sein Durchschnitt gegen Spark 1.0 w32.

Aber Chiron spielt ein sehr gutes Endspiel und hat selbst taktische Stärken, überzeugt taktisch!
Chiron spielt sehr ausgeglichen und ist stets für eine Überraschung bzw. überraschende Partiewende gut.

Zwei wirklich sehr interessante Engines!

Gruß
Frank

Bevor ein falscher Eindruck entsteht.
Im Endspiel hat Spark 1.0 gegen Chiron 1.1 kaum Chancen.

Parent - - By marsell Date 2011-12-04 21:30
Ich möchte hier keine Unruhe stiften oder gar Erfahrungen, welche durch zig Partieanalysen deinerseits entstanden sind anzweifeln.
Kurz aber dennoch: Spark braucht ewig bis es in Tiefe kommt. Spark 24ply zu houdini 30ply nach geringerZeit (immer 1cpu). Aber passt schon. Jeder hat wie du sagst seine eigene subjektive Meinung. Chiron haltet, glaube ich, auch nicht das was es verspricht. italienischer Meister?? (Sjeng war das, bin mir nicht sicher) - wurde im talk chess forum auch berichtet, ich weiß es nicht mehr. Spielstärke 3.000 Elo auf 1cpu, wie von Ubaldo Farina proklamiert, entspricht wohl auch nicht deinen Tests.Habe diese Engine auch nicht gekauft, da du den Test ja angekündest hast und ich auf deine Eloermittlung warten wollte. Hat mich im Nichterwerben bestätigt. Aber jetzt  genug. Wünsche allen eine gute Nacht, eine neue Arbeitswoche beginnt.
Parent - - By Frank Quisinsky Date 2011-12-05 01:13
Hallo,

die Tiefe oder die Stellungen pro Sekunde sind nicht entscheidend für die Qualität eines Zuges. Sicherlich interessante Anhaltspunkte aber mehr auch nicht. Oftmals ist es eher so, dass wenn eine Engine in die Tiefe rast auch einiges im Suchbaum übersehen wird. Und mit Suche und nur mit Speed entsteht auch noch kein Schachwissen. Auch hat der Programmierer von Chiron dem was angekündigt war Stand gehalten. Er sprach nicht von SWCR ELO, sondern von CEGT ELO, da ja schon eine ältere Version in der CEGT war. Siehst Du, so schnell entstehen Missverständnisse.

Chiron ist auf Anhieb unter den TOP-10 gelandet von über 600 verschiedenen Engines, liegt ca. 200 ELO entfernt von Houdini. Das ist das Level von Shredder, Naum, Fritz, Hiarcs und Junior hat um mal ein paar Kaliber zu benennen.

Programme die drüber liegen haben alle eine Stärke und das ist der Übergang zum Endspiel. Diese Stärke ist anhand von Ratinglisten nicht abzulesen. Ratinglisten geben nur eine dumme Zahl aus aber sagen keinesfalls etwas für die Stärken und Schwächen der Engines aus. Das ist der Nachteil bei den ganzen Ratinglisten. Ich versuche zwar immer mal wieder ein paar Infos mehr zu geben aber ich kann auch nicht zaubern. Einzelstatistiken sind trotz Datenbanken nicht so einfach zu erstellen und benötigen auch sehr viel Zeit.

Wie jetzt hier im Falle von Spark fällt mal augenscheinliches auf und wird weiter im Detail nachgegangen. Aber auch nur oberflächlich weil weder die Zeit noch die Schachkenntnisse vorhanden sind solche ELO-Leistungen richtig zu analysieren. Hier dürften selbst GMs überfordert sein weil wie gesagt, es dauert zu lange.

Mit starker Freeware läßt sich ja eine gute Analyse-Gruppe zusammenstellen.

z. B. Critter 1.2, Stockfish 2.1.1, Komodo 3.0 und Houdini 1.5 aber selbst bei dieser geballten Ladung Power ist immer noch nicht sicher gestellt das die vier in Kombination alles mögliche aufspühren. Das wird schon sehr deutlich wenn Du ständig z. B. auch andere Engines analysieren läßt. Es kommt auch immer auf die Stellung selbst an. Ist es eine ruhige Stellung macht eine Mittelspielanalyse mit Spark 1.0 auch nicht sehr viel Sinn. Da sind dann eher die positionellen, strategischen Programme wie z. B. Komodo, IvanHoe, Fritz gefragt.

Aber wie gesagt, Ausführungen von meiner Seite sollen eher animieren.
Eine Ratingliste soll animieren. Feste Aussagen sind und bleiben fragwürdig weil die Engines einfach zu stark sind.

Im Falle von Spark ist die Sache aber sehr eindeutig und das wird aus der SWCR Datenbank sehr schön ersichtlich. Überhaupt werden viele meiner Statistiken auch wieder auf dem Kopf gestellt. Zu ungenau wären Aussagen zu fantasievollen herausgepickten Statistik-Möglichkeiten. Schwierig sind z. B. die Statistiken zum Endspiel, bzw. Übergang Endspiel. Es scheint als wäre Komodo hier überlegen aber so klar geht das aus meinen Statistiken nicht hervor weil die Statistiken selbst nicht klar genug sind. Möglich solche zu erstellen aber dann dürfte ich monatelang nichts anders tun als zu versuchen das auszuwerten.

Verbleiben eigene Erfahrungswerte.
Diese kannst Du Dir aber auch nur dann bilden wenn Du alles zumindest kennst.
Setzt Du nur z. B. 5 Engines ein, kannst Du Dir im Grunde überhaupt kein Urteil bilden. Können im Grunde sicherlich auch nur wenige Personen, meine nur wenige beschäftigen sich dauerhaft mit einer Vielzahl von Engines.

Viele Grüße
Frank
Parent - - By Ludwig Bürgin Date 2011-12-05 10:41
Hallo Frank

Obwohl Du in Deinem Schreiben recht kritisch mit dem Engietesten umgehst, nehme ich nicht an, dass Du selbigen den Rücken kehren willst.
Dein Schreiben findet besonders in der oberen Hälfte meine absolute  Zustimmung.
Com.Schächer im Maschinenraum kennen die Probleme und sind bestrebt mittels Buchtuning den Ablauf von Partien sowohl auf Positionen,als auch auf das Erreichen schneller Tiefe zu lenken.
Könnte mir Vorstellen, dass Dein Schreiben nicht überall gut ankommt.

Gruß Ludwig
Parent - - By Frank Quisinsky Date 2011-12-05 19:24 Edited 2011-12-05 19:33
Hallo Ludwig,

ich habe so einige Eröffnungsbücher mit sehr schönen Varianten und Ideen zu beliebten Systemen. Wenn ich denn mal eine dieser Stellungen mit einer meiner favorisierten Engines (je nach Stellungstyp) studier sehe ich oft, dass egal welche starke Engine die Ideen überfliegt, oftmals nicht der beste Zug ausgewählt wird. Dann denke ich mir, OK lasse die Engine länger rechnen aber es kommt meist nichts anders dabei heraus.

Wir hatten vor vielen Jahren das Thema:
Schachwissen kontra schnelle Suche / Speed mit weniger Schachwissen.

Es hat Gründe warum Programme schnell auf Zugtiefe kommen. Es muss weniger Code abgearbeitet werden. Das ist die Tendenz und offenbar auch der Grund warum wir heute so enorm hohe Spielstärken haben. Aber das alles hat auch Nachteilte. Mit mehr Schachwissen werden oftmals interessante Züge schneller gefunden. Züge die Rechenmonster gerne überspringen.

Ich denke, dass je weniger Figuren auf dem Brett sind Speed und schnelle Suche immer wichtiger werden. Das erklärt die enorm hohen Spiesltärken der Engines im späten Mittelspiel / frühen Endspiel. Sind aber noch viele Figuren auf dem Brett ist es eher Schachwissen welches benötigt wird. Hier liegt die Schwäche bei den Rechnenmostern, sofern überhaupt noch von Schwächen geredet werden kann. Und genau diese ist auffällig durch das Verhalten nach den Buchzügen.

Buchtuning bringt hier gar nichts. Eine Engine wird durch Tuning von Büchern nicht schlauer, sondern arbeitet wie eh und je "dumm" seine Sourcen ab. Interessant für die Buchtuner ist es natürlich festzustellen, welche Varianten liegen einer Engine und welche eher nicht. Aber auch hier ... es kommt immer auf den Gegner an. Eine deaktiviert geglaubte schlechte Variante gegen Engine A könnte gut gegen Engine B sein. Die Engines spielen nunmal nicht gleich und genau das ist auch gut so.

Insofern ... Buchtuning ist und bleibt zweischneidig. Lange Buchvarianten haben allerdings den Vorteil, dass durch Abtäsuche die Anzahl der Figuren weniger werden. Ein schnelles Programm wird dann stärker wird und zu guter letzt ein Zeitvorteil entsteht. Aber das hat wenig mit Computerschach zu tun, denn es spielt die Datenbank und nicht die Engine. Wir gaukeln der Engine dann eher eine erhöhte Spielstärke vor die so nicht existiert --- ACHTUNG, Betrachtungsweise ---

Buchtuner auf Server spielt 1. e4 und ist vorbereitet auf sämtliche gängigen Varianten die kommen könnten. Sein Gegner antwortet mit 1. b6 ... OK, habe immer noch etwas im Buch. Dann als zweiter Zug 2. ... c6 und die Sache wird kritisch. Dann haben wir vielleicht 0.8 Vorteil aber gegen eine Engine die sich gut entwickelt ist der Vorteil viel geringer. Mal vom Anzugsvorteil weg.

Meines Erachtens ist also nicht wichtig festzustellen, was muss in mein Buch rein damit ich Varianten stärke, die einer Engine nicht grundsätzlich nicht liegen. Interessanter ist es festzustellen, welche Varianten mag meine Engine und ist in der Lage die vermutlich besten Forsetzungen selbst zu errechnen. Mit diesen Wissen kann ein Buch aufgebaut werden, denn nun können Eröffnungen gesammelt werden die gleiche Eröffnungsmuster aufweisen.

Es gibt ja so einige Experten

Beispiel:
Shredder 12 hat in der SWCR ca. 8.000 Partien gespielt. Nun sammeln wir doch ganz einfach die Verlustpartien und bilden ein Buch daraus das möglich sehr tief geht. Ja klar, viel Spass dabei Dann lasse dieses Buch mal gegen Shredder antreten mit einer beliebigen Engine. Glaubst Du wirklich daran, dass Shredder hier benachteiligt wird im Vergleich zu dem Umstand das als Vergleich mit einem normalen Buch gegen Shredder gespielt wird.

Wichtig ist zu wissen, mit welchen Eröffnungen geht meine Engine sehr gut um. Wichtig ist nicht durch x Varianten zu Eröffnungen die eine Engine nicht mag den Nachteil auszugleichen. Die kleinste Abweichung und das Dilemma nimmt seinen Lauf.

Schnelle Tiefe sagt in einer Eröffnung gar nichts aus. Ob Ply 22 oder 25 oder 30 ... wenn eine Engine die Eröffnung nicht versteht. Nicht alles kann errechnet werden, erst Recht in der Eröffnungsphase zumal bei sehr schnell ermittelten hohen Zugtiefen eher die Gefahr besteht das vieles übersehen wurde. Und mit mehr Zügen und weniger Figuren auf dem Brett wird das Problem immer kleiner und kleiner. Letztendlich liegen die schnellen Sucher in den Ratinglisten vorne weil ... schaue Dir mal in welcher Partiephase die meisten Partien entschieden werden.

Glaube mir, das ist nicht die Eröffnung aber das wirst Du selbst wissen.

Klar, viele interpretieren in Ihre Favoriten so einiges rein aber Schachprogramme arbeiten nunmal nur Ihren Sourccode ab, nicht mehr und nicht weniger. Das heute verblüffendes dabei herauskommt wissen wir aber gerade in der Eröffnung ist ofmals ein Treffer zur richtigen Variante bzw. der richtige Zug ein Zufallsprodukt, wie dann meist die nachfolgenden Züge aufzeigen.

Ich bin froh das es so ist.
Wäre es anders wäre die Spannungskomponente weg, nichts wäre mehr zu verbessern und es würde zum Entwicklungsstillstand kommen.

Viele Grüße
Frank

Der Vorteil: Eine Engine findet eine Neuerung die gut ist ... kann ja sein, wird auch sicherlich hin- und wieder so sein aber ist eher selten. Glaube die Riege der GMs wird mehr Neuerungen aufspühren als Engines.
Parent - - By Ludwig Bürgin Date 2011-12-05 20:59
Hallo Frank

Danke Dir für Dein ausführliches Schreiben.Dass Du viel von Com.Schach verstehst wird keiner bezweifeln.Die andere Seite vom Com.Schach erlebe ich im Moment bei einem Turnier im Maschinen Raum.Ich spiele mit einer CPU mit 4 Kernen
.Die meisten haben CPUs mit 6 oder gar 8 Kernen.Das ist das wahre Computerschach aber trotzdem immer weiter machen

Gruß Ludwig

Gruß Ludwig
Parent - By Frank Quisinsky Date 2011-12-05 21:14
Hallo Ludwig,

nun ja, da entsteht ein Nachteil, klar!

Gibt es eigentlich auf dem Server auch Turniere bei der es eine Hardwarebegrenzug gibt?
Also z. B. Fritz Bench zwischen 6-8 oder irgend wie so in der Richtung.

Obwohl, wenn es das geben würden, würde sicherlich dann wieder so ein paar Kandidaten mit schnellerer Hardware versteckt spielen.

Also ich verstehe eh nicht so richtig das ganze Geschrei um den Server. Wenn ich doch etwas testen möchte dann mache ich das auf meinen PCs bei gleicher Hardware um einen optimalen Vergleich zu erstellen. Egal, welche Engines oder sonstigen Bedingungen wie Zeitkontrolle. Ich sehe es aber auch positiv das es auf dem Server einen Austausch gibt. Nur wurde mir berichtet, dass die Personen im Computerraum Ihre Computer unbeaufsichtigt spielen lassen. Nur dann verstehe ich nicht warum ausgerechnet auf einen Server.

Muss ich auch nicht verstehen, meinen Ratinglistenquatsch versteht auch nicht jeder

Dir noch einen schönen Abend!

Viele Grüße
Frank
Parent - - By Frank Quisinsky Date 2011-12-04 22:24 Edited 2011-12-04 22:32
Hallo,

mal eine kleine Datenbankstatistik.

Spark 1.0 w32 / x64 hat 40x unter 56 Zügen verloren.
Spark 1.0 w32 / x64 hat 272x unter 56 Zügen gewonnen.

Bei 4.702 Spark 1.0 w32 / x64 Partien = 5,78% Gewinnpartien unter 56 Zügen oder 0,85% Verlustpartien unter 56 Zügen.

Dagegen konnte bislang Hiarcs 13.2, Stockfish 2.1.1 PHQ, Junior 12.5.0.3 und Houdini 1.5 / 2.0c halten.

Schauen wir uns die Statistiken für diese vier an.
Beginnen wir mit Hiarcs 13.2 w32:

Hiarcs 13.2 w32 hat 73x unter 56 Zügen verloren.
Hiarcs 13.2 w32 hat 173x unter 56 Zügen gewonnen.

Bei 3.705 Hiarcs 13.2 Partien = 4.66% Gewinnpartien unter 56 Zügen oder 1.97% Verlustpartien unter 56 Zügen.

Sehr gut aber nicht gut genug.

Schauen wir jetzt auf Stockfish 2.1.1 PHQ / 2.1.1 (ziehe die Partien zusammen):

Stockfish 2.1.1 w32 / x64 hat 17x unter 56 Zügen verloren.
Stockfish 2.1.1 w32 / x64 hat 229x unter 56 Zügen gewonnen.

Bei 4.306 Stockfish 2.1.1 Partien = 5,31% Gewinnpartien unter 56 Zügen oder 0,39 Verlustpartien unter 56 Zügen.

Besser bei den Verlustpartien als Spark 1.0 w32 aber diese beiden Engines trennen ca. 170-180 ELO.
Bei den schnellen Gewinnpartien ist Spark 1.0 immer noch vorne.

Schauen wir jetzt mal auf Junior 12.5.0.3:

Junior 12.5.0.3 w32 / x64 hat 55x unter 56 Zügen verloren.
Junior 12.5.0.3 w32 / x64 hat 153x unter 56 Zügen gewonnen.

Bei 3.185 Junior 12.5.0.3 Partien = 4.80% Gewinnpartien unter 56 Zügen oder 1.72% Verlustpartien unter 56 Zügen.

In etwas das Ergebnis von Hiarcs 13.2.

Ach ja, wir haben ja auch noch Critter 1.2, stimmt ...

Schauen wir jetzt auf Critter 1.2:

Critter 1.2 w32 / x64 hat 7x unter 56 Zügen verloren ... ups, hatte ich gar nicht verfolgt.
Critter 1.2 w32 / x64 hat 198x unter 56 Zügen gewonnen.

Bei 2.866 Critter 1.2 w32 / x64 Partien = 6,90% wow Gewinnpartien unter 56 Zügen oder 0.24%

Das wäre ja gar Platz 1 vor Spark bei den Gewinnpartien und bei den Verlustpartien auch.
Wie gesagt, habe diese Statistik schon seit einem halben Jahr nicht mehr gemacht.
Wieder etwas dazugelernt, muss ich mir näher ansehen

Und zu guter letzt haben wir ja noch die Nummer 1 Houdini.
Ziehen wir die Houdini 1.5 und 2.0c Versionen zusammen.

Houdini 1.5 / 2.0c w32 / x64 hat 15x unter 56 Zügen verloren
Houdini 1.5 / 2.0c w32 / x64 hat 392x unter 56 Zügen gewonnen.

Bei 4.746 Houdini 1.5 / 2.0c Partien = 8,26% schnelle Gewinnpartien unter 56 Zügen und 0,31% schnelle Verlustpartien unter 56 Zügen.
Damit klar auf Platz 1.

Mehr taktische Engines die hier zu bewerten wären gibt es nicht.

Somit:

1. Houdini (schnelle Gewinnpartien)
2. Critter (schnelle Gewinnpartien)
3. Spark (schnelle Gewinnpartien)

1. Critter (schnelle Verlustpartien)
2. Houdini (schnelle Verlustpartien)
3. Spark (schnelle Verlustpartien).

Bei den schnellen Verlustpartien könnte es aber sein, das andere Engines noch einen Tick besser sind wie Spark, z. B. Komodo!

OK, schauen wir auf Komodo 3.0 ...

Komodo 3.0 w32 / x64 hat 19x unter 56 Zügen verloren.
Komodo 3.0 w32 / x64 hat 173x unter 56 Zügen gewonnen.

Bei 2.785 Komodo 3.0 Partien = 6.21% schnelle Gewinnpartien und 0,68% schnelle Verlustpartien.
Damit habe ich jetzt auch nicht gerechnet, wie gesagt schon länger nicht mehr erstellt.
Aber Komodo 3.0 ist im Vergleich zur Version 2.03 taktisch stärker geworden.

Und jetzt kommt der Kasus ... wir müssen das alles in ein Verhältnis zur Spielstärke setzen.
Spark 1.0 liegt gut 260 ELO hinter Houdini oder ca. 200 ELO hinter Critter und Komodo und muss laufend auch gegen diese Engines spielen.

Wenn das in einem Verhältnis gesetzt wird ist Spark 1.0 auf Platz 1.
Ansonsten spielt Spark oben mit und aus diesen Statistiken wird ersichtlich wie stark diese Engine im Angriff Mittelspiel und Verteidigung Mittelspiel ist.

Übrigens, das wird wieder ersichtlich wenn ich den Schnitt von 56 Züge z. B. auf 45 Züge drücke.
Gerade auch mal gemacht und hier liegt Spark dann wieder auf Platz 2, hinter Houdini !!

Und wie gesagt, das was Houdini hier im Angriff findet muss Spark nicht finden und umgekehrt. Das wird schnell ersichtlich wenn z. B. auf Quad Core vier Engines im Mittelspiel bei mir analysieren. Ich nutze bislang hierfür:

1. Houdini
2. Spark
3. Stockfish
4. Junior

Critter muss da rein
Bei Stockfish ist noch zu beachten, dass die PHQ Version bei über 7% liegt und die 2.1.1 unter 5%.
Ich hatte das hier gemixt.

Genug

Viele Grüße
Frank

Wer ein Interesse hat kann ja mal eine schöne Excel Auswertung darüber machen.
Alle Partien liegen zum download bereit.
Parent - - By Frank Quisinsky Date 2011-12-04 22:50
Hi,

einer noch ...

Logischer Weise muss Spark 1.0 Houdini 1.5 / 2.0c ja irgend wann überholen.
Drücken wir die Statistik auf unter 40 Züge.

Also:
Spark 1.0 w32 / x64 Gewinnpartien unter 40 Zügen = 42, Verlustpartien unter 42 Zügen = 0
Houdini 1.5 / 2.0c w32 / x64 Gewinnpartien unter 40 Zügen = 37, Verlustpartien unter 40 Zügen = 3

Bedeutet:

Spark 1.0 w32 / x64 = 4.702 Partien = Verlustpartien = 0,0% und Gewinnpartien = 0,89%
Houdini 1.5 / 2.0c w32 / x64 = 4.746 Partien = Verlustpartien = 0,06% und Gewinnpartien = 0,77%

Damit wird die Stärke von Spark 1.0 immer deutlicher.
Diese Engine ist nach den Eröffnungszügen kaum angreifbar bzw. gar nicht angreifbar durch Schwächen in der Königssicherheit.

Und das war meine Aussage:
Zumindest nach der SWCR Statistik ist die Engine für Analysen nach den Buchzügen optimal geeignet.

Ich habe hier noch eine SWCR Datenbankversion mit 110.000 Shredder Partie Kommentaren.
Enthalten sind alle Spark 1.0 Partien.

Machen wir mal eine andere Statistik.
In wie vielen Partien bewertete sich Spark unter 40 Zügen schon mit mehr als -2
Ergebnis: In fünf der 4.702 Partien.

Aber lassen wir das, möchte hier auch niemanden Illusionen seiner Favoriten nehmen.
Sind eigentlich Statistiken die ich für mich mache.

Viele Grüße
Frank
Parent - By Frank Quisinsky Date 2011-12-04 23:00
Hi,

Korrektur:
Es sind 14 Partien bei denen sich Spark 1.0 bei Zugnummer 40 mit mindestens -2.0 bewertet hat.
Hatte die falschen Datenbank im Texteditor.

Und das bei 4.702 Partien!
Das wird dann nicht mehr von einer anderen Engine getoppt.
Zumindest nach einer Auswertung die ich vor ca. 4 Monaten machte.

Hm, 4x in der selben Eröffnung?
Muss ich mir ansehen, vielleicht ist die Eröffnung nicht gut ...
Wieder weg!

Gruß
Frank
Parent - - By Ludwig Bürgin Date 2011-12-06 10:31
Hallo Frank

Bei Deiner Aufzählung von brauchbaren Engines zur Analyse fehlt mit Deep Sjeng.Habe mich vor etwa eins,zwei Jahren kurze Zeit mit dem freien Programm beschäftigt.Im Maschinenraum waren die Ergebnisse bei mir nicht so gut.Bei der Analyse von Partien,besonders im Mittelspiel ,war sie zur damaligen Zeit schon sehr gut.

Gruß Ludwig
Parent - - By Frank Quisinsky Date 2011-12-06 18:40
Hallo Ludwig,

DeepSjeng öffnet geschickt und spielt strategisch sehr bissig. Hat aber wieder zu den TOP-7 zu viele Lücken die durch die Stärke kaum kompensiert wird. Oft bin ich auch begeistert wenn ich mir Sjeng Partien ansehe aber im weiteren Verlauf nimmt alles seinen normalen Weg und gegen die TOPs wird die Engine dann wieder zusammengeschoben. Und auch hier, passiert wieder in der späten Partiephase.

Es ist schwierig die Stärken und Schwächen der TOP-30 herauszupicken. Auffällig wirds wirkilch nur dann wenn es überragende Stärken sind. Schade eigentlich aber die TOP-7 sind zu weit weg von der Konkurrenz, wie die SWCR ja aufzeigt. Chiron, Naum, Fritz, Shredder, Hiarcs, Junior, Spark, Protector, Gullchess etc. ... sind ja schon fast überall über 200 ELO Unterschied.

Da ist das was ich meine.
Diese 200 ELO sind zu finden im späten Mittelspiel. Hier werden die Comp-Comp Partien entscheiden. Selten in der Eröffnung!

Es ist schade, dass die Ratinglisten für Ausgaben sorgen, für blanke Zahlen sorgen, und diese dann immer und immer wieder auf die Gesamspieltstärke übertragen werden. Aber eigentlich auch logisch, weil die TOP-7 zu weit weg sind und dann wie gesagt die Stärken der Verfolger meist untergehen.

Bleibt zu hoffen, dass die Annäherung der Verfolger im kommenden Jahr in größeren Schritten erfolgt. Hiarcs und Junior, Shredder, Chiron oder Protector mit 100 ELO mehr würden sehr interessant sein. Die Stärken kommen besser heraus und die Vielfalt bei Engine Analysen, z. B. für den Fernschachbereich wird größer. Im Moment haben wir die Situation das sich hier alles auf wenige Programme beschränkt. Schön ist das durch Critter, Komodo und Stockfish unterschiedliche Spielstile produziert werden. Aber es bleiben dennoch wenige Analysewerkzeuge für Fernschachspieler, die ja bekanntlich auch immer das Beste einsetzen möchten.

Der Spark Programmierer hat es verstanden.
Es ist nicht wichtig 3.000 ELO zu erreichen mit Speed und Suche fürs späte Mittelspiel / Endspiel. Davon haben wir reichtlich an Engines. Es ist heute viel wichtiger eigene Stärken zu implementieren die besonders herrausragen. Dann hin zur Gruppendynamik und weg von der Einzelkämpfermentalität. Engines sollten zukünftig zusammen wirken, sich unterstützen mit Stärken und Schwächen damit wir des Rätsels Lösung ein Stück näher kommen.

Ich kaufe mir einen 5.000 EUR PCs mit vielen Kernen und setze eine Engine auf meine Analysen an.
Wie langweilig.

Hardware natürlich nicht aber dann die Hardware auch richtig nutzen und je nach Stellungstyp mehrere Engines analysieren lassen.

Das ist die Zukunft bei Engine Analysen aber benötigt werden viele viele Inforamtionen von guten Schachspielern wie hier Arno Nickel. Die uns dann viel mehr Details geben können welche Engines wie eingesetzt werden sollten. Wie gesagt, wir benötigen bei den immer stärkeren Engines DRINGEND eine GUI die Engine Datenbanken auswertet und uns Ausgaben über Stärken und Schwächen gibt. Wir sind alle keine GMs und sollten lernen auch einfach mal Statistiken für uns zu Nutzen denn 99,9% der Engine-Fans werden sonst total überfordert sein, ob mit 1.500 oder 2.500 ELO.

Gruß
Frank
Parent - - By Achim Müller Date 2011-12-16 23:03
Welche von den Top7 und welche von den schwächeren Engines sind Deiner Meinung nach gut in Stellungen mit materiellem Ungleichgewicht im (meist späten) Mittelspiel? Ich meine T+2B gegen 2 Leichtfiguren oder Dame gegen Turm + Leichtfigur + Bauer etc.

Ciao

Achim
Parent - - By Frank Quisinsky Date 2011-12-17 14:25
Hallo Achim,

das habe ich nicht intensiv beobachtet, weil das nicht das ist was mich persönlich wirklich interessiert. Auffällig ist nur, das die Quelle oft zu früh gegeben wird und dann später die Partien meist mit Verlust enden. Rein intuitive Eindrücke wenn ich zuschaue. Mich interessieren eher die Bauerketten, Bauernvorstöße weil das der Schlüssel für ein aggressives Spiel ist, durch offenen Linien die dann entstehen.

Ich kann Dir aber sagen welche Programme recht gut bei fianchettierten Läufern spielen, oder bei welchen Programmen mir Springerumgruppierungen immer wieder positiv auffallen. Oder welche Programme zu schnell einen starken Läufer unnötiger Weise gegen einen nur meist kurzzeitig aktiv stehenden Springer tauschen.

Ich glaube ein Geheimnis bei den imens hohen Spielstärken die auch die Läuferstrukturen. Falsche Läufer, lange Diagonalen, Läufer halten, Läuferpaar halten ... Läufer haben auch viel mit Remischancen zu tun. Es enden wesentlich weniger Springerendspiele mit Bauern Remis als Läuferendspiele. Dennoch werden mehr Punkte durch Remis erzielt wenn die Läufer behalten werden.

Beim Computerschach ist es meines Erachtens richtig den Läufer mehr Punkte zu geben. Es ist richtig die Punktzahl abhängig von weiß / schwarz zu gestalten. Spielen Programme aber taktisch und öffnend dann sollten die Läufer nicht besser als die Springer bewertet werden. Wahrscheinlich ist es richtig die Bewertung von Läufern und Springer abhänig von der Spielphase zu machen, bzw. wie viele Figuren stehen noch auf dem Brett, anstatt das immer gleich zu händeln.

Läuferstrukturen und Bewertungen sind meines Erachtens von der vorhandenen Bauernkette abhänig und sollten sich variabel ändern. Insofern halte ich es für viel wichtiger die Bauernstrukturen mit vielen Bewertungen zu versehen und die Läufer und Springer Bewertungen dann hiervon abhänig zu machen und variabel zu gestalten. Ob das Programme programmiertechnisch so umsetzen entzieht sich meiner Kenntnis. Sind meine Eindrücke und haben jetzt auch weniger mit Deiner Frage zu tun die ich so nicht wirklich beantworten kann.

Gruß
Frank
Parent - By Frank Quisinsky Date 2011-12-17 14:36
Nicht Quelle, sondern Qualle ...
Parent - - By Peter Krug Date 2011-12-04 21:10
"Bewertung der Engine völlig daneben, viel zu hoch, wie bei Stockfish."

Ich kann da nur aus den Erfahrungen im Endspiel sprechen:

Dort ist sowohl Houdini als auch Stockfisch oft daneben. Und es gibt noch sehr
viel zu verbessern.

Aber ich kenne keine besseren zum Analysieren. Oder weißt du eine bessere im EG -Bereich?

Houdini neigt dazu, die Werte zu niedrig anzusetzen und suggeriert damit, dass
die Partie eher ausgeglichen ist.
Stockfish Werte sind zu hoch und suggerieren einen Gewinn.

Ich denke, wenn man Remis anstrebt und auch sicher ist, dass diese in einer Endspielstellung
drinnen ist, dann wird Houdini als Analysepartner die bessere Wahl sein.

Wenn hingegen man einen verborgenen Gewinn suchen möchte in einem Endspiel,
wo man weiß, dass da noch mehr drinnen ist, dann ist Stockfish oft überraschend intuitiv.

Eine absichernde Analyse mit beiden mache ich dann abschließend...

(weitere Analyseengines brauche ich eigentlich derzeit nicht)

Peter
Parent - - By Frank Quisinsky Date 2011-12-05 01:29
Hallo Peter,

um mal wieder bei den schwächeren Engines zu bleiben die aber auch Ihre Stärken und Schwächen haben.
z. B. ist Ktulu ohne TBs bei Turmendspielen eine Macht.

Rahman Paidars Paradepferdchen, so schwach die Engine taktisch auch ist, so stark ist diese bei Turmendspielen.
Sein absolutes Hobby war genau das zu programmieren und hier sehr detailreich.

Lt. seiner Aussage spielt Ktulu ca. 70% der Turmendspiele nahe an der Perfektion.
Diese Aussage z. B. kann dann überprüft werden und in der Tat, geht Ktulu ausgeglichen in ein Turmendspiel wird die Partie Remis oder Ktulu gewinnt. Hier gibt es keine bzw. nur sehr sehr selten Verlustpartien.

Das ist das interessante an der Engine-Vielfalt. Wenn die Engines nicht gleich spielen und mit eigenen Stärken daher kommen wird die Engine-Vielfalt richtig interessant. Liegen uns aber solche Informationen nicht vor, ist es oftmals eher ein Zufall wenn das anhand von Partiedaten deutlich wird, weil die Spielstärke für die Computerschächler zu hoch ist. Die Zeiten Schachcomputer zu bewerten sind heit schon lange vorbei. Stockfish und Houdini sind im Endspiel sehr gut aber nach meinen Auswertungen, und diese sind nicht so deutlich wie die von Spark 1.0 nach den Eröffnungszügen, scheint Komodo besser zu sein. Auch Critter hat in den späten Endspielen sehr viel Wissen über Bauernketten, vergleichbar zu Fritz. Da werden oftmals verlorene Partien noch in eine Remis abgewickelt. Junior z. b. spielt das Endspiel wie Spark katastrophal im Vergleich zu den TOP-7. Wie auch GullChess hier viele Schwächen hat. Nur einfach Endspieldatenbanken einsetzen bringt etwas aber nicht viel. Und genau hier werden im Computerschach die Punkte gemacht denn die meisten Partien entscheiden sich erst im Übergang zum Endspiel bzw. im sehr späten Mittelspiel.

Dennoch, ich glaube Dir das es im Endspiel auch noch einiges zu verbessern gibt aber ich denke eher das es nach den Eröffnungszügen durch mehr Schachwissen viel mehr zu verbessern gibt. Hier liegen die Schwächen der Programme, das Endspiel hingegen ist schon sehr weit entwickelt. Hier zählt sicherlich auch Zugtiefe und Speed aber das ist auch nicht allein entscheidend. Nur welcher Programmierer hat das Wissen, Schachkenntnisse um hier das Wissen zu implementieren?

Der Autor von TheKing hatte vor vielen Jahren das Glück mit sehr starken IMs zusammenzuarbeiten. TheKing spielt Schwerfigurenendspiele sehr gut und hat hier sehr viel Wissen erhalten. Aber diese Engine wird dann in diesem Bereich durch Speed von anderen Engines mit weniger Wissen zusammengeschoben.

Gruß
Frank
Parent - By marsell Date 2011-12-05 07:37
ich bedanke mich bei dir über die Ausführungen. Die endgültige Entscheidung sollte sowie beim Spieler/Menschen liegen. Wünsche Allen eine besinnliche Adventszeit.
Parent - By Kurt Utzinger Date 2011-12-05 07:58
[quote="Frank Quisinsky"]
Der Autor von TheKing hatte vor vielen Jahren das Glück mit sehr starken IMs zusammenzuarbeiten.
TheKing spielt Schwerfigurenendspiele sehr gut und hat hier sehr viel Wissen erhalten. Aber diese
Engine wird dann in diesem Bereich durch Speed von anderen Engines mit weniger Wissen zusammengeschoben.
Gruß
Frank
[/quote]

Stimmt Frank, was die Aussage bezüglich Schwerfigurenendspiele betrifft, wo die Dame noch auf
dem Brett ist. Reine Turmendspiele waren hingegen eine echte Schwäche von TheKing.
Kurt
Parent - - By marsell Date 2011-12-05 14:04
Hi Frank. Das mit Tiefe ply ist mir schon bewußt. Habe aber mit Sparkanalysen schon öfters daneben gegriffen, und ja, ich als Fernschachspieler weiß es braucht Kontrollengines. Deshalb habe ich mir sogar die Mühe gemacht: Zug/Stellungsanalyse im frühen Mittelspiel,
Zug 18 mit Spark 1.0 1core, als Kontrollengine Rybka, Houdini Stockfish PHQ, alle 1 core im 5 Multivariantenmodus und 12 Stunden analysieren lassen. Schön zu sehen war, dass, die Kontrollengines die Sparkzugvorschläge auch schon mal ignorierten, gar nicht in Betracht zogen. (verstehe schon: anderer Spielstil, andere Zugvorschläge). Jedoch noch eklatanter war, wieder zwar großer Aufwand aber musste sein: gleiche Stellung gleicher Zug, jedoch lief Spark diesmal auf alles cores, gleiche Hashgröße; Spark änderte in regelmäßigem Rhythmus seinen AnalyseOutput mit zunehmender Suchtiefe und zwar ähnlich meiner Kontrollengines. Das meinte ich mit fragwürdiger Sparkanalyse. Nichts für ungut ich lasse halt diese Engine weg. Benutzte diese aber, da Spark als "die" Analyseengine nach der Eröffnung und im frühen Mittelspiel bezeichnet wurde, neben einigen anderen: Junior usf.! Sehe ich halt "so" nicht. Aber jetzt werde ich mich wieder meinen Spielen widmen, ohne Spark, hab sowieso meine eigenen Lieblingsengines für die jeweilige Stellung, offen, halboffen, Eröffnungsfortsetzung usw.
Beste Grüße
Parent - By Frank Quisinsky Date 2011-12-05 19:47
Hallo,

klar, Deine eigenen Erfahrungen zählen und stelle Dir mal vor jeder würde immer Gleiches tun. Wie gesagt, ich wollte aufzeigen das auch spielschwächere Engines Stärken aufweisen die durchaus genutzt werden könnten. Die Engine-Vielfalt ist heute sehr groß und Möglichkeiten gibt es ausreichend.

Ich wünsche mir z. B. eine GUI bei der ich die Engines mixen kann.
z. B. Lasse bis Zug Nummer x und je nach Stellung drei Engine laufen, eine Entscheidungsmodul entscheidet über den Zug der ausgespielt wird. Dreihirn mäßig aber das Problem ist sicherlich das Entscheidungsmodul bzw. ist das ganz schwierig.

Dann würde ich gerne mal engine-engine Matches zwischen der Nummer 1 und einer Kombination von Gegnern laufen lassen. Ich könnte mir vorstellen, dass die Nummer 1 bei vielleicht 50 ELO Vorsprung auf die Konkurrenz keine 35% erzielt. Und genau solche Dinge würden auch aufzeigen, dass die Entwicklung noch längst nicht am Ende ist, so gewaltig 3.000 ELO auch ausschaut.

Sprich, die programmiertechnische Leistung der ganzen Programmierer zusammenziehen. Weg von der Einzelkämpfermentalität bei Engines, hin zur Gruppendynamik. Mir gefällt das Du mehrere Engines analysieren lässt, dabei kommt meines Erachtens mehr heraus als wenn nur eine Engine auf vielen Cores analysiert.

Gruß
Frank
Parent - By Kurt Utzinger Date 2011-12-05 08:02
Hallo Peter
Gehört Fritz nicht mehr zu den besten im Endspiel. In meiner Windows Zeit hatte ich
stets den Eindruck, dass diese Engine im Endspiel zu den absoluten Tops gehört.
Kurt
Parent - - By Dieter Hagemann Date 2011-12-05 10:19
[quote="Peter Krug"]Ich kann da nur aus den Erfahrungen im Endspiel sprechen:

Dort ist sowohl Houdini als auch Stockfisch oft daneben. Und es gibt noch sehr
viel zu verbessern.

Aber ich kenne keine besseren zum Analysieren. Oder weißt du eine bessere im EG -Bereich?[/quote]
Hallo Peter,
wenn Du die Tablebases bis zu den Sechssteinern benutzt, sind Zappa, DeepFritz 10 (!) und Shredder meine Referenzen.

Viel Erfolg wünscht:
Dieter
Parent - - By Arno Nickel Date 2011-12-05 12:50
Eine Frage an die Allgemeinheit, aber auch an die Spezialisten:
Ist Rybka keine erste Wahl mehr für tiefe Analysen, speziell im Fernschach?
Mich wundert, dass diese Engine in diesem Thread überhaupt nicht auftaucht. Was habe ich eventuell versäumt, obwohl ich kürzlich mit dem deutschen Olympia-Team am 3. Brett die Goldmedaille erringen konnte (8 aus 12) und dabei gut und gern auch auf Rybka (jetzt 4.1) zurückgegriffen habe? Natürlich muss man bei jeder Engine die Besonderheiten berücksichtigen. Nobody is perfect. Aber ich kann mir kaum vorstellen, dass ein Spitzenspieler heute im Fernschach ganz auf Rybka verzichten könnte, ohne damit einen Nachteil zu riskieren. Rybka ist langsamer als Houdini, aber nach meinem Erfahrungen dafür oft gründlicher und gelegentlich auch einfach anders. 
Parent - By Ludwig Bürgin Date 2011-12-05 17:38
Hallo Arno

Zuerst mal Gratulation zu Deinem großen Erfolg.Es bleibt mir Spielstärkemäßig verwehrt Dir gute Ratschläge zu unterbreiten.Jedes Forum lebt naturgemäß von den unterschiedlichen Meinungen der Schreibenden.Viele Comp.Schächer beschäftigen sich gerne mit neuen Enginen und wollen ihre Stärken , Spielweise und Verwendung erforschen.Zu Houdini und Rybka. Im Maschinenraum ist Houdini bei kürzeren Partien der absolute Favorit.Houdini findet zu etwa 80 % auf Anhieb den besten Zug.Rybka ist etwas langsamer und kann bei schnelleren Partien nicht mehr so recht mithalten.
Für die Analyse bleibt es wohl  wie Du schreibst bei den beiden  Programmen.Wenn man die Stärken und Schwächen von Rybka kennt,gehört die Engine für die Analyse meiner Meinung nach immer noch mit zur ersten Wahl.

Habe mir einfach erlaubt, Dir zu antworten.

Gruß Ludwig
Parent - By Frank Quisinsky Date 2011-12-05 19:00
Hallo Arno,

im Spielaufbau fallen bei den Ratinglisten eher andere Engines auf. Aber das ist immer alles eine Sache des Betrachters bei den Bedinungen die ausgewählt wurden. 40 Züge in 10 Minuten ist keine Zeitkontrolle, die einen Fernschächler umhaut. Dagegen halten könnte ich das ja auch die erwähnten Engines die hier positiv beschrieben wurden mit mehr Zeit auch zulegen, nicht nur die bekannten Analyseengines.

Strittig wäre folgender Umstand:

Nehmen wir an wir geben sowohl Spark als auch Houdini 50x mehr Zeit. Da Houdini ca. mit 260 ELO höher liegt als Spark müsste das mehr an Zeit eher Houdini zu Gute kommen. Aber dem ist nicht so! Schwächere Engines kämpfen sich mit mehr Zeit näher an gute Züge als Engines die ich Windeseile schon nach wenigen Sekunden / Minuten einen guten Zug ermitteln. Ich habe die Erfahrug bei meinen eigenen Analysen gemacht, dass durchaus auch deutlich schwächere Programme Züge regelrecht errechnen und nicht überfliegen. Das soll nicht bedeuten, dass z. B. ein Houdini mit mehr Zeit und höheren Zugtiefen auch die Varianten wechselt und vermutlich bessere Züge errechnet. Aber dies im Verhältnis zu spielschwächeren Engines eher seltener.

Rybka spielt das frühe Mittelspiel meines Erachtens eher passiv, zu verhalten ohne wirklich etwas zu riskieren. Offene Stellungen werden eher im Vergleich zu anderen Programmen vermieden. Eine passivere Spielweise ist vielleicht fürs Fernschach gut, ich kann das nicht wirklich beurteilen.

Spark war ja mein Aufhänger.
Wenn 4017 Partien gegen die komplette Computerschachkonkurrenz gespielt wurde, keine Partien unter 40 Zügen bis zum Matt verloren wurde und nur in 14 Partien bei Partiennummer 40 ein höhere Stellungsbewertung als -2 ausgeben wird muss das unstrittig gut sein. Wenn diese Engines auch noch in der Lage ist die meisten Kurzpartien von den gesamten TOP-40 zu produzieren muss das gut sein. Umso tragischer das diese Engine dann mit immer mehr Zügen im Vergleich zu den besten Konkurrenten abfällt.

Aber wir haben, einen Spark 1.0 der sich für Analysen zu diesen Partienphasen eignen muss. Die ausgegebenen Statistiken sind nicht nur klar sondern eindeutig. Insofern regte ich das Thema auch schon öfters mal an um einfach darauf hinzuweisen, dass sich viele Engines, je nach Stellung und Partiephase, für sehr gute Analysen eignen.

Es wäre vielleicht mal interessant in bekannt schwierigen Eröffnungen Spark die bekannten Schlüsselzüge untersuchen zu lassen. Dies dann zu vergleichen mit anderen Engines. Das wäre aber auch wieder ein enormes Unterfangen aber durchaus interessant für Fernschachspieler die vielleicht mittels einer guten Engine-Kombination Vorteile beim Prüfen Ihre Züge haben.

Abschließend:
Glückwunsch zur Goldmedaille.

Viele Grüße
Frank
Parent - - By Eduard Nemeth Date 2011-12-05 22:19
Hallo Arno,
ich kann mich deiner Meinung zu 100% anschliessen!
Es ist wirklich erstaunlich zu sehen, wie schnell eine TOP-ENGINE wie Rybka, hier fasst in Vergessenheit gerät. Würde ich aktuell FS spielen (oder z.B. Freestyle), ich würde Rybka allen anderen Engines vorziehen.

Bei dieser Gelegenheit möchte ich Dir zum Gewinn der Goldmedaille gratulierten. Herzlicher Glückwunsch!

MfG
Eduard
Parent - - By Arno Nickel Date 2011-12-06 09:25
Hallo Eduard,
Dir auch vielen Dank. Welches sind denn Deine Lieblingsengines neben Rybka bzw. welche hälst Du bei Partieanalysen für eine gute Ergänzung?
Übrigens gibt es bei InfinityChess für Mitte Januar konkrete Vorbereitungen, erste Freestyle-Turniere mit 60m+15s abzuhalten. Turniersoftware und Serverstabilität sind auf einem guten Weg. - Um die Sache zu verstetigen und nicht zu stressig zu gestalten, haben wir fürs erste ein Turniersystem entwickelt, indem man sich in 5er Gruppen durch einen Gruppensieg für die nächste Stufe qualifiziert. Gespielt wird am Tag nur eine Partie, allerdings können die Spieler via Turnierleiter Terminverlegungen vornehmen und auch Partien vorspielen (ausnahmsweise: nachspielen), wenn es ihnen passt und das Turnier sich dadurch nicht verzögert. Im nächsten Stadium spielen bis zu 20 Gruppensieger bzw. Qualifizierte wiederum in 5er-Gruppen. Die vier Gruppensieger dieser zweiten Etappe spielen dann Mini-Matches im K.o.-Modus. Das ganze entspricht einem Liga-System.
Ein Zyklus dauert einen Monat (bis max. 12 Partien + evtl. Tie-break), allerdings beginnt alle 2 Wochen ein neuer Zyklus, also immer wieder eine neue Chance für diejenigen, die sich nicht im vorigen Zyklus qualifiziert und nur 4 Partien gespielt haben (oder die einfach über genügend Zeit verfügen). Ich denke, es beginnt damit eine neue interessante Freestyle-Zeit. Die großen Open nach Schweizer System mit attraktiven Geldpreisen soll es später auch wieder geben, wenn der Server sich bewährt hat und komplett ist.
Nähere Informationen folgen bald.
Schöne Grüße (auch an alle anderen interessierten Freestyler!),
Arno
Parent - By Thomas Müller Date 2011-12-06 10:33
Hallo Arno,
danke für die Info.
War damals auch auf dem Server bissl aktiv bis er vom netz ging.
Aktuell ist die seite http://www.infinitychess.com/ aber noch down oder gibt es eine neue adresse?

Und danke für deine interessanten postings (mehr davon!) und noch GW zu gold!!

gruß thomas
Parent - - By Arno Nickel Date 2011-12-06 00:39 Edited 2011-12-06 00:41
Vielen Dank an Ludwig und Frank für die Kommentare und die Gratulation. Spark sollte keineswegs unterschätzt werden. Ich weiß zwar sehr wenig über das Programm, kann mich aber noch gut erinnern, dass es in Thüringen 2010, wo ich damals vor Ort war, für alle Konkurrenten eine harte Nuss war.
Was den Spielaufbau von Rybka betrifft, ist dieser nach meinem Eindruck von der Version 3 nach 4 aktiver geworden, soweit sich das anhand des Analyseverhaltens bei Theorievarianten nachvollziehen lässt. Ich kann schon verstehen, dass Leute lieber Houdini oder eine andere "schnelle" Engine nehmen, um sich eben schnell ein Bild von einer Stellung oder von einem Partieverlauf zu machen, z. B. beim Kiebitzen oder Nachspielen von Partien. Auch das Aufspüren orgineller Manöver und Motive mit Junior oder Stockfish, um nur zwei Beispiele zu nennen, macht Sinn, wenn man denn eine Stellung aus möglichst vielen und verschiedenden Blickwinkeln betrachten will.
Ein paar Worte zum Fernschach: Wenn man in einer schwierigen Stellung, die sich in einem dynamischem Gleichgewicht zu befinden scheint, die besten Zugfolgen für beide Seiten sucht, stellt man immer wieder fest, dass die von den Engines nach mehrstündiger Suche angegebenen Varianten nur erste Hinweise auf die Stellungsprobleme geben, aber keineswegs schon Klarheit darüber bringen, welches nun der oder die besten Züge und Antwortzüge sind. Die Bewertungen relativieren sich rasch, wenn man geduldig Zug für Zug die Varianten in die Tiefe verfolgt; oft verändert sich dabei die ganze Variante. Man bekommt eine Ahnung davon, wie tief die Stellungspropleme liegen. Nach einer Woche Analyse ist man eventuell verunsichert: Ist man überhaupt in der Lage, ein fundiertes Urteil über den Wert der einzelnen Kandidatenzüge zu fällen? Wird die Entscheidung nicht letztlich einen starken subjektiven Anteil haben?
Nehmen wir an, wir haben mit Houdini in einer komplexen Mittelspielstellung Tiefe 30 erreicht und finden es unökonomisch, hier noch weiterrechnen zu lassen. Beim Nachvollziehen der nächsten 10 Halbzüge zeigt sich ein gewisses Auf und Ab der Bewertung; sagen wir, sie pendelt zwischen 0.20, 0.40 und 0.20, also wenig aufregend, aber auch nicht rein statisch. Der Fernschachspieler versucht nun, herauszufinden welches Potential die einzelnen ähnlich bewerteten Kandidatenzüge haben. Welche Art von Vorteil ist dauerhaft, welcher Vorteil lässt sich ausbauen, welcher eher nicht? Genauso, nur mit umgekehrtem Vorzeichen, stellt sich die Sache für den Verteidiger dar. Die letztlich getroffene Entscheidung basiert dann auf einer interaktiv ermittelten Stellunganalyse von einiger Tiefe, die ein einzelnes Programm nur erreichen könnte, wenn es in der besagten weitläufigen Ausgangs-Mittelspielstellung bis in Tiefe 45 oder 50 rechnen könnte. Häufig habe ich dabei die Erfahrung gemacht, dass prophylaktische Züge die entscheidenden Schlüsselzüge sind, jedenfalls nicht weniger als die oft spektakulären forcierenden Züge. Der Mensch lässt sich aber gern von spektakulären Zügen beeindrucken, zumal wenn diese höher oder gleichwertig von Engines bewertet werden. Houdini und Rybka eignen sich hier ganz gut zur gegenseitigen Korrektur, was aber natürlich nicht ausschließt, dass gelegentlich - im Laufe der Suche - beide irren und auch mal eine dritte Engine Recht hat.
Zwei kleine Hinweise in eigener Sache:
1) Das kommende KARL-Heft (4/2011) hat den Schwerpunkt "Fernschach", darunter auch mit einem Beitrag von mir, der u.a. drei kommentierte Partien mit Aspekten von Engineverhalten und Enginenutzung enthält.
2) Für "Schach" (ca. ab 2/2012) plane ich eine Artikelserie zum Thema "Analysieren mit dem Computer". Für Hinweise, was ihr - in diesem Zusammhang - für relevante Stärken und Schwächen der besten Engines haltet, bin ich gern jederzeit dankbar, da ich mich nicht nur auf die eigene Fernschachpraxis stützen will, sondern auch an die vielen Schachspieler denke, die Engines nutzen, um ihre Nahschachpartien zu analysieren, sich auf Nahschachkämpfe vorzubereiten, Eröffnungsvarianten zu prüfen, Meisterpartien nachzu spielen etc. Auch Analysetechniken und Analyseerfahrungen sind von Interesse. Sicherheitshalber lasse ich auch meine Email-Adresse hier: arnonickel[at]t-online.de.
Parent - - By Frank Quisinsky Date 2011-12-06 02:00 Edited 2011-12-06 02:09
Hallo Arno,

sehr interessant wenn starke Schachspieler versuchen sich mal näher mit den Engines zu beschäftigen bzw. auch das Analyseverhalten durchforsten. Werde mir Deinen Bericht durchlesen.

Zu Rybka kurz:
Ja, die Engine spielt aktiver in Version 4.1. Rein vom Spielstil gefiel mir die Version 3.0 sehr gut. Auffällig bei Rybka ist das ebend nichts auffällig ist (direkter Vergleich zu den derzeit 6 Konkurrenten).
Die Engine spielt zäh im Mittelspiel und wird meines Erachtens dann immer stärker. Vielleicht sind die anderen 6 (Stockfish, Komodo, IvanHoe, Fire, Critter und Houdini) ca. gleicher Spielstärke nicht besser in den späten Partiephasen. Critter und Stockfish fallen eher durch aggressiveres Schach auf. Ivanhoe spielt zäher als Rybka, ist viel schwieriger zu bezwingen und verliert meist nur aufgrund kleiner Stellungsnachteile die dann irgendwann genutzt werden. Houdini spielt in allen Partiephasen sehr gut, wenn diese Engine zu bewzingen ist dann taktisch bei offenen Stellungen im Mittelspiel. Komodo nutzt kleine Vorteile gnadenlos aus und beharrt auf diese Vorteile, sucht immer den Weg eine Partie zu entscheiden. Besonders auffällig wirds im Endspiel.

Das jetzt z. B. feiner zu unterteilen ist sehr schwierig und stößt absolut an meine eigenen Grenzen. Es gibt auch nur wenige Programme die für Analysen neben diesen 6 + Rybka interessant sind. Die Vorteile die spielschwächere haben sind irgendwo verborgen in den Vorteilen dieser 7 Programme.

Spark wurde ja hier angesprochen.
Chiron spielt auch sehr zäh im Endspiel und blitzt immer mal wieder mit schönen Kombinationen auf. Junior im Mittelspiel ist wenn die Juniorische Stellung erreicht wird eine Augenweide. Mit großen Abständen zu Junior spielt auch Smarthink sehr interessant, hat aber zu viele Lücken. Die Stärke von Smarthink ist daher ganz schwierig herauzufinden. Fest steht, dass Smarthink vergleichbar zu Junior komplett anders Schach spielt und hier dann hin- und wieder mit absolut tollen Partien überzeugt. Ktulu im Endspiel mit Türmen ... glaube nicht das eine TOP-7 Engine hier deutlich besser ist, wahrscheinlich ist Ktulu in den meisten Turmendspielen überlegen. Fritz erkennt wie wichtig die Bauernstrukturen im Endspiel sind und spielt darauf hin, erreicht damit oft in schwächeren Stellungen noch Remise. Beim Einsatz mit den Endpieldatenbanken gefällt mir Shredder und ZappChess als auch IvanHoe gut.

Interessant wird die Sache heit immer wenn die Programmierer besonders Wissen einarbeiten. Protector spielt oft gegen den König mit seiner Bauernstruktur aber es fehlt an Durchsetztungsvermögen Ofmals verpuffen gute Ideen einfach. Hiarcs scheint Wissen über Angriffe zu haben, merkwürdig bei Hiarcs ist das die Engine selbst öfters in Angriffe gerät. Hiarcs spielt ein sehr interessantes Schach aber es ist schon auffällig das Stärken im Vergleich zu den TOP-7 nur minimal sind. Hiarcs geht mit seiner Stärke daher ein wenig unter weil nicht so deutlich ausgeprägt das diese stark auffällig ist.

Meines Eachtens sind das die folgende TOP-Analyse Engines.

1. Houdini, Stockfish, Critter taktisch ... in frühen Partiephasen auch Hiarcs und Junior und natürlich Spark, Chiron scheint hier auch Vorteile zu haben.
2. Spark, Critter und Houdini ... nach den Buchzügen ... Stockfish spielt hier gar einen Tick zu taktisch, denke daher das Stockfish hier ein wenig überfordert ist.
3. Rybka, Komodo, IvanHoe eignen sich bei den frühen Partiephasen eher für ruhige Stellungen.
4. Und beim späten Mittelspiel sind die Vorteile von Houdini und Komodo einfach zu groß, wahrscheinlich reicht es diese beiden einzusetzen. Die anderen werden nicht viel mehr finden. Je nach dem was für eine Stellung dann IvanHoe oder Critter / Stockfish hinzu. Auch Stockfish errechnet wahnsinnig viel im Endspiel ... schon fast verwunderlich.
5. Endspiele mit Tablebases: ZappChess, Fritz eignet sich gut, Shredder und natürlich wieder Houdini und Komodo. IvanHoe spielt zäh und spielt oftmals auch sehr ungewöhnlich und dabei gar erfolgreich.
6. Ktulu bei den Turmendspielen ... egal ob 400 ELO schwächer, taktisch ist Ktulu sicherlich 600 ELO schwächer aber wie gesagt der Programmierer hat sich speziallisiert und hier ist Ktulu wirklich gut.

Hiarcs z. B. fehlen einfach 100 ELO.
Dann wird die Stärke im Mittespiel deutlicher und die Engine könnte für Mittelspielanalysen eingesetzt werden. Gleiches meines Erachtens für Chiron. Beide Programme speilen wirklich erfrischendes sehr schönes Schach, wie auch Hannibal aber es fehlen ELOs im Vergleich zu den anderen. Auf die nächste Hiarcs Version bin ich daher sehr gespannt. Hiarcs und auch Chiron werden bei jeder noch so kleinen Schwäche dann gnadenlos überrechnet. Bei Chiron bin ich sehr gespannt, irgendwie glaube ich hier das sehr viel Potential vorhanden ist. Da entsteht etwas wunderbares.

Tja und Naum!
Spielt auch positionell sehr gut aber diese Stärke geht bei der derzeitigen Konkurrenz unter. Das können andere Programme auch, sind spielstärker und haben noch andere Vorteile.

Und AnMon
Dieses Teil mit 2.375 ELO gilt es zu schlagen. Und gegen AnMon selbst zu spielen macht richtig Spass weil die Engine durch MTD einfach aufregend sucht und zweischneidig findet. Du weißt nie was Dich erwartet hast aber immer Chancen schwache Züge teilweise auch schnell auszunutzen. Genau richtig für meine Bedürfnisse. Ich gehe mit Siegchancen in die Partie und weiß das es eine schöne Partie wird.

Übrigens, einer Leser erwähnte Deep Fritz 10. Ja, Deep Fritz 10 spielte noch wesentlich mehr auf Linienöffnung. Dadurch entstanden interessante Positionen die sehenswert umgesetzt wurden. Die neuen Fritz Versionen spielen passiver, nicht mehr so interessant wie noch Deep Fritz 10. Vielleicht werde ich Deep Fritz 10 auch mal in die SWCR aufnehmen wenn ich mehr Zeit dafür habe.

Viele Grüße
und weiterhin viel Erfolg bei Deinen Turnieren

Frank

Alles sehr subjektiv aber aufgrund meiner Beobachtungen bei Eng-Eng Vergleichen und eigenen Analysen entstanden.
Parent - - By Arno Nickel Date 2011-12-06 09:46
Hallo Frank,
besten Dank für die Fülle an Informationen und Anregungen, die ich auch für meine geplante Artikelserie gut gebrauchen kann.
Übrigens hat sich Chiron in der Holländisch-Partie weiter oben (gegen Spark) mit dem frühen c2-c3(?) das Leben selbst sehr schwergemacht. Den Zug kann man eigentlich nur spielen, wenn Schwarz d7-d6 gespielt hat, obwohl auch dann meistens c2-c4 aussichtsreicher ist. Spark hat rechtzeitig in einen Stonewall eingelenkt und schon bald die Initiative übernommen; c2-c3/Dd1-b3 beißt auf Granit. Ein Mensch hätte vielleicht, koste was es wolle (mindestens den Anzugsvorteil), c3-c4 nach gereicht, aber dazu kam es hier nicht mehr (letzte Gelegenheit evtl. um den 14 Zug herum, aber ich hab's nicht konkret analysiert).
Viele Grüße,
Arno
Parent - By Frank Quisinsky Date 2011-12-06 16:59
Zu viele Figuren auf dem Brett + Dame.
Ktulu ist eher bei Endspielen mit Bauern und Türmen sehr gut.
Aber hier mal die gewünschte Analyse.

13.00   0:01   +1.00   1.Kg1 De7 2.Td4 g6 3.Tb4 Dd7 4.Df3 Kg7 5.g4 Te5 6.Tf4 Kh8 7.d4 Ta5 8.b4 Td5 9.a5 Dd6 10.g5 (3.445.065) 2026
14.01   0:04   +0.91   1.Kg1 De7 2.Td4 g6 3.Td1 De2 4.Dxe2 Txe2 5.b4 Tc7 6.c4 Kf7 7.Td6 Ta2 8.a5 Te7 9.Tb6 Tc2 10.Td6 (9.818.411) 1971
15.01   0:12   +0.88   1.Kg1 De7 2.Td4 g6 3.Df3 Dg5 4.Te4 Txe4 5.dxe4 De7 6.exf5 Txf5 7.Dg3 Txf1+ 8.Kxf1 De4 9.Db8+ Kf7 10.Dc7+ Ke6 11.b4 g5 (24.391.164) 2007
15.03   0:21   +0.99   1.h3 De7 2.Dc5 g6 3.c4 De2 4.Df2 Kg7 5.Kg1 Tc7 6.Kh2 Tf7 7.b3 De5+ 8.Df4 Dc3 9.Dd4+ Dxd4 10.Txd4 Te2 11.Td8 Tc7 (44.288.107) 2035
16.01   0:31   +0.99   1.h3 De7 2.Dc5 g6 3.c4 Dg5 4.Dd5 Kg7 5.Tb6 Td8 6.Df3 De7 7.Td1 Td4 8.a5 Kg8 9.Kg1 f4 10.Tf1 De3+ (63.883.189) 2049
17.01   1:03   +0.96   1.h3 g6 2.c4 Dxf2 3.Txf2 Te1+ 4.Kh2 Ta1 5.b3 Tb1 6.Tb6 Td1 7.Tf3 Te7 8.Td6 Td2 9.Td8+ Kg7 10.Kg3 Kf6 11.Td6+ Te6 12.Tf2 Txd6 13.Txd2 Td4 14.c5 (131.068.721) 2072
18.01   3:08   +0.99   1.h3 g6 2.Kg1 De5 3.Dd4 De7 4.c4 Dg5 5.Kh2 Dd2 6.c5 a5 7.Tf2 De1 8.Td8 Txd8 9.Dxd8+ Tf8 10.Dd4 Te8 11.Tf4 De6 12.Dc4 Dxc4 (380.648.956) 2018
19.01   5:24   +1.04   1.h3 g6 2.Kg1 De5 3.Dd4 Dxd4+ 4.Txd4 Kg7 5.Td1 Te2 6.Tb4 Tc2 7.Te1 Td7 8.d4 Kf6 9.Tb6+ Kg5 10.Kh2 Td2 11.Kg3 Td3+ 12.Kf2 Kf4 13.a5 Td2+ 14.Te2 (650.712.654) 2006
20.01  10:13   +1.11   1.h3 g6 2.Kg1 De5 3.Dd4 Dxd4+ 4.Txd4 Kg7 5.Td1 Te2 6.Tb4 Tfe7 7.Kf1 b5 8.axb5 axb5 9.Txb5 Tc2 10.Te1 Txe1+ 11.Kxe1 Txg2 12.d4 Th2 13.Tb7+ Kh6 14.c4 (1.208.579.539) 1971
21.01  25:13   +1.15   1.h3 g6 2.Kg1 De5 3.Dd4 Dxd4+ 4.Txd4 Kg7 5.Kf2 Tfe7 6.Kg3 Tf7 7.Td6 Te3+ 8.Tf3 f4+ 9.Kf2 Tfe7 10.Txf4 Te2+ 11.Kg3 Txb2 12.Tfd4 Tc2 13.Td7 Tf7 14.Txf7+ (-1338739631) 1953
22.01  35:26   +1.15   1.h3 g6 2.Kg1 De5 3.Dd4 Dxd4+ 4.Txd4 Kg7 5.Kf2 Tfe7 6.Kg3 Tf7 7.Td6 Te3+ 8.Tf3 Te2 9.Tf2 Te3+ 10.Kf4 Tfe7 11.h4 h6 12.b4 Te1 13.Kg3 Th1 14.b5 (-164986736) 1942
23.01  61:48   +1.13   1.h3 g6 2.Kg1 De5 3.Dd4 De7 4.c4 De2 5.Df2 De7 6.Dc5 De2 7.Dd4 Tfe7 8.c5 Dc2 9.Tf2 Db3 10.Dd5+ Dxd5 11.Txd5 Te5 12.Txe5 Txe5 13.d4 Td5 14.Td2 (-1398720017) 781
24.01  213:53   +1.15   1.h3 g6 2.Kg1 De5 3.Dd4 Dxd4+ 4.Txd4 Kg7 5.Kf2 Tfe7 6.Kg3 Tf7 7.Td6 Te3+ 8.Tf3 Te2 9.Tf2 Te3+ 10.Kh2 Te1 11.d4 Ta1 12.b3 Tb1 13.Tb6 Td1 14.Te6 (-1769393297) 196
Parent - - By Frank Quisinsky Date 2011-12-06 17:20 Edited 2011-12-06 17:22
Hallo Arno,

habe die Ktulu Analyse an die falsche Stelle gesetzt
OK, weißt ja welche Analyse gemeint ist.

Vielen Dank für die Eindrücke zur Spark - Chiron Partie. Im Spießroutenlauf von Chiron nach jetzt 1.320 Partien kam es nicht so vielen sehenswerten Partie wie die gepostete. Es spielte die komplette Konkurrenz gegen Chiron 1.1 aber in er letzten Runde hat sich dann doch noch ein Programm aufgerafft eine Glanzpartie hinzulegen. Sorry, mal wieder war es Spark 1.0.

Event:
Ort:
Datum:

Weiss:
Schwarz:

Ergebnis
Board
Parent - - By Frank Quisinsky Date 2011-12-06 17:46 Edited 2011-12-06 17:56
Hm,

war ja doch noch so eine beim Spießroutenlauf dabei ...
Mal auf das Angriffsmuster dieser Engine achten.
Meist Öffnung der Bauernstruktur und dann sämtliche Figuren rein ins Vergnüngen.
In der nachfolgenden Partie dann mal anders. Wie konsequent die weißen Schwerfiguren plötzlich in den Angriff gebracht werden.
Und schwarz schaut zu und kann gar nicht so viel dagegen spielen.

30. Kg2 ist schon frech!
Und dann konsequent alles an verbleibenden Figuren umdisponiert.
Ob Kg2 errechnet ist oder Schachwissen ist.
Glaube nicht das viele Programme diese Schlange an Angriffszügen wirklich sehen.
Muss sich das wirklich mal in Ruhe ansehen, wo stehen die weißen Figuren vor 30. Kg2 und werden diese dann aufgebaut bzw. wo stehen die weißen Figuren bei Zug 38. Springt einfach mal von Zug 30 zu Zug 38 und beginnt zu staunen!

Die SWCR Statistiken zu Spark haben natürlich Gründe und bei den drei Beispielen wirds auch ein wenig mehr offensichtlich.

Also hier noch eine dritte ... bei 40 Partien, drei davon ... gar nicht so schlecht

Event:
Ort:
Datum:

Weiss:
Schwarz:

Ergebnis
Board
Parent - By Frank Quisinsky Date 2011-12-06 18:14 Edited 2011-12-06 18:18
Hi,

wer Lust hat mit Spark 1.0 zu experimentieren kann folgendes Experiment starten.
Hatte ich vor ca. einem halben Jahr mal gemacht.

Lasst Spark 1.0 gegen eine ruhige Engine spielen.
Z. B. IvanHoe, Rybka, Komodo.

Nicht unbedingt gegen Engines die auch ansatzweise diese Stärken haben.

z. B. ein Match über 100 Partien, solltet aber die Bedenkzeit etwas höher setzen, kein Blitz!
Und nun brecht einfach jede dieser 100 Partien ab.

Bewertet die Partie mit Houdini 2.0c nach Zug Nummer 40.
z. B. alles von +1.0 - -1.0 = Remis

Und dann beginnt mal zu stauen wie eine Engine die eigentlich 250 ELO schwächer ist gegen die TOP-7 spielt.
Ich verrate zwei Ergebnisse ...

Spark 1.0 x64 - IvanHoe B47cB x64 58:42 bei 40 in 10
bei 40 Zügen und das Endergebnis war ... 31:69

Spark 1.0 x64 - Rybka 4.1 x64 52,5:47,5 bei 40 in 10
bei 40 Zügen und das Endergebnis war ... 29,5:70,5

Diese Ergebnisse bedeuten, dass Spark nach der Eröffnung ca. 300 ELO spielstärker ist, als die eigentliche ELO ausgibt.
Ich könnte mir gar vorstellen das es vielleicht sogar zu Platz 1 reicht, sofern eine Partie bei Zugnummer 40 endet, wobei das schwierig wird.

Ich weiß nicht ob solche Experimente hier für Aufregung sorgen.
Ich möchte ja niemand von irgend etwas überzeugen, und halte mich mit solchen Veröffentlichungen eigener Experimente immer etwas zurück, weil es einfach nichts bringt.

Aber das wir das Thema mal haben ...
Vielleicht eine nette Idee Schach mal anders zu spielen, auf die Suche nach Stärken und Schwächen zu gehen.

Viele Grüße
Frank
Parent - By Kurt Utzinger Date 2011-12-06 11:46
Hallo Arno
Vielen Dank für diese interessanten Ausführungen, die bestätigen, dass
heutiges Fernschach doch Schwerarbeit unter gütiger Zuhilfenahme und
richtigem Einsatz von Computerprogrammen bedeutet.
Gruss
Kurt
Parent - - By Dieter Hagemann Date 2011-12-06 00:47
Hallo Arno,
meine Aussage bezog sich auf das Endspiel. In den vorhergehenden Partiestadien hielte ich es für fahrlässig, auf Rybka zu verzichten. Aber auch Hiarcs, Junior und Shredder würde ich zu Rate ziehen. Keine Ahnung, wie weit man damit beim Fernschach kommt.

Angenehme Nachtruhe und Gratulation zur Goldmedaille wünscht:
Dieter
Parent - - By Arno Nickel Date 2011-12-06 10:20
Hallo Dieter,
manche Endspieltypen behandelt Rybka m. E. sehr gut, Leichtfigurenendspiele mit Freibauern, auch die Kombination von Turm + Leichtfigur + Bauern, wobei das Problem des "falschen" Läufers (der nicht das Umwandlungseckfeld beherrscht) gelegentlich nicht rechtzeitig genug erkannt wird. Schwerfigurenendspiele mit D+T, in denen naturgemäß Dauerschachdrohungen oder Remisschaukeln eine große Rolle spielen, versteht Rybka wohl weniger gut. - Ich hatte in einer meiner Fernpartien, die ich für KARL (4/2011, kommt erst noch) ausführlich kommentiert habe, einen forcierten Übergang in ein einfaches Turmendspiel, beginnend mit 37.Dxe2.
Dass dieser Übergang langfristig gewinnt, sieht meines Erachtens keine Engine bei der uns zur Zeit zur Verfügung stehenden Hardware (z.B. i7). Nach meinem Eindruck lieferte Rybka hier aber, wenn man in die Varianten hineingeht, deutliche bessere Ergebnisse als Houdini (oder z.B. Shredder, Fritz, Junior, Naum, die ich interessehalber mal verglichen habe). Rybka hat hier den richtigen "Biss" für die Freibauernverwertung beider Seiten (wie für die Bauernzüge überhaupt) und für das Stellungsspiel des weißen Königs. Andere Engines kapieren überhaupt erst ganz allmählich, kurz vor der Aufgabe des Schwarzen mehr als 40 Halbzüge später, dass die Stellung für ihn verloren ist. Falls jemand Interesse hat, das Endspiel zu testen (vielleicht auch mit Ktulu, - Frank?!) wäre das schon interessant.


Das ist die Stellung nach 36...Te8, in der sich Weiß entscheiden musste, ob er die Damen auf dem Brett lassen soll oder nicht. Die Entscheidung fiel nach 2-3 Wochen, in denen ich mich überzeugt hatte (u.a. auch mit Konsultation der Mannschaft), dass das zu erzwingende einfache Turmendspiel für Weiß zu 95% (so habe ich es damals gesagt) gewonnen ist.

[Event "ICCF Olympiad 17 Final"]
[Site "ICCF"]
[Date "2009.09.10"]
[Round "?.3"]
[White "Nickel, Arno"]
[Black "Drake Díez de Rivera, Pedro"]
[Result "1-0"]
[WhiteElo "2641"]
[BlackElo "2589"]
[PlyCount "123"]
[EventDate "2009.??.??"]
[WhiteTeam "Germany"]
[BlackTeam "Spain"]
[WhiteTeamCountry "GER"]

1. e4 c5 2. Nc3 Nc6 3. Bb5 Nd4 4. Bc4 e6 5. Nge2 a6 6. a4 Ne7 7. Nxd4 cxd4 8.
Ne2 Nc6 9. O-O Be7 10. d3 O-O 11. Bb3 f5 12. Bd2 Bc5 13. exf5 Rxf5 14. Ng3 Rf8
15. f4 d5 16. f5 Kh8 17. Qh5 exf5 18. Rae1 Bd7 19. Qf3 Nb4 20. Nh5 Rc8 21. Bf4
Rf7 22. Kh1 Bf8 23. Be5 Qg5 24. Nf4 Bc5 25. c3 Nc6 26. Nh3 Qg6 27. Bg3 Ne7 28.
Nf4 Qb6 29. Bxd5 Nxd5 30. Qxd5 Kg8 31. Ne6 Bxe6 32. Rxe6 Qd8 33. Bd6 Bxd6 34.
Rxd6 Qe7 35. Qxd4 Qe2 36. Qf2 Re8 37. Qxe2 Rxe2 38. Rd8+ Rf8 39. Rxf8+ Kxf8 40.
Rxf5+ Ke7 41. Kg1 Rxb2 42. a5 b5 43. axb6 Rxb6 44. Rg5 Kf6 45. Rc5 Rb3 46. Kf2
a5 47. Ke3 a4 48. h4 a3 49. c4 Rb2 50. Ra5 a2 51. g4 Rh2 52. Ra6+ Ke7 53. h5
Rg2 54. d4 Kd7 55. c5 Rg3+ 56. Kf4 Rg2 57. d5 Kc7 58. Ra7+ Kb8 59. Ra3 Kc7 60.
Kf5 Re2 61. g5 Kb7 62. d6 1-0

Viele Grüße,
Arno
Parent - - By Peter Martan Date 2011-12-06 12:28
[quote="Arno Nickel"]
Falls jemand Interesse hat, das Endspiel zu testen (vielleicht auch mit Ktulu, - Frank?!) wäre das schon interessant.


Das ist die Stellung nach 36...Te8, in der sich Weiß entscheiden musste, ob er die Damen auf dem Brett lassen soll oder nicht. Die Entscheidung fiel nach 2-3 Wochen, in denen ich mich überzeugt hatte (u.a. auch mit Konsultation der Mannschaft), dass das zu erzwingende einfache Turmendspiel für Weiß zu 95% (so habe ich es damals gesagt) gewonnen ist.
[/quote]

Gratuliere erstmal auch recht herzlich, Arno!

In Hinblick auf das Endspiel hab ich hier mal auf gut Glück Junior angeworfen mit den 6Steinern, hier der ouptput:

4r1k1/1p3rpp/p2R4/5p2/P7/2PP4/1P2qQPP/5R1K w - - 0 1

Analysis by Deep Junior 12.5.0.3 UCI:

37.Dxe2
  +/-  (0.78)   Tiefe: 6   00:00:00  1kN
...
37.Dxe2 Txe2 38.Td8+ Tf8 39.Txf8+ Kxf8 40.Txf5+ Ke7 41.Kg1 Txb2 42.a5 b5 43.axb6 Txb6 44.Tc5 Tb3 45.d4 Kd6 46.h3
  +/-  (0.94)   Tiefe: 27   00:04:30  6274mN, tb=469

Nicht so übel für gerade mal 5 Minuten aus dem Stand (nix in die Varianten hinein und wieder raus, nur um dem Verdacht zuvorzukommen ), hmh?
Immerhin decken sich die ersten 7 Züge mit deiner Partiefortsetzung, Junior strebt die Vereinfachung an, marschiert mit dem König los und mit dem a-Bauern, zufrieden?
Parent - - By Michael Scheidl Date 2011-12-06 14:07
Hiarcs 12 auf Stufe: 3 Halbzüge
(Lernfile zuvor gelöscht, leere Hashtables)

Hiarcs 12 - User, 3 Ply

Analysis by Hiarcs 12:

37.Qxe2 Rxe2 38.Rd8+ Rf8 39.Rxf8+ Kxf8 40.Rxf5+ Ke7 41.Kg1 Rxb2
  +/-  (1.34)   Depth: 3/16   00:00:00  1kN
  +/-  (1.34)   Depth: 3/16   00:00:00  1kN

Daueranalyse:

Analysis by Hiarcs 12:

37.Qxe2 Rxe2 38.Rd8+ Rf8 39.Rxf8+ Kxf8 40.Rxf5+ Ke7 41.g4 Rxb2 42.Re5+ Kf6 43.d4
  +/-  (1.28)   Depth: 8/28   00:00:00  48kN
  +/-  (1.16)   Depth: 16/43   00:02:36  31683kN, tb=1

Fünfsteiner für Turmendspiele waren an Bord, doch erst auf Tiefe 15 oder 16 gab es einen Zugriff. Im 41. Zug angekommen, würde H12 offenbar Kg1 statt g4 ziehen.

Die meisten Engines scheinen "aus dem Stand" jedoch 37.Kg1 oder das amüsante 37.Td8 vorzuziehen. Auf letzteres antwortet Hiarcs 12 bei mir auf mittleren Tiefen mit der "Gegenüberraschung" DxTf1+, was zum Materialverhältnis D+B für TT führt.

(Deswegen H12 und nicht H13, weil ich mir H12 zu einem günstigen Preis inkl. Playchess-Seriennummer gegönnt habe. Man gönnt sich ja sonst nichts.)
Parent - - By Peter Martan Date 2011-12-06 14:41
[quote="Michael Scheidl"]
Analysis by Hiarcs 12:

37.Qxe2 Rxe2 38.Rd8+ Rf8 39.Rxf8+ Kxf8 40.Rxf5+ Ke7 41.g4 Rxb2 42.Re5+ Kf6 43.d4
  +/-  (1.28)   Depth: 8/28   00:00:00  48kN
  +/-  (1.16)   Depth: 16/43   00:02:36  31683kN, tb=1

[/quote]

Ich weiß, Michael, den hatte ich auch schon probiert. Mit den 6Steinern und etwas längerer Bedenkzeit auf 12 Kernen kommt er aber bei mir wieder davon ab:

4r1k1/1p3rpp/p2R4/5p2/P7/2PP4/1P2qQPP/5R1K w - - 0 1

Analysis by HIARCS 13.2 MPP0:

37.Dxe2 Txe2 38.Td8+ Tf8 39.Txf8+ Kxf8 40.Txf5+ Kg8 41.Kg1 Txb2 42.Tc5 b5 43.Tc8+ Kf7
  +-  (1.42)   Tiefe: 14/46   00:00:00  1599kN
...
37.Dxe2 Txe2 38.Td8+ Tf8 39.Txf8+ Kxf8 40.Txf5+ Ke7 41.Kg1 Txb2 42.a5 b5 43.axb6 Txb6 44.Tg5 g6
  +/-  (1.03)   Tiefe: 21/49   00:00:26  147mN, tb=551
37.h3
  +/-  (1.04)   Tiefe: 21/49   00:00:32  177mN, tb=551
...
37.h3 g6 38.Kg1 De5 39.Dd4 Dxd4+ 40.Txd4 Te2 41.Tf2 Te1+ 42.Kh2 Tfe7 43.Td8+
  +/-  (1.18)   Tiefe: 23/50   00:02:23  751mN, tb=554

Mag sein, dass er auch wieder dazu zurückkehrt, das lohnt sich mir aber nicht mehr, die Bewertung ist ja auch bei Junior noch nicht das Gelbe vom Ei, wieviel Verständnis welche engine da wirklich mitbringt, muss man mit längeren Varianten und backward solving probieren, wieviel eval wie weit wieder mit zurück genommen wird, melde mich wieder, wenn ich was Ordentliches zusammenbringe.
Parent - - By Peter Martan Date 2011-12-06 19:58
Also hier mal Stockfish, nachdem er die Partie rückwärts in den hash geschaufelt hat, über eine Stunde auf 3 Varianten:

4r1k1/1p3rpp/p2R4/5p2/P7/2PP4/1P2qQPP/5R1K w - - 0 1

Analysis by Stockfish 111030 64bit:

1. +-  (1.57): 37.Dxe2 Txe2 38.Td8+ Tf8 39.Txf8+ Kxf8 40.Txf5+ Ke7
2. +/-  (1.29): 37.g3 g6 38.Kg1 De7 39.Dd4 De2 40.Tf2 De1+ 41.Kg2 Tfe7 42.Dd5+ Kg7 43.Td7 Txd7 44.Dxd7+ Te7 45.Dd4+ Te5 46.Df4 h5 47.Df3 Te7 48.h3 Kf6 49.d4 Te4 50.h4 Kg7 51.Dd3 Kf6 52.Dc4 Te7 53.Dd5 Kg7 54.a5
3. +/-  (1.21): 37.Kg1 De7 38.Td5 g6 39.g3 h5 40.Dd4 Kh7 41.Kg2 Tg7 42.Tf2 De1 43.Td7 Tee7 44.Txe7 Dxe7 45.Dd5 De8 46.d4 Dxa4 47.De5 Td7 48.d5

Immerhin eine Bewertung, die deutlichen Vorteil für Weiß anzeigt und das nur für den Damentausch mit doch deutlichem Abstand zu den Alternativzügen.
Bleibt natürlich die Frage offen, ob die Partie nicht auch anders gewonnen hätte werden können und ob die schwarze Verteidigung wirklich überall optimal war.
Nur so als Beispiel:
Stockfish markiert im backward solving 44...Kf6 mit guten +2, und schlägt als Alternative 44...g6 mit nur +1.25 vor.
Was waren doch noch gleich die restlichen 5%  Arno?
Parent - - By Arno Nickel Date 2011-12-07 01:33
Hallo Peter und alle anderen Poster hier in diesem Thread,

soviele spontane und teilweise ausführliche Postings hatte ich beileibe nicht erwartet, erstmal vielen Dank dafür!

Du schreibst, dass Stockfish die Partie "rückwärts in den hash geschaufelt hat". Nun, das ist allerdings eine Methode, die dem Fernschachspieler so nicht zur Verfügung steht, denn die Partie existiert ja noch nicht, wenn er vor der konkreten Entscheidung steht. Andererseits vermute ich, dass die Partie bei so vielen Zügen die da rückwärts "geschaufelt" wurden, gar nicht so tief bzw. komplett in den Hashtables enthalten ist., ansonsten wäre die niedrige Bewertung für 37.Dxe2 unverständlich.

Ich hatte damals auch eine Stockfish-best move-Variante in Tiefe 38 abgespeichert, und die sah so aus:
Stockfish 1.8 JA: 37.g3 g6 38.Kg1 Kf8 39.Dd4 Kg8 40.Tf2 De1+ 41.Kg2 Tfe7 42.Kh3 Dd1 43.Td7 Dh1 44.Txe7 Txe7 45.g4 fxg4+ 46.Kxg4 Dc6 47.Kg3 Dc7+ 48.Tf4 Td7 49.Dc4+ Dxc4 50.dxc4 Td2 51.Tf2 Td6 52.Kf4 Tc6 53.b3 Kf8 54.Kg5+ Kg7 55.Td2 Tc7 56.Kf4 Kf6 1.33/38  Line
Das nur nebenbei. Mir scheint, mit Computerbelegen ist es manchmal so wie mit Statistiken; es lässt sich vieles beweisen... Aber für konkrete Zugentscheidungen taugen sie nur im großen Zusammenhang und nicht isoliert betrachtet, solange es kein klares +- (-+) oder = gibt.

Übrigens verliert die von Dir zitierte Stockfish Alternative 44...g6 (die einzig mögliche substantielle Abweichung) langfristig genauso; es handelt sich um eine Schwächung der schwarzen Bauernstruktur, die Weiß gerade beabsichtigt hat (oder eben das Ablenken des Königs nach f6, weg vom Damenflügel bzw. den weißen Freibauern). Der Zug 44.Tg5 ist wichtig; auf 44.Te5+ könnte Schwarz 44...Kd6 antworten mit besseren Verteidigungschancen als in der Partie (kleiner Nebenaspekt, der auch nicht so ohne weiteres von Engines erkannt wird).

Die meisten haben wohl richtig verstanden, und auch Dir Peter will ich natürlich nichts anderes unterstellen, dass es nicht einfach um den nächsten Zug geht, sondern um die Perspektiven der Partie, d.h. die analytischen Probleme in der Dxe2-Variante beginnen genau dort, wo die forcierte Zugfolge nach 40...Ke7 aufhört (bis dahin ist alles selbstverständlich).

Wenn man sich als Fernschachspieler auf eine solche Variante einlässt, muss man selbstverständlich die weitere Folge analysieren, und da wird es schon etwas komplizierter. Die leicht höhere Bewertung mancher Engines für die Dxe2-Spielweise (im Vergleich zu den anderen Zugkandidaten; dazu geben nicht alle Analysen Auskunft) würde ich erstmal in den etwas unterschiedlichen Bewertungsparametern begründet sehen und nicht in irgendeiner tiefsinnigen Gewinntendenz, die sich bemerkbar macht. - Was hinter den Bewertungen stecken könnte, zeigt sich außerdem erst, wenn man nach 40...Ke7 das Spiel Halbzug für Halbzug fortsetzt (nach 41.Kg1 kommt ein weiteres relativ forciertes Stück bis 43...Txb6). Das macht natürlich Arbeit und erfordert sowohl Genauigkeit als auch schachlich-analytische Kompetenz, ansonsten könnte man ebensogut eine Münze hochwerfen.

Für einen direkten Stellungtest im Sinne der Ermittlung eines "Lösungszuges" ist die Position vor 37.Dxe2 sicherlich nicht geeignet; daran hatte ich auch nicht gedacht. Engine-technisch geht es um die Bewertungsdifferenz zu den Alternativen und darum, wie sich die Bewertung beim Vertiefen weiterentwickelt.

Der Vergleich, wieviele Züge von Weiß und Schwarz auch von Houdini gespielt würden, ist interessant, aber problematisch. Die größere Anzahl von schwarzen Houdini-Zügen (wenn ich recht erinnere, 50 : 39) deutet m.E. schlichtweg darauf hin, dass Schwarz mehr Zwangszüge gemacht hat (die andere Engines genauso machen würden). Ansonsten lässt sich daraus nicht viel ablesen. Wer sich ein kompletteres Bild von der Partie machen möchte, kann sich später die kommentierte Fassung in KARL anschauen bzw. kann ich sie auch nach Erscheinen mit dem Einverständnis des Herausgebers hier mal posten.

Die Partie eignet sich an vielen Stellen, um den Unterschied zwischen (reinem) Computerschach und Fernschach zu demonstrieren; denn um überhaupt die kritische Endspielstellung zu erreichen, musste Weiß einige positionelle Manöver durchführen und dabei der Versuchung eines früheren Bauerngewinns im Zentrum gegen Engine-Verlockungen widerstehen. Es ist diese Einheit einer Partie über verschiedene Entwicklungs- und Problemphasen hinweg, die die Sache so spannend und lohnend macht. Sie vermittelt einige Einblicke in das Schach und wird am Ende reichlich belohnt, wenn der Sieg nicht durch irgendwelche Zufälligkeiten oder Patzer des Gegners entwertet wird.

Die 5%, Peter, stehen für die menschliche Fehlbarkeit, doch noch etwas übersehen zu haben. Für Spanien ging es mit dieser Partie um die Chancenwahrung auf die Goldmedaille (sie lagen damals in Führung!), und ich bin mir sicher, dass das Team alles versucht hat, den halben Punkt zu retten. Nachdem sie gesehen haben, dass es immer enger wird, haben sie sich den Schluss, wo Schwarz (nach Tausch des a-Bauern gegen die weißen Freibauern) die Königsflügelbauern verliert und mit einem abgedrängten König in der Mitte verbleibt, nicht mehr zeigen lassen. Eine neue Dame auf g8 oder h8 wollten sie denn doch nicht sehen.  Soviel zur Frage, ob zu früh aufgegeben wurde.

Für Thomas (Hallo!) und andere hier der Link zur neuen InfinityChess website,

http://www.infichess.com/Web/Page/Default.aspx

wo man nach Anmeldung eines kostenlosen Accounts die Client-Software herunterladen kann (26 MB). Es werden dort schon fleißig Engine-Matchs gespielt; allerdings ist das Infinity-eigene Buchformat viel zu langsam (zeigt sich bei größeren Büchern) und die Settings funktionieren noch nicht komplett. Für Spezialisten ist es attraktiver, mit dem AquariumBookAdapter andere Bücher (meist wohl *.ctg) einzubinden, was ganz gut funktioniert und auch mit großen Büchern recht flottes Spiel gestattet.

Für den bevorstehenden "soft launch" (Freigabe zum Testen im erweiterten Freundes- und Interessentenkreis) sollten diese Einschränkungen allerdings kein Hindernis sein. Da sind andere Dinge wesentlicher und eben auch die Fähigkeit, reibungslose Freestyle-Turniere durchzuführen. Dazu, wie gesagt, später mehr.

Viele Grüße,
Arno
Parent - - By Peter Martan Date 2011-12-07 06:30
Danke für die wirklich lesenswerte lange Antwort, Arno!

[quote="Arno Nickel"]

http://www.talkchess.com/forum/viewtopic.php?topic_view=threads&p=436572&t=41340&sid=b3fe236d42037cff525aefd648bb7f77

Du schreibst, dass Stockfish die Partie "rückwärts in den hash geschaufelt hat". Nun, das ist allerdings eine Methode, die dem Fernschachspieler so nicht zur Verfügung steht, denn die Partie existiert ja noch nicht, wenn er vor der konkreten Entscheidung steht. Andererseits vermute ich, dass die Partie bei so vielen Zügen die da rückwärts "geschaufelt" wurden, gar nicht so tief bzw. komplett in den Hashtables enthalten ist., ansonsten wäre die niedrige Bewertung für 37.Dxe2 unverständlich.
[/quote]
Da hast du natürlich absolut recht. Leider oder Gott sei Dank ist das natürlich so, dass eine Variante von 20 Zügen das Fassungsvermögen von engines auch mit guten Lerndateien hoffnungslos überfordert, es sei denn, es ist ein Matt in 20.
Die Bewertung von Stockfish hab ich nur gerade deshalb nicht so schlecht gefunden, weil sie immerhin wenigstens nach irgendwelchen Definitionen (in diesem Fall denen von chessbase) einem +-, also einem Vorteil, der eigentlich spielentscheidend sein sollte, genügt.

[quote="Arno Nickel"]
Ich hatte damals auch eine Stockfish-best move-Variante in Tiefe 38 abgespeichert, und die sah so aus:
Stockfish 1.8 JA: 37.g3 g6 38.Kg1 Kf8 39.Dd4 Kg8 40.Tf2 De1+ 41.Kg2 Tfe7 42.Kh3 Dd1 43.Td7 Dh1 44.Txe7 Txe7 45.g4 fxg4+ 46.Kxg4 Dc6 47.Kg3 Dc7+ 48.Tf4 Td7 49.Dc4+ Dxc4 50.dxc4 Td2 51.Tf2 Td6 52.Kf4 Tc6 53.b3 Kf8 54.Kg5+ Kg7 55.Td2 Tc7 56.Kf4 Kf6 1.33/38  Line
Das nur nebenbei. Mir scheint, mit Computerbelegen ist es manchmal so wie mit Statistiken; es lässt sich vieles beweisen... Aber für konkrete Zugentscheidungen taugen sie nur im großen Zusammenhang und nicht isoliert betrachtet, solange es kein klares +- (-+) oder = gibt.
[/quote]

Genau! Wenigstens das dritte Hirn bei der endgültigen Auswahl des Zuges sein zu dürfen, der dann wirklich ausgeführt wird, sollte sich der Mensch schon noch gönnen, um überhaupt noch mitzuspielen, sonst wird's wirklich ein saublödes Spiel, wie ich kürzlich auf die Frage, warum ich nicht noch mehr Schach spiele, als ich das ohnehin schon mache, hier gepostet habe, tut mir eh schon wieder leid, aber nur mehr den engines beim Spielen zuzusehen, unterhält mich tatsächlich auch immer noch nicht ausreichend.
(Ich muss da mal wieder Chrilly Donningers Vergleich mit dem Zuschauen beim Wäschewaschen der Waschmaschine und Kishons Erdäpfel anbauender, erntender, kochender, schälender und aufessender Maschine bringen.)
Anhand dieser deiner obigen Stockfish- Variante:
Der will ja zunächst lange nicht die Damen tauschen, wie du weißt, gerade deshalb habe ich gerade dessen output mit dem vollen hash (mit vollem hash ist gut stinken ) gebracht, wo er dann eben doch genau das genau deutlich favorisiert.
Genau darum ging es ja auch, übrigens auch mir ganz ausschließlich, mir ist erst dann im Nachhinein wieder klar geworden, wie missverständlich meine reinen engine- outputs da gewirkt haben dürften: es ging darum, welche engine in dieser Stellung, dieser Partie von dir, wie gut durchblickt und ab wo.
Ich wollte in keiner Weise demonstrieren, dass diese oder jene engine mit oder ohne vollem hash hier die Stellung deines Diagramms "lösen" kann.
(Typisch: da mach ich mal ausnahmsweise nur ein paar kurze kernige Worte, halt auch etwas launig, wie das so meine Art ist, und schon werde ich total missverstanden, ich muss ja einfach immer wieder mindestens so langatmig sein, wie ich eben sein muss, dann liest's wenigstens keiner mehr und man kann mich auch nicht missverstehen, gell Kurt? )

Wenn wir zum diesem deinem ursprünglichen Thema wieder etwas zurückkehren wollen, lustig finde ich ja an der Variante, die du von Stockfish gebracht hast zum 37. Alternativzug, dass sie Stockfish an ihrem Ende durchaus deutlich positiver bewertet als an ihrem Anfang, immerhin auch dort schon in Tiefe 38, wie du schreibst.
Hier der output, wenn man die Züge dieser Variante eingibt und Stocki wieder eine Weile rechnen lässt:

56: Nickel,A - Drake Díez de Rivera,P, 2009 ICCF Olympiad 17 Final 2011
8/1pr4p/p4kp1/8/P1P2K2/1PP5/3R3P/8 w - - 0 1

Analysis by Stockfish 111030 64bit:

57.Td6+ Ke7 58.Ke5 Tc5+ 59.Td5 Tc8 60.c5 h6 61.Ke4
  +-  (1.41)   Tiefe: 6/9   00:00:00  8kN
...
57.Td6+ Ke7 58.Tb6 Ke8 59.Ke4 Kd8 60.Tf6 Ke7 61.Ke5 Tc5+ 62.Kd4 Th5 63.Tb6 Th4+ 64.Ke5 Th5+ 65.Kf4 Kd7 66.Txb7+ Kc6 67.Ta7 Kb6 68.Tf7 Txh2 69.Tf6+ Kb7 70.Ke3 g5 71.b4 g4 72.Tf7+ Kb8 73.Tg7 h5 74.c5 Tc2 75.Kd4 Td2+ 76.Kc4 Kc8 77.b5 Td7 78.Tg5 axb5+
  +-  (2.30)   Tiefe: 35/72   00:09:42  8547mN
57.Td6+ Ke7 58.Tb6 Kd8 59.Tf6 Td7
  +-  (2.18 --)   Tiefe: 36/72   00:10:47  9512mN
57.Td6+ Ke7
  +-  (2.06 --)   Tiefe: 36/72   00:11:11  9875mN

Ok, ok, nicht ganz dieselbe Stockfish- Version, sagt natürlich genau so wenig, wie jeder andere engine- output, aber:

Was ich auch schon öfter mal hier wiederholt habe: die Bewertung, die eine engine abgibt für eine Stellung und die HV, die sie dazu ausgibt, schaut so aus, als meinte die engine damit die Endstellung der HV, ist aber ein ganz krasser Fall von höchstens so tun als ob, wie soll sie etwas an ihrem Ende bewerten, was noch Unmengen von Abweichungen hat, die gar nicht erst berechnet wurden oder nur ganz kurz oder als nicht ganz so weit wichtige Alternativen?
Die eval gilt, so dass man die engine darauf festnageln kann und meiner Meinung nach auch soll, für die Stellung, an der sie rechnet und für sonst absolut gar nix.
Ist ja auch ok, wenn ich eine Stellung bewerten soll und nicht gegen einen bestimmten Gegner auch gleich ausspielen, kann ich auch nur das bewerten, was ich sehe und schon konkret weiß.
In forcierten Varianten ist das möglicher Weise das sichere Ende, in den meisten Varianten insbesonders beim menschlichen Spieler, schiere Strategie und ganz ganz wenig konkrete zwingende Taktik.

[quote="Arno Nickel"]
Übrigens verliert die von Dir zitierte Stockfish Alternative 44...g6 (die einzig mögliche substantielle Abweichung) langfristig genauso;
[/quote]

Schon auch klar, Arno.

37. Qxe2 Rxe2 38. Rd8+ Rf8 39. Rxf8+ Kxf8 40.
Rxf5+ Ke7 41. Kg1 Rxb2 42. a5 b5 43. axb6 Rxb6 44. Rg5...

...g6 45. Rc5 Rb3 46. d4 h5
47. Kf2 a5 48. Rxa5 Rxc3 49. Rg5 Kf6 50. Rg3 Rc2+ 51. Ke3 g5 52. Rf3+ Ke6 53.
Rf2 Rc1 54. Ke4 Re1+ 55. Kd3 Rd1+ 56. Rd2 Rg1 57. Re2+ Kd6 58. h3 g4 59. hxg4
hxg4 60. Ke3 Rb1 61. Kf4 Rb8 62. Kxg4 #41.
hatte ich schon recht bald von Stocki selbst gezeigt bekommen, da konnte jedenfalls kein Hutiwuti dagegen helfen, der ist übrigens, um das mal auch deutlich gesagt zu haben, in dieser Partie wirklich ziemlich überfordert, auch mit den 6Steinern braucht er einfach wieder mal (mit den Nalimovs hat er's überhaupt immer noch etwas buggy, scheint mir...) furchtbar tief hinein in die Varianten, bis ihm was schwant, woran das aber auch noch liegen könnte, dazu gleich noch.

[quote="Arno Nickel"]
es handelt sich um eine Schwächung der schwarzen Bauernstruktur, die Weiß gerade beabsichtigt hat (oder eben das Ablenken des Königs nach f6, weg vom Damenflügel bzw. den weißen Freibauern). Der Zug 44.Tg5 ist wichtig; auf 44.Te5+ könnte Schwarz 44...Kd6 antworten mit besseren Verteidigungschancen als in der Partie (kleiner Nebenaspekt, der auch nicht so ohne weiteres von Engines erkannt wird).
[/quote]

Von zeit zu zeit seh in den alten gern,
und hüte mich, mit ihm zu brechen
es ist gar hübsch von einem großen herrn
so menschlich mit dem teufel selbst zu sprechen...

kann ich mir nicht verkneifen hier den vielzitierten Geheimrat zu bemühen und den Advokatus Diaboli zu machen.


Schön sagst du das mit den wenigen einleuchtenden Worten, wie du die Strategie von Weiß so einfach und klar zu Papier oder Tastatur bringst, das gefällt mir wirklich.

Entschuldige, das sitzt mal wieder was in meinem Nacken, natürlich der pure Schalk, ich würde sowieso den Teufel tun und dem Fernschachweltmeister nicht ordentlich zuhören, wenn er was über eine eigene Partie sagt, die er gerade so gewonnen hat.
Entschuldige wirklich nochmal ausdrücklich die dummdreisten Sprüche dazu von mir, aber mir fällt da außer den vielen vielen Lehrsätzen, die man in vielen vielen wirklich guten Büchern lesen kann, ein thread aus dem CCC ein:
http://www.talkchess.com/forum/viewtopic.php?topic_view=threads&p=436572&t=41340
Diese alte Lehrpartie Aljechin- Capablanca 1927 wurde dort hinterfragt, nicht als Ergebnis, sondern als Weg zum Sieg und den engine- Tests, die darauf aufgebaut wurden, unter anderem eben auch mit eine paar kernigen Lehrsätzen, die die engines halt nicht geschnallt haben. Warum ich das so lustig finde, Arpad Rusz, den ich als witzigen Studienkomponisten kenne, antwortet in demselben thread etwas weiter unten folgendes:
http://www.talkchess.com/forum/viewtopic.php?topic_view=threads&p=436667&t=41340


Theorie und Praxis, Strategie und Taktik, und nur soviel zu den "einfachen Turmendspielen", von denen du in dem Zusammenhang auch sprachst. Die Turmendspiele, wie du sie siehst und wie sie der Laie in mir sieht.
Was du über den Plan zur Stellung sagst, ist klar und deutlich und nachvollziehbar und vermutlich einfach wahr, allein, mir fehlt der Glaube, dass ich (von irgendjemandem, der nicht viel besser spielt als ich, muss ich wohl ausgehen dürfen ) mit diesen Anweisungen allein die Partie schon gegen Pedro gewonnen hätte.

Das dann konkret in Zug und Gegenzug aufs Brett zu zaubern, ist schon noch ein weiteres schönes Stück Arbeit, wem sag ich das jetzt hier eigentlich wieder?

Das passt nur auch wieder so gut zur engine- Frage: woher sollen denn die wissen, was sie meinen, bevor sie sehen, was sie spielen?
Ich hoffe ja mit dir, dass es das ist, was wir ihnen noch voraus haben könnten, was mich persönlich angeht, zweifle ich halt gerade an den schönen Plänen immer wieder, wenn sie mir von Blechtrotteln jeder Art auf Taschenrechnern um die Ohren gespielt werden, kaum, dass ich sie mir zurecht gelegt hatte.


[quote="Arno Nickel"]
Die meisten haben wohl richtig verstanden, und auch Dir Peter will ich natürlich nichts anderes unterstellen, dass es nicht einfach um den nächsten Zug geht, sondern um die Perspektiven der Partie, d.h. die analytischen Probleme in der Dxe2-Variante beginnen genau dort, wo die forcierte Zugfolge nach 40...Ke7 aufhört (bis dahin ist alles selbstverständlich).
[/quote]

Danke, Arno, wäre ich restlos überzeugt, dass du wirklich restlos überzeugt bist, ich hätte den Unterschied zwischen engine- Analyse- output und Analyse an und für sich so richtig voll und ganz verstanden, würde ich wirklich nicht so viele Worte machen, um Unterstellungen wie die, von denen du schreibst, gar nicht erst aufkommen zu lassen.

Einen letzten engine- ouptut muss ich an dieser Stelle (deinem 40...Ke7) noch bringen:

56: Nickel,A - Drake Díez de Rivera,P, 2009 ICCF Olympiad 17 Final 2011
8/1p2k1pp/p7/5R2/P7/2PP4/1P2r1PP/7K w - - 0 1

Analysis by Stockfish 111030 64bit:

41.Kg1 Txb2 42.Tf2 Tb1+ 43.Tf1 Tb2 44.Tf2
  +/=  (0.52)   Tiefe: 6/8   00:00:00  3kN
41.h4 Txb2 42.Kh2 Tc2 43.c4 Ke6 44.Tf1
  +/=  (0.64)   Tiefe: 7/12   00:00:00  12kN
...
41.Kg1 Txb2 42.a5 b5 43.axb6 Txb6 44.Te5+ Kf6 45.Tc5
  +/-  (1.37 --)   Tiefe: 38/62   00:20:56  19468mN
41.Kg1 Txb2
  +/-  (1.29 --)   Tiefe: 38/62   00:24:11  22523mN
41.Kg1 Ke6 42.Tg5 g6 43.a5 Kd6 44.d4 Te1+ 45.Kf2 Td1 46.b3
  +-  (1.53 !)   Tiefe: 38/65   00:31:06  28821mN

Warum gerade das? Nicht nur der Bewertung wegen hier, sondern weil der arme Stocki nach einer Weile sich das naheliegende 41...Txb2 gar nicht mehr spielen traut, nach 41.Kg2, wohl erkennend, dass das vielleicht sogar mehr als +1.53 zählen würde.

Übrigens gebe ich dir in aller Bescheidenheit unumwunden zu, dass mir dieser Unterschied in den letzten Feinheiten noch lange nicht klar ist und wahrscheinlich zu meinen Lebzeiten auch nicht mehr wirklich klar werden wird, ansonsten würde ich Peter Krugs Anregung sofort aufnehmen und in ordentlichen Turnieren im Fernschach gegen dich antreteten, jetzt bin ich aber dann eh schon wieder still.


[quote="Arno Nickel"]
Wenn man sich als Fernschachspieler auf eine solche Variante einlässt, muss man selbstverständlich die weitere Folge analysieren, und da wird es schon etwas komplizierter. Die leicht höhere Bewertung mancher Engines für die Dxe2-Spielweise (im Vergleich zu den anderen Zugkandidaten; dazu geben nicht alle Analysen Auskunft) würde ich erstmal in den etwas unterschiedlichen Bewertungsparametern begründet sehen und nicht in irgendeiner tiefsinnigen Gewinntendenz, die sich bemerkbar macht. - Was hinter den Bewertungen stecken könnte, zeigt sich außerdem erst, wenn man nach 40...Ke7 das Spiel Halbzug für Halbzug fortsetzt (nach 41.Kg1 kommt ein weiteres relativ forciertes Stück bis 43...Txb6). Das macht natürlich Arbeit und erfordert sowohl Genauigkeit als auch schachlich-analytische Kompetenz, ansonsten könnte man ebensogut eine Münze hochwerfen.

Für einen direkten Stellungtest im Sinne der Ermittlung eines "Lösungszuges" ist die Position vor 37.Dxe2 sicherlich nicht geeignet; daran hatte ich auch nicht gedacht. Engine-technisch geht es um die Bewertungsdifferenz zu den Alternativen und darum, wie sich die Bewertung beim Vertiefen weiterentwickelt.

Der Vergleich, wieviele Züge von Weiß und Schwarz auch von Houdini gespielt würden, ist interessant, aber problematisch. Die größere Anzahl von schwarzen Houdini-Zügen (wenn ich recht erinnere, 50 : 39) deutet m.E. schlichtweg darauf hin, dass Schwarz mehr Zwangszüge gemacht hat (die andere Engines genauso machen würden). Ansonsten lässt sich daraus nicht viel ablesen. Wer sich ein kompletteres Bild von der Partie machen möchte, kann sich später die kommentierte Fassung in KARL anschauen bzw. kann ich sie auch nach Erscheinen mit dem Einverständnis des Herausgebers hier mal posten.

Die Partie eignet sich an vielen Stellen, um den Unterschied zwischen (reinem) Computerschach und Fernschach zu demonstrieren; denn um überhaupt die kritische Endspielstellung zu erreichen, musste Weiß einige positionelle Manöver durchführen und dabei der Versuchung eines früheren Bauerngewinns im Zentrum gegen Engine-Verlockungen widerstehen. Es ist diese Einheit einer Partie über verschiedene Entwicklungs- und Problemphasen hinweg, die die Sache so spannend und lohnend macht. Sie vermittelt einige Einblicke in das Schach und wird am Ende reichlich belohnt, wenn der Sieg nicht durch irgendwelche Zufälligkeiten oder Patzer des Gegners entwertet wird.
[/quote]

Zu all dem sollte ich klüger auch einfach gar nichts sagen, hab's aber zitiert, weil ich's so gut finde.

Nur zu dem Thema Stellungen für engine- Tests und Stellungstests, ist halt leider mein Reizthema schlechthin.

Ich habe das, zugegeben, als Stellungstest aufgefasst, weil ich nicht glaube, dass es schlechte Teststellungen gibt, es gibt nur schlechte Auswertungen schlechter Stellungstests.
Ich kann mir nicht die Antwort, wie stark spielt eine engine in irgend einer anderen Stellung, von einer einzelnen erwarten und ich kann genau genommen kaum Muster sortieren, nach denen taktische und "strategische" Stärken und Schwächen anders als im Einzelfall beurteilbar sind, wenn man Reproduzierbarkeit und Objektivität verlangt.

Ich kann immer nur für die einzelne Stelllung testen, die einzelne engine und die einzelne Variante, die ich für die beste halte.
Taktische best move Aufgaben in forcierten Abwicklungen sind der einzige und relativ selten praktisch vorkommende Fall, in dem man Pointen hat, bei denen die Bewertungen hochschnellen müssen und ohne Konkurrenz von Alternativen sind.
Dass man immer wieder zu denen zurück kehrt auf der Suche nach Teststellungen, liegt einfach daran, dass man sie als Mensch wenigstens überhaupt auch verstehen kann.
Alle anderen Stellungen, einschließlich der Grundstellung, sind so gut verwendbar, als man gute Abspiele kennt.

Fängt man aber nicht irgendwann damit an, die evals und die Varianten, die die engines ausgeben, auf Punkt und Komma ernst zu nehmen, am Anfang und am Ende der engine- Varianten und der mit und ohne engines geeichten Vergleichsvarianten, wie du mit deiner Partie welche anbietest, wird man nicht auf einen grünen Zweig kommen in der der Beurteilung, was hinter dem ganzen oder halben Punkt am Ende dessen steht, was die Maschinen so vor sich hin und hinter sich her spielen.

Sorry, das musste mal wieder sein, aber die Gelegenheit ist so günstig:

Ich maße mir wirklich nicht an, deine Varianten, die du uns da gibst, persönlich zu hinterfragen, ich finde nur, wenn man in dem Zusammenhang von engines spricht, müssen die outputs an den einzelnen Stellungen, die du auch noch dazu schon markiert hast für uns, mit den Varianten der engines, die sie spielen und die sie als Analyse ausspucken, mit denen verlglichen werden, von denen du schon weißt, dass sie gut sind.

Mit den Zahlenwerten der evals, womit sonst? Wonach sonst richten sich die Dinger selbst in der Selektion ihrer Züge, wonach soll sich der Mensch dabei richten, wenn er sich damit auseinandersetzt?
Natürlich nicht mit den Absolutwerten allein, (mit denen aber zwangsläufig auch) sondern mit den Relationen (ich würde ausdrücklich sagen, den Quotienten, geht halt mit der 0.00- Bewertung nicht gut, aber sonst...)der evals zueinander, am Anfang, am Ende und wieder am Anfang nach dem backward solving der Varianten, denen der engines und deinen.

[quote="Arno Nickel"]
Die 5%, Peter, stehen für die menschliche Fehlbarkeit, doch noch etwas übersehen zu haben. Für Spanien ging es mit dieser Partie um die Chancenwahrung auf die Goldmedaille (sie lagen damals in Führung!), und ich bin mir sicher, dass das Team alles versucht hat, den halben Punkt zu retten. Nachdem sie gesehen haben, dass es immer enger wird, haben sie sich den Schluss, wo Schwarz (nach Tausch des a-Bauern gegen die weißen Freibauern) die Königsflügelbauern verliert und mit einem abgedrängten König in der Mitte verbleibt, nicht mehr zeigen lassen. Eine neue Dame auf g8 oder h8 wollten sie denn doch nicht sehen.  Soviel zur Frage, ob zu früh aufgegeben wurde.
[/quote]

Spannende Sportberichterstattung.

[quote="Arno Nickel"]
Für Thomas (Hallo!) und andere hier der Link zur neuen InfinityChess website,

http://www.infichess.com/Web/Page/Default.aspx
[/quote]

Danke für die Infos.

Und sorry nochmal dafür, dass du dich für das Alles, was du uns hier bietest, mit solchem Undank meinerseits abgibst.
Viel Erfolg weiterhin für deine bewundernswerte Fernschachkunst.

Up Topic Hauptforen / CSS-Forum / Schachprogramm Spark im Fernschach
1 2 Previous Next  

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill