Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Nachdenkliches ...
1 2 Previous Next  
- - By Frank Quisinsky Date 2013-12-26 17:12 Edited 2013-12-26 17:19
Hallo zusammen,

als vor vielen Jahren versucht wurde zu bewirken, dass die Programme untereinander kompatibel werden hätte ich niemals gedacht, dass mal so irrsinnige Diskussionen ausgelöst werden wie heute. Engine - Engine ist interessant aber nicht der Kern und die Spielstärke selbst ist auch nicht der Kern. Die Spielstärke selbst ist ein Ergebnis aus 60 Faktoren, wobei jeder einzelne dieser Faktoren für sich interessant ist.

Computerschachpartien auf dem Niveau von heute dauern ca. 90 Züge (sofern kein Aufgabefaktor gesetzt wird). Denke bewiesen ...
Wenn eine Partie 90 Züge dauert werden es durchschnittlich 60 Züge sein, die eine Engine selbst berechnen muss. Je mehr desto besser hinsichtlich der Messung einer genauen Spielstärke. Denke bewiesen ...
70% der Computerschachpartien werden spät entschieden, nachdem die Weichen der Partie für das Endspiel gelegt sind, also im späten Mittelspiel. Denke bewiesen ...
--- STOP, anders beim Schach zwischen Menschen ... da entscheidet meist das frühe Mittelspiel die Partie und je nach Niveau der Spielstärke fallen die Entscheidungen immer ein paar Züge später ---
--- Der Unterschied ---

Es gibt Programme die spielen diese Partiephase richtig gut, angefangen mit Rykba, heute können wird die ganzen IPPs dazu zählen, zuzüglich die Entwicklungen Stockfish und Komodo. Denke bewiesen ...

- müsst mich korrigieren wenn ich falsch liege -
Gibt ja auch noch ein paar Denker hier ...

Wenn wir nun 60 messbare Züge in einer Partie haben sind das z. B. bei 1.000 gespielten Partien ... 60.000 Messpunkte!

Wir haben nun die Situation das sich drei Engines oben treffen.
Komodo, Stockfish und Houdini (vielleicht bald vier mit GullChess).

Und dann haben wir ca. 1.000 Experten, denn jeder der sich mit Computerschach beschäftigt ist heute ein Experte. Ob nun eine Ratingliste mit 3 verschiedenen Engines und 100 Abkömmlingen bei einer Minute pro Zug oder einer anderen Blitzliste oder sonst was für Listen. Das war der Mensch selbst macht ist immer höher rangig als das was andere Menschen so tun ... denke darüber sind wir uns einig Die die sich jetzt angesprochen fühlen ... lasst es undokumentiert ... geht in Euch ... tief ... noch tiefer ... noch tiefer, also richtig ... GUT!

Nun ist das Geheimnis einen Konsenz zwischen alle Beteiligten und Engines zu finden denn der Mensch kann nur ruhig schlafen mit einem Ergebnis. Wir brauchen Ergebnisse um besser schlafen zu können, damit wir den inneren Frieden zwsichen uns der Welt, die Frau, den Kindern, den Artgenossen, unserem Bauch in dem ein Vermögen steckt ... zu finden.

Noch sind wir uns doch einig, oder etwas nicht?
Gut!

Die Lösung ist einfach!
Schlagt Euch weiter die Köpfe ein

Denn jegliche Diskussionen wie ein eigentlich einfaches Thema auch einfach betrachtet werden soll scheitert hier erfolgreich. Und da muss ich auch nicht weiter mitmischen weil mir mittlerweile das Lesen hier so schwer fällt weil ich überwiegend Schmarn lese. Was mir persönlich ein wenig Leid tut ist der Umstand das ich so viele Jahre das Thema Kompatibilitäten dahin getrieben habe zu dem was wir heute haben. Hätte ich vorher gewusst was dabei raus kommt ... das wäre ja was für Jason Dark. Der würde einen 20ig Bänder John Sinclair auflegen. Da laufen ja gar die Dämonen weg.

Habe im Grunde die einfache Lösung in dieser Message versteckt. Wir haben bei "nur" 1.000 Partien ca. 60.000 Bewertungen. Schachprogramme bewerten Züge und anhand dieser Bewertungen ist eine Einteilung in Spielstärkekategorien einfacher. Je mehr Zeit wir einer Engine geben desto mehr unterschiedlicher Bewertungen kommen dabei heraus und nicht nur ein dreier Ergebnis wie 1:0, 0:1 oder Remis. Wenn dieses Thema mit vernünftigen statistischen Tools angegangen werden würde, würden wir erkennen das Engines unterschiedlich spielen (unterschiedliche Stärken und Schwächen haben) und jetzt kommt der entscheidende Punkt ... unterschiedlich eingesetzt werden sollte.

Auf eine einzige Zahl zu achten bei Programmen die den besten Spielern der Welt um derzeit ca. 14-20 Kategeorien voraus ist geht nicht mehr bzw. geht schon aber dafür haben wir nicht die Mittel. Wir haben keine 20 Programme die auf einem Level sind und unterschiedlich spielen. Aber wir haben 60 Bewertungen pro Stellung in nur einer Partie. Und die decken alles auf, alles!! Auch ob eine Engine fremd gegangen ist oder nicht, alles!

Denkt mal drüber nach oder schlagt Euch weiter die Köpfe ein mit unsinnigen Auslegungen von oftmals unsinnigen Ratinglisten bzw. sonstigen Ergebnissen!
Wer es braucht!

Gruß
Frank

Und ...
Na klar ...
Wer diesen Beitrag erfolgreich auseinandernimmt ... macht sich hier viele Freunde.
Das ist eine gute Chance ... nur zu!
Parent - - By Dieter Kraft Date 2013-12-26 18:54 Edited 2013-12-26 19:02
Hallo verehrte Computerschachfreunde,

als Fernschachfreund und -spieler mit DWZ ca. 1800 (notorische Zeitnot)
BdF FWZ 2220 und ICCF ELO bald 2450, d.h mit geringem Schachverständnis,
wage ich es - auch weil meine Gegner fast alle am Zug sind - diesen
intellektuell sehr hochstehenden auch eben historisch bedeutsamen Artikel
als erster zu beantworten.

Frank, ich darf Sie bitte beim Vornamen anreden, ich bewundere schon
immer Ihren Humor und auch Ihre Selbstkritik, die sich auch hier wieder
zum Ausdruck bringen.

Vielleicht sind meine Fragen ein wenig off topic, vielleicht stecken sie aber
auch in Ihrem Text und sind teilweise schon beantwortet.

1) Haben engine Tests mit super Blitzpartien einen Wert für FS-Analysen?
Meine längste Analyse auf 16 Kernen gg. Schachfreund Adelseck im
laufenden German Masters dauerte über 40 Std. bis Houdini Lg4 fand.
Schon das letzte TCEC Turnier mit Nahschach Bedenkzeit sah ja nicht
den auf allen Ranglisten mit einigem Abstand führenden Houdini 4 vorne,
sondern äußerst knapp Komodo vor Stockfish. Und NS-Bedenkzeit ist für
FS-Analysen immer noch weit zu gering.

2) Ich kenne keine Statistiken über die Anzahl der Computerschächler
vs. die Anzahl der Fernschächler. Diese dürften aber für die Entwickler
kommerzieller engines von großer Bedeutung sein, da die Entwickler
die engines ja verkaufen wollen. Ich gehe einmal davon aus, dass
Computerschächler kein Interesse an Turnieren haben, die zwei Jahre
und länger dauern wie die letzte ICCF/CL, von Postturnieren ganz zu
schweigen. Auch hier spielt die BZ eine große Rolle und zählt wohl
zu Nachdenlichswertem.

Allen Schachfreunden eine gute Zeit "zwischen den Jahren".

Dieter Kraft
kraft@hm.edu
Parent - By Guest Date 2013-12-26 20:08
... "diesen intellektuell sehr hochstehenden auch eben historisch bedeutsamen Artikel" .... 

ich würde gerne noch einige weitere Attribute hinzufügen: substanziell und tiefschürfend! 
SF Quisinsky hat sich wieder einmal selbst übertroffen!
Bitte, lieber Frank, weiter so!
Parent - - By Frank Quisinsky Date 2013-12-26 20:19 Edited 2013-12-26 20:22 Upvotes 1
Hallo Dieter,

vorab ...
Ich gehöre ja auch zu denen die einen in der Computerschach Klatsche haben. Aber mich ärgert das maßlos das hier so viele dazu beitragen, dass die Entwicklung steht anstatt produktiver zu werden. Gerade mit den Möglichkeiten die wir haben ist das doch nicht so schwierig und die Beschäftigung mit diesem Hobby macht viel mehr Spaß. Oftmals hat in der Computerschachszene nur blanke Provokation geholfen um zumindest mal ein paar Personen wach zu rütteln. Ein bewährtes Mittel, so sehr ich das eigentlich gar nicht mag.

1. Bedingt haben die super Blitzpartien einen Wert für FS-Analysen. Wir erkennen zumindest welche Engines von der Tendenz oben spielen, in der Mitte spielen und unten spielen. Es ist vergleichbar wie mit dem 1:0, Remis und 0:1. Aber das reicht nicht um genauer zu werden und hier reichen auch keine unsinnigen 500 Partien pro Engine Match oder x-tausend Partien von im Grunde drei Programmentwicklungen und vielen verschiedenen Namen. Houdini stand lange Zeit oben aber schon vor 2 Jahren, als ich die SWCR1 spielen ließ (das waren 40 Minuten Partien auf 2.86GHz Intel Hardware) war klar, dass Houdini sich nicht als ultimative Analyse Engine eignet. Heute wird es noch klarer weil andere aufgeholt haben. Das Houdini mit mehr Zeit an Spielstärke im Vergleich zu anderen verliert geht schon aus der Analyse unterschiedliche Test-Ergebnisse / Ratinglisten hervor. Aber das ist noch nicht mal der interessanteste Punkt. Interessanter ist vielmehr, wo und wie setze ich Engines wie Houdini für eine Analyse ein. Ca. bis Zug 30 gibt es derzeit 7 Engines die leicht bessere bis stark bessere Ergebnisse als Houdini 3 produzieren (mit Houdini 4 habe ich mich noch nicht beschäftigt). Aber grundsätzlich wird Houdini Houdini bleiben auch wenn die Engine minimal zulegen konnte in Version 4. Selbst Spark oder Junior produziert interessantere Dinge als ein Houdini in der ersten wirklich wichtigen Partiephase. Stockfish und Critter überragen zusammen mit Spark und Junior diese erste Partiephase. Ich schrieb hierzu ein wenig in anderen Threads in den letzten Tagen.

Das Geheimnis für die Computerschächler ist eher herauszufinden wo ist welche Engine stark. Nicht welche Engine ist im Gesamtbild die Nummer 1 im Blitz oder minimal höhere Zeiten dahinter. Das ist zu einfach und wird bei stärkeren Engines immer unlogischer.

Houdini wird ca. ab Zug Nummer 50 stark und hält mit Komodo und Stockfish ... je mehr Züge ab ca. durchschnittlich 80 bis zum reinen Endspiel nun kommen nimmt die Houdini Stärke wieder ab und die drei sind wieder auf einem Level. Also das frühe Endspiel ist das Geheimnis dieser Engine. Und da genau hier die meisten Punktentscheidungen beim Eng-Eng Match erfolgen war Houdini auch so lange die Nummer 1. Klar wenn in der für eng-eng wichtigsten Phase einer Partie eine Engine hervorsticht diese dann auch in den Ratinglisten oben liegt. Das heißt aber nicht, dass es sich bei Houdini um die ultimative Engine handelt wie es uns dumme Ratinglisten vorgaukeln.

Und das ist wirklich schade, dass so viele nur auf ELO schauen ...
Schrieb es vor ein paar Tagen, ELO macht Computerschach kaputt und die ErrBar der Berechnungsprogramme lassen leider viele Computersschächler blind werden.

Wir haben früher über Thorsten Czub gelacht. Er sagte mal ich kann anhand weniger Turnierpartien erkennen ob eine Engine gut oder stark ist. Na ja, er neigte oft zu übertreiben aber so ganz Unrecht hat Thorsten mit der Aussage gar nicht. Wir müssen keine Angst vor der künstlichen Intelligenz haben nur weil die uns überlegen ist. Wir haben so viele Möglichkeiten diese Intelligenz für uns zu nutzen ... wir tun es verdammt nochmal nicht sondern Computerschächler neigen dazu in die Welt der fliehenden Jasan Dark Dämonen sich zu begeben.

2.
Du kannst die Frage ja schon fast selbst beantworten wenn Personen Ergebnisse feiern die aufgrund von 1-Minute Partien erfolgen. Das hat etwas mit Ungeduld zu tun. Schnell etwas herausfinden um möglich nach der eigenen Denke etwas unangreifbares auf die Beine zu stellen. Da sind so viele Denkfehler drin aber egal. Das Problem für Computerschächler ist auch, dass Fernschach einfach zu lange dauert. In der Zeit einer Fernschachpartie ist Stockfish schon 50x upgedatet wurden und wer interessiert sich für ein Stockfish Resultat einer Version die schon 1 Jahr alt ist.

Das ist unser Problem!
Wir brauchen schnell einen guten Test um sicher sagen zu können ...

A. Engine Version X hat folgende Stärken und Schwächen.
Liegt in etwa Partiephase 1-6 bei folgenden Punktwerten und das muss kein ELO sein.

Ich bin der Meinung die Spielstärke sollte bei Computerschach anders gemessen werden. Wir haben ja auch nicht nur Schachbücher zu einem Thema sondern zu Eröffnung, Strategie, Taktik, positionelles Wissen, Endspiele etc.. Aber die Computerschächler meinen alles in einem TOP und ELO drüber und das Packet steht. Deswegen ist der Kreis der Interessierten auch so klein, die Schachspieler rennen ja alle weg wenn sie hier regelmäßig lesen und denken sich wahrscheinlich ... diese Gruppe da ... die lassen wir mal ganz in Ruhe denn die wissen bestimmt was sie da von sich geben, selbst muss ich das ja nicht verstehen.

Um das Dilemma zu lösen in dem wir uns befinden ...
Wir, die Computerschächler, sollten den anderen die Vorgaben erteilen ... die ambitionierten Clubspielern, den Fernschachspielern und auch den GMs als Zuarbeiter dienen und das herausfinden was unsere Aufgabe ist herauszufinden.

müssten wir ...
Das Thema aufrollen und zunächst mal die Spielstärke in vielleicht 6 Kategorien einteilen.

Cat 0: Nicht wichtig für uns: Eröffnungstheorie ... die steht
Cat 1: Frühes Mittelspiel
Cat 2: Mittelspiel
Cat 3. Spätes Mittelspiel
Cat 4. Frühes Endspiel
Cat 5. Endspiel --- könnten wir auch sagen nicht wichtig für uns ... wir haben die 6-Steiner und die TOPs unterscheiden sich hier mit 6-Steiner nicht so sehr.

Verbleibt Cat1-Cat4 ...
Wir brauchen also z. B. ein Tool was für jede dieser Partiephasen ein 1:0, 0:1 oder Remis setzt. Das wäre mal ein Anfang und wir könnten die Spielstärke für die 4 wichtigen Phasen berechnen.

Wir könnten auch versuchen die jeweiligen Stellungsbewertungen nach Anzahl der verbliebenen Figuren zu bewerten. Es gibt mehrere Möglichkeiten und wenn einmal ein findiger Programmierer angefangen sich dem Thema anzunehmen wird mit Sicherheit unsere Phantasie über die künstliche Intelligenz siegen.

Denn so blöd sind wir nicht wie die Computerschachprogramme sich denken würden, wenn sie denken könnten.

Gruß
Frank
Parent - By Frank Rahde Date 2013-12-26 22:04
+1
Parent - - By Hauke Lutz Date 2013-12-27 00:44
Hallo Frank,

grundsätzlich stimme ich dir bei der Unterteilung in Spielphasen/Stellungsprofile zu.

Die Eröffnungstheorie allerdings würde ich nicht so Stiefmütterlich behandeln wie du es vor hast, weil es dort auch noch viele spielbare Varianten gibt.
Ich hatte am 15.Dez nach wenigen Zügen eine in meinen Augen relativ interessante und gut spielbare nicht-Theorie-Eröffnung auf dem Brett, welche ich mir in meinem Urlaub anschauen werde.
Beim "späten" Endspiel hingegen stimme ich dir aufgrund der 6 und 7 Steiner vollkommen zu.

Gruß
Hauke
Parent - - By Frank Quisinsky Date 2013-12-27 01:06 Edited 2013-12-27 01:09
Hallo Hauke,

ja die Eröffnungstheorie ist natürlich auch ein Thema.
Aber hier sind die Engines zu unterlegen im Vergleich zu den GMs.

Ich glaube hier fehlen einfach noch 100-200 ELO an Gesamtspielstärke um in die Theorie-Beeinflussungsbereiche einzudringen. Natürlich wird hier und da neue Theorie geschrieben durch gute Fortsetzungen aus Engine Hand. Aber das wiegt das vorhandene Theorie Wissen nicht auf.

Muss aber auch ehrlicher Weise sagen ... so ganz mich der Meinung von Jörg Hickl anschließen.
Eröffnungen interessieren mich zu wenig sind eher Mittel zum Zweck.

Dennoch glaube ich schon das folgendes passieren wird ...

Schauen wir uns die Eröffnungssysteme an die von 1900 - 1940 gespielt wurden, dann die die ca. bis 1980 gespielt wurden und wie sich seit dem Ansichten über bekannte Eröffnungen geändert haben. Die Eröffnungstheorie wird heute als Modern bezeichnet, nicht zuletzt weil viele GMs der Meinung sind das in modernen Eröffnungen mehr Möglichkeiten stecken als in alt ausgedienten und analysierten Systemen.

So wie wir heute von alten Eröffnungen sprechen oder von modernen Eröffnungen sprechen wir in 30 Jahren dann wieder von alten (die von heute) und modernen Eröffnungen (die von morgen). Und bei den Eröffnungen von "Morgen" werden Computerschachprogramme maßgeblich beteiligt sein. Aber wie gesagt, ich glaube hierfür sind Engines noch sehr weit weg. Vielleicht nicht die, die heute bei den modernen Eröffnungen durch eine sichere Fortsetzung der Ideen glänzen. Wenn z. B. Engines wie Critter, Stockfish und Spark kaum angreifbar in der Eröffnung sind (z. B. nicht schnell Partien bis Zug Nummer 50 verlieren), müssten im Umkehrschluss diese Engines heute auch dazu in der Lage sein moderne Theorie zu ergänzen.

Engines die angreifbar bei modernen System sind ... sehr z. b. Shredder, auch Houdini oder Rybka ... eignen sich nicht dazu bei Analysen zu modernen Systemen eingesetzt zu werden.

Hier mal wieder das Spark Beispiel.
Diese Engine spielt offene Spiele derart aggressiv das selbst Programme die in der Eröffnung verhalten sind wie Equinox an die Wand gespielt werden (Stärke von Equinox ist das späte Mittelspiel ... hier auf einem Level knapp unter den TOP 3 mit spannenden Ideen). Anders als bei den IPPs das frühe Endspiel ist es bei Equinox das späte Mittelspiel.

Event:
Ort:
Datum:

Weiss:
Schwarz:

Ergebnis
Board


Solche Engine wie Spark ist ein MUSS für Analysen nach den Eröffnungszügen, wie Stockfish, wie Critter und bedingt auch Junior. Wer dieses Partiephase mit Houdini prüft müsste zur Strafe nackt vor allen Nachbarn 5 runden um das Haus drehen.

Wohlgemerkt Equinox 2.0.2 liegt ca. auf Critter 1.6a Level bei 2.960 - 2.980 (etwas unter Critter).
Spark liegt bei 2.750 - 2.775

Da liegen 200 ELO dazwischen aber wir erkennen diese Stärke von Spark nicht wenn wir nur auf den Ratinglistenplatz schauen.

Gruß
Frank
Parent - By Frank Quisinsky Date 2013-12-27 01:36
Steckt auch ein bissel ELO in den Eröffnungsaussagen.
Die Altmeister waren eher Schachkünstler, keine ELO Jäger.

ELO macht Schach kaputt!
Die Schönheit des Spiels bleibt ein wenig auf der Strecke.

Erinnern wir uns an Königsgambit und die vielen Glanzpartien, die unsterbliche oder andere Wahnsinns Partien. Da saßen die Menschen bei Schachturnieren und vergötterten die GMs wie Steinitz, Capablanca, Lasker und wie sie sich alle schimpften. Petrossian, Smyslov, Karpow, Kortschnoj andere ... durch sie kamen ganz andere Elemente in den Schachsport. Das Iwantschuk oder Shirow Schach noch als Kunst sahen ... die spiel(t)en wie die Künstler von einst ist eine andere Geschichte.

Heute gehen GMs hin und machen folgendes.
Starten bei einem Turnier und da gibt es Knete.
Bloß keine ELOs verlieren und lieber mal schnell eine Partie Remis geben.

Das hat Schach kaputt gemacht und Computerschach macht dieses elende Übergang Endspielgeschiebe kaputt. Aber wir sind nun mal an dem Punkt wo es immer schwieriger ist bei der Spielstärke Kurzsiege zu feiern. Heute haben die GMs mehr Wissen über die "Macht der Bauern" und spielen schon frühzeitig auf gewinnbringende Endspielkonstellationen. Spielen auf gezielte Abtauschmanöver um einzig den kleinen Vorteil zu erreichen. Nicht zuletzt weil das auch unsere Engines tun und vormachen das hier bei höher werdender Spielstärke der Grundstein liegt.

Eröffnungstheorie bei Computerschach bedeutet im Grunde ...
Offene Stellungen provozieren!
Je mehr Möglichkeiten in der Stellung liegen, je mehr Reichtum an Figurenaufenthalten in der Stellung liegt, je mehr Möglichkeiten gibt es auf dem Brett. Die Menschen überfordert die Programme im Element. Und ich denke hier wird sich die Theorie verändern, zurück zu "sicheren offenen Stellungen" als Einleitung in die Partie. Aber ich glaube nicht das Eröffnungen wie Königsgambit oder andere Gambit-Ideen (die überwiegendenden) eine Chance in der Neuzeitlichen Theorie finden werden.

Für Menschen nach wie vor das Geheimkonzept ist ...

Gegen Eröffnungsschwache Gegner kann ich zuschlagen wenn diese geschlossen spiele und ich öffne. Das was die Programme beherrschen muss ich selbst spielen. Programm sollte geschlossen stehen und ich offen. Lasse ich mich auf geschlossen ein verliere ich im Übergang zum Endspiel. Denn bis dahin kann ich halten und die Partie dümpelt vor sich hin. Um dummerweise sind GMs im ELO-Rausch und die erreichen ein besseres Ergebnis wenn die Stellung übersichtlich ist und gezielt nach kleinen Vorteilen gespielt wird.

GM Schach heute ist meist noch langweiliger als Computerschach. Es sein denn man beobachtet die wirklichen Meister von heute die es immer noch verstehen mit Ihrem Spielstil die Massen anzuziehen, wie einst die Altmeister die es konnten, ich meine begeistern konnten in Zeiten der unausgereiften Theroie die es seinerzeit gab.

Gruß
Frank
Parent - - By Hauke Lutz Date 2013-12-27 01:38 Edited 2013-12-27 01:40
Das Stockfish und Critter für Eröffnungen besser geeignet ist als Houdini unterschreibe ich sofort.

Spark kann ich leider nicht beurteilen, weil ich noch nicht mit der Engine gearbeitet habe.
Dies sollte ich aber anscheint nachholen und das nicht nur weil der 4-Bauernangriff sehr gut gespielt wurde.

Wie würde bei dir eine Expertenliste der jeweiligen Kategorien aussehen, Frank?
(Es wäre gut, wenn sich auch andere dazu äußern würden.)
Parent - - By Frank Quisinsky Date 2013-12-27 02:07 Edited 2013-12-27 02:12
Hallo Hauke,

also auch bin immer wieder verblüfft was bei der Auswertungen der Partien (nicht bei den Resultaten als solches) herauskommt. Muss mich selbst beugen und bin hin- und hergerissen wenn es um Einschätzungen geht.

Meine bisherige Favoriten-Konstellation schaut wie folgt aus (nicht aufgrund Liebeleien mit Engines sondern aufgrund der nackten Statistik):

1. Nach der Eröffnungsphase
- Stockfish (muss)
- Critter (ergänzend)
- Spark (ergänzend)
- Junior (ergänzend, weil unglaublich anders als die anderen, sowohl genial als Anfänger)

2. frühes Mittelspiel
- gleiche Auswahl an Engines aber ich würde hier auch Hiarcs Beachtung schenken. Hiarcs leitet schöne Dinge ein spielt diese aber nicht konsequent zu Ende. Dennoch gute Ideen in dieser Partiephase.
- Komodo eignet sich gut wenn es sich jetzt um geschlossene Stellungen handelt. Komodo hat ein unglaubliches Figurenspiel, spielt ein wenig wie Karpow vergleichbar. Sucht ständig den kleinsten Vorteil und kann dann auch taktisch zuschlagen was die Vorgängerversionen nicht unbedingt konnten.
- Spark benötigt etwas mehr Zeit ... kommt im Vergleich nicht mehr zu sehr auf Tiefe, findet aber dann wieder !!!

3. spätes Mittelspiel
- Komodo (muss)
- Equinox (ergänzend)
- und hier gibt es dann eine Reihe von Engines mit sehr guten Ideen ... wie Jonny, als auch Protector und auch Sjeng spielt diese Partiephase ausgezeichnet. Auch Houdini dreht langsam auf, ist im kommen ...
- natürlich auch hier dann Houdini und Stockfish aber nachrangig.

4. frühes Endspiel
- Houdini (muss)
- Komodo (muss - ergänzend)
- Rybka (ergänzend - muss)
- die IPPs (ergänzend)

Stockfish hier zu Remisträchtig, verspielt oft errungene Vorteile aber das ist OK. Die Engine riskiert mehr und zahlt hier bei den Fehlversuchen den Tribut.

5. Endspiel
Das ist nicht unbedingt mein Lieblingsthema ... ich denke das hier im Grunde das Thema stärker aufzuteilen ist.

z. B. in Turmendspielen:
die spielt Ktulu zu 75% perfekt ohne TableBases, wahnsinnige Leistung beim Lieblingsthema von Rahman Paidar.

Grob gesagt:
Alle TOP Programme spielen das gut, auch Stockfish wieder.
Ich finde am besten spielt Komodo die Endspiele weil immer noch nach kleinen Vorteilen auf der Suche und punktet hier einfach gut.

Es gibt auch ein paar Sensationen:
Quazar spielt das ausgesprochen gut und liegt 300 ELO hinter den TOPs zurück.

GullChess ist derzeit am interessantesten in der Entwicklung. Die Engine beginnt langsam ein Gesicht zu formen. Habe mich mal mit der unoffiziellen R600 beschäftigt. Die scheint im Endspiel gegen die TOPs zu halten, spielt das Mittelspiel ausgewogen, ist nicht anfällig für schnelle Angriffe nach der Eröffnung aber spielt nach wie vor zu verhalten aggressiv. Muss beobachtet werden das Teil.

Hannibal hat auch so einige Vorteile aber noch in allen Partiephasen echte Schwächen. Daher schwierig mit Statistik die Engine zu bewerten. Scheint aber wie Equinox im späten Mittelspiel gute Ideen zu haben. Wobei das schon echt schwierig ist ... späte Mittelspiel / frühes Endspiel. Ich kann das nur wenn ich ab Zugnummer x einen Cut mache und hier dann Statistiken anfertige. Aber irgendwie muss ja ne Lösung her um etwas herauszufinden. Die Art wie ich vorgehe ist nicht immer ganz Stubenrein.

Gruß
Frank
Parent - - By Frank Quisinsky Date 2013-12-27 02:17 Edited 2013-12-27 02:20
Hi,

gibt ja auch noch Chiron
Mit dieser Engine verhält es sich ein wenig wie mit Junior.
Immer für eine Überraschung gut, aber eher im späten Mittelspiel aber auch hier tückisch.
Spielt alles sehr ausgewogen, vielleicht von allen Programmen das Programm welches alles am ausgewogensten spielt ... im Verhältnis zur Spielstärke.

Schwierig über Statistik wie die jetztigen GullChess Versionen, Protector oder auch Spike.

Spike ist im Übrigen taktisch interessant.
Hat hier auch eine gewisse Stärke, allerdings ist Spike kein Spark.
Spike ist auch sehr ausgewogen wenn gleich taktisch anfällig (ungewöhnlich denn Programme die taktisch gut sind verlieren auch selten schnell, sehen auch gegen sich ... nicht Spike) aber auch schon etwas in die Jahre gekommen. Eine sehr interessante Engine wie auch Sjeng aber da muss auch mal wieder was passieren. Spike übersieht auch gerne aber sieht auch gut taktische Kombinationen.

Ich finde von den schwächeren noch Smarthink interessant weil gute Ansätze in allen Mittelspielbereichen. Gandalf war eine tolle Engine! Shredder spielte das Endspiel immer sehr gut aber ist in die Jahre gekommen und abgelöst durch Rybka und IPPs bei der eigentlichen Stärke die Shredder immer hatte.

Gruß
Frank
Parent - By Frank Quisinsky Date 2013-12-27 02:30
[Event "SWCR2, 40/05, p=on, i7-4770k, 4.3GHz"]
[Site "Trier"]
[Date "2013.??.??"]
[Round "?"]
[White "Spike 1.4 Leiden w32"]
[Black "Rybka 4.1 SSE42 x64"]
[Result "1-0"]
[ECO "B21"]
[PlyCount "55"]
[EventDate "2013.??.??"]
[EventType "rapid"]
[EventRounds "50"]
[EventCountry "GER"]
[Source "Frank Quisinsky"]
[SourceDate "2013.12.22"]

1. e4 {[%eval 0,0] [%emt 0:00:00]} c5 {[%eval 0,0] [%emt 0:00:00]} 2. d3 {
[%eval 0,0] [%emt 0:00:00]} Nc6 {[%eval 0,0] [%emt 0:00:00]} 3. f4 {[%eval 0,0]
[%emt 0:00:00]} g6 {[%eval 0,0] [%emt 0:00:00]} 4. Nf3 {[%eval 0,0] [%emt 0:00:
00]} Bg7 {[%eval 0,0] [%emt 0:00:00]} 5. Be2 {[%eval 0,0] [%emt 0:00:00]} d6 {
[%eval 0,0] [%emt 0:00:00]} 6. O-O {[%eval 0,0] [%emt 0:00:00]} Nf6 {[%eval 0,
0] [%emt 0:00:00]} 7. Qe1 {[%eval 0,0] [%emt 0:00:00]} O-O {[%eval 0,0] [%emt
0:00:00]} 8. Qh4 {[%eval 0,0] [%emt 0:00:00]} c4 {[%eval 0,0] [%emt 0:00:00]}
9. Nc3 {[%eval 2,16] [%emt 0:00:09]} cxd3 {[%eval 0,13] [%emt 0:00:11]} 10.
Bxd3 {[%eval 6,18] [%emt 0:00:02] (cxd3)} Nb4 {[%eval 2,13] [%emt 0:00:13]} 11.
h3 {[%eval 0,19] [%emt 0:00:00]} Qb6+ {[%eval -6,14] [%emt 0:00:06] (b6)} 12.
Kh1 {[%eval 8,17] [%emt 0:00:12] (Df2)} e6 {[%eval -8,14] [%emt 0:00:16]} 13.
e5 {[%eval 25,18] [%emt 0:00:00] (Td1)} Ne8 {[%eval 24,13] [%emt 0:00:09]
(Sfd5)} 14. Ng5 {[%eval 7,17] [%emt 0:00:10] (Td1)} h6 {[%eval -10,14] [%emt 0:
00:25]} 15. Nf3 {[%eval 21,20] [%emt 0:00:00]} Nxd3 {[%eval 18,14] [%emt 0:00:
04] (Ld7)} 16. cxd3 {[%eval 49,14] [%emt 0:00:01]} Kh7 {[%eval 19,12] [%emt 0:
00:05] (Tb8)} 17. Ne4 {[%eval 47,18] [%emt 0:00:19] (b3)} Bd7 {[%eval 34,15]
[%emt 0:00:15]} 18. f5 {[%eval 235,18] [%emt 0:00:00]} exf5 {[%eval 38,16]
[%emt 0:00:07]} 19. Nf6+ {[%eval 240,20] [%emt 0:00:04]} Bxf6 {[%eval 38,16]
[%emt 0:00:00] (Sxf6)} 20. Qxh6+ {[%eval 630,19] [%emt 0:00:12] (exf6)} Kg8 {
[%eval -30,6] [%emt 0:00:00]} 21. exf6 {[%eval 693,20] [%emt 0:00:15]} Rc8 {
[%eval 97,11] [%emt 0:00:00] (Db4)} 22. Be3 {[%eval 760,19] [%emt 0:00:10]
(Lg5)} Qd8 {[%eval 528,12] [%emt 0:00:10] (Dxe3)} 23. Ng5 {[%eval 32756,11]
[%emt 0:00:00] (Lg5)} Nxf6 {[%eval 32758,22] [%emt 0:00:13]} 24. Rf4 {[%eval
32758,37] [%emt 0:00:00]} Rc4 {[%eval 32760,21] [%emt 0:00:04]} 25. dxc4 {
[%eval 32760,46] [%emt 0:00:00]} Qa5 {[%eval 32762,24] [%emt 0:00:07]} 26. Rh4
{[%eval 32762,80] [%emt 0:00:00]} Qe1+ {[%eval 32764,34] [%emt 0:00:07]} 27.
Rxe1 {[%eval 32764,80] [%emt 0:00:00]} Be6 {[%eval 32766,43] [%emt 0:00:13]
(f4)} 28. Qh8# {[%eval 32766,1] [%emt 0:00:00]} 1-0

Das ist z. B. typisch Spike ... im Unterschied zu Spark ... nicht so aggressiv mit den Bauern aber versucht in offenen Stellungen aggressiv die Figuren einzusetzen. Und natürlich ein Rybka (IPPs und Rybka sind für mich gleich) muss daran glauben. Diese Engine sehen das einfach nicht so gut bzw. spielen selbst die Partiephase zu passiv.

Das war übrigens die einzige Partie bis zum Matt unter 30 Zügen nach derzeit ca. 14.000 SWCR2 Partien. Das war bei der SWCR1 noch anders. Da gab es deutlich mehr Kurzpartien, gerade von Spark ... aber die Engines werden stärker und stärker.
Parent - - By Hauke Lutz Date 2013-12-27 02:48
Deine Meinung über Hiarcs deckt sich mit meiner Erfahrung mit Version 13.

Du scheinst dich ja sehr für GullChess zu interessieren. Wie würdest du Gull in einer Rangliste mit den aufgeführten Engines, sowie Stockfish, Komodo & Houdini beurteilen?
Parent - By Frank Quisinsky Date 2013-12-27 10:08
Hallo Lutz,

teste ja noch die Version 2.2.
Das Update auf 2.3 kam zu schnell, warte daher mit meinem Test auf die Version 2.4.
Die inoffiziellen kann ich nicht testen, nutze nur einen Rechner dafür und bei den vielen Updates der letzten Tage hänge ich hinterher.
Wie gesagt bei GullChess warte ich auf die Version 2.4.

Habe mir die Version R600 aber kurz angesehen, denke die ist ca. 30-40 ELO stärker und würde bei mir ca. die 3.000 ELO erreichen, also ca. 15 ELO über Critter liegen.
Interessant werden die Statistiken zu GullChess, denn ich glaube im taktischen Bereich nimmt die Engine beständig leicht zu (war immer ein Problem bei dieser Engine).

Die 2.2 liegt auf dem Level der besten IPP Engines.
Das sind z. B. Dinge für die ich die Liste von Stefan Pohl einsetze. Um zu sehen ob es Verbesserungen gibt bei den IPPs oder den anderen die oben stehen ist die Liste sehr aufschlussreich. Das Verhältnis bei mehr Engines in einer Liste und auch anderen Bedenkzeiten stimmt dann allerdings nicht mehr, egal wie viele Partien er spielen lässt

Aufgrund der Ergebnisse von Stefan werde ich Bouquet auch ersetzen durch Fire. Bei mir ist eine IPP erlaubt und derzeit ist Bouquet in meiner Liste. Wobei ja eigentlich alle die oben stehen Dinge nutzen die von den IPPs kommen, da sagt auch keiner mehr nein, weder das Stockfish Team noch der Critter Programmierer und bei Houdini wissen wir es ja. GullChess wird auch einiges drin haben, denn alle diese Engines im Verhältnis zu den die es nicht tun (Hiarcs andere) setzen sich im Übergang zum Endspiel ab. Denke das ist auch kein Geheimnis.

Gruß
Frank
Parent - - By Kurt Utzinger Date 2013-12-27 18:05
Hallo Frank
Dieser Beitrag hingegen freut mich. Ich bewundere Deine Fähigkeit
und Deinen Mut, die Stärken und Schwächen der Engines ganz
kurz zu schildern. Dazu wäre ich nicht in der Lage, setzt dies doch
voraus, dass man viele Partien anschaut, vergleicht und auswertet.
Dabei tut es keinen Abbruch, wenn ich zwischendurch mal mit
Deiner Bewertung nicht einig gehen kann. Mach weiter so.
Mfg
Kurt
Parent - By Frank Quisinsky Date 2013-12-27 22:19
Hi Kurt,

ich schaue mir in der Tat sehr viele Partien an.
Aber die Erkenntnis die ich gewonnen habe, habe ich eher aus Auswertungen der gespielten Partien.
Versuche immer neue Statistiken zu kreieren wenn mich ein Thema besonders interessiert.

Hatte gestern eine Partiekonstellation mit falscher Läufer und Randbauer und zwei weiteren Figuren die aber nicht eingreifen konnten bzw. die Stellung war Tod remis. Da dachte ich mir warum +6. Suchte ein wenig nach vergleichbaren Stellungen bildete einen Kurztest aus drei dieser Stellungen und prüfte die TOP21. 7 Engines sahen es nicht und 2 davon gaben identische Bewertungen ab. Mal wieder ein nette kleine Erkenntnis.

Denke das hat weniger mit Mut zu tun.
Ich versuche seit geraumer Zeit mit den Beiträgen ein wenig zu provozieren in der Hoffnung das sich ein Programmierer der Statistik Frage annimmt. Hatte damit schon öfters Erfolg, lernte so z. B. Martin Blume kennen der mir dann schrieb. Frank ich habe eine GUI in der Entwicklung die mehr kann als Winboard, willst Du dir diese mal ansehen. Und das Team war geboren und diese Entwicklung machte richtig Spaß, nicht nur mir sondern alle die wir daran beteiligt haben denn wir wollten ja das sich möglich viele mit Ideen beteiligten.

Gruß
Frank
Parent - - By Kurt Utzinger Date 2013-12-27 18:10
Hallo Frank
Spannende Partie, obwohl ich hier gewisse Zweifel habe, ob dies ein
wirklich gutes Beispiel der Stärke von Spark ist, weil sein Gegner doch
einige fragwürdige bis schlechte Entscheidungen getroffen hat, z. B.
10...Sa5?, 12...Lg6?!, 14...Tc8?! und deshalb wohl auch andere Engines
als Spark die Partie im guten Angriffsstil nach Hause gefahren hätten,
oder nicht?
Mfg
Kurt
Parent - By Frank Quisinsky Date 2013-12-27 22:22
Hi Kurt,

dann lade Dir mal auf meinen Webseiten die SWCR Datenbank runter und schaue dir an welche Engines Spark so schon auseinander genommen hat. Dann suche mal ob andere Engines es in dieser beeindruckenden Häufigkeit auch getan haben. Zu welchen Schluss würdest Du kommen?

Aber Du hast natürlich auch Recht. Die Spielstärke rast voran und mithin gelingt es Spark in der SWCR2 nicht mehr so häufig. Nicht zuletzt weil die Gegner weniger Fehler produzieren. Aber wenn eine Engine solche Kurzpartien im Vergleich zu anderen (Stockfish ist hier heute deutlich besser als Spark bei solchen Kurzpartien, bei der SWCR1 waren beide ca. gleich gut) in Häufigkeit produziert heißt das auch das die Engine grundsätzlich in der Lage ist solche Angriffe zu spielen und mit mehr Zeit auch immer wieder noch verblüffendere Fortsetzungen finden wird.

Gruß
Frank
Parent - - By Benno Hartwig Date 2013-12-27 14:20

> Er sagte mal ich kann anhand weniger Turnierpartien erkennen ob eine Engine gut oder stark ist. Na ja, er neigte oft zu übertreiben aber so ganz Unrecht hat Thorsten mit der Aussage gar nicht.


Eine sehr interessante Behauptung. Damals wie jetzt. Zumindest wenn man so erkennen möchte, welche Engine stärker als eine andere ist.

Bei Spielstärkeeinschätzungen kennt jeder die große Fehleranfälligkeit bei nur wenigen Partien.
Diese zufällige Streuungvon Erfolg und Misserfolg begegnet aber doch auch dem die Engine Analysierenden!

Beispiel:
Angenommen, da sind zwei unbekannte Engines mit 100 ELO (oder auch 200 ELO) Differenz.
Und angenommen, man präsentiert jeweils jeweils z.B. 5 Verlustpartien der stärkeren Engine.
Könnte Thorsten, könntest du, könnten andere einigermaßen treffsicher erkennen, dass diese Engine trotz dieser Niederlagen die bessere war?
Ist an den verlustbringenden Zügen der an sich stärkeren Engine erkennbar, dass es die stärkere Engine ist?
Ist es nicht notwendig, eine ungefähr der tatsächlichenSpielstärke entsprechende Anzahl von Siegpartien zu haben?

Nur dann(!) wäre vorstellbar, das Thorstens These richtig ist.

Benno
Parent - By Frank Quisinsky Date 2013-12-27 21:50
Hallo Benno,

also ich finde es ist schon erkennbar wenn eine Partie beobachtet wird ob spielstärkere Engines spielen oder nicht. OK, nicht in jeder Partie aber es gibt viele Hinweise darauf. Habe mal versucht AnMon Partien durch zusehen zu erkennen, weil AnMon einige Eigenarten hat die kein anderes mir bekannte Programm so offensichtlich spielt. Es ist mir fast zu 60% gelungen. Aber auch nur weil ich die Engine sehr gut kenne.

Erkennen kann ich natürlich nicht ob eine Engine trotz Niederlage eigentlich die bessere war.
Aber ich finde schon das durch vielen Beobachtungen von Eng-Eng Partie erahnt werden kann ob da spielstärkere oder spielschwächere aktiv sind (natürlich auch nicht immer). Wäre vielleicht mal ein nettes Thema. Die deutschen lieben ja Ratespiele. Könnte mal als Fun Option in eine GUI eingebaut werden.

Viele Grüße
Frank
Parent - - By Dieter Kraft Date 2013-12-27 21:40
Hallo Frank und andere, auch Ironiker,

hier ein praktisches Beispiel aus Cat. 1 (frühes Mittelspiel).
a) Welche engine(s) würdet Ihr hier loslassen?
b) Welches ist die (fast schon gewinnende) Fortsetzung?

Event:
Ort:
Datum:

Weiss:
Schwarz:

Ergebnis
Board


Viel Spass beim Knobeln (lassen)
und herzlichen Dank
Dieter
Parent - By Frank Quisinsky Date 2013-12-27 21:44
Hallo Dieter,

wenn in dem Thread offenbar schon eine Partie gesetzt wurde ist das setzen einer zweiten oder einer Stellung offenbar nicht möglich.
Aber vielleicht gibt es einen Trick?

Viele Grüße
Frank
Parent - - By Michael Bechmann Date 2013-12-27 11:51 Edited 2013-12-27 11:55
Zitat:
Was mir persönlich ein wenig Leid tut ist der Umstand das ich so viele Jahre das Thema Kompatibilitäten dahin getrieben habe zu dem was wir heute haben.


Was heißt das "Thema Kompatibilität dahin treiben?" Was sollen wir heute haben?

Ehrlich zu sein, ich habe den Artikel nicht verstanden, nicht mal den Sinn erfasst. Was hat es mit den 1000 Partien und den 1000 Experten auf sich?
Hätte man diese 1000 Partien (welche eigentlich, von wem?) nicht austragen sollen?
Was soll man den "60.000 Messpunkten" dann tun?
Weswegen sollten wir die Köpfe einschlagen?

Ich schätze, dass in diesem reichlich wirren Beitrag substanziell nichts steht.
Parent - - By Joe Boden Date 2013-12-27 13:04
@Michael Bechmann

Frank Quisinsky bringt mit diesem Beitrag seine Unzufriedenheit zum Ausdruck, dass sich im Computerschach alles nur noch um das Erstellen von Ranglisten dreht und keiner mehr dem eigentlichen Schach mehr Aufmerksamkeit schenkt. Und das ist sicher richtig, obwohl Frank sich (er ist ja kein Schriftsteller) etwas verzettelt und das Thema wenig konsistent angeht.

Tatsache ist aber auch: Frank hat schon richtig erfasst, dass die Art und Weise, wie hier unter Freaks das Computerschach verstanden und gelebt wird, nicht mehr viel mit Schach zu tun hat. Es geht um Punkte in irgendwelchen Listen. Auf welche Weise ein Programm seine Punkte erspielt ist nicht mehr von Bedeutung. Und es wird hier sichtbar, dass bis auf wenige Ausnahme sich auch niemand mehr die Zeit nimmt Partien wirklich zu studieren oder zu kommentiere. Kurt Utzinger tut das noch..sonst fällt mir gerade niemand ein. Und selbst Kurt hat sich oft beschwert, dass seine Partien hier keine Resonanz erzeugen.

Diese Entwicklung ist tatsächlich seelenloses Schach, und wir Menschen fühlen uns davon immer weniger berührt, weil die "menschliche Dimension" fehlt.

Wie heißt es in einem Indianerwort:.."wenn der letzte Baum gefällt, der letzte Fluss vergiftet usw...wird man erkennen, dass man Geld nicht essen kann.

Wie könnte dieser Spruch lauten, wenn wir die menschliche Faszination des Schachs im Blick haben?
Parent - By Michael Bechmann Date 2013-12-27 14:04 Edited 2013-12-27 14:09
Danke für die Erklärung.

Prinzipiell kann ich aber nicht der Argumentation folgen.
Schach ist eine math. Optimierungsaufgabe und deshalb ist es für Computer hervorragend geeignet, hingegen für Menschen - im Vergleich zu einem Programm - nicht so gut.

Wo eine Aufgabe im mathematischen Bereich gelöst wird ist das definitiv "seelenlos".

Eines Tages hat man die Lösung wie schon bei Dame und Mühle, so für Schach für alle Stellungen, etwa so wie man es für 6 Steine jetzt schon hat.
Danach wird man den Schwerpunkt zu einem anderen math. Problem wechseln.

Zu überlegen ist allerdings,ob man stundenlang und das täglich irgendwelchen Ranglisten nachjagen soll.
Jeder PC ist gegen ein ganzes Rechenzentrum unterlegen, egal wie lange man an den Eröffnunsbüchern und Optionen herumdoktert. Wer in den ersten Plätzen in den Listen liegt hat eine Rechenkapazität die man nicht annähenrd mit dem heimischen PC erreicht.
Was man daheim haben kann ist recht begrenzt: Eine populäre Engine und einen irgendwie noch benutzbaren PC haben und eine persönliche Zielstellung stellen, etwa eine ELO-Zahl mit 2400 mit seiner Engine und dann die Datenbanken regelmäßig aktualisieren und an den meist höchst komplizierten Settings variieren (wobei man hier schon "im Nebel stochert"). Das könnte man 2 Stunden tun, aber auch nicht täglich und das als Hobby, nicht als Lebensaufgabe.
Und wer er doch als Hauptaufgabe sieht irgendwelche fiktive Punkte zu ergattern, soll es doch tun.

Empfehlenswert ist es, regelmäßig (etwa 1 mal pro Woche) selbst ganz seelenlos gegen eine Engine zu spielen - nicht um zu gewinnen (kann man ohnehin nicht), aber den eigenen Bezug zum Schach zu trainieren, bevor man nicht mehr versteht, wie Schach eigentlich funktioniert und man nicht mehr weiß, was sein Programm da zieht und warum es verliert oder gewinnt.
Parent - - By Michael Scheidl Date 2013-12-27 15:14 Upvotes 1
Sobald keine Elosteigerung mehr meßbar ist, wird man sich erinnern daß Schach ein Spiel ist.

Davon sind wir zwar noch entfernt, aber es ist ja jederzeit möglich Aspekte abseits jedweder Statistik zu betrachten. Wie wäre es z.B. mit Schönheitspreisen je Turnier, vielleicht sogar eingeteilt in Kategorien bzw. Partiephasen...

Mein Eindruck ist, daß überraschende, brillante Züge weniger werden weil, bzw. falls man sich nur mit Partien zwischen sehr starken Engines befaßt. Diese lassen so etwas gegenseitig nur noch sehr selten zu. Meistens blättere ich nach meinen Turnieren die graphischen Bewertungsprofile durch. Es sind fast nur noch "kontinuierlich ansteigende" Kurven bzw. kleine Schritte...

Und was wird das neue Jahr 2014 bringen? - Ich freue mich schon auf nTCEC/Saison 3.
Parent - - By Joe Boden Date 2013-12-27 15:58 Edited 2013-12-27 16:02
Eine gute Anregung Michael Scheidl:

Die Partien einteilen in z.B.

Mattangriff
Opfer
kürzester Angriff mit Erfolg
Spiel auf Raum
Das Spiel mit der Kommutativität der Faktoren Raum, Kraft, Zeit
geniale Verteidigung
erfolgreiche strategische Ideenumsetzung
Kombinationen (taktische und strategische)
Schönheit und Asthetik im Stellungsaufbau usw....

fällt Dir noch was ein?

Natürlich stellt uns das vor die Herausforderung, wie wir das messen und bewerten. Wer nimmt sich dafür Zeit?

Da man in Chessbase nach Stellungsfragmenten suchen kann, müsste eine Software so etwas auch prinzipiell erfassen können. Dann wären wir bei dem von Frank Q. erwünschten "Spielstil". Und das wäre sicher eine Bereicherung für das Computerschach, weil wir Engines dann nicht nur Gewinn- und Verlustpunkten beurteilen können.
Parent - - By Michael Scheidl Date 2013-12-27 16:42 Upvotes 1
Zitat:
kürzester Angriff mit Erfolg

Das ist bestimmt eines der attraktivsten Motive.

"Messen und bewerten" möchte ich das gar nicht, denn dann landen wir wieder bei Statistik.

Sobald wir von Schönheit und Ästhetik reden, sind die Einschätzungen sowieso sehr individuell und geschmacksbedingt. So etwas kann nicht "physikalisch" mit irgendeinem Maßstab gemessen werden. Hier treffen wir auf die Gemeinsamkeit von Kunst und Schach.
Parent - By Frank Quisinsky Date 2013-12-27 21:58
Hi Michael,

nehme Dir mal eine Datenbank mit sagen wir mal 10.000 Engine Partien vor. Mache Statistiken über die Dauer der Partie, über die jeweiligen Stellungsbewertungen etc. über alles was Dir so einfällt. So viele Dinge werden Dir auffallen was z. B. Engine A sehr gut macht, Engine B nicht kann.

Alleine schon die Statistik von Stockfish hinsichtlich kurze Gewinnpartien. Selbst die Nummer 2 der TOP-21 produziert noch nicht mal die Hälfe von den schnellen Stockfish Siegen. Wenn Stockfish schnell so viele Punkte einfährt wo baut die Engine dann wieder ab und verliert zu gleichstarken anderen Programmen. Die vielen logischen Fragen nachdem Du Dich näher mit Statistik beschäftigt hast folgen. Und genau das finde ich viel interessanter als eine bloße Wertungszahl in einer Ratingliste abzulesen.

Diese Information ist zwar ganz nett aber was sagt mir eine Ratingliste von Schachprogrammen wirklich?
Welches Programm spielt den Übergang zum Endspiel am Besten, mehr eigentlich nicht denn da werden die Partien entschieden. Aber der Übergang zum Endspiel ist nur eine Partiephase, nicht mehr und nicht weniger. Und das ist ein sehr spannender Punkt. Wir könnten die derzeitige Spielstärke der TOP-3 wahrscheinlich nochmals um mind. 100 ELO steigern wenn wir diese Programme gezielt einsetzen. Wenn uns eine GUI die Möglichkeit gibt z. B. den von Benno zitierten Staffelstab zu übergeben. Wir hätten ganz andere Möglichkeiten. Ein Statistik Programm wertet irgendwann automatisch die Engine Datenbanken aus. Gibt uns die Information und wir mixen die Engines so zusammen das eine noch höhere Spielstärke dabei heraus kommt.

Ingo sprach davon und sagte, doch mich interessiert wer die Nummer 1 ist.
Dann müsste er doch jubeln wenn es solche Möglichkeiten gibt und wir plötzlich feststellen das die Kombination x noch mal 100 ELO vor der aktuellen Nummer 1 liegt. Das ist Fortschritt und Entwicklung, unsere Sklaven ... die Engines ... so einzusetzen das der Nutzen größer wird.

Finde eines der spannendsten Computerschachthemen überhaupt.

Gruß
Frank
Parent - By Frank Quisinsky Date 2013-12-27 19:22
Hallo Josef,

ich habe Handbücher für Schachcomputer geschrieben, für 5 Schachzeitschriften nicht nur Reviews geschrieben, Schachbücher rezensiert, ca. 40 Interviews mit Schach Programmierern gemacht. 4 Newsseiten im Internet zum Thema Computerschach geschrieben. Ich habe 3 Schachbücher korrigiert, und für 2 andere Zeitschriften zu einem anderen Thema geschrieben. Es ist schön das Du schreibst ich wäre kein Schriftsteller, ich fühle mich auch nicht als ein Schriftsteller, aber mir ist sehr bewusst was ich schreibe und wenn ich solche Beiträge verfasse wie diesen den ich verfasst habe dann denke ich mir etwas dabei. Und der Beitrag hat sehr wohl den Nagel auf dem Kopf getroffen. Wenn der Beitrag nicht verstanden wird ... ist doch nicht schlimm. Ich verstehe hier viele Beiträge nicht mehr und wundere mich selbst sehr oft.

Ein paar Dinge hast Du aber schon richtig erfasst, das beruhigt mich

Gruß
Frank
Parent - - By Kurt Utzinger Date 2013-12-28 16:03 Upvotes 1
Joe Boden schrieb:

[...]

Und es wird hier sichtbar, dass bis auf wenige Ausnahme sich auch niemand mehr die Zeit nimmt Partien wirklich zu studieren oder zu kommentiere. Kurt Utzinger tut das noch..sonst fällt mir gerade niemand ein. Und selbst Kurt hat sich oft beschwert, dass seine Partien hier keine Resonanz erzeugen.

Diese Entwicklung ist tatsächlich seelenloses Schach, und wir Menschen fühlen uns davon immer weniger berührt, weil die "menschliche Dimension" fehlt.

[...]


Partien zu analysieren und zu kommentieren ist nach wie vor mein liebstes Hobby beim Schach.
Nur bringe ich diese Partien nicht mehr ins Forum, weil die Erfahrung gezeigt hat, dass kaum
jemand noch Interesse dafür bekundet. Deshalb finde ich die andersartigen Ansätze von Frank
echt spannend, auch wenn ich mir bewusst bin, dass Frank als einsamer Rufer in der Wüste
des Computerschachs wenig Anhänger finden wird. Die Auseinandersetzung und das Studium
von Partien im Sinne von Frank ist ebenfalls zeitintensiv und natürlich nicht zu vergleichen mit
dem automatischen Abspielen lassen von Computerpartien und der Publikation von ebenfalls
automatisch generierten Rating-Tabellen. Eigentlich braucht es beides, aber in der heutigen
Zeit, wo die Zeit für aufwändige Untersuchungen fehlt, muss offenbar viel Interessantes
auf der Strecke bleiben,
Mfg
Kurt
Parent - By Frank Quisinsky Date 2013-12-28 18:26
Hi Kurt,

Partien analysiere ich auch gerne aber eher wie in Zeiten der Schachcomputer. Nehme mir dann ein Buch zur Hand und spiele für mich nach und lese die Kommentare hierzu. Ich kann das am PC einfach nicht so gut bzw. macht es mir weniger Spaß. Es sei denn ich finde etwas außergewöhnliches in einem Schachbuch. Dann schnell eine Analyse mit 4 Engines und je einen Core mal ein paar Stunden laufen lassen. Zur Zeit auch eher nicht weil ich die SWCR2 spielen lasse und es einfach zu viele Updates in den letzten Wochen gab. Komme ja gar nicht mehr mit. Beim Start der SWCR2 dachte ich noch, so wenig wie derzeit upgedatet wird reicht ja ein Rechner dicke aus.

Glaube auch durch die Vielfalt der Möglichkeiten heute sind auch viele überfordert, wissen gar nicht wo sie anfangen sollen und lassen dann hinsichtlich Computerschach mal hier und da ein kleines Turnier laufen oder ein längeres Match zwischen zwei Programmen. Aber das liegt auch ein wenig daran, dass die GUI Optionen eingeschlafen sind. Zwar haben wir viele Möglichkeiten beim Engine Testen aber wie gesagt nicht bei der Auswertung der Partien. Da herrscht Stillstand seit vielen Jahren.

Denke das die Analyse (im Grunde das was Du machst) auch ein wirklich spannendes Thema ist weil sehr abwechslungsreich. Ich konnte nie verstehen wie jemand z.B. Spaß daran haben konnte immer die gleichen 30 Stellungen auf x Programme zu jagen oder Ratinglisten zu produzieren bei denen immer die gleichen Eröffnungen gewählt werden. Wir haben ein sehr umfassendes Hobby welches in sich viele Themenbereiche beherbergt. Das wird schon ersichtlich wenn du Dir anschaust wie viele Schachbücher zu dem Thema ständig zu x Themen generiert werden. Glaube es gibt gar kein anderes Thema als Schach zu welchem so viele Bücher erschienen sind. Und dann meinen ein paar Computerschächler alles ist über einen Kam zu scheren anhand einer vierstelligen Zahl.

Das würde ja bedeuten ich erkläre gleichzeitig sämtliche Buchautoren für bescheuert die sich vielleicht einem Teilbereich dessen annehmen. Computerschächler müssen ein wenig verrückt sein um die Grundvoraussetzung mitzubringen sich dem Thema zu widmen. Hörst du dich in der Schachwelt mal ein wenig um, gelten die Computerschächler als eher verrufen. Nischenbereich was die da so treiben. Aber fast jeder nutzt heute Schachprogramme, meist für Analysen ... das was die Computerschächler in viel Arbeit entwickelt haben.

Wie gesagt, ich finde es nur schade was letztendlich draus gemacht wird. In diesem Forum reagieren mittlerweile bloße vierstellige Zahlen und die welche diese Zahlen erzeugen sind sich zwar untereinander einig (sofern nicht einer den anderen angreift) und meinen das der ganze Bereich nur noch aus Zahlen vom Übergang Endspielgeschiebe beherrscht werden sollte. Das ist echt krass und für echte Computerschächler eher eine Schmach bzw. es ist dann vielleicht an der Zeit das dieser Kreis an Personen seinen eigenen Club gründet und anderen die vielleicht noch ein Interesse haben die Entwicklung ein wenig voran zu treiben aus den Weg gehen.

Führt leider in den letzten Computerschachforen auch dazu dass sich immer mehr Personen absondern.
Es ist schon seit vielen Jahren so, dass ich z. B. die spannendsten Diskussionen per eMail führe und ich dann selbst immer wieder gefragt werde ... Frank warum machst Du dir eigentlich überhaupt in diesem Forum noch die Mühe.

Gruß
Frank
Parent - - By Frank Quisinsky Date 2013-12-27 19:15
Hallo Michael,

1. Kompatibilitäten ...
Bin ein wenig zurückgegangen in Zeiten als ein paar wenige Personen das Winboard Protokoll nach vorne getrieben haben. In Zeiten in denen z. B. auch hier im Forum das Protokoll verschriehen war, lange bevor dann ein zweites Protokoll kam, UCI. Muss immer an so viele Beiträge in den Foren denken von Personen die das was seinerzeit in wahnsinnig viel Arbeit geleistet wurde ablehnend gegenüber gestanden haben und heute die Dinge nutzen. Ziel war es ja auch das wie den Autoplayer ablegen um vernünftiger testen zu können. Wenn ich mir anschaue was daraus geworden ist, Partien in einer Minute oder gar noch weniger ... also das wollten wir seinerzeit ganz sicher nicht in der Form bewirken. Aber sei es drum.

2. Bei 1.000 (willkürliche Zahl) hätten wir 60.000 Messpunkte ... (Stellungsbewertungen). Anhand dieser lässt sich auch eine Spielstärke messen, nicht nur an dem reinen Endergebnis.

3. Köpfe einschlagen ...
Die Diskussionen in verschiedenen anderen Threads hinsichtlich unterschiedlichen Bedenkzeiten und welche Engine ist nun die Nummer 1. Halte das nicht für das spannendste Thema, eher wie setze ich die Engines wann ein.

Der Beitrag ist nicht wirr, auch nicht reichlich wirr sondern ich vermisse ein wenig den Forscherdrang aus früheren Zeiten.
Mein Gott, mit der Community von heute ... HILFE ... da hätten wir früher nichts auf die Beine stellen können.

Gar nichts!
Aber es waren auch früher nur sehr wenige Personen die wirklich Beiträge geleistet haben, leider!

Gruß
Frank
Parent - - By Guest Date 2013-12-27 20:55
Frank Quisinsky schrieb:

...

3. Köpfe einschlagen ...
Die Diskussionen in verschiedenen anderen Threads hinsichtlich unterschiedlichen Bedenkzeiten und welche Engine ist nun die Nummer 1. Halte das nicht für das spannendste Thema, eher wie setze ich die Engines wann ein.
...


Genau das halte ich für das spannendste Thema. Nicht weil sich die Leute "die Köpfe einschlagen", sondern in der Konsequenz das wir zurück zum Normalen sind!
Jahrelang hatten wir eine so große Dominanz einer Engine, dass niemand auf die Idee kam irgend etwas am drumherum der besser werdenden Listen zu kritisieren (kritisieren ist hier positiv besetzt). Jetzt sind wir in einer Situation das es mal wieder Sinn macht sich über das "wie" einer Rangliste Gedanken zu machen. Wir haben viel gelernt in den letzten Jahren und lernen gerade das neben der Anzahl an Spielen auch andere Faktoren eine Rolle (und damit meine ich nicht so etwas abstraktes wie "Spielstil" den jemand der hunderte ELo darunter steht sowieso nicht erfassen kann). Faktoren wie, Zeit (ich zweifle stark), Anzahl der Kerne, Eröffnungen (Bücher, nicht ob, sonden welche) fangen an eine Rolle zu spielen.
Nachdem nun in den letzten Jahren mehrere Listen die Anzahl an Spielen ordentlich erfassen können (mehr oder weniger) muß sich jetzt ein Konsenz über die anderen Faktoren bilden.
In PräRybka Zeiten hatten wir schlicht nicht die Resourcen um ordentliche Listen auf die Beine zu stellen. Jetzt haben wir ordentliche Listen und müssen uns um die Feinheiten kümmenr. Die Anzahl an Spielen ist immer noch das A und O aber der Rest sind feine Stellschrauben an denen gedreht werden muß. Am Ende wird nicht eine Liste stehen, sondern viele.
Zurückkomemnd auf den Anfang ist dieses "Hauen und Stechen" der Normalfall. Ich erinnere nur an die früheren Konflikte der großen Player. Die gegenwärtige, kontroverse Diskusion ist nur die Rückkehr zum Normalen und ich hoffe sehr das bleibt so!
Die jetzige Computerschächergeneration muß sich nur (wieder) daran gewöhnen das es eben nicht DIE beste Engine gibt und wir das, mit den heutigen Ansprüchen an Genauigkeit) bei den TOPs auch nicht bestimmen können - zumindest nicht im Moment!

Ingo

PS: ... und schwelgen in Nostalgie wie doch mal alles war und was man geleistet hat hilft da auch nicht und interessiert auch nicht mehr!
PPS: Es gibt eine praktische Instanz wo man tagesaktuell ablesen kann, welche Engine für diesen speziellen Fall die beste ist: Playchess. Man mag lachen aber dort wird immer schnell entschieden was - für diesen Zweck - wirklich am besten ist!
Parent - By Guest Date 2013-12-27 21:42
Hallo Ingo,

also ich sehe es eher so die Stärken der Engines entsprechend einzusetzen für den eigentlichen Zweck der Analyse. Das ist nach wie vor das was wir hauptsächlich mit Schachprogrammen tun, vielleicht nicht Du oder ich oder andere Computerschächler. Wir arbeiten dann eher daran herauszufinden welche Engines sind derzeit die spielstärksten bzw. ich versuche ergänzend herauszufinden wie setze ich die Stärken der besten Programme so ein um möglich noch bessere Analysen (das mache ich auch sehr gern) zu erhalten.

Computerschach hat eine Vergangenheit und diese ist natürlich wichtig.
Denn wäre die Entwicklung nicht gewesen würde es solche Diskussionen hier gar nicht geben.

Finde es eher problematisch das diese Entwicklung seit geraumer Zeit steht. Entwicklung bedeutet nicht nur die Spielstärke von Engines. Die werden so stark, dass wir andere Mittel brauchen um dieses Hobby weiter zu entschlüsseln. Damit meine ich keine vierstelligen Wertungszahlen denn diese geben mir derzeit im Grunde nur die Basisinformation ... Nummer 1 ist weil zwischen Zugnummer 50-75 am spielstärksten (denn da werden die Partien überwiegend entschieden). Eine Schachpartie beginnt aber nicht bei Zugnummer 50, sondern schon viel früher.

Gruß
Frank
Parent - By Stefan Pohl Date 2013-12-28 04:48
Guest schrieb:

In PräRybka Zeiten hatten wir schlicht nicht die Resourcen um ordentliche Listen auf die Beine zu stellen. Jetzt haben wir ordentliche Listen und müssen uns um die Feinheiten kümmenr. Die Anzahl an Spielen ist immer noch das A und O aber der Rest sind feine Stellschrauben an denen gedreht werden muß. Am Ende wird nicht eine Liste stehen, sondern viele.



So ist es. Bin ganz deiner Meinung. Ich habe genau aus diesem Grund meine LS-Rangliste ganz bewußt anders aufgebaut als andere Listen (mehr Partien, weniger Bedenkzeit, alle Derivate und vor allem auch ausschließlich nur starke Engines als Gegner in allen Testläufen (nur die top10+ den Ur-Ippo)). Nichts wäre doch sinnfreier, als viele Listen, die alle mehr oder weniger den gleichen Ansatz haben und das Gleiche messen. Und mein Ansatz macht aus meiner Not (wenig Hardware, wiel wenig Geld) noch eine Tugend: dank kurzer Bedenkzeit dennoch viele Partien und dank nur maximal 11 Gegner pro Testrun auch noch statistisch belastbare Einzelergebnisse. Daher bin ich mit meinen Testbedingungen sehr zufrieden (gemessen an meinen Möglichkeiten) und bekomme auch sehr positives Feedback. Dennoch würde ich meine Liste nie zur alleinseligmachenden erklären.

Stefan
Parent - - By Michael Bechmann Date 2013-12-28 18:21
Hallo Frank,

zunächst einmal sind 1000 Partien statistisch eine Stichprobe - viel zu wenig um verallgemeinernde Werte festzustellen. Obwohl deine Zahl willkürlich ist müsste man mindestens 2 Nullen dranhängen.

Die Köpfe einzuschlagen zum Thema, welche die beste Engine ist und welche ELO-Zahl damit erreicht wird ist völlig sinnfrei, denn das wird hautsächlich von der Hardware dominieren. Es hat keinen Sinn mit einem kleinen PC ein riesiges Rechnercluster, der garantiert auch eine der besten Engines benutzt (vielleicht auch eines das für Windows-PC gar nicht geschrieben ist und somit die große Mehrheit auch nicht kennt) schlagen zu wollen.
Dazu habe ich gestern weiter oben einiges geschrieben.
Daher gebe ich dir recht - das Thema ist nicht spannend und nicht sinnvoll.

Meine Prognose: Wenn man den DEEP BLUE der 1997 gegen Kasparow gespielt hat wieder zusammenbauen wollte, ggf. mit besserer schnellerer Technik, würde der jeden Windows-PC mit Houdini4 zusammenschieben und nach 1000 Partien wird er mit großem Abstand auf der Liste oben stehen und dann wäre die Diskussion erübrigt.

Wer soviel Rechenzeit investieren kann, könnte tatsächlich die gleiche Zeit (und auch die persönliche Zeit) auch für die Forschung in der Schachtheorie investieren und die Ergebnisse in den Programmen einflioeßen lassen, wie etwa die vollständige Endspieltabellen für 7 oder mehr Figuren.
Parent - - By Frank Quisinsky Date 2013-12-28 19:19
Hallo Michael,

sorry, Deine Meinung zu 1.000 Partien kann ich nicht teilen.
Wiederspricht 15 Jahre Erfahrungen mit dem erstellen von Ratinglisten und mittlerweile mehr als 200.000 Partien die ich habe gegeneinander spielen lassen.
Sorry!

Ja, da stimme ich Dir zu.
Natürlich dominiert die Hardware auch bzw. auch einer der wesentlichen maßgeblichen Beeinflussungsfaktoren.

Erinnere mich kaum noch an den Wettkampf 1997. Sofern ich mich erinnere sprachen die Programmierer von Deep Blue ca. von einer Spielstärke von 2.900 ELO. Kasparow lag seinerzeit bei ca. 2.825 ELO. Lt. GM Meyer (zum Zeitpunkt des Schachwelt Interviews vor ca. 2-3 Jahren die Nummer zwei in Deutschland mit ca. 2.640 ELO) geht davon aus das Shredder 12 seinerzeit bei ca. 2.750 - 2.800 liegt auf herkömmlicher Notebook Hardware. Wir können leicht sehen wie sich die Engine Entwicklung von 1997 - 2013 verändert hat. Nehmen wir ein TOP Programm von 1997 und lassen es gegen ein TOP Programm von 2013 auf gleicher Hardware spielen sollte die reine programmiertechnische Leistung um ca. 350-450 ELO gesteigert worden sein. Die Programmierer von Deep Blue zählen nach Expertenmeinungen nicht zu denen die das ultimativ beste Programm hatten, aber zu denen die die ultimativ beste Hardware hatten.

Insofern glaube ich das ein modernes Quad Core System von heute mit moderner Schachsoftware wie Stockfish den Deep Blue von 1997 so was von an die Wand spielen würde das es nicht mehr schön wäre zuzusehen. Vermute mindestens 75% für Stockfish nach den Erkenntnissen der Entwicklung die wir heute haben.

Die Forschung der Schachtheorie ist immer interessant aber ich glaube hierfür sind die Programme noch zu schwach um gegen das geballte aktuelle moderne Theoriewissen zu halten. Hier und da werden ja mal interessante Neuerungen durch Computeranalysen gefunden aber die gibt es regelmäßig auch durch die GMs. Denke den Programmen fehlt in dieser Partiephase noch mindestens 200-300 ELO denn es ist wie es ist, die Ideen der Eröffnung kann ein Programm noch nicht selbst errechnen. Leicht zu sehen wenn ich mir nach 2-3 Zügen irgend welcher Theorieeröffnungen mal die Fortsetzungen ansehe die unsere Programm da errechnen. Da fehlt meist jeglicher Plan. Dieser entsteht für die Programme im Grunde erst dann wenn die Eröffnung fortgeschritten ist mindestens schon 8-10 Züge tief geht.

Denke wir haben komplett unterschiedliche Ansichten, aber das macht nichts.
Das Leben ist dennoch schön

Viele Grüße und Dir weiterhin viel Spaß beim Computerschach.
Frank
Parent - - By Tom Paul Date 2013-12-28 19:40
Ich schätze mal Stockfish würde gegen Deep Blue auf einem 6 Kerner bei 10000 Partien mit langer Bedenkzeit 99,9% gewinnen.
Da Deep Blue 2900 ELO angegeben hat würde ich Stockfish auf mindestens 3500 wenn nicht sogar auf 3900 schätzen.
Parent - - By Frank Quisinsky Date 2013-12-28 19:43
Hi Tom,

wenn nun in der Mitte die Wahrheit liegt wären es ca. 90%.
Aber wahrscheinlich bist du mit Deiner These näher dran als ich mit meinen kurzen Gedankengängen.



Gruß
Frank
Parent - - By Tom Paul Date 2013-12-28 20:07
Hier seht ihr was ich meine:
CCRL
http://www.computerchess.org.uk/ccrl/4040/cgi/engine_details.cgi?print=Details&each_game=1&eng=Stockfish%20DD%2064-bit%204CPU#Stockfish_DD_64-bit_4CPU
Stockfish DD vs Deep Fritz 14 der jetzt im Jahr (2014) auf den Markt kam.
Stockfish erreicht 93,8% gegen den frischen Deep Fritz 14.
Jetzt zählt ihr die Jahre von 1996/97 bis 2014.
Und jetzt dürft ihr schätzen wie viel Prozent Stockfish zu seinen 93,8% bekommt wenn er gegen Deep Blue spielt.
Es fehlen nur 6,2% für die 100% diese dürfte Stockfish in den fast 20 Jahren in der Geschichte der Engineentwicklung dazugewonnen haben.
Es würde mich nicht wundern, wenn Stockfish 100% gegen Deep Blue erreichen würde, also nur Siege.
Vorausgesetzt es gibt keine zu stark vorteilhaften Vorgabestellungen.
Parent - By Thorsten Czub Date 2013-12-28 22:26
bei längeren bedenkzeiten (ich habe 40/120) bei 4 cores getestet,
spielt DF14 sehr schön und auch erfolgreich.

ich wäre wohl der letzte der fuer die Firma CB reden wuerde.
Mir gefällt das Programm jedenfalls.

Allein das man so schlecht engines testen kann mit der GUI geht mir auf den senkel.
Parent - - By Frank Quisinsky Date 2013-12-28 22:30 Edited 2013-12-28 22:34
Hallo Tom,

Stockfish ist wirklich eine Ausnahme.
Ich testete noch die Version vom 05.12.2013 die bei mir 10-15 ELO über Houdini 3 liegt (SF mit den neuen Endspieldatenbanken).
Habe mal ein bissel auf einem i3 Notebook verglichen. Die aktuelle Version scheint ja wieder um ca. 20-25 ELO stärker geworden zu sein und findet aggressive Lösungen wieder schneller.
Das ist unheimlich!

Nun ja das Thema DeepBlue.
Es ist für uns schwierig zu verstehen das die besten Schachspieler den derzeitigen TOP Engines schon deutlich unterlegen sein müssen. Dieses Match erregte seinerzeit sehr viel Aufmerksamkeit und läutete leider das Ende des Medieninteresses an "Mensch gegen Maschine" ein. Finde das dieses Thema auch von den seinerzeit Beteiligten falsch angegangen wurde. Die Sensationslust die da drin lag wurde so stark übertrieben, dass die Macher sich für ein Event die Zukunft an solchen Matches selbst ruiniert haben. Tja, wer den Hals nicht voll bekommt und für den Moment arbeitet.

Heute würde mich persönlich interessieren ...
Die besten vier Schachspieler der Welt spielen ein Vierhirn gegen Stockfish auf einem i5 Notebook (reicht).
Aber ich glaube die Super GMs würden sich die Blamage nicht antun.

Denn Stockfish ist bei dieser enormen Königssicherheit schnell nicht mehr zu bezwingen bzw. die Wahrscheinlich ist zu gering. Wäre mal neugierig wie die Riege der Super GMs eröffnen würde. Wahrscheinlich würden sie unregelmäßig aus Respekt spielen.

Viele Grüße
Frank

Zu Deep Fritz kann ich nichts sagen.

Stockfish liegt fast bei 3.100 ELO. 300 ELO Unterschied auf einem i5 Notebook ...
Remis Chancen bei der Remisträchtigkeit von SF sind natürlich mehr als vorhanden.
Parent - By Frank Quisinsky Date 2013-12-28 22:43
Kommt natürlich auch auf die Bedenkzeit an.
Wenn die 4 GMs unter Turnierbedingungen spielen steigen die Remis Chancen und der Unterschied ist dann vielleicht 150 ELO?
Weiß niemand so genau aber die Ergebnisse der aktuellen Engine Entwicklung lassen das vermuten.
Parent - - By Michael Bechmann Date 2013-12-28 20:40 Edited 2013-12-28 20:49
Der DEEP BLUE hätte nach meiner Schätzung mit der damaligen Hardware etwa 100-150 Punkte mehr. Ein ELO-Wert von heute ist schachspielstärkemäßig nicht gleichzusetzen, wenn der gleiche Wert von vor 20 Jahren ist.
Wegen der großen Menge der Spieler und den wechselseitigen Partien und Ergebnissen müsste sich einen "Aufschaukel-Effekt" für alle Spieler ergeben. Tatsächlich ist eine Verschiebung der ELO-Werte nach oben zu verzeichnen und es ist nicht erwiesen, dass die Spieler wirklich besser sind. Möglicherweise kann der Einsatz von Computern und Datenbanken zum Training helfen, aber das macht allein sicher nicht die durchschnittliche Werteerhöhung aus. Würde z. B. Carlsen nicht immer gegen 2750+ spielen sondern wie in den 90er Jahren 2650-2700-Spieler  - die besten Spieler der ELO-Werte damals, Kasparow war eine Ausnahme mit 2847 - würde Carlsen auch heute nicht über 2870 haben sondern schätzungsweise 2770-2790 und wäre damit auch mit diesem Wert unter den 5 besten (nach dem damals noch aktiven Kasparow). 

Nehmen wir also 3050 für den alten DEEP BLUE an und man benutzt 100fach schnellerer Technik und enstprechend mehr Speicher könnnte auch er die besagten 350-450 ELO zulegen.

Wie auch immer - es bleibt leider eine reine Spekulation. Keiner baut DEEP BLUE und Kasparow mehr zusammen.
Parent - - By Tom Paul Date 2013-12-28 20:54 Edited 2013-12-28 20:57
Ich glaube es war der Mephisto Programmierer, der gesagt hatte:
Der einzige Unterschied zwischen dem alten Mephisto und dem neuen ist, dass der neue Mephisto dank schnellerer/besserer Hardware die Fehler schneller aufs Brett spielt.
Somit gab es 0 / kaum Spielstärke Steigerung.

Und bei einem Deep Blue der im Vergleich zu einem Stockfish extrem miserabel programmiert ist, gibt es dank besserer Hardware vielleicht einen Hauch von ELO Gewinn.
Während Stockfish auf der gleichen Hardware um ein Vielfaches an ELO dazu gewinnt.

Beispiel Deep Blue +450 ELO
Stockfish +450 ELO x 100 weil die Engine um ein vielfaches (z.B.100) besser programmiert ist. = 45000 ELO
Parent - By Frank Quisinsky Date 2013-12-28 23:07
Hi Tom,

war ja auch ein großes Thema in TalkChess. Dort schrieben einige gar das es mindestens 20 Programme geben würde die deutlich stärker als Deep Blue waren. Auch das war dann eine Vermutung aber es war schon allein schade das nicht ein bekanntes TOP Programm spielte. Insofern verschleierte dieses Event die eigentliche Stärke der seinerzeitigen aktuellen TOP Programme und genau das tat dem Computerschach nicht gut.

Ja, das war eine beliebte Aussage. Mit mehr Zeit werden die Fehler nur langsamer ausgespielt. CL1 gegen CL7 war ja schon der Beweis Anfang der 80er. Mit DB und PB konnte man beim ChessChallenger 7 die Seite wechseln. Schnell vorher die Spielstufe gewechselt als ich das Gerät von meinen Eltern zu Weihnachten geschenkt bekam. Und dann was war das erste was ich tat ... CL1 - CL7 (Blitz gegen Turnier Level). Das Match endete mit 5:5. Und selbst CL3 (das war glaube ich ca. 1 Minute) konnte CL7 bezwingen. Also ich großkotzig im Verein als Neuling ... den ChessChallenger 7 schlage ich problemlos auf CL7 und ich tat es und die Verwunderung war groß

Gegen den Vereinsmeister musste ich mich dann aber schon mit Niederlagen zufrieden geben (nach dem Match).

Tja Computerschach ...
Ein Thema für sich, immer schon gewesen!

Gruß
Frank

Hoffe jetzt schreibt keiner ... Frank Du brauchst aber 10.000 Partien für eine genaue Aussage ob CL1 gleich gut war als CL7.
Hätte das seinerzeit jemand gesagt, den hätte ich gar nicht verstanden.
Parent - - By Benno Hartwig Date 2013-12-30 18:40
1) natürlich ist es möglich, dass bei Deep Blue ein irrealer ELO-Wert steht. Wann wurde der ermittelt. Und gegen welche Gegnerschaft?

2) Woher nimmst du, dass Stockfish 99,9% gewinnen würde? Gerade SF neigt doch dazu, auch gegen schwächere Gegner, von deren Schwäche SF ja nichts weiß, bereitwillig mal in ein Remis zu gehen, wenn das Buch SF mit schwarz in eine etwas unglückliche Position entlässt.
Meinst du wirklich, dass SF dies bei immerhin 5000 schwarz-Partien nicht wenigstens 21 mal passiert, ganz egal wie viele Kerne du dem in dieser Situation ängstlichen SF spendierst?

Benno
Parent - - By Tom Paul Date 2013-12-30 21:48
Eine 20 Jahre alte Engine wird ganz sicher vom heutigen Stockfish vernichtet!
Rybka auf dem Rybkacluster wurde von Houdini mit nur ein paar Kernen plattgemacht.
Die Züge von Deep Blue sind viel zu ungenau, damit Stockfish ins Remis abwickelt.
Die ELO Angabe von Deep Blue halte ich für irrelevant.
Ich würde Deep Blue auf gleicher Hardware gegen heutige PC Engines auf 1500 ELO grob schätzen.
Unter schwächeren Gegnern verstehe ich solche die 200 ELO schwächer sind, aber nicht die aus der Steinzeit.
Das Buch muss schon fair sein, wie ich zuvor geschrieben habe, Stockfish spielt ja immer den (besten) Zug und wenn der Gegner mit +0.50 aus der Eröffnung herauskommt und Stockfish ein 3-Fold Rep. findet, dann wird das auch gespielt, aber dann ist das Buch mit den Vorgabestellungen schlecht und nicht das was es sein sollte.
Sofern es aber bei +0.50 für den Gegner, kein 3-Fold Rep. für Stockfish gibt, wird Stockfish sich immer mehr Vorteil ansammeln und gewinnen.

Deep Blue wäre aber zum spielen auf dem Revelation II und vor allem um Spaß zu haben bestens geeignet.
Parent - By Benno Hartwig Date 2014-01-01 09:11
Cluster Rybka hatte soviel Kerne, dass sie damit kaum was anfangen konnte, so meine dringende Vermutung.
Und die Hand voll Kerne des Gegners waren sooo wenige auch nicht.
Ich hätte Houdini da gern auf einem Kern gesehen. Das wäre überzeugend gewesen! Oder allerhöchstens auf handelsüblichen 4.
Rybka hätte wohl auch mit 1000 Kernen keinen Deut besser gespielt. Die riesengroße Kernanzahl ist meiner Meinung nach Augenwischerei.

ein 'faires Buch' forderst du.
Nach meinem Eindruck ist der Weiß-Vorteil bei den gängigen Büchern aber immer mal wieder in dieser Größenordnung.
Du willst also schon eine Sonderanfertigung.

Aber du magst recht damit haben: Aus ausgeglichener Stellung heraus könnte Deep Blue ggf. wirklich kaum mal eine vorteilhafte Stellung erreichen, aus der heraus sich SF dann doch in ein Remis locken lässt.

Benno
Up Topic Hauptforen / CSS-Forum / Nachdenkliches ...
1 2 Previous Next  

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill