rybka4 abgeschlachtet

By Frank Quisinsky Date 2010-10-06 17:07

Hallo Willi,

in einer Diskussion kannst Du alles niederlegen und Dein Gegenüber kann immer alles glaubhaft aus einer anderen Perspektive schildern. Die Politik geht da ständig mit gutem Beispiel voran.

Auch Statstiken stehen und werden immer in der Kritik stehen, wie auch der grüne Rasen ... denn grün ist nicht grün und gesund aussehen heißt nicht gesund sein.

Aber irgendwann werden auch die Statistiken genauer und wir haben nunmal nicht viele Möglichkeiten als bei Messungen immer wieder Statistiken hinzuzuholen.
Wäre der 100m Läufer wirklich erster geworden wenn er nicht andere Schuhe angehabt hätte, seine schwere Kette getragen hätte, morgens etwas anderes gegessen hätte, sein Freundin ihm an Tag vorher nicht eine Szene gemacht hätte, er von einem Reporter nicht unnötig depremiert worden wäre etc..

So, nun können wir beginnen die ganze Klamotte mit Statistiken aufzurollen.
Was kommt dabei raus, der Mensch hat sich beschäftigt und trifft eine Aussage was andere Menschen gerne hören um sich von irgend etwas abzulenken oder weil das Thema selbst interessiert oder weil die Freundin eine Szene gemacht hat ... umso mehr dann der Grund ins Internet zu rasen um sich abzulenken ... tja, die Wege des Herrn sind schier ...

Schaue Dir mal den letzten Beitrag auf meiner Aktuell Seite an, glaube Eintrag 58. Die ErrorBar der Berechnugsprogramme ist mal wieder das Thema. Diese von mir ungeliebte ErrorBar an denen so viele die sich mit dem Thema beschäftigen glauben. Wenn einer von denen das liest kommen die wildesten Theorien was falsch gelaufen ist weil ... der eigene Glaube das nicht zuläßt.

Ich hoffe ich komme nicht zu sehr vom Thema ab.

Mit Deinem Berechnungsbeispiel am Ende Deines Beitrages ... damit kann ich weniger anfangen.

Fest steht, das auch Statistiken das Übel mit sich bringen, dass bei mehr Vergleichswerten die Aussagen genauer werden.
Wie genau die Aussagen dann sind, tja das hängt von zu vielen anderen Faktoren ab und ganz sicher kann Dir das auch niemand wirklich gut beantworten.

Gruß
Frank

By Willi Prinz Date 2010-10-06 17:46

Doch kann man schon Frank,solange sie im Zufallsbereich liegen sind sie wertlos.
Es ist unumschritten das Rybka und die angeblichen Clones etwa gleich stark sind,paar Elos mehr oder weniger,alles Zufall.
Bei den anderen ist der Unterschied schon so gross,das von Zufall keine Rede mehr sein kann.
Der angebliche Superfritz ist auf jeden fall schwächer als Rybka und die angeblichen Clones.
Im allgemeinen finde ich Computerschach sowieso langweilig.
Ich mag villeicht den Carlson als Schachspieler,oder den Anand,oder auch den Kasparov,aber mit den Programmen kann ich mich nicht identifizieren.
Wenn es also eine Wm gibt,Rybka gegen Shredder,warum soll ich das gucken ?
Es fehlt das Carisma,das ich villeicht habe für einen der Supergms.
Das sind Menschen mit einem sehr grossen Talent für Schach,etwa wie der Messi von Barcelona im Fussball.
Ich verstehe eigentlich auch nicht,wie man sich dafür interessieren kann,ob nun Shredder oder Rybka das wahre im Computerschach sind.
Das sind doch keine Menschen,die können mich doch nicht begeistern wie Placido Domingo,oder Pavarotti.
Um mich zu begeistern,braucht es Gefühle,Carisma,etwas das mich aus meinem täglichen Leben etwas entfernt.
Ich habe aber trotzdem nichts gegen Computerschach,jeder kann ja sein Glück finden wo er will.
Jeder kann ja auch sein Hobby aussuchen.
Aber um auf Umfragen zurückzukommen,diese Tabellen die Ihr hier veröffentlicht sollten mit einer Fehlerqoute belastet sein,genau so wie es bei statistischen Umfragen normal ist.
Also könnte man schreiben diese Tabelle ist mit einem Fehler von maximal +-1 Prozent belastet.
Je geringer die Anzahl der Spiele um so grösser die Fehlerquote.
In diesem Sinne Gruss aus Rio.
Willi

By Frank Quisinsky Date 2010-10-06 18:08 Edited 2010-10-06 18:16

Hallo Willi,

viele wertvolle Ansichten, die Du beschreibst.

Computerschach ist ein Hobby wie jedes andere auch.
Kann mich auch nicht mit jeder Engine anfreuden und habe meine absoluten Favoriten, meist Engines die das Schach mögen was ich natürlich selbst sehr gerne sehe. Und das ist Angriffsschach ... und dennoch sind es nur Engines, allerdings von Menschenhand programmiert ... zumindest die meisten

Allerdings wechselt das oft bei mir. Mal schaue ich mir gerne Schachcomputer Partien an, spiele selbst oder schaue bei Eng-Eng zu. Hatte drei Jahre im Grunde fast nichts schachmäßig gemacht und wenn dann mit ChessBase GM Partien nachgespielt und einen AnMon als Analyseengine mitlaufen lassen, oder einen Phalanx. Wenn die Stellungen heftiger wurden, auch mal zu einer klar stärkeren Engine gewechselt.

Es gibt viele Möglichkeiten sich mit dem Hobby zu beschäftigen. Viele Fussballfans schauen sich oftmals gar nicht mehr die Spiele an, sondern werfen ein Blick in die Zeitschriften und studieren die Tabelle. Mit den Schachprogrammen ist das gut vergleichbar.

Ratinglisten für sich allein sind trotz aller Möglichkeiten die dahinter stecken auch oftmals langweilig wenn nicht etwas spannendes hinzukommt. Die Tabelle ... mitfiebern! So spiele ich Turniere lieber als ein Spießroutenlauf durchzuführen oder nur Eng-Eng Matches für eine Ratingliste zu spielen. So viel Spannung wie möglich aufbauen um sich selbst alles interessanter zu gestalten, heit wie mit allen anderen Hobbys auch.

Weiß noch bei den letzten Ausgrabungen an denen ich teilnahm. Wir wussten da ist etwas, sah jeder das der Boden in seiner natürlichen Konsistenz unterbrochen war. Wir wussten schnell, OK kann nur ein Brunnen sein je mehr mir gruben. Wir wussten auch wann dieser Brunnen angelegt wurde. Aber wir wussten nicht, was in dem Brunnen war. Die Römer waren sehr sauber oder Wiederverwertung war angesagt. Sie hinterließen kaum etwas bei Ihren Lagern aber irgendwo müssen die Reste ja hin. Also die Brunnen ... eine Vermutung, Wahrscheinlichkeit aufgrund anderer Grabungen. Aufgrund von Statistiken wurde begonnen einen riesigen Aufwand zu treiben um Spuren aus unserer Geschichte zurückzuholen.

Spannung liegt in der Luft und so ist das mit Dingen die uns interessieren.
Das variiert geht auseinander aber wichtig ist das es Spaß macht.

Es ist schade das Computerschach in den Anfangszeiten derart gepowert wurde und heute eher stiefmütterlich behandelt wird. Der kommerzielle Nutzen wird kleiner und leider, leider wird auch nicht so begeistert wie noch vor Jahren darüber diskutiert, berichtet etc..

Im Wandel der Multimedia Zeit ...
Die nächste Generation!

Grüße von Trier nach Rio

Frank

By Willi Prinz Date 2010-10-06 18:14

Ja du hast Recht Frank
alles ist irgenwie unwirklich,und nicht zu verstehen.
Jedem sein Hobby und seine statistischen Unwirklichkeiten.
Hier ist etwas wirkliches,villeicht gefällt es Dir,Emotion pur,jedenfalls für mich.
Gruss Willi

http://www.youtube.com/watch?v=eyoCvaUZE68

By Frank Quisinsky Date 2010-10-06 18:26

Hi,

will ja gar nicht Recht haben

Wir hatten mal 10.000 Interessierte, heute haben wir 10.000 Experten.
Das ist ein Unterschied.

Höre diese Musik auch gerne, aber selten.
Derzeit gerade mal wieder Loreena McKennitt!

Spiele gerade gegen den Star Diamond und bei Loreena konnte ich rein statistisch gesehen

die besten Ergebnisse erzielen.
Bei der Domingo Musik würde ich ja sofort aus reinem Wohlwollen meine Dame spendierend zur Verfügung stellen.

Gruß
Frank

By Willi Prinz Date 2010-10-06 18:48

Ja so ist es,Menschen kann man nicht leugnen,es ist unwirklich Rybka zum besten zu erklären,es ist sinnlos!
Ob der nun Rybka heisst oder Fritz oder was weiss ich,das ist nur ein Programm was villeicht besser ist als ein Weltmeister,ich glaube das nicht!
Grund Weltmeister haben Nerven,und bei hundertausenden von Zuschauern kommen die zur Geltung.
Fritz hat keine,rechnet nur bis er entweder gewonnen oder verloren hat,sonst nichts.
Diese Programme können auch 1 Jahr ohne Unterbrechung gegeneinander spielen,solange der Computer keinen Crash hat,oder der Strom ausfällt.
Das kann kein Gm.
Deshalb ich bin mit den Super Gms.
Gruss Willi
Trotzdem viel Spass beim testen.
Ich finde Ihr nehmt das zu ernst,was soll es bringen wenn irgenein Programm besser ist als der Weltmeister,villeicht eine eigene Kategorie,das ist ok,aber dann müsst ihr auch einheitliche Regeln aufstellen mit Fehlerquoten um das rüberzubringen.
Du tetstet mit was weiss ich für Zeitvorgaben,ich kann mir jede andere Ausdenken um das Gegenteil zu beweisen.
Solange es keine Regeln gibt im Computerschach ist es sinnlos.

By Frank Quisinsky Date 2010-10-06 19:02

Hallo Willi,

kurz, muss gleich auch mal wieder was schaffen ...

Das spielstärkste Programm muss nicht das Beste sein.
Rein aus der eigenen Sicht der Dinge.

Wenn durch eine andere Zeitvorgabe eine andere Liste zu Stande kommt, PRIMA!
Sind wir um ein paar Erkenntnisse reicher geworden.

Einheitliche Regeln beim Computerschach!
Wäre ja mal was aber nicht daran zu denken. Muss auch nicht sein!

Ernst nehmen!
Ich denke viele nehmen die ermittelten Ergebnisse ernster als ich selbst

Persönlich teile ich mir Schachprogramme in Spielklassen auf.
Allerdings nicht in den normalen 50 ELO Schritten sondern in 25 ELO Schritten.

Also Aussage:
Komodo hat die gleiche Spielstärke wie Shredder.
Spark, Hiarcs und GullCess liegen dahinter.

So in etwa!
Diese Spielklassen Aufteilung dann auch nur von den Programmen die mich persönlich überzeugt haben und mit denen ich dann etwas mehr mache. Das Problem dabei, unmöglich sich jede Engine im Detail anzusehen ... auch wenn ich denke ... ups ich verpasse vielleicht etwas.

So schieße ich mich ein auf Engines und weiß ... OK, da ist noch Engine x ... könnte auch interessant sein aber leider keine Zeit mehr.

Bei den GMs spiele ich gerne Miles Partien nach und analysiere diese. Oder Ivantchuk, Shirov Partien.

Ivantchuk ist unberechenbar ... und wieder und immer wieder ... der Überraschungseffekt der ein Thema noch interessanter macht. Wie die Angriffe von Spark oder Stockfish, Hannibal oder Thinker, Junior oder Hiarcs, Shredder ... bist Dir nie sicher ... kommt da gleich ein genialer Zug, wie macht der Programmierer das nur wenn ein Rybka im dunkeln umhertappelt.

Gruß
Frank

By Frank Quisinsky Date 2010-10-06 19:15

vergessen ...

Übrigens, der genialste Spieler aller Zeiten ist für mich mit ganz großen Abstand zu allen anderen Ivantschuk.
Zugegeben, habe auch nicht viele Partien von Carlson und Co nachgespielt um das zu beurteilen.
Aber für mich persönlich ist es Ivantschuk und das absolut ohne jeglichen Wiederstand nach dem was ich bislang nachgespielt habe.

Und menschlich ist er auch wie auch seine vielen Patzer Partien zeigen

By Benno Hartwig Date 2010-10-06 19:06

[quote="Willi Prinz"]...was soll es bringen wenn irgenein Programm besser ist als der Weltmeister,villeicht eine eigene Kategorie,das ist ok,aber dann müsst ihr auch einheitliche Regeln aufstellen mit Fehlerquoten um das rüberzubringen.[/quote]Mir macht es Spaß zu verfolgen, wie die Engines stärker werden und dabei zu verstehen, zu erahnen, zu spekulieren oder nur zu bestaunen wodurch.
Es war ein Durchbruch, als die ersten Rechner wenigstens Kreis- und Bezirksklassenniveau erreichten, als sie begannen, auch für GMs wenigstens interessant zu werden, dann ihre Stärke zu erreichen.
Und wenn(?) sie es nun schaffen, stärker als die besten GMs zu sein, dann interessiert mich das auch.
Zugegeben: danach wird es schwierig, weitere Maßstäbe zu finden.
"Die erste Engine, die das "GM-Turnierstärke" erreicht, wenn sie nur 5 Sekunden denkt" vielleicht.
"Durchgerechnete Gewinnwege am Ende von heute als ausgeglichen anerkanten Standarderöffnungen" fänd ich aich super.

Aber ernsthafte Partien zwischen GMs und Engines werden noch seltener werden, befürchte ich.

Mich interessiert der Vergleich der Spielstärke mit Menschen.
Mich interesiert, wenn die Engines die Menschen hinter sich lassen, und wie weit(!)

Benno

By Willi Prinz Date 2010-10-06 19:07

Das Leben bezieht sich auf Einsteins Formel,E= m*c2.Das ist aber nicht richtig,Einstein ist auch nur ein Mensch.
Die Emotionen und Gefühle sind dabei ausgeschlossen.
Das geht nur in der Mathematik und in der Statistik.
Wir sind aber nicht mathematisch,wir sind viel mehr vom Gefühl beeinflusst als von Mathe.
Das sieht man hier deutlich,Anna Netrebco,dein ist mein ganzes Herz.
Was ist jedes Computerprogramm gegen diese Stimme und aussagekraft ?

http://www.youtube.com/watch?v=Irb5gGk0Wog&feature=related

By Ludwig Bürgin Date 2010-10-06 21:37

Hallo Willi

Habe mir die Sängerin angeschaut. Kann Deine Begeisterung schon einigermaßen verstehen,wenn man hört ,wie die Dame stimmlich in der Lage ist, solche Höhen zu erreichen.
Im Gegensatz bin ich genau so begeistert,wenn eine Engine auf meinem PC enorme Tiefen erreicht.

Gruß Ludwig

By Frank Quisinsky Date 2010-10-06 02:12 Edited 2010-10-06 02:21

Hallo Peter,

das kann ich direkt unterschreiben.

Es macht auch mehr Spass wenn etwas Zeit vorhanden ist die Partien zu beobachten.
In der SWCR läuft eine Partie bei einem Zügedurchschnitt von 85 ca. 40 Minuten. Darunter würde ich keinesfalls mehr gehen. 40 Züge in 15 Minuten vielleicht noch und wenn es darüber geht wird selbst das Zusehen vieler Partien nicht mehr wirklich interessant, dauert einfach zu lange ... auf Dauer gesehen.

Vor ein paar Stunden schaute ich bei folgender spannenden Partie zu.
Diesmal ein Patzer von Shredder 12 x64 und ... sehr selten ... Critter 0.80 x64 schlug schnell und eindrucksvoll zu! Habe die Partie noch nicht analysiert aber ich vermute im Zug 12 / 13 hat sich die Partie schon entschieden!

Ganz wenige Partien in der Datenbank, bei denen Shredder so schnell verlor. Aber bekanntlich hat Shredder ein paar taktische Lücken. Schaut alles so einfach und logisch aus, meine so einfach kann eine TOP Engine geschlagen werden. Critter gar mit korrekter Matt in 9 Ankündigung, was aber auch klar war.

Das ist abgeschlachtet ... um auf den Thread-Titel zurückzukommen.
Der gute Shredder, eigentlich wenn so kurz ist es eher Shredder der Schlächter.

Event:

Ort:

Datum:

Weiss:

Schwarz:

Ergebnis

Board

Gruß
Frank

By Ludwig Bürgin Date 2010-10-06 10:53

Hallo Frank

Die Partie mit Stockfish 1.9 und Rybka 4 angesehen.
Während Stockfish schon mit dem 5. Zug von Schwarz nicht einverstanden war,
meldet Rybka erst bei dem 10. Schwarzzug bedenken an.
Leider waren die Buchzüge bei mir nicht zu sehen.

Gruß Ludwig

By Günther Höhne Date 2010-10-06 11:08

Hallo Ludwig,

in meinem Buch ist schon 4. Sf6 rot markiert, da es statistisch gesehen zu schlecht wegkommt. (70% Siege für Weiß) Und nach 5. Lb4 wird es dann auch nicht besser...

Gruß
Günther

By Frank Quisinsky Date 2010-10-06 11:21

Hallo Günther, Ludwig,

allerdings wird Zug 5. nicht das Problem sein. Wird in der aktuellen Theorie seltener ausgewählt (dennoch weit über 300 Forsetzungen in der Mega). Dieser Zug verliert nicht sofort die Partie. Aber wie durckvoll Critter hier spielt war ein wenig überraschend für mich denn die Engine glänzt nicht durch solch schnelle Gewinne.

Nun wird ja bis Zug 8 schwarz aus dem Buch gespielt. Auch diese Variante wurde wie alle anderen von Stockfish 1.7.1 JA x64 4Cores über 1 Minute untersucht. Absolut ausgeglichen sagt Stockfish nach Zug 8 von schwarz. Daher ging die Variante auch in das Random Buch ein. Wenn ich das jetzt richtig in der Erinnung habe spielte Critter 0.80 direkt aus dem Permanent Brain h4 und die Stellungsbewertung ging nach oben, im darauffolgenden Zug schon bei über 3, sofern ich das noch in Erinnerung habe. Vor h4 rechnete Shredder über 40 Sekunden.

Also, der Angriff hat sich etwas zufällig entwickelt und aus irgend einem Grund hat Shredder mit h4 gar nicht gerechnet. Danach spielte Critter dann konsequent.
So meine Eindrücke, die ich beim Zusehen hatte ohne jetzt tiefer zu analysieren.

Viele Grüße
Frank

By Günther Höhne Date 2010-10-06 12:03

Hallo Frank,

da gebe ich dir Recht, dass muss man erst mal so spielen wie Critter. Als Testvariante ist das ok. In einem Turnier wo es um was geht, würde ich diese Eröffnung für Schwarz nicht wählen. (wenig aussichtsreich)

Gruß
Günther

By Frank Quisinsky Date 2010-10-06 12:05

Hallo Günther,

sehe ich auch so!

Haben sich auch ein paar Altmeister an der Variante versucht.
Scheint sich um eine ältere Eröffnung zu halten, nur die Liste der Spieler in ChessBase 10 überflogen.

Gruß
Frank

By Peter Martan Date 2010-10-06 12:10 Edited 2010-10-06 12:13

[quote="Frank Quisinsky"]
Nun wird ja bis Zug 8 schwarz aus dem Buch gespielt. Auch diese Variante wurde wie alle anderen von Stockfish 1.7.1 JA x64 4Cores über 1 Minute untersucht. Absolut ausgeglichen sagt Stockfish nach Zug 8 von schwarz. Daher ging die Variante auch in das Random Buch ein.
[/quote]

Sei mir nicht böse, Frank, aber hier hält es mich wieder einmal nicht mehr am Sitz.
Der Lars Bremer- Artikel über Stellungstests, den mir Ingo wieder ins Gedächtnis gerufen hatte, passt genau auf das, was ihr tut. Während Ingo seine Startstellungen, wie er sie gerne nennt, damit sie nur ja nix mit Testen zu tun haben, danach aussucht, ob eh nicht einzelne engines unerwünscht gut oder schlecht mit ihnen umgehen, schmeißt du alles raus, wozu einem eine Minute darüber brütenden Stockfish nix einfällt außer 0.xx.
Ingo geht wenigstens mit einem gewissen Statistik- Aufwand daran, das, was als Ergebnis hinten herauskommt, als Kriterium für das, was er an Kautelen vorne korrigiert, wenn's nicht passt, heranzuziehen, natürlich schon auch genau die eine und einzige Methode, aus einer Statistik eine self fulfilling prohecy zu machen.
Bei dir wird hingegen der ganze Blunder, wie du das nennst, den die Schachmeister so spielen, aus deren Partien du die Rohdatenbank rekrutierst, einfach von Stockfish in einer Minute aussortiert und was übrig bleibt, ist das Testbuch schlechthin für dich.
Sei mir nicht böse, wie gesagt, aber dein Umgang mit der Eröffnungstheorie und dein Vertrauen in das, was die engines damit anfangen können, dürfen, müssen, sollen, wollen, damit es am Ende nach Gerechtigkeit und Zufall ausschaut, ist schon irgendwie rührend.

By Frank Quisinsky Date 2010-10-06 12:23 Edited 2010-10-06 12:31

Hallo Peter,

ich bin absolut zufrieden mit dem erstellten Random Buch nach über 10.000 gespielten Partien mit dem Buch.

Um Deinen Beitrag ein wenig zu vervollständigen:

Doku zum Buch:
http://wwww.amateurschach.de/master-pgn/dokumentation.htm

Du kannst in der SWCR unter History entnehmen wann ein Buch-Update durchgeführt wurde.
Du kannst in der SWCR Datenbank das Datum jeder Partie leicht erkennen.

Filtere alle Partien heraus und gehe dann mal auf die Suche nach Buchzügen die nicht geeignet für eine Ratingliste ist.

Stockfish 1.7.1 JA 4 Cores 1 Minute pro Stellung untersuchte alle Stellungen auf Blunder. Eine längere Analyse ist nicht notwendig, weil die Engines in der SWCR mit 40 in 10 spielen, würde ich mit 40 in 20 spielen, hätte ich die Stockfish Analyse vielleicht 2 Minuten pro Stellung laufen lassen. Die Vorgehensweise zur Erstellung war bewusst wie in der Doku beschrieben gewählt. Mit der Doku und dem Tool von Volker Annuss zu der Datenbank möchte ich natürlich auch andere Anwender ein wenig animieren aktiv zu werden und auch eine Arbeit anzubieten. Vielleicht reizt Dich ja dieses Thema und wir können sehr bald eine Arbeit von Dir bewundern?

Die Blunder wurden herausgefiltert, auch die leicht zweischneidigen Züge und stehen in einer gesonderten Datenbank zur Verfügung (siehe Doku und Download der kompletten Arbeitsschritte zu diesem Buch).

Ich gebe Dir Recht, das ich mir noch viel mehr Mühe hätte machen können aber leider habe ich keine Jahre dafür Zeit und ferner ...
Habe noch nie mit einem so guten Buch für den Zweck einer Ratingliste spielen lassen.

Dieses Random Buch ist weniger geeignet für eine Engine als Hauptbuch oder mit einem klassischen Eröffnungsbuch vergleichbar aber ich bin absolut überzeugt, dass dieses Buch für eine Ratingliste schlicht und ergreifend "perfekt" ist.

Wenn Du nun auf die sorgfältige Suche nach Fehlern gehst, vergleiche das mit sämtlichen anderen Büchern die verfügbar sind ... hinsichtlich enthaltene zweischneidige Züge.

Vielleicht kannst Du mich ja vom Gegenteil überzeugen.
Meine SWCR Statistik zu diesem Random Buch ist überwältigend !!

Übrigens,
Nicht weil ich von dem Random Buch nicht überzeugt bin aber auch das neue Buch von Sedat (Perfect 2010) ist absolut Klasse und sehr gut für eine Ratingliste geeignet. Was ich gesehen habe überzeugt mich. Werde das Buch auch mal bei einem kommenden größeren SWCR Turnier einsetzen.

Viele Grüße
Frank

PS:
Bin immer sehr selbstkritisch zu eigenen Arbeiten aber dieses Random Buch ist absolut TOP, offenbar hatte ich mal ein paar Geistesblitze ... was auch hin- und wieder mal vorkommt.

Ach ja ... noch wichtig:
Wenn Du eine Kritik zu dem Buch formulieren möchtest, ich würde das sehr gerne in die Doku aufnehmen.
Du kannst mich dahingend dann gerne anmailen, eMail Adresse von mir findest Du unter Impressum auf meiner Webseite.

By Peter Martan Date 2010-10-06 12:38

[quote="Frank Quisinsky"]
Vielleicht kannst Du mich ja vom Gegenteil überzeugen.
Meine SWCR Statistik zu diesem Random Buch ist überwältigend !!
[/quote]

Hallo Frank!
Wenn ich dich von etwas überzeugen wollte, dann eben genau davon, dass deine Statistik zu deinem Buch so überwältigend ist, gerade weil deine Methode so unheimlich gut geeignet ist, genau die Statistik zu erbringen, die dir gefällt.

Mag ja aber sein, du weißt es ohnehin und tust es im vollem Bewusstsein dessen, dass du den engines mit deinem Buch soweit entgegenkommst, wie du kannst.
Nur für den Fall, dass es dir doch noch nicht so ganz ganz klar war: du lässt nicht den Zufall entscheiden, welche Eröffnungen den engines passen, sondern die engines selbst, in deinem Fall die Lieblingsengines, die dir die Ausgeglichenheit der Stellungen im Minuten- Stellungstest beweisen, in Ingos Fall das Kollektiv, das er dann damit testet.
Das als die optimale Voraussetzung dafür zu sehen, dass das Ergebnis so ist, wie man erwartet, ist verständlich, mit Zufall und Mehraussagekraft über die Engine- Entwicklungen als bewusste, absichtliche Auswahl von Stellungen für Stellungstests oder matches nach schachlichen Kriterien, hat das aber nix zu tun.
Was ihr mit euren engine- konformen Büchern und Startstellungen beweist, ist nur, dass die den engines, die damit am besten abschneiden, am besten liegen.
Aus.
P.S. Frag mich jetzt bitte nicht, wie ich das anders machen würde oder mache, ich hab das schon so oft so lang und breit erläutert, dass es mir schon fast weh tut, wieder damit angefangen zu haben, Gott helfe mir, ich konnte nicht anders.

By Frank Quisinsky Date 2010-10-06 12:50 Edited 2010-10-06 12:52

Hallo Peter,

ob mir eine Statistik gefällt oder nicht spielt für den Einsatzzweck keine Rolle.
Mich überzeugen hier eher die bereits ca. 10.000 gespielten Partien.

Lasse heit gerne Fakten sprechen, sofern das beim Computerschach überhaupt möglich ist.

Lieblingsengines?
Weil ich mit Stockfish getestet habe?

Auch das hatte einen Sinn.
Die komplette Doku ist frei verfügbar, die ganzen Arbeitsschritte auch.
In Anlehnung an die hervorragende Arbeit vom Stockfish Team ... die komplette Arbeit ist frei verfügbar.
Mithin, hätte sich keine andere Engine besser geeignet als Stockfish.
Steht aber auch in der Doku.

Absichtliche Auswahl von Stellungen?
Das Buch hat keinerlei Ausspielpräferenzen, daher ist es wichtig das alle Varianten überprüft wurden das es möglichst fehlerfrei ist. Als Auswahl dienten die Partien der besten Spieler der Welt.

Wichtig ist mir:
Die Engines möglichst ausgeglichen aus dem Buch kommen ...
Schnelle Remispartien durch 3-fache Stellungswiederholung vermieden werden.
In der SWCR werden Partien die unter 16 Zügen mit Remis endeten wiederholt.

Es gab seit ich dieses Buch benutze davon 18 Partien. Eine solche Statistik hatte ich noch nie!
Auch bei dieser Statistik ist das Buch Klasse, ich erspare mir Arbeit mit Partiewiederholungen ... schließlich möchte ich die Spielstärke messen und nicht eine Datenbank.

Du spendierst den Büchern vermutlich eine zu hohe Bewertung.
Schaue Dir mal den CEGT zu SWCR Vergleich an. Beide Listen spielen mit absolut unterschiedlichen Ideen bei der Eröffnungswahl.
Die durchschnittliche ELO-Differenz beider Listen liegt bei den vergleichbaren 53 Engines bei 0.5 ELO.

Und bevor wir jetzt aneinander vorbei reden ...
Ich spreche von Büchern für Ratinglisten, nicht von speziellen Büchern für Engines!
Für mich ein sehr großer Unterschied !!

Das Engines auch mal schneller verlieren weil eine zweifelhafte Buchvariante dabei ist geht aufgrund der Masse der Partien unter.
Dennoch, mir ist es wichtig eine möglichst saubere Datenbank mit Partien anzubieten und bei dem verwendeten Random-Buch sehe ich absolut grün!

Milos hatte übrigens vorgeschlagen, diese Datenbank noch mit anderen Engines zu untersuchen.
Auch darüber habe ich in der Doku berichtet.

Ist ja eine Doku und sofern sollte das alles rein!

Viele Grüße
Frank

By Peter Martan Date 2010-10-06 13:26 Edited 2010-10-06 13:30

[quote="Frank Quisinsky"]
Absichtliche Auswahl von Stellungen?
[/quote]

Ja, Frank, tut mir leid, ist aber so, du kannst es drehen und wenden wie du willst, selbst wenn deine Absich ist, keine Absicht zu haben, doppelblind geht hier nicht, das wäre nur doppelblöd, wenn du wirklich versuchen wolltest, eine Statistik so zu erstellen, dass du selbst nicht weißt, wovon du ausgehst, dass es die engines nicht wissen, ist eh klar, wenn du sie das aber entscheiden lässt, bist es erst wieder du der dafür verantwortlich ist und nicht der Zufall.

[quote="Frank Quisinsky"]
Als Auswahl dienten die Partien der besten Spieler der Welt.
[/quote]

Und von denen streichst du mit Stockfish gemeinsam das weg, was dir und Stockfish nicht gefällt.

[quote="Frank Quisinsky"]
Du spendierst den Büchern vermutlich eine zu hohe Bewertung.
[/quote]

Du schilderst mir zu Recht voller Stolz, was du alles an Arbeit da hinein gesteckt hast und ich messe dem zuviel Bedeutung bei?

Noch ein letztes Mal, Frank, weil dir persönlich hab ich das ja vielleicht wirklich noch nicht so ausführlich erklärt:
Ich messe dem Buch in einer Partie tatsächlich sehr viel Bedeutung bei, drum ist für mich die Methode, die Bücher oder Startstellungen möglicht ausgeglichen für engines als Ausgangspunkt für ihr rating zu machen, nur eine, ich kenne sie, ich akzeptiere sie, ich bin mir im Klaren, dass man das, was die meisten an den generellen Ranglisten am meisten interessiert, so am sichersten testen kann.
Aber ein für alle Mal: du wirst damit in erster Linie den Stärken derjenigen engines am besten gerecht, die damit am besten spielen.
Mittelspielstärken kommen schon weniger zum Tragen als Eröffnungsstärke, Endspiel noch weniger, warum ist allen klar, ich muss es nicht noch einmal eklären.
Ebenso ist es nicht so, dass die Schachspieler diejenigen Eröffnungsvarianten am meisten interessieren, in denen die engines ausgeglichen gegeneinander spielen. Daher wäre mir Entwicklungskontrolle von Schachsoftware nicht nur in Hinblick auf den Umgang mit Eröffnungsstellungen, die den engines liegen, relevant, sondern auch in Hinblick auf den Umgang mit scharfen Eröffnungsstellungen, unausgeglichenen, Gambits, in der Meisterpraxis gerade umstrittenen.....
Dazu muss man sich trauen, auch das von den engines zu verlangen und nicht immer nur die ersten 5,8,9 Züge und von denen nur ja keine irgendwie komplizierten, wo vielleicht Stockfish auch eine Seite schon leicht im Vorteil sieht und das Kollektiv, das ich untersuche, vielleicht eine unausgeglichenere Statistik hat, als ich mir das wünsche, um nicht in den Verdacht zu geraten, ich hätte manipuliert.
Und noch einmal unnötig wiederholt: danke für deine Arbeit, Frank, die du dir machst, Ranglisten so zu machen, wie sie gemacht werden sollen, damit sie eine möglichst große Aussagekraft über 0815 Fragen an die Spielstärke haben.
Das gehört so gemacht oder nicht viel anders und ausdrücklich: ich ziehe deine Integrität, absolut nicht manipulieren zu wollen und es weitgehend auszuschließen, es in eine bestimmte Richtung zu tun, nicht in Frage.
Ich sage nur noch einmal: es ist nicht die einzige Frage, die man an Spielstärken und -Schwächen von engines haben kann, die man so beantwortet.
Man kann nicht vermeiden, durch die Auswahl der Startstellungen Einfluss auf das Ergebnis zu nehmen, man soll sich nur darüber klar sein, welche man in welcher Absicht nimmt und das nicht prinzipiell zu einer heiligen Kuh machen, man habe ja ganz eindeutig nur das Kollektiv über die Auswahl entscheiden lassen und daher habe nur das Probandenkollektiv das Ergebnis besimmt, weil das ist nur eine Ausrede, um sich nur möglichst von Stellungstests zu unterscheiden.
Man kann mit denen vielleicht noch leichter Ergebnisse absichtlich herbeiführen, das ist aber auch genau ihr Vorteil gegenüber eng-eng-eng-matches-matches-matches, man muss eben wissen, was man mit welchen Stellungen testet, sondst wird's halt sicher ein Quatschtest oder Manipulation aber dass die Teststellungen, die man für die Ranglisten von mir aus Startstellungen nennen soll, wenn man sich dann wohler fühlt, auch ausgesucht werden müssen, das muss man einfach zugeben und sich darüber Rechenschaft geben, was man damit tut, sonst macht man möglicherweise genau so Quatschtests und weiß es nur nicht.
Aus aus aus, du weißt das alles und machst dir deine Gedanken über die Auswahl deiner Eröffnungsstellungen und eine Heidenarbeit, ich mach mir meine nur für mich und du deine für die community, trotzdem, wie gesagt, es musste wieder sein...

By Frank Quisinsky Date 2010-10-06 14:01 Edited 2010-10-06 14:05

Hallo Peter,

Du schreibst:
Ja, Frank, tut mir leid, ist aber so, du kannst es drehen und wenden wie du willst, selbst wenn deine Absich ist, keine Absicht zu haben, doppelblind geht hier nicht, das wäre nur doppelblöd, wenn du wirklich versuchen wolltest, eine Statistik so zu erstellen, dass du selbst nicht weißt, wovon du ausgehst, dass es die engines nicht wissen, ist eh klar, wenn du sie das aber entscheiden lässt, bist es erst wieder du der dafür verantwortlich ist und nicht der Zufall.

Ich kann mit diesen Äußerungen wirklich rein gar nichts anfangen und weiß absolut nicht was Du meinst.
Was lasse ich entscheiden, dass ca. 4.000 Vorgabestellungen per Zufall von Shredder ausgewählt werden?

Blicke hier bei Deiner Logik nicht durch!
Sorry!

Nach der Stockfish Analyse:
Ja klar, nehme ich die Stellungen raus ... und ganz sicher sind viele Stellungen verschwunden die andere Programme besser beurteilen würden. Aber wie sollte ich vorgehen, Engine 2, Engine 3, Engine 4 und so weiter auch noch drüber laufen lassen. Das würde sehr viel Zeit in Anspruch nehmen und ich denke nicht das sonderlich mehr Positionen verschwunden wären. Hätte ich das gemacht, könntest Du schreiben ... aber Du hast erst mit Stockfish begonnen und die Stellungen gelöscht bevor Du einen Critter auf die Stellungen gejagt hast. Du hättest erst einen Critter und dann einen Stockfish und dann einen x und y.

Peter, ich wollte ein Ergebnis erzielen und nicht alles in Frage stellen.
Du kannst jede, wirklich jede Aktion auseindernehmen aber wirst dann niemals zu einem Ergebnis kommen.

Wie gesagt, die Statistiken zeigen das dieses Random Buch perfekt funktioniert. Es handelt sich mehr oder weniger nicht um ein Buch sondern um 4.000 Vorgabestellungen die per Zufallsgenerator ausgespielt werden. Bitte beachte das bei Deinen Überlegungen, sonst reden wir aneinander vorbei.

Ich gehe absolut Contra zu Deinen Buchausführungen und Beeinflussung in etwa ... gutes Buch für Stockfish.
Das ist wirklich Quatsch nach 8 Zügen die als Vorgabe dienen!
Suche mal in der Datenbank ob Stockfish im Vorteil war und schnell Partien gewonnen hat die aufgrund der Buchzüge zu Stande gekommen sind.
Viel Spass bei der Suche

Anonsten, Du hast die Doku nicht gelesen.

Ich musste viele kritischen Eröffnungen absolut herausholen.
Wie z. B. Gambits etc..

Das hat aber eher damit zu tun, weil Shredder sonst mittels Buchoptionen die Züge zu oft per Random ausgespielt hätte.

Beispiel:
01. e4 e5 02. f4

Würde 02. f4 drin sein, würde dieser Zug so oft ausgespielt wie alle anderen Züge nach 1. ... e5. Das ist das große Problem bei einem Random Buch weil sonst zu viele Partien dieser Eröffnung gespielt werden die bekanntlich nicht so gut für Eng-Eng geeignet sind. Ausgewogen soll Shredder per Zufall die aktuell spielbare moderne Eröffnungstheorie ausspielen. Wenn ich so lese was Du schreibst, hast Du das Prinzip von diesem Buch nicht verstanden.

Das Shredder Random Buch soll eine Funktion ersetzen die nur Arena hat (PGN-Random). Wahrscheinlich würden wir einheitliche Meinungen haben wenn Du selbst schon x eng-eng Partien und Ratinglisten erstellt hättest und die Probleme bei der Eröffnungswahl kennen würdest. Angefangen von doppelten Partien aufgrund gleicher Eröffnungen bei vielen Engines die z. B. mit dem eigenen Buch spielen, Ktulu als Beispiel. Wenn x hundert Partien gespielt werden, muss das Spektrum breit sein, Learning sollte aus sein etc..

Siehe auch den Bericht zu Beeinflussungsfaktoren beim Erstellen einer Ratingliste, Thema Bücher!

Die Auswahl von Startstellungen haben keinen großen Einfluss bei Ratinglisten.
Riesige Datenmengen beweisen es ... nochmals CEGT zu SWCR Vergleich.
Und dennoch möchte ich eine Datenbank die weitesgehend frei von schnellen Partien aufgrund Buchfehlern ist. Immerhin liegt die komplette Datenbank, die Konfigurationsdatei das erstellte Buch ... einfach alles nachvollziehbar auf meinen Webseiten ... ohne das ich aus irgend etwas ein Geheimnis mache.

Das ist ein altbekanntes Computerschach Märchen.
Nochmals ich rede nicht von speziell getunten Büchern für Engines sondern von Büchern die zum Zweck einer Ratingliste besser geeignet sind.

Es mag sein, dass z. B. ein Engine Buch so gut auf eine Engine zugeschnitten ist, dass dies vielleicht 30 ELO ausmacht. Aber bei einer Ratingliste wird die Spielstärke der Engine gemessen und nicht wie gut oder schlecht eine simple Datenbankabfrage (Eröffnungsbuch) ist.

Peter:
Ich habe zu diesem Komplex offenbar ganz andere Ansätze aber ich denke das wir aneinander vorbei reden.
Du kannst keine Äpfel mit Birnen vergleichen!

Gruß
Frank

By Peter Martan Date 2010-10-06 15:08

[quote="Frank Quisinsky"]
Was lasse ich entscheiden, dass ca. 4.000 Vorgabestellungen per Zufall von Shredder ausgewählt werden?
[/quote]

Indem du genau die 4000 auswählst, die Shredder dann zur Auswahl hat.

[quote="Frank Quisinsky"]
Die Auswahl von Startstellungen haben keinen großen Einfluss bei Ratinglisten.
[/quote]
Wozu dann die ganze Mühe?
[quote="Frank Quisinsky"]
Riesige Datenmengen beweisen es ... nochmals CEGT zu SWCR Vergleich.
[/quote]
Die Datenmengen beweisen, dass sich die Mühe gelohnt hat, also doch nicht just wörscht, sag ich ja.
[quote="Frank Quisinsky"]
Und dennoch möchte ich eine Datenbank die weitesgehend frei von schnellen Partien aufgrund Buchfehlern ist. Immerhin liegt die komplette Datenbank, die Konfigurationsdatei das erstellte Buch ... einfach alles nachvollziehbar auf meinen Webseiten ... ohne das ich aus irgend etwas ein Geheimnis mache.

Das ist ein altbekanntes Computerschach Märchen.
Nochmals ich rede nicht von speziell getunten Büchern für Engines sondern von Büchern die zum Zweck einer Ratingliste besser geeignet sind.
[/quote]

Wie kann ich dir nur glaubhaft machen, dass ich davon auch nicht rede.
[quote="Frank Quisinsky"]
Ich habe zu diesem Komplex offenbar ganz andere Ansätze aber ich denke das wir aneinander vorbei reden.
Du kannst keine Äpfel mit Birnen vergleichen!
[/quote]

Dass wir aneinander vorbei reden, kann sein, dennoch glaube ich nicht, dass ich an dir so sehr vorbeirede wie du an mir.
Du hörst bei allem, was ich schreibe (lesen kann man das nicht nennen

das war wieder ein Opfer, das ich einem bon mot bringen musst, verzeih) immer nur den Vorwurf, Manipulation, Manipulation.
Ich bin es nicht, der den macht, du bist es selbst, Außenprojektion, Frank.
Ich sage nicht, dein Buch bevorzugt eine bestimme engine, wolltest du das machen, wär's mit deinen Stellungen wirklich genau der falsche Weg, ich sage du bevorzugst alle engines, die damit gut zurecht kommen.
Klingt nach, na dann ist's ja eh wurscht, wenn's alle bevorzugt, stimmt aber nicht, es bevorzugt diejenigen, denen die Stellungen mehr liegen mehr und diejenigen, denen sie weniger liegen, weniger.
Und dass du damit für deine Absichten das geringere Übel von zweien wählst, ist mir auch klar. Du streust möglichst breit und suchst so aus, dass sich gröbere Vorteile einzelner engines möglichst sicher wieder ausgleichen. Trotzdem sind alle, die da dann in deiner Rangliste weiter oben sind, ziemlich wahrscheinlich in erster Linie in der Eröffnung in Vorteil gekommen, wie gut sie das dann wann erst gegen die anderen ausnützen können, kann man selbst wenn man sich jede einzelne Partie genau anschaut, oft schwer sagen, der Nachteil, der in der Eröffnung schon entsteht, kann von sehr ähnlich spielenden engines oft erst sehr viel später ausgenützt werden, die Stärke im Mittelspiel der engine, die in der Eröffnung leicht ins Hintertreffen geraten ist, kommt aber trotzdem nicht mehr zum Tragen und die Stärke im Endspiel erst recht nicht.
Ich sage nicht, du sollst einfach längere Eröffnungen auch aus dem Buch ausspielen lassen, wenn du eine overall- Rangliste der momentan mit den gängigen Eröffnungen nach wenigen Zügen am besten zurecht Kommenden erstellen willst.
Ich sage aber, die gängige Methode bringt Ranglisten hervor, bei denen man sich klar sein muss, dass sie nur die eine Frage beantworten, für die die Teststellungen geeignet sind, engines und engine- settings für spezielle Eröffnungs- Mittelspiel- und Endspielfragen wird man gegeneinander sinnvoll mit speziellen Eröffnungs- Mittelspiel- und Endspielstellungen vergleichen.
Kannst du mir endlich folgen und glauben, dass ich nicht deine Methode deine Rangliste zu erstellen, in Frage stelle?
Ich hinterfrage die Aussagkraft genau dieser statistisch und von den Teststellungen her optimal angefertigten Rangliste.
Sie ist für mich einfach nicht das einzige Kriterium zur Beurteilung von Entwicklungen, die ja ihrerseits auch wieder Einfluss auf die Tests haben sollen und müssen.
Ihr macht euch wahnsinnig viele Gedanken über das Maßsystem, ob es jetzt weiter Elo sein sollen oder was, ich sage, das macht viel weniger Unterschied als die Eröffnungsstellungen, du musst halt immer wieder eichen nach neuen hardware- und software- Standards, das wirst du aber mit einem anderen Maßsystem auch müssen.
Wenn jetzt aber die Entwicklung in die Richtung vom 8.Zug ausgeglichener Eröffnungsstellungen ohne Buch spielender engines zu stagnieren anfängt, vielleicht wäre es dann auch schon deshalb gut, Entwicklungen von engines, die damit nicht so gut klar kommen aber dafür besser mit scharfen langen Varianten, vielleicht auch einfach mit dem Mittelspiel besser als mit der Eröffnung, getrennt zu betrachten?
Ich sag ja auch nicht, dass die engines in deiner Liste nicht wirklich die besten sind im Kampf um den 9. Zug und dessen Folgen, dass sie in Thementurnieren späterer Varianten nicht trotzdem schlechter abschneiden, kannst du nur dadurch herausfinden, dass du sowas auch veranstaltest. Ich will jetzt auch gar nicht wieder mit den pfui pfui Stellungstests kommen, wenn du meinst, eine Stellung ausspielen lassen zu müssen zwischen den Teilnehmern, kannst du dir immer noch sehr viel Gedanken machen, wie ist das dann mit der Reproduzierbarkeit auf bestimmter hardware unter bestimmten Zeitbedingungen, mit Mehrkern, pondern und und und.
Ich stelle das ebenso wenig wie Stellungstests euren geliebten Ranglisten als Konkurrenz gegenüber, ich sage nur, mit einer bestimmten Versuchsanordnung erhält man nur bestimmte Antworten.
Ich will nicht das eine und einzige Maß der Dinge sein noch erfinden, ich will mir nur auch nicht ständig eines unter diesem Titel auf's Aug drücken lassen unter dem Vorwurf, sonst Äpfel mit Birnen zu vergleichen, was man in der Kategorie Obst übrigens sehr wohl kann, darf und vielleicht sogar hin und wieder auch sollte.
Was mich am meisten an der ganzen Klugschwätzerei quält ist wirklich wahr die Frage, kann man das wirklich absolut nicht verstehen oder darf man nur nicht, weil man sonst fürchten muss, man hätte irgendwo was übersehen und am Ende zugegeben, der Andere habe vielleicht auch einfach recht, nicht nur er, aber einfach auch.
Natürlich geht's genau so wie beim Schachspielen, bei dem es um Gewinnen oder Verlieren geht, auch immer irgendwie um's Rechthaben bei solchen sinnlosen Diskussionen, beim Schachspielen sollte es nicht nur ums Gewinnen gehen und beim Diskutieren nicht nur ums Rechthaben, findest du nicht auch?
Ich hör dich jetzt schon wieder schreiben, jaja, soll natürlich jeder seinen eigenen Spaß haben, aber...
Schreiben kannst du das jetzt nicht mehr, Frank, ätsch, darum geht's nämlich mir zumindest hierbei auch nicht, ihn jemandem zu verderben oder ihm beizubringen, wie er ihn zu haben habe, den Spaß nämlich.
Ich hätte nur gern, dass man bei aller Pedanterie, die man in der eigenen Arbeit an den Tag legen soll und darf, die Ergebnisse anderer, die sich auch Arbeit machen und was denken bei dem was sie tun, hin und wieder ein klein bisschen über den eigenen Tellerrand hinaus schaut und deren Ergebnisse gelten lässt, auch wenn es ganz etwas anderes ist, was der dort tut, es kann trotzdem auch Sinn haben für das, was ich selbst tue.
Wenn zum Beispiel ein Swaminathan, den ich persönlich genau so wenig kenne, wie die meisten Anderen hier, einen Stellungstest mit auch nicht gar so wenig Mühe mit Anderen gemeinsam aus jedenfalls einer auch ziemlich großen Zahl von Stellungen zusammenbastelt und über deren Auswertung auch einiges an Arbeit macht, kann es für einen Schachprogramminteressierten einfach nicht der Weisheit letzter Schluss sein, sich das mal kurz anzuschauen, wenn überhaupt und dann zu sagen, naja, wenn's ein Stellungstest ist, muss es ja Quatsch sein.
Doch, kann man so machen, die Möglichkeit, es besser zu machen, hat man sich damit, was Stellungstests angeht, verschossen.
Eiine andere Sicht auf Teststellungen als die eigene, verschießt man sich z.B. auch schon damit, dass man Eröffnungsstellungen prinzipiell nicht mehr als Teststellungen bezeichnen und betrachten darf, mein ich halt, ist das wirklich so unklar?

By Frank Quisinsky Date 2010-10-06 16:46 Edited 2010-10-06 16:51

Hallo Peter,

4.000 ausgewählt ...

Auswählen is der falsche Ausdruck, ich würde es automatisch selektieren schimpfen.
Am Ende musste ich willkürlich die Systeme entfernen die den Random Faktor zu stark beeinflussen.
So ist leider mein geliebtes Scandinavisch nicht enthalten. Auch andere Systeme die ich gerne spielen sind leider nicht durch die automatischen Selektierungen gekommen.

Wozu die ganze Mühe ...

Ich muss doch jetzt wirklich nicht die ganze Doku wiederholen, oder?
Alles wurde seinerzeit hier im Forum und in der Doku beschrieben.
Du kannst das gerne nachlesen.

Manipulation ...

Du solltest mit solchen Formulierungen vorsichtiger sein und genauer schreiben was Du meinst.
Viele Kommentare von Dir sind sehr schwamming ... habe wahnsinnige Probleme damit zu verstehen was Du meinst.
Das ist nicht böse gemeint, gebe mir ja Mühe und antworte Dir.

Klar ist auch das wir mit Informationen Tod geschlagen werden und vieles überlesen oder gar nicht lesen, nicht komplett zu Ende lesen.
Die typischen Probleme bei Diskussionen in Foren.
So überlese ich auch, verpasse wichtige Informationen oder wirke dann interessiert aber nicht informiert.
Mit diesem Problem kämpfen sicherlich alle die regelmäßig Foren lesen, viele eigenes zum Thema festgestellt haben und mit Äußerungen anderer dann ein Problem haben. Aber dafür sind die Foren dann auch da um sinnvoll darüber zu diskutieren. Insofern bin ich auch niemanden böse wenn ich eine andere Meinung habe ... die auch nicht unbedingt immer richtig sein muss.

Klingt nach, na dann ist's ja eh wurscht, wenn's alle bevorzugt, stimmt aber nicht, es bevorzugt diejenigen, denen die Stellungen mehr liegen mehr und diejenigen, denen sie weniger liegen, weniger.

Das ist so ein Satz ...
Was kann ich damit tun?

Wer wird bevorzugt nach ab Zug 9. weiß.
Eine stärke Engine ist immer im Vorteil und ist schon ab Zug 1 bevorzugt weil die Grundspielstärke höher ist.
Was möchtest Du damit sagen, ich weiß es nicht!

Trotzdem sind alle, die da dann in deiner Rangliste weiter oben sind, ziemlich wahrscheinlich in erster Linie in der Eröffnung in Vorteil gekommen, wie gut sie das dann wann erst gegen die anderen ausnützen können, kann man selbst wenn man sich jede einzelne Partie genau anschaut, oft schwer sagen, der Nachteil, der in der Eröffnung schon entsteht, kann von sehr ähnlich spielenden engines oft erst sehr viel später ausgenützt werden, die Stärke im Mittelspiel der engine, die in der Eröffnung leicht ins Hintertreffen geraten ist, kommt aber trotzdem nicht mehr zum Tragen und die Stärke im Endspiel erst recht nicht.

Rein theoritisch könnte es sein, wenn nicht der Umstand wäre, das es evtl. doch wahrscheinlicher ist, wenn nicht bzw. wenn doch, in Anbetracht der Tatsache, das im Grunde alle, wenn überhaupt, aber rein subjektiv hypothetisch wäre, das maximal so ist, das wenn es bewiesen wäre, es sowieso genau kontraproduktiv zu dem eigentlich gesagten, nein eher uneigentlich gesagten, wäre, aber weil wir wissen, das es sein könnte, das dann doch nicht der Umstand zum Tragen kommt, müssen wir annehmen, zumindest uns gedanklich damit auseinander setzen, das heute nicht der Postbote kam und mir dieses verflixte ChessBase 11 brachte.

Weißt Du was ich meine ...
Damit kann ich nichts anfangen.

Fasse den Rest Deiner Erläuterungen mal zusammen:

Es gibt viele Möglichkeiten zu versuchen eine Spielstärke zu messen. Sicherlich ist das Spiel zwischen zwei Engines dafür sehr gut geeignet, kenne keine bessere Methode. Dann kommen bei Turnieren / Ratinglisten die vielen Beeinflussungsfaktoren hinzu. Viele ermittelten Ergebnisse gegen ein wenig auseinander aber mit immer besserer Hardware kommen wir heute zu besseren Ergebnissen als noch vor 10 Jahren. Viele unklare Punkte lösen sich auf, viele produzierte Ergebnisse von Ratinglisten lassen sich erklären, nicht alle. Eine Ratingliste stellt nicht nur eine ELO fest, sondern gibt Auskunft über ein Spielverhalten einer Engine, zum Stil einer Engine, zu den Stärken und Schwächen und vor allem auch Fehlern einer Engine. Es werden Partien gespielt ... wir reden vom SCHACHSPIEL. Ein Schachspiel bedeutet eine Partie zu spielen.

Wir können bei Stellungstest Fragmente entnehmen und abtesten. Diese Partiefragmente sammeln und einen Test-Set daraus bauen. Auch diese Ergebnisse haben einen Wert, geben Aufschluss über ein Spielverhalten einer Engine.

Ich gehe nicht hin und betrachte die SWCR als Maß aller Dinge, so vermessen bin ich nicht und das habe ich niemals irgendwo geschrieben. Oder ich gehe nicht hin und verurteile die Arbeiten anderer nur weil mir diese nicht in den Kram passen. Nein, oftmals beschäftige ich mich gerade mit diesen Arbeiten viel lieber als mit den eigenen Arbeiten. Es bringt mir neue Erkenntnisse und zu verstehen was andere herauszufinden ist viel spannender als nur selbst gebetsmühlenmäßig die eigenen runter zu beten. Darum geht es mir nicht, ging es mir noch nie ... eher darum zu informieren und Personen zu finden, die sich dann an diesen, meinen Erkenntnissen wieder erfreuen so wie ich mich an deren Erkenntnisse erfreue. Das ist der Austausch der eigentlich gefördert werden sollte und genau der Austausch der ein Forum belebt.

Nur ich erkenne bei Deinen vielen Erläuterungen nicht imeer eine klare Aussage auf die ich mich beziehen kann. Für mich ist eine gute Ratingliste unter den jeweils gespielten Bedinungen eine klare Aussage zu der Spielstärke einer Engine. Für mich ist auch ein Stellungstest eine klare Aussage zu der Spielstärke der Engine bei der Verwendung der selektierten Stellungen. Es gibt keine ultimative Aussage zu einer 100%igen Einschätzung. Es gibt Ergebnisse und letztendlich formt sich ein Bild über die Spielstärke einer Engine.

Persönlich ist es mir egal ob Shredder 12 10 ELO vor Komodo steht oder punktgleich mit Komodo ist. Die beiden Engines sind in der Grundaussage gleich stark. Das bei den Ratinglistenbetreibern gerne gefachsimpelt wird hängt eher damit zusammen, das die Listen auch den schönen Nebeneffekt haben sich mit Statistiken zu beschäftigen. So haben wir ...

1. Zusehen und die Kraft der Engines bewundern.
2. Möglichkeiten interessante Analysen mit dem gewonnenen Material anzustellen.
3. Statistiken auszuwerten, zu mutmaßen ... keine Statistik gibt Dir eine 100% korrekte Aussage.
4. Spielstile zu orten
5. Fehler zu orten
6. Stärken und Schwächen zu orten

etc.

Ein so breites Spektrum an interessanten Möglichkeiten kann Dir ein Stellungstest nicht geben.

Recht haben und nicht Recht haben:
Ich muss nicht Recht haben, habe überhaupt kein Problem damit auch mal zu sagen ... Sorry ich habe mich verzettelt. Ja, Männer sind da ganz sonderbar und ticken oftmals wie wildgewordenen Stiere. Gehen aufeinander los und erst Recht bei einem Kampfsport wie Schach. Und gerade bei Schach wo doch so viele Individualisten aufeinander treffen und auch ganz klar ...

Alles ist richtig was festgestellt wird um Probleme zu vermeiden die kommen werden

In der SWCR wurden nun schon fast 60.000 Partien bei einem Partiedurchschnitt von 85 Zügen gespielt. Du kannst aus diesen Partien Dein Leben lang Test-Sets kreieren und dann wieder von vorne anfangen zu versuchen damit die Spielstärke zu messen. Gerade zum Thema Testset habe ich ellenlange Diskussionen mit Gurevich im ChessBits Forum geführt ... bitte nicht schon wieder.

Tja, Du bist ein anderer Diskussionspartner, klar !!
Aber ich messe dem Thema zwar eine Bedeutung zu und schaue mir auch gerne den Test von Swami oder andere an aber für mich ist das nur ein Mosaiksteinchen auf dem Weg zur Beurteilung einer Engine. Genau wie die eigenen SWCR. Aber immerhin Peter ... zumindest mal ein Mosaiksteinchen auf die Reihe bekommen, dass ist doch schon mal etwas, oder?

Gruß
Frank

By Michael Hoeppenstein Date 2010-10-06 17:23

Schon mal über die Forum-Netiquette nachgedacht? Da kann man unter anderem lesen (z.B. hier http://www.yoome.de/index.28.0.html):

Zitat:

Schreiben Sie kurze und prägnante Beträge, so wenig wie nötig.

Gruß, Michael

P.S. Schreib' ein Buch und lass' es veröffentlichen.

By Frank Quisinsky Date 2010-10-06 17:28

Hallo Michael,

ich passe mich meinem Diskussionspartner an.
Wie jetzt auch in meiner Antwort zu Dir.

Gruß
Frank

By Benno Hartwig Date 2010-10-07 14:57

[quote="Michael Hoeppenstein"]

Zitat:

Schreiben Sie kurze und prägnante Beträge, so wenig wie nötig.

Als Empfehlung für diejenigen, die wirklich gelesen werden wollen, trifft dies sicher zu.
Ich habe aber auch kein Problem, etwas einfach nicht zu lesen, was mich nicht interessiert und wegen seines Umfanges fern hält.
Wenn denn also jemand einen Roman schreiben möchte, weil er ihn für so gehaltvoll hält, nur zu.
Benno

By Michael Scheidl Date 2010-10-06 16:12

Da bzw. wenn bei Variantenvorgaben üblicherweise jede mit Farbwechsel ausgespielt wird, halte ich es gar nicht für nötig, daß jede Startstellung (sehr) nahe einem anzunehmenden 0.00(*) ist. Ich glaube, es kommt nur darauf an daß keine sehr unausgewogenen (oder nur sehr wenige unausgewogene nach Meinung nur sehr weniger Engines) enthalten sind. Denn diese ergäben tendenziell fast immer ein 1:1 f.d. Variante und nivellierten/verfälschten einen Zweikampf. Das, d.h. die Ausgewogenheit der Stellungen sollte man aber mit mehr als nur einer einzigen Engine überprüfen. Bei meinen Balanced-Büchern habe ich das nach 12 Vollzügen jeweils mit zwei soliden starken Engines versucht, zugegebenermaßen mit weniger als 1 Minute je Stellung, weil ich bei einem herkömmlichen Buch mehr Tests als bei einer eher kleineren Testsuite bewerten lassen mußte.

Dafür benötigt man keine kompletten Partien, sondern kann mit Hilfe der Fritz-Partielängenbeschränkung nur je 2 berechnete Plies ausspielen lassen. Genialerweise schreibt Fritz dann die resultierenden Evals direkt in die Partieliste der Match-Datenbank! Man kann also "Verdächtige" schnell identifizieren. Ich denke, das ist ein effizientes Verfahren, das man natürlich qualitativ verbessern kann (längere Zeit, Durchläufe mit 3./4. Engine...).

Ich weiß nicht ganz genau wo man die Grenzen ziehen sollte, aber so ungefähr zwischen -0,20...+0,50 würde ich als unbedenklich ansehen. Der weiße Anzugsvorteil sollte irgendwie in Betracht gezogen werden, deswegen kann man für die Plus-Werte einen etwas größeren Spielraum ab Null einräumen. Wie gesagt, die schwarze Engine bekommt ja normalerweise dann auch die Chance mit Weiß.

*) Echte, frühe "0.00"-Stellungen sind etwas unnatürlich für eine starke Eröffnung, denn das hieße ja Weiß hätte seinen Anzugsvorteil schon verspielt!

Laut Hans Berliner hat Weiß (wie eigentlich deutlich einleuchtet) im Durchschnitt einen Anzugsvorteil von einem halben Tempo.

Doch wer kann das in Bauerneinheiten beziffern...?