Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / FCT1: Stockfish 03.08.14 BMI2 x64 (Zwischenfazit) nach 50%
- - By Frank Quisinsky Date 2014-08-14 00:35 Edited 2014-08-14 01:19 Upvotes 2
Hallo zusammen,

mein kleines Zwischenfazit nach 500 von 1.000 zu spielende Partien:

Es ist ein Gemetzel!

Das ist die aggressivste Stockfish Version welche ich bislang gesehen habe.
Schon 19 Partien unter 50 Zügen nach 500 Partien (23 waren es bei Stockfish 5 SSE42 x64 Release Version nach 1.000 Partien).
Der Zügedurchschnitt ist derzeit knapp einen Zug geringer und steht bei nur 79-80 bei Aufgabefaktor = aus.
Die Remisquote scheint zurück zu gehen, nur wenige fragwürdige schnelle Remispartien sind in der Datenbank!
Derzeit +25 zur offiziellen 5er Releaseversion und das Rating war schon nach 100 Partien stabil, Stockfish dreht unerschrocken die Runden.

Es macht einfach Spaß der Engine zuzusehen.
Die Entwickler leisten großartiges, von meiner Seite gibt es nichts zu beanstanden.
Ich habe die aggressive Engine die ich mir wünsche.

Der Spielstil:
Stockfish sucht immer Wege sofort die Initiative zu ergreifen. Geht aggressiv mit Bauerzügen gegen die Rochade vor, sucht stets die offenen Linien und vermeidet den Abtausch wichtiger Leichtfiguren in der Eröffnung. Die Dame kommt nicht zu früh zu spät zum Einsatz. Die Türme werden schnell ins Spiel gebracht. Die ganzen Kräfte werkeln zusammen ... da spielt auch wirklich ein Heer in Teamwork zusammen. Einzig zum Thema strategisches spätes Mittelspiel würde ich Komodo als stärker ansehen. Komodo ist hier bissiger versteht mehr davon richtiger abzutauschen und spielt bissiger kleine Vorteile aus. Stockfish sucht eher schneller die Lösung, ist nicht zu zäh bei der Umsetzung von längeren Ideen. Das wäre vielleicht ein Kritikpunkt im Vergleich zu Komodo aber ein Kritikpunkt auf einem sehr sehr hohen Niveau. Ich hoffe nicht, das der Stil geändert wird um z. B. hier anzusetzen die Engine zu verbessern auf Kosten dieser fantastischen Taktik.

25 Elo bei dieser extrem hohen Spielstärke ist riesig!
Das muss immer in ein Verhältnis zur Stärke gesetzt werden. 25 ELO bei deutlicher Steigerung der taktischen Fähigkeiten die schon vorher gigantisch waren. Eigentlich geht die Spielstärke runter wenn eine Engine aggressiver wird. Das ist einfach irre was in der Entwicklung passiert ist im Vergleich zur Release Version. Da sehe ich zwar die gleiche Engine aber die aktuelle dev. Version kommt im wahrsten Sinne mit einer Art Booster daher. Als wenn ein Rennwagen einen Knopf hätte nochmal 100km/h die Stunde auf Knopfdruck zuzulegen. Das ist einfach brutal, diese Taktik.

Die Partien liegen zum Download bereit und wer mal die ganzen kurzen Partien in Folge nachspielt dem wird ganz schwindelig.

Tolle Leistung ...
Stockfish begeistert mich nochmal eine Klasse mehr.
Dachte bei der Release Version, ups es geht abwärts mit der Taktik, Stillstand ... auf Kosten von Elo.

Nichts da!
Diese dev. Version legte 25 Elo zu und ich würde fast sagen um 40% an taktischen Fähigkeiten hinzugewonnen!
Nach Schulnoten würde ich Stockfish jetzt die 1 geben. Vorzeigeentwicklung im Computerschach auf einem nie dagewesenen Niveau. Das als freie Programmentwicklung und genau das animiert dann andere! Hier stimmt einfach alles und so oft ich negativ schreibe ... das ist wirklich ein echtes Vorzeigeprojekt vor dem ich bei dem was ich schon alles gemacht habe meinen Hut ziehe und mich mithin bei den vielen Mitwirkenden auch bedanken möchte. Diese Entwicklung mit dem Wissen der mitwirkenden Personen versüßt uns dieses Hobby. Eine echte Errungenschaft für uns für Analysen und nach wie vor ... wir haben mit Komodo noch eine zweite TOP Engine die gegensätzlich spielt. Das ist ein Eldorado an Möglichkeiten, nie dagewesen ... wir können so viel aufdecken was uns Elo Nasen bislang verborgen geblieben ist.

Nun schauen wir uns die nächsten 500 Partien an.
Melde mich zwischenzeitlich hier ein bissel ab denn ich muss das zweite FCT1 System nun konfigurieren, vorbereiten ... soll zum nächsten Round Robin zum Einsatz kommen. Ist fertig und will konfiguriert werden und ich habe eigentlich gar keine Zeit hierfür denn ich bin beruflich sehr ausgelastet. Weiß gar nicht wie ich das immer schaffe noch so viele Beiträge hier zu setzen. Bin ja reif für die Klapse.

Weiterhin viel Spaß den Verfolgern von meinem kleinen Round Robin.

Ein wirkliches Gemetzel ...
Als wenn Achilles über das Schlachtfeld rennt (Film Troja) ... das ist Stockfish!
Macht sogar vor Spark in der Eröffnung nicht halt ... auch Spark so stark in der Königssicherheit ... verliert so selten schnell ... musste schon dran glauben.
Mensch, meine favorisierte Engine wird in der starken Partiephase zerlegt ... also das sehe ich nicht so gerne aber da muss ich durch.


Im Grunde können Engines nur mit einem durchgezogenen Geistesblitz SF schlagen, meine Engines die dann doch mittlerweile deutlich unterlegen sind. Zeigte Junior und Spike in den Beispielpartien auf. Stockfish ist also nicht unschlagbar (wäre ja noch schöner). Fast hätte gerade auch Quazar eine Partie gewonnen aber SF suchte wirklich jeden erdenklichen Weg ein Remis zu finden und fand es. Es gab zwischen Partienummer 401 und 500 ne Verlustpartie gegen Hannibal, muss man sich mal anschauen. Aber interessanter ist es die tollen Gewinnpartien zu betrachten, davon gibt es unzählige mehr.

Gruß
Frank

PS:
Es gab eine Verlustpartie bei der letzten Serie gegen GullChess (verloren auf Zeit bei +1).
Die siebte Zeitüberschreitung nach 17.500 FCT1 Partien, die zweite einer Stockfish Version.
Diese Partien werden bei mir grundsätzlich wiederholt.
Aber das wird eher Zufall sein bzw. die Zeiteinteilung ist auch sehr aggressiv, jede Sekunde wird wenn es drauf ankommt genutzt.

So rein gefühlsmäßig würde ich gar sagen die Spielstärke geht gar noch nach oben.
Wahrscheinlich wird's ausgehen mit +30 Elo zu Stockfish 5 Release Version ...
Parent - - By Tom Paul Date 2014-08-14 07:09
Gull gegen Stockfish.
Gleich der erste Zug aus der Vorgabestellung heraus Dd2 +0.56, zu viel Vorteil.
14.a6 der Patzer von Stockfish, Sf7 wäre besser gewesen anstatt diesen am Rand stehen zu lassen und Bauer a7-a6 zu ziehen.
Nach a6, Komodo Ld1 +0.74/d29, Stockfish Ld1 + 0.75/d36.
Nach Sf7, Komodo Se6 +0.31/d25, Stockfish Le4 +0.33/d32.

Event:
Ort:
Datum:

Weiss:
Schwarz:

Ergebnis
Board
Parent - - By Frank Quisinsky Date 2014-08-14 07:48
Hi Tom,

schaue Dir die Stellung mal genau an.
Laden und betrachten, selbst einschätzen, Referenzpartien suchen ...

Wo ist der Vorteil ...
Ich sehe einen weißen Anzugsvorteil (ja) eine minimal bessere Stellung von schwarz (ja) aber mit Chancen für beide Seiten. Gullchess hat das gut gespielt, kommt auch mit ein paar Elo mehr daher!

Wir reden vom Anzugsvorteil.
Auch hier, sehe keinen Grund die Stellung aus dem Buch zu löschen!
Damit müssen die Engines klar kommen!

Wie gesagt, wenn ich anfange bei einem Buch für alle solche Stellungen zu löschen kann ich im Grunde die komplette Theorie streichen.

Gerade gab es eine zweite Zeitüberschreitung von SF.
Eine Niederlage gegen Hiarcs ... SF wurde hier mit den eigenen Waffen bezwungen.
Ansonsten wieder viele schöne Siege ...

Viele Grüße
Frank
Parent - - By Tom Paul Date 2014-08-14 08:02
Wie viel Vorteil bezeichnest du als Anzugsvorteil?
Maximal +0.20? +0.30? +0.40? +0.50? +0.60? ....+1.00?

In meinem Eröffnungsbuch bei bestem Spiel beiderseits kommt weiß über einen Anzugsvorteil von maximal +0.18 nicht hinaus. Jedes + mehr wäre auf Ungenauigkeiten des schwarzen zurückzuführen.
Und somit wäre mehr + für weiß nur durch schlechtes Spiel des schwarzen möglich, dies hat aber nichts mit dem Anzugsvorteil zu tun.
Parent - - By Frank Quisinsky Date 2014-08-14 08:16 Edited 2014-08-14 08:24
Hi Tom,

das kommt darauf an.
Ich bin davon weg auf die Stellungsbewertung nach dem ersten Zug zu schauen.

Wie gesagt ich muss hier ganz anders vorgehen.

Ich habe Stellungen aus derzeit 52 ECO codes in einer Datenbank.
Wenn sich bei den Partien die Stellungen mehrfach wiederholen und die Partien mehrfach vergeigt werden nehme ich die Stellung raus.

Schaue mir eigentlich eher an wie sich die Stellungsbewertungen bei den Folgezügen entwickeln.
Das ist nicht so einfach, weil viele schwächere Engines auf viele stärkere treffen. Wie gesagt NirvanaChess hat z. B. eine sehr eigenwillige Stellungsbeurteilung. Auch sehen viele schwächere Engines die Möglichkeiten nicht und vergeigen schnell nach den Eröffnungszügen, die stärkeren sehen mehr und spielen das dann teilweise ganz anders, sehr viel sicherer und vergeigen nicht.

Der Anzugsvorteil ist nicht die Stellungsbewertung sondern die Einschätzung der Stellung nach Möglichkeiten die in der Luft liegen. Ich muss mir so behelfen wie ich vorgehe denn ich bin kein GM. Einfach das vorhandene Wissen anwenden und kritischer mit den Systemen umgehen.

Ich habe schon rund 300 Stellungen aus dem Buch entfernt und es sind immer noch einige drin die raus müssen.
Aber ich lösche die nicht so schnell raus und wild raus.

Das Buch soll eine Arbeit werden, die begleitend zum Turnier läuft.
Wenn weitere 100.000 Partien vorliegen wird auch das Buch besser sein.

Du kannst ja wenn Du helfen willst die Partien mal selbst durchgehen und wirkliche schlechte Stellungen versuchen zu finden. Aber immer im Hinterkopf behalten ... die Stellungsbewertung nach Zug 1 nach dem Buch ist nicht entscheidend. In Zweifelfällen habe ich zwei GMs zur Hand mit denen ich viel schreibe. Die kennen auch die Datenbank mit meinen herausgesuchten Stellungen aber die helfen mir hier wenig. Kommen eher Kommentaren ... ja die Stellung 40 ... wie oft wurde darüber schon gefachsimpelt. Oder ... die Stellung 35 war eine Idee von Kollege x ... in der Praxis nicht erprobt, würde ich selbst nicht spielen. Kommentare wie ... Frank, nehme x oder y raus kommen nicht, andere interessante Hinweise aber nicht die die ich brauche. Wenn ich gezielt nachfrage kommt eher ... das erfordert eine ausführliche Analyse und dann wird auf Theorie Nachschlagewerke verwiesen, kann mir die ja nicht alle kaufen wenn gleich ich schon einige habe.

Oft kommt auch ... wie blind ... sind halt Engines, die können das nicht sehen was in der Eröffnung langfristig steckt.
Immer interessant aber nicht wirklich eine richtige Hilfe.

Insofern ... muss da mit meinen eigenen Mitteln vorgehen.

Gruß
Frank

Und das Problem bei meinem Buch ist ... da ist ne Datenbank eingeflossen die ich nicht richtig überprüft habe. Kann den Schritt nicht mehr rückgängig machen. Daher bin ich auch hin- und hergerissen und arbeite an einer neuen Buchidee. Aber dafür brauche ich viel Zeit die ich derzeit nicht habe, geht nur langsam voran. Also, nichts ist perfekt aber ich habe schon so viele Stunden in das vorhandene Buch investiert das ich die Arbeit nicht wegschmeiße, dafür ist es schon in vielen Dingen zu gut geworden für den Zweck für den ich es einsetze.
Parent - - By Tom Paul Date 2014-08-14 08:41
Wie wäre es damit:
Vorgabestellung maximal 10 Züge(20 Halbzüge) aus der Grundstellung heraus, denn die Eröffnung gehört auch zur Schachpartie und warum sollten die Engines direkt im Mittelspiel starten.
Vorgabestellung maximal 1 Bauer weniger bei weiß und einer bei schwarz.
Parent - By Frank Quisinsky Date 2014-08-14 08:52 Edited 2014-08-14 08:56
Hi Tom,

habe im Buch 6 Züge Vorgabestellungen (die Datenbank die eingeflossen ist und nicht gut war).
Wollte damit eigentlich die Zugumstellungen wieder rein bringen die wichtig sind auch wenn das Buch dann komplizierter zu optimieren ist.

habe im Buch 8 Züge Vorgabestellungen (beruhend auf die in SWCR1 / SWCR2 abgetesteten) Version 5.5 von meinem Buch. Diese Stellungen sind optimiert und OK.

habe im Buch 10 Züge Vorgabestellungen (Datenbank beruhend auf einer mittels Engine Analyse durchgetesteten Datenbank von neueren GM Partien, welche die 8 Züge Datenbank ergänzt). Hier sind kaum Varianten drin die zweifelhaft sind, bzw. muss ich da sehr wenig löschen.

habe im Buch 12 Züge Vorgabestellungen (ausgesuchte Eröffnungen die weiter gehen als 10 Züge nach dem ECO Code) bzw. schwierige Systeme. Wenn eine Vorgabe also länger als 10 Züge geht dann habe ich schon mehrfach Hand angelegt.

habe im Buch 10 Züge Vorgabestellungen der gespielten Eng-Eng Partien aus SWCR2 und FCT1. Hier werden im Grunde nur bestehende Varianten durch die erspielten Eng-Eng Partien verlängert. Dann kommt es oft vor ...

Eine Partie geht bis Vorgabe 8 Züge und hat von Zugnummer 5-8 als Beispiel nur eine Abfolge. Plötzlich ab Zugnummer 9 tauchen dann wieder 5 Züge aus. Das sind Züge aus den gespielten Eng-Eng Partien. Auch wichtig diese Datenbank einfließen zu lassen wegen den Zugumstellungen.

Das Buch verfolgt also ein Konzept beim Aufbau.
Lediglich das ich die 6 Züge Datenbank habe einfließen lassen war nicht gut.
Hier und da muss ich auch Züge aus Eng-Eng nach Zugnummer 8 deaktivieren weil schwächere Engine ne schlechte Fortsetzung spielen.
Im Gesamtergebnis ist die Idee aber gut, diese Datenbank rein zu nehmen.

Die Vorgabe mit 10 Zügen ist keine gute Idee weil viele ECO codes tiefer als 10 Züge gehen und diese dann zu selten oftmals gar nichts aufs Brett kommen. Zu sagen ich mache ein 8-Züge Buch ist keine gute Idee. Aber wie gesagt ich arbeite mit dem ganzen Material an einem sehr schönen neuen Buch.

Hoffe es gelingt etwas.

Gruß
Frank

Nachteile:
Bei der durchgeprüften 8 Züge Datenbank aus der Buchversion 5.5 sind keine Zugumstellungen drin.
Die müssen rein und daher dieses Konzept was ich verfolge.
Die 6 Züge Datenbank ... da ist zu viel drin was ich löschen musste, die hätte ich besser überprüfen müssen.

Vorteile:
Ich kann später wenn mein neues Buch steht, je nach ECO Code Länge die Zugvorgabe um 2-3 Züge nach den ECO-Code verlängern durch die gespielten Partien. Geht aber nur wenn ich mit 500 Datenbanken arbeite und dann diese Datenbank für Datenbank in das Buch bringe. Bei dem neuen Buch versuche ich auch die unklaren Zugumstellungen herauszunehmen. Dann ist etwas großartiges entstanden und jeder kann z. b. seine Partien zu dem Buch kopieren und hat die kompletten Prios etc. und muss das nicht mehr bearbeiten.

Also, steckt trotz der Fehler die ich gemacht habe immer noch ein klares Konzept drin welches ich durchziehe.
Parent - - By Tom Paul Date 2014-08-14 07:52
Hannibal vs Stockfish.
15.Dd7? Komodo +0.49/d26, Stockfish +0.38/d34.
Lb6 ist besser. Komodo +0.41/d28, Stockfish +0.31/d35. Der Läufer wird gedeckt und deckt c7 und schaut auf a5.

19.c6? besser Sf5. Der Springer wird aktiver gestellt. Der Te8 ist nicht versperrt. Der Bauer c7 wird flexibel behandelt und legt die Bauernstruktur nicht fest.
Nach Sf5 wäre a4 ein Patzer wegen Sh4.
Nach c6 kommt a4.

Event:
Ort:
Datum:

Weiss:
Schwarz:

Ergebnis
Board
Parent - By Frank Quisinsky Date 2014-08-14 07:59
Hi Tom,

ja, sehe ich auch so ...
Diese Partie muss mal in Ruhe analysiert werden.
Hannibal hat das klasse gespielt, da stimmte in der Partie bei Hannibal auch einfach jede Abfolge.

19. c6 fand ich auch nicht so gut.
15. Dd7 vielleicht noch spielbar denke ich.

Viele Grüße
Frank
Parent - - By Benno Hartwig Date 2014-08-14 08:23
Thanx für deinen Bericht und auch für die offene Begeisterung dabei.
25 ELO wären in der Tat solch ein Hammer, dass ich erst mal lieber skeptisch bleibe, deine nächsten Partien abwarte, die von anderen, und auch das, was ich selbst beobachte.
Derartige 25 ELO wären halt solch ein Hammer...
Ein Hammer...
Um so mehr, als du von einem interessanterem/agressiveren/schönerem Stil berichtest
Benno
Parent - - By Frank Quisinsky Date 2014-08-14 08:33 Edited 2014-08-14 08:36
Hallo Benno,

das ist das Salz in der Suppe.
Die Ergebnisse vergleichen mit denen der anderen.
Einschätzungen teilen um nicht gesehene eigene Dinge kritischer zu betrachten.

Ich bin gar am überlegen ob ich durch die zweite Maschine die Bedenkzeit verdoppel und FCT2 starte. Aber erst muss mein neues Buch fertig werden. Insofern lasse ich an dieser Liste noch weiter spielen. Die Frage ist dann welche Bedenkzeit!

40 in 10 ... bedeutet 42-45 Minuten ohne Aufgabefaktor.
Zusehen ist OK ...

Wann ist das Zusehen nicht mehr OK bzw. dauern die Partien zu lange.
40 in 20 ... 1 1/2 Stunden pro Partie ... das dauert zu lange.

Anbieten würde sich ...
40 in 10 und Ponder wieder einschalten aber dann kommen wieder zu viele Engine Probleme zum Vorschein und das testen wird mühseliger. Kein Bock mehr mails an Programmierer zu schreiben.
40 in 15 bei Ponder = off ...

Das würde bedeuten ca. 180-200 Partien pro Tag.
Ca. eine Stunde für eine Partie halte ich noch für OK.

Was ich im Kopf habe ist also 40 in 15, ponder = off wenn mein neues Buch fertig ist.
Und dann ziehe ich FCT2 ne Zeit durch.
FCT1 dient im Grunde nur dazu weitere Dinge zu sammeln die mir selbst nicht gefallen um dann genau das zu starten was für mich optimal ist.

Also über SWCR2 zu FCT1 um dann langfristiges Testen mittels FCT2 zu erreichen.

Gruß
Frank
Parent - - By Tom Paul Date 2014-08-14 08:45
40 in 15 finde ich gut.
Parent - By Frank Quisinsky Date 2014-08-14 10:00 Edited 2014-08-14 10:06
Hi Tom,

also wenn dann frühestens zum Jahresende !!
Bzw es steht ja fest das FCT2 folgen wird, daher nannte ich das jetzige auch FCT1.

Und 40 in 15 auf der Hardware ist höher zu betrachten als 40 in 40 bei CCRL, wobei mir CCRL nicht gefällt, finde CEGT deutlich besser.
Die Ergebnisse waren für mich bei Vergleichen immer plausibel und hier wird alles getestet.

Wenn es um Ratings geht ist CEGT für mich nach wie vor die Nummer 1 und um ein paar Klassen höher zu bewerten als zum Beispiel meine eigene Arbeit. Auch was Andres Stangmüller macht finde ich richtig gut. Auch Sedat als Einzelkämpfer kommt immer mit tollen Sachen daher, gibt so viele gute Sachen die ich mir gerne ansehe.

Nur ich hätte gar keine Motivation immer gleiches zu tun.
Muss immer das eine oder andere verbessern und fange dann schnell etwas neues an.
Sonst wird's für mich langweilig.
Daher schon beeindruckend mit welcher Ausdauer die CEGT daher kommt.
Bin da im Vergleich eher der unruhige Geist, wenn gleich ich dann beim Testen auch gnadenlos ein Strickmuster durchziehe was ich dann im Kopf habe.

Gruß
Frank
Parent - - By Frank Quisinsky Date 2014-08-14 09:15 Edited 2014-08-14 09:22
Hi Benno,

ist aber sehr unwahrscheinlich das nach 5 100ter Serien zwischen 81.0 und 84.0 Punkten auf 100 Partien der große Einbruch oder die große Verbesserung kommt. Kann natürlich sein, dass noch ne schlechte oder ne besonders gute Serie kommt aber der Querschnitt (denke da etwas anders als Du) ist für mich bei Engines mit gleicher nicht veränderebarer Spielstärke wichtiger als Elo Ansätze die eher auf veränderbare Spielstärke aufsetzen bzw. den Wahrscheinlichkeitstheorien die meines Erachtens bei gleicher Spielstärke nur bedingt eingesetzt werden können.

Die 100ter Serien sind als Prognose zu sehen. Wie wahrscheinlich ist die Blitzeinschlagtheorie wenn dann schon 1.000 Partien vorliegen. Variieren die 100ter Serien zu stark, gibt es zu viele schlechte und gute Serien, gehen die Punktergebnisse zu weit auseinander ... wäre das ein Indiz dafür das ein Erdbeben droht. Sind aber die konstante Serien in Folge zu sehen passiert nichts. Kann natürlich sein das die 11 Serie dann ein schlechtes Ergebnis produziert und das erst wieder mit der 12-15 Serie ausgeglichen wird ist dann wirklich wahrscheinlich und dann das Rating augenscheinlich erst ab 1.500 Partien stabiler wird aber das kann abgelesen werden an den 100ter Serien in krass fast allen Fällen !!!

So meine Denke ... die nicht etwas 100%iges vorhersagen soll aber immerhin eine Vorhersage mit großer Verlässlichkeit darstellt. Wie bei den Erdbeben Vorhersagen ... ganz genau kann nichts vorhergesagt werden aber mittels Statistik welche auf Vergleichswerte beruht können zumindest Warnungen ausgegeben werden

Das ist 100x besser als eine ErrorBar.

Schaue Dir mal die 10 Serien in News 032 auf meinen Webseiten an zum beendeten FCT1 Basic Tourney 2. Kannst Du erkennen das ein Rating nach 1.000 Partien bei einer der 6 Engines vielleicht durch mehr Partien nach oben oder unten wandert?

Haben wir drei schlechte Serien in Folge dann steigt ein Rating an. Das Rating bildet sich ja nicht für uns ersichtlich von Partienummer 1.000 - 2.000 sondern von Partienummer 100-400 in Step 1 und festigt sich von Partie Nummer 400- 700 in Step 2. Dann bleibt es in der Regel stabil.

Gruß
Frank
Parent - - By Benno Hartwig Date 2014-08-14 09:26
1000 Partien, die du jeweils absolvierst finde ich schon gut. (Die Sinnhaftigkeit der 100er-Unterteilung habe ich zwar nie eingesehen, aber sie stört sicher auch nicht, und vielleicht unterhält sie ja).
Wenn bei den vielen derartigen Serien eine dabei ist, bei der während der ersten 500 Partien z.B. zufallsbedingt 20 ELO mehr heraus kamen, als es der Spielstärke entspricht, dann ist der Erwartungswert nach dann 1000 Partien auch immer noch um 10 ELO höher als es der Spielstärke entspricht. Und die Wahrscheinlichkeit ist durchaus groß, dass du sogar um mehr als diese 10 ELO zu hoch liegen wirst.
Den bereits eingetretenen "Fehler" bekommst du ja nicht dadurch wirklich weg, seine Auswirkung wird wahrscheinlich nur eben geringer.

Aber was soll man machen, 1000 Partien sind schon gut, Frank. Ein Kompromiss aus immerhin einiger 'Genauigkeit' und Praktikabilität.

Benno
Parent - By Frank Quisinsky Date 2014-08-14 09:38 Edited 2014-08-14 10:08
Hi Benno,

genau so sehe ich das auch.
Das meine Ergebnisse um 10 ELO variieren können ist denke ich unumstritten.
Passiert zwar auch selten aber passiert (siehe Spark ... ist abgefallen, Chiron ist gestiegen).

Aber wenn ich erreichen kann ein so genaues Rating zu erzielen mit spannenden drum rum bei 1.000 Partien hält sich Mittel zum Zweck die Waage mit den anderen Dingen die wichtig sind. Was über 1.000 Partien hinaus geht ist natürlich immer gut und noch mehr Verlässlichkeit aufzubauen aber ich finde es ist übertrieben. Die Kirche bleibt dann nicht mehr im Dorf wenn versucht wird herauszufinden ob es zum Blitzeinschlag kommt wenn schon 1.000 Partien vorliegen.

Ich denke dann mit den geringsten Mitteln den größtmöglichen Erfolg. Und diese geringsten Mittel können immer noch weiter und weiter optimiert werden.
Wie kann ich mit 1.000 Partien noch besseres erzielen, das interessiert mich.

Anders wenn ich z. B. eine Engine teste und muss herausfinden ob eine Verbesserung wirklich etwas gebracht hat und das dann mittels Elo ... dann sind mehr Partien notwendig. Aber hier stellt sich dann die Frage das möglich viele unterschiedliche Engines ein besseres Ergebnis produzieren als viele gleiche Engines. Wobei ich zugeben muss ... würde es weitere 20 Engines von 2.700 - aufwärts geben hätte ich auch leicht unterschiedliche Resultate. Insofern ist dann auch Kritik angemessen von Personen die mit Clones arbeiten um eine Spielstärke zu messen. Es ist alles nicht so einfach und ein genaues Ergebnis ob mit vielen Partien mehr als 1.000 ist NIE möglich. Aber wir können schon in etwa feststellen wo die Spielstärke liegt.

Und was ich jetzt schreibe ist vermessen aber das sind meine Erfahrungen ...
1.000 Partien mit vielen unterschiedlichen Engines misst genauer als 10.000 Partien mit vielen gleichen Engines trotz der Kritik die ich teils nachvollziehen kann teils nicht. Aber da ich die Weisheit auch nicht gepachtet habe hege ich gar keinen Anspruch darauf das das was ich denke auch immer richtig sein muss. Dafür ist das Thema zu kompliziert.

Gruß
Frank
Parent - - By Joe Boden Date 2014-08-14 09:38
Hallo Frank,

danke für die Begeisterung, die Du hier ins Forum reinbringst.

Das wirkt ansteckend und inspirierend und Du bleibst immer positiv eingestellt. Das ist ein hilfreicher Gegenpunkt zu all denen, die hier nur immer meckern, alles kleinreden, kritisieren und bezweifeln. Tolle Einstellung von Dir, auch wenn Du manchmal schon fast vor Enthusiasmus zu zerplatzen drohst.

Deine SF-Ergebnisse decken sich in etwa mit denen von Stefan Pohl, der ja die aktuellen Stockis ca. 20 Punkt vor SF5 sieht.

Freue mich auf weitere Berichte von Dir!
Parent - - By Frank Quisinsky Date 2014-08-14 09:47
Hi Joe,

wobei Stefan mit seiner Art zu testen zwar nicht unbedingt Jubelschreie bei mir auslöst (hätte keine Lust so zu testen, muss auch etwas von den Partien haben) aber seine Ergebnisse sind gut. Es gibt immer mehrere Wege die nach Rom führen aber nur einer führt direkt zum Goldschatz der dort vielleicht vergraben liegt. Dieser Weg ist nur noch nicht gefunden wurden

Deswegen, es ist wichtig das die die sich bemühen nicht alle gleiches tun und auch kontroverse unterschiedliche Ansatzpunkte haben. Führt zwar langfristig dazu das sich die Personen dann untereinander nicht so wirklich mögen aber das ist uninteressant. Will ja selbst niemand seine eigene Arbeit in Frage stellen und keiner liest gerne wenn es dann andere tun. Aber der feine aber kleine Unterschied ist es wenn es andere tun und es versuchen zu begründen ... dann wird's interessant. Einige ziehen sich dann wie beleidigte Leberwürste zurück oder lassen das HBMännchen raus. Ist auch OK, wird dann spannender

Ja, mein Ziel ist es immer gewesen zu animieren.
Egal was ich gemacht habe ... denn dadurch profitiere ich selbst.

Geben und nehmen ... bin ein Fan vom Energieausgleich!

Gruß
Frank
Parent - - By Tom Paul Date 2014-08-14 13:45
477.0  -  103.0    82.24%    Perf=3090

Sind inzwischen +30 ELO.
Parent - - By Frank Quisinsky Date 2014-08-14 14:57 Edited 2014-08-14 15:00
Hi Tom,

Shredder errechnet die Elo etwas anders als EloStat.
Für +30 müssen ca. 82.6 - 82.7% her.
Eher so +25 - +27 derzeit.

Mal schauen wie es steht ...
Gab gerade ein Remis gegen Texel ... also 82,20 ...
Drei der laufenden vier Partien steht Stockfish auf Gewinn ... wird also gleich ein 82,30%
Die vierte laufende Partie hat gerade begonnen.

Und jetzt kommen die Schwächeren ...
Könnte also bei 501-600 Partien wieder zu einer Steigerung kommen, dann sind es wohl ca. +27-+28 schätze ich mal.
Bedeutet so wahrscheinlich 83.0 - 84.0 Punkte werden es wieder.

Ein bissel was fehlt noch für +30 Elo.

Gruß
Frank

Und am Ende vom Round Robin schaue ich nach doppelten ECO Codes innerhalb der Matches.
Kann sein das dann wieder ein paar Partien wiederholt werden müssen.
Will keine doppelten Partien bis Zug 8 innerhalb der Matches.
Dann fliegt die neuste Partien raus (wenn 2x B38 und bis Zug Numemr 8 identisch).
Kleinkariert aber so gehe ich die ganze Zeit vor.
Parent - - By Frank Quisinsky Date 2014-08-14 15:45 Edited 2014-08-14 15:47
Gegen Zappa und Spike wird's Remis.
Die zwei anderen Partien stehen auf Gewinn und dann kommen noch die letzten drei.

Also derzeit 82,32 - 0,10 +0,6 und wahrscheinlich +0.9 maximal.
Also ca. 82,35 ca ... das wären dann ca. 3088 und +28 bei der nächsten Messung nach dann 600 Partien.
Mache dann direkt das Update, war eine Verlustpartie bei den letzten 100 Partien dabei, sofern ich verfolgt habe gegen Hiarcs.
Remisquote geht weiter runter !!

Dann kommt noch mal ne kritische Phase ... Partie Nummer 601-700 und dann regt sich kaum noch was und das Rating steht so gut wie "fest".

Gruß
Frank
Parent - - By Frank Quisinsky Date 2014-08-14 16:26 Edited 2014-08-14 17:08
Hi Tom,

alle vier laufenden Partien stehen auf Gewinn ...
Zur Zeit nach 595 82,27% + 0,12 = 82,39 und dann kommt noch die letzte gegen NirvanaChess.
ELO geht hoch auf 3088 - also derzeit dann +28

Breche dann mal für 1-2 Stunden ab.
Laufen also noch 4 Partien zu Ende, die letzten 3 der Runde 30 und die erste gegen Komodo der Runde 31.

Mache die Vernetzung der beiden Systeme und den Abgleich vom Bios.

Dann starte ich wieder.
Bringe vorher noch die Partien bzw. das Update auf meine Seite.

Gruß
Frank

Nirvana hält sich wacker und steht gut in D78 Leo-Grüner mit schwarz nach ausgeglichener Eröffnung.
Könnte Remis werden.

Komodo spielt E70 und Stocki spielt aggressiv auf dem Damenflügel.
Bewertung steigt langsam und langsam an ... derzeit +0,5 nach 23. Zügen.
Stecken alle Möglichkeiten bei Stockfish ... glaube nicht das die Partie verloren wird, eher muss Komodo hier kämpfen. Aber solche Systeme liegen Komodo.
Während Vajolet und Deuterium gerade zersägt werden. Also das endet mit 82,35 - 82,40 je nachdem wie die Nirvana Partie ausgeht.
Dame und Springer bei je sechs Bauern, Nirvana steht gut, sehe keinen Gewinnweg für Stockfish. Bewertung liegt bei 0,22 für Stockfish.
Wird bestimmt Remis!

Shit, ist SF frech ...
jetzt 1.28 gegen Nirvana ... hätte ich nicht gedacht.
Da gab es in der Tat doch noch ne Gemeinheit in der Stellung.
Einfach Brutal ... könnte also doch noch gewonnen werden.
Hätte ich nie gesehen!

Kommentiere ein wenig ohne das einer die Partie sehen kann
Sind ja gleich auf meiner Seite ...

Also die Partie gegen Komodo ist super interessant.
Komodo kam langsam zum Ausgleich und die Bewertung von SF geht auch hoch, 0.7.
SF spielt immer noch sehr aggressiv auf dem Damenflügel.
Wer behält recht?

Gegen Deuterium und Vajolet wurde gewonnen.
Laufen noch zwei Partien ...

Bei Nirvana spielt jetzt Dame gegen Dame bei je drei Bauern ...
Ein Bauer von Nirvana geht verloren.
Das wird wohl zu 95% ein Sieg für SF weil die Bauernstruktur das zulässt wenn die Damen nicht mehr wären.

Oh Shit ... Sf gibt die Quelle her.
Jetzt Dame und zwei Springer gegen Dame Läufer und Turm auf Komodo Seite.
Geht das ... kann es nicht glauben!

Ja geht
Komodo geht auf -0.9 und SF auf +0.9.
Nur wie soll das gewonnen werden?

Packe die Partie gleich mit ins Update, sind dann 601 Partien

Oh Mann 2.3 bei Stockfish und -1.2 bei Komodo ...
SF behält mal wieder Recht.
Jetzt sehe ich auch den Gewinnweg

Ja Komodo sieht es auch ... -1.8 ...
Das gewinnt SF nun sicher ... keine Frage mehr!

Und Nirvana ... -M12 ... gleich zu Ende.
Auch das hat SF gemeistert in Weltmeister Manier!

Mein Gott wie konnte das passieren ...
SF mit Dame und Springer und jetzt vier Bauern gegen Komodo mit Dame und Turm.
Da wurde alles abgeholzt ... das ist entschieden.

-1.37 bei Komodo
+2.78 bei Stockfish

Oder doch nicht ?
Komodo bei -1.1 und nur noch 3 Bauern ...
Stockfish bei +2.12 und die Bewertung von Komodo geht weiter runter ...
Nichts für schwache Nerven.

Geiles Endspiel ...
Parent - By Frank Quisinsky Date 2014-08-14 17:51
Hi,

Komodo hat sich alle Bauern zurückgeholt.

SF mit KDS
Komodo mit KD

Das sollte Remis sein.
Die Partie wird noch mindestens 50 Züge laufen.
Habe schon alle Updates auf der Seite ...
Partie 601 ist dann im nächsten Download drin.

Gruß
Frank
Parent - By Frank Quisinsky Date 2014-08-14 15:20 Edited 2014-08-14 15:39



So, das zweite System ist fertig gebaut.
Muss alles noch konfigurieren und vernetzten.

Unterschiede der beiden Systeme:
Andere SSD (1x OZX, 1x Samsung).
Leicht anderes Netzteil beim neueren System, auch von BeQuiet
Beide in fast gleichen Servergehäusen, nur ein wenig andere Blende.
Andere DVD Laufwerke in einem ist ein BlueRay Brenner drin.

Ansonsten habe ich 8GB Ram Riegel von Rechner 1 in Rechner 2 gesteckt.
Keine Lust welchen zu besorgen (hatte vorher 16Gb in Rechner 1).

Sonst:
Gleiches Kühlsystem (Gehäusekühler und Prozessorkühler von Noctua).
Gleiches Motherboard, gleicher Prozessor.

In den Rechnern, habe ich nur eine SSD, keine sonstige Festplatte ... keine Grafikkarte (nutze den Intel Grafik-Chip).
Frisst alles nur unnötig Strom.

Die Temperaturen bei 4.3 GHz und Raumtemperatur von 24 Grad liegt bei 56-58 Grad unter Voll-Last.
Konnte die Temperatur bei System um 6 Grad verringern. Hatte einen Denkfehler beim Anbringen der Lüfter, schon vor einiger Zeit geändert.
Rein theoretisch geht auch 4.5 GHz aber das kostet zu viel Strom denn der Stromverbraucht steigt dann überproportional an.

Hängt alles an einer Stromversorgung mit Überspannungsschutz etc.
Da passiert nichts.
Stromverbraucht ist optimiert, weniger geht nicht unter Voll-Last.
Beide Rechner arbeiten lautlos ... hörstde nichts.

Denke morgen Abend können dann zwei i7-4770k laufen.

Also, wichtig bei den Dingern ...
Maximale Leistung bei einem Core ... darauf lege ich wert ... dabei lautlos, stromsparend.
MehrCore Systeme bzw. andere Rechner interessieren mich eher wenig, weil dann meist die Leistung von einem Core runter geht.
Engine testen bedeutet für mich immer herauszufinden wie gut bei einem Core.

Also maximal mögliche Power bei Eng-Eng und einem Core mit 4.3 GHz.

Gruß
Frank
Parent - - By Tom Paul Date 2014-08-14 14:04
Komodo ist eben doch stärker im Übergang zum Endspiel und im Endspiel.
Das ist doch mal eine richtig üble Niederlage für Stockfish, wo er sich doch mit viel Vorteil + einem Mehrbauer im Mittelspiel sieht und das Endspiel war schon ein Hammer.
Hat jemand Verbesserungsvorschläge für Stockfish?
Ein Klick auf Zitieren, dann ist die Partie sichtbar.

Event:
Ort:
Datum:

Weiss:
Schwarz:

Ergebnis
Board
Parent - - By Frank Quisinsky Date 2014-08-14 16:14 Edited 2014-08-14 16:16
Hi Tom,

glaubst Du?
Im reinen Endspiel glaube ich das nicht.
Zumindest gleich stark wenn nicht gar SF stärker.
Kann es auch kaum glauben aber SF hat genau da auch zugelegt in den letzten Versionen.

Übergang Endspiel und sehr spätes Mittelspiel ... da glaube ich das Komodo einen Tick zäher ist, auch andere Ansätze verfolgt.

Im frühen Mittelspiel ist Komodo zwar deutlich aggressiver geworden aber hier und da immer noch ein wenig anfällig. Stockfish ist da ne Klasse besser als Komodo, geht auch besser mit den Eröffnungssystemen um. Glaube gar das Stockfish die erste Engine ist die nach der Theorie stark überwiegend richtig gute Ansätze in die Theorie bringen kann. Die meisten Systeme werden verstanden.

Übrigens wir haben ja noch den Clone Houdini.
Houdini spielt den Übergang zum Endspiel richtig gut.
Aber ich glaube nicht das Houdini dort stärker ist als Komodo.

Es gibt nichts was Houdini gut macht was Stockfish oder Komodo nicht besser können bis auf das vermeiden von frühen Remispartien vielleicht.

Also, wenn ich mir jetzt die Spielanlage und die Partien von Stockfish zu Gemüte führe hätte ich keine Verbesserungsidee bzw. ich kann beim Besten Willen keine Schwäche mehr sehen. Bis auf das noch die ganz frühen Remispartien weiter vermieden werden sollten. Aber so viele sind das gar nicht mehr.

Na ja ... Spielstärke ist erreicht da blickt ja niemand mehr durch bei den taktischen Kombinationen die Stockfish daher zaubert. Ich meine ich spiele schon sehr aggressiv aber bei Stockfish sehe ich Züge da raufen sich meine Nackenhaare und ich denke dann ... geht das denn überhaupt? Dann sehe ich 3-4 Züge weiter was damit eigentlich erreicht wurde. Die Programme spielen einfach nunmehr deutlich über unseren Level und nur in Analysen können wir teilweise noch verstehen. Ohne Hilfsmedium wären wir im Vergleich zu Stockfish und Komodo noch nicht mal Elo Nasen, da gibt es gar keinen Ausdruck für was wir wären. Deswegen wenn wir hier klagen oder etwas herausfinden nur deswegen weil wir uns im Computerschach besser auskennen als "normale" Schachspieler und weil wir wissen wie wir etwas zu analysieren haben.

Bin mal gespannt ob nach dieser Version von August 2014 Stockfish noch weiter verbessert werden kann.
Jetzt beginnt hier für mich die spannende Phase ... vorstellen kann ich mir das kaum noch, nicht mehr im Breitband des Vorstellbaren!

Gruß
Frank
Parent - By Tom Paul Date 2014-08-14 19:09
Komodo ist TOP in positionellen Endspielen.
Stockfish ist TOP in taktischen Endspielen.
Stockfish gegen andere, da entsteht spätestens nach den ersten Endspielzügen zu 90% ein taktisches Endspiel.
Stockfish gegen Komodo, da werden die Endspiele zu 90% positionell gespielt, weil das Level der Engines zu hoch ist um auf taktische Fehler hereinzufallen.
Und es gewinnt die Engine die mehr Wissen in diesem Bereich hat.
Parent - - By Tom Paul Date 2014-08-15 07:55
Auf deiner Seite, müsste da nicht die Engine mit der kleinsten Remisquote den Titel (T-Shirt) Remiskönig haben und
die Engine mit der größten Remisquote den Titel Remisopfer.
Parent - - By Frank Quisinsky Date 2014-08-15 16:08
Hi Tom,

na ja ... je nachdem wie das gesehen wird


So, jetzt laufen 8 Matches.
Sind noch 320 Partien zu spielen ...
Jetzt anstatt 125 dann 250 Partien pro Tag.

Sollte dann morgen gegen Mitternacht beendet sein.
Bin mal gespannt ob das funktioniert oder ob ich beim konfigurieren Fehler drin habe, hoffe nicht.

Fest steht es laufen 8 Matches

Gruß
Frank
Parent - - By Tom Paul Date 2014-08-15 19:17
Kann man ja noch etwas ergänzen.

Ps.     592.0  -  124.0    82.68%    Perf=3095
Spricht für sich selbst.
Parent - - By Frank Quisinsky Date 2014-08-15 20:37 Edited 2014-08-15 20:43
Hi Tom,

Ergebnis der letzten 23 Partien ...
22:1 für SF gegen den Rest der Welt ...
Sagte ja ... Achilles flitzt über das Schlachtfeld ... nicht Schachfeld.

Unglaublich, da geht die Elo weiter hoch.
Ein Einbruch von Partie nummer 701-800 ist also nicht zu erwarten.

Muss noch das Update nach Partienummer 700 auf die Seite bringen.
Es gab bislang nach 700 Partien 4 Partien mit gleichen ECO Code ab Zugnummer 8 ... das ist ärgerlich.
Die werden wiederholt. 3 Gewinnpartien von SF und eine Remispartie ... die Remis Partie ging wieder Remis aus und eine gewonnen wurde wieder gewonnen.
Die anderen beiden sind noch nicht gespielt.

Dauert noch ein bissel ...
Hält SF die 83% wären das gar 35 ELO Verbesserung zu SF5 Release!

Die zweite Maschine läuft gut ...
Temperatur vom System ist gar 1 Grad geringer als bei meinem ersten und liegt zwischen 56 und 59 Grad.
Könnte im Grunde auch mit 4.5 GHz aber dann geht der Stromverbrauch überproportional nach oben.

Gruß
Frank
Parent - - By Tom Paul Date 2014-08-15 22:08
620.5  -  129.5    82.73%    Perf=3097

Vielleicht noch mehr T-Shirts?
Parent - By Frank Quisinsky Date 2014-08-15 23:46
Hi Tom,

sind jetzt +32 nach 700 ...
Von 700 auf 1.000 verändert sich nicht mehr viel, es sei denn ne wirklich besonders gute oder schlechte Serie kommt.
Die 100ter Serien sind mal wieder sehr stabil, schaut einfach nicht danach aus.

Insofern wird's ausgehen mit +28 - + 36 Elo.
Das ist schon ein fantastisches Ergebnis.
Remisquote um ca. 4-5% runter, die Anzahl der kurzen Gewinne stark gestiegen.
Zugdurchschnitt minimal besser als bei der 5er Release Version.
Sehr wenige Verlustpartien ...

Das ist eine echte Nummer 1 in fast allen Belangen.
Ja, da könnte es wirklich noch ein paar T-Shirts geben.
Schaue ich mir an wenn das Turnier zu Ende ist.

Komme wohl auch erst dazu am Sonntag Abend die Seiten upzudaten.
Bringe noch das Update nach 800 Partien und dann kommt das Endergebnis erst am Sonntag Abend.
Muss am WE arbeiten.

Kannst aber zumindest LIVE die Turniertabelle verfolgen.

Anschließend startet dann NirvanaChess 1.7.
Hoffe das der Anschluss zu Platz 20 deutlich geringer wird.

Dann Smarthink 1.7 und die Vajolet Version von heute.
Geht ja jetzt schnell mit doppelter Power.

Viele Grüße
Frank

PS: Das war der interessanteste Round Robin den ich bislang gestartet habe.
Machte einfach Spaß SF zu verfolgen.
Parent - By Karl Müller Date 2014-08-16 01:30
Hallo und danke für den Tipp!

gerade im heutigen DDR 4+2 auf InfinityChess in der zweiten Runde aktiviert und mich vom4.auf den 2.Platz gespielt . . .
diese version ist echt ein Kracher . . .

Danke und gute Nacht

Karl alias meawk, rusticus und suzy . . .
Parent - By Benno Hartwig Date 2014-08-16 07:28
Eine tolle Serie spielt der SF ja bei dir!

Aber noch mal zum Verständnis:
Es ist schon ein SF vom 3.8.2014.
Also ein Vorgänger von jenem SF vom 9.8.2014, der bei Stefan zwar sehr gut, aber nicht wirklich besser als seine Vorgänger spielen konnte.
Richtig?

Benno
Up Topic Hauptforen / CSS-Forum / FCT1: Stockfish 03.08.14 BMI2 x64 (Zwischenfazit) nach 50%

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill