Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / FCT1: Stockfish 03.08.2014 BMI2 x64 Round Robin gestartet!
1 2 Previous Next  
- - By Frank Quisinsky Date 2014-08-10 16:04
Hallo zusammen,

nach dem Horror-Update Turnier mit 5.250 neuen 45-Minuten Partien läuft nun Stockfish 03.08.2014 BMI2 x64.

Ca. 125 Partien pro Tag, also 8 Tage.
Nach dem Round Robin werde ich eine zweite Maschine (baugleich) einsetzen.
Dann verkürzen sich die Durchgänge auf 4 Tage.

Viel Spaß beim Verfolgen!

Frank's Chess Page
http://www.amateurschach.de

Gruß
Frank

PS:
Gehe von ca. 20-30 Elo Zuwachs aus, schon alleine wegen Contemp, BMI2, Endgame databases zur offiziellen Version.
Schaun wir mal ...
Parent - - By Frank Quisinsky Date 2014-08-10 18:14 Edited 2014-08-10 18:54
Hallo zusammen,

ich habe nun schon etliche der knapp 40 Partien verfolgt.
Noch keine einzige Partie verloren, und so wie es ausschaut wird fast alles regelrecht abgeschlachtet.
Das ist ein Massaker was ich hier nach 40 Partien sehe.

2 sehr schwierige Eröffnungen konnte SF gegen die TOP3 (weiß nicht mehr, glaube gegen Fire und Komodo) Remis halten mit was für genialen Zügen.
Wenn das so weiter geht ist die Welt zufrieden
Remisquote bei unter 25% ...

Aber wie gesagt, das sind erst 40 Partien.
Aber das macht nichts, die Spielanlage ist entscheidend.
So druckvoll habe ich SF auch noch nicht gesehen. Gerade in ausgeglichenen Mittelspielstellungen viel druckvoller mit den Bauern.
Blicke selbst kaum noch durch bei den Kombinationen.

Mal schauen ob die dev. das halten kann.
Dann schaut es gar nach 50 Elo Verbesserung zur Release Version aus.
Nicht das direkt wieder die erste 100ter Serie die beste wird ... das Pech hatte ich bei den letzten 14 Round Robins aus SWCR2 und FCT1 schon 2x.

Übrigens, jedes Remis bislang war auch eines!
Noch nicht gesehen das ein halber Punkt verschenkt wurde.
Gaviota kämpft gerade tapfer um Stocki ein Remis abzutrotzen, eigentlich jetzt eine tote Remisstellung.
Aber Gaviota spielt ein gutes Endspiel und ist durchaus dazu in der Lage, hat irgendwie das Mittelspiel überstanden

Mein Gott, das sind 35.0 aus 40.0 = 87,5%.
SF5 scorte mit 79,6% nach 1.000 gegen die gleichen Gegner!

8% Unterschied wären, wenn das so bleibt, glatte 55 Elo zur SF5 Release Version oder 50 ELo zur letzten getesteten dev. Version von März 2014!
Das geht mit Sicherheit noch runter, glaube ich nicht ...

Aber bei dem Spielstil wundern mich jetzt zumindest 40 Elo überhaupt nicht.



Gruß
Frank

Allerdings läuft auch ein B93 Najdorf Mafiosi ...
Schwierig die Eröffnung für weiß und SF liegt bei -0,9 als weißer nach ausgeglichener Eröffnung gegen Komodo 7a. Gerade in der starken Partiephase von Komodo aber ich denke das ist Remis zu halten. Nach 42 Zügen, so langsam wird die Bewertung von Stockfish aber wieder besser ... die wird zu 90% Remis, zu 10% gewinnt Komodo. Auch hier wieder, witzig gespielt um den Ausgleich herbeizuführen bzw. einzuleiten. Unglaublich, das wird nun zu 99,9% Remis, unglaublich in dieser Stellung und das gegen Komodo 7a. Bei der Version SF5 hätte ich keinen Pfifferling mehr ... und im Brett nebenan wird GullChess an den Marterpfahl gepappt und dann sitzt ne alte Hexe mit der Voodoo Puppe davor und sticht zu. Grausamer Tod für GullChess ...

Genug für heute ... Schnauze voll vom Schach.
Geh ins Kino!
Parent - - By Frank Quisinsky Date 2014-08-10 19:10 Edited 2014-08-10 19:13
Da war die erste schnelle Remis Partie gegen Protector.
Muss man sich anschauen, einen dreifache unter 30 Züge.
Stellung sah schwierig aus ...

Gegen Fire auch sehr Remis verdächtig, aber kein schnelles Remis.
Fire hat gut gegen gehalten!

Warten wir einfach mal die ersten 200 Partien ab.
Melde mich dann wieder

Wirklich genug jetzt.
Aber schön wie GullChess an die Wand gespielt wurde.

Gruß
Frank
Parent - - By Krug Peter Date 2014-08-10 22:10
Hallo Frank,

wenn sich die Gelegenheit ergibt freuen wir uns wieder auf ein Partiebeispiel.

Peter
Parent - By Frank Quisinsky Date 2014-08-11 19:21 Edited 2014-08-11 19:29
Hallo Peter,

schaue Dir das mal an ...
Bei der Partien ist interessant wie Stockfish durch die Mitte kommt aber noch viel interessanter ist folgender Umstand:

Eröffnung geht bis Zug 10 von schwarz.
SF zieht als schwarzer 14. ... exd5 und kommt mit +2.13 daher.
Erst im Zug 21. a4 sieht Senpai das Unheil und geht auf -1.28 während Stockfish sich zwischenzeitlich schon auf fast 4.0 hochgeschraubt hat.
Also noch in Zug 20. sieht Senpai alles ausgeglichen ... 6 Züge nachdem SF schon alles kommen sah.

Das ist überhaupt auch das Senpai Problem.
Diese Engine spielt bei vielen Figuren auf dem Brett sehr passiv und sieht einfach viel zu wenig.
Daher auch deutlich mehr schnelle Verluste und kaum Gewinne. Dieses Problem hatte schon Fruit ... die Königssicherheit war eine Katastrophe bei Fruit und von schnellen Angriffen war nichts zu sehen.

Treffen die richtigen beiden aufeinander.
Gab noch zwei andere schnelle Gewinnpartien unter 40 Zügen, eine zweite gegen Senapai und eine gegen Gaviota.
Aber ich finde nicht wirklich etwas so besonderes auch wenn schöne Mattbilder.

Aber diese hier finde ich ganz interessant.
Nicht zuletzt weil Senpai dann doch etwas sehr früh versucht hat und die schwarze Stellung von SF nun auch nicht so gut aussah. Aber wie SF sich dann befreit hat und wie der König in der Mitte leiden musste ist schon beachtlich. Sehr aggressives Spiel mit den Bauern, dass ist auch das was SF auszeichnet und das ist aber auch das was dann der Engine hier und da zum Remis-Verhängnis wird. Finde den Stil von Stockfish einfach Klasse aber ich bin mir gar nicht mehr so sicher ob das mit weniger Remisen auch noch so geht.

Event:
Ort:
Datum:

Weiss:
Schwarz:

Ergebnis
Board
Parent - - By Michael Scheidl Date 2014-08-11 07:25
Worauf stellst Du den Contemptfaktor bei Stockfish ein (ich habe mich "freihändig" zu 10 entschlossen)?
Parent - - By Frank Quisinsky Date 2014-08-11 07:41 Edited 2014-08-11 07:43
Hallo Michael,

ich habe an den Standard Settings nichts verändert.
Will gar nicht damit anfangen Settings zu testen, es sei denn es sind Hash-Einstellungen.

Dachte das der Contemp schon integriert ist bzw. zusätzliche Optionen diesen nur erhöhen?
So wie es ausschaut geht die Prozentzahl zusehend nach unten und offenbar auch wieder viele Remis Partien.

MIST !!
Egal, teste ich halt unter Umständen 2x

Schaue ich mir später an, sitze nicht an dem PC.
Habe ja auch bald den zweiten PC im Einsatz da ist ein solcher Test schnell durchgelaufen.

Gruß
Frank

Hinweis:
Die Konfigurationseinstellungen der Engines sind im Download zu den FCT1 Partien enthalten.
Wie auch die History zu den Listen etc.
Parent - - By Michael Scheidl Date 2014-08-11 08:25
Aha, danke. - Der Contempt 20 wurde laut Abrok-Einträgen am 15. Juli eingebaut, aber am 20. Juli wieder zurückgesetzt.

Gar nicht so leicht, dort den Überblick zu behalten. Ich schau aber gerne öfters rein; wann gibt es schon die Top-Engine kostenlos und mit häufigen Aktualisierungen... Mitunter lade ich dann herunter, aktualisiere bei mir aber nicht so oft wie vermeintliche Fortschritte gemacht werden.

P.S. Die Syzygy-SF. werden derzeit nur noch in größeren Abständen, ich glaube nur bei "functional changes", hergestellt. Doch nur dann lade ich u.U. herunter, zwecks beider ansonsten gleicher Versionen, und betrachte das andere als Zwischeninformation.
Parent - - By Frank Quisinsky Date 2014-08-11 19:40
Hallo Michael,

Es liegt ja ausreichend Partiematerial vor um den Contemp zu optimieren. Postete ja glaube ich schon 7-8 schnelle Remisstellungen in Talkchess. Kann schnell ne riesige Datenbank als Test-Datenbank benutzt werden. Aber ich bin mir derzeit gar nicht mehr so sicher ob das Stockfish Team nicht Recht behält. Der Spielstil von Stockfish führt hier und da auch zu schnellen Remispartien, nicht zuletzt weil so heftig geöffnet wird und sehr aggressiv mit den Bauern gearbeitet wird. Keine Ahnung, denke ein intelligenter Contemp wäre die Lösung aber das ist sicherlich auch nicht einfach zu programmieren. Hatte da kürzlich zwei Ideen gepostet. Denke die Programmierer wissen es besser und probierten da sicherlich auch schon einiges aus.

Muss auch immer noch gesehen werden, dass SF weniger Verlustpartien produziert als z. B. Komodo. Die werden dann meist auch Remis bzw. wird hier auch immer noch irgend ein Weg gefunden. Dann lieber weniger Verluste und mehr Remise.

Werde keinen zweiten SF Test hinten dran hängen.
Werde nach dem Test dann NirvanaChess 1.7 und SmarThink 1.7 testen.
Finde ich auch interessanter, bin schon sehr neugierig auf diese beiden Udpates, gerade auf das SmarThink Update.
Beide Engines werden sehr schnell upgedatet, wahrscheinlich wird schon wieder eine neue Version gebracht während dann der Test noch läuft oder gerade abgeschlossen ist.
Aber so mag ich das, meine wenn sich bei den ausgewählten TOP-21 etwas regt und ich keine Engine Leichen unter den TOP-21 habe und die Plätze dann für aufstrebende Engines blockiert werden.

Viele Grüße
Frank
Parent - - By Tom Paul Date 2014-08-11 20:47
Stockfish sollte in der Eröffnung eben nicht zu heftig öffnen und nicht zu aggressiv agieren, weil oft einfach nur ausgeglichene Stellungen entstehen und kaum Figuren für einen Gewinn übrig bleiben.
Daher eher positionell spielen, somit wird der Gegner erstens ausmanövriert und zweitens wird dadurch die Anzahl der Partiezüge verlängert, was höhere Chancen für einen gegnerischen Patzer bietet.
Parent - By Frank Quisinsky Date 2014-08-11 21:29
Hi Tom,

das sehe ich anders.
Gerade das macht doch den Reiz aus.
Es müssen nicht alle Engines gleich spielen und das schnelle öffnen ist optimal für taktische Analysen.

Hier geht es mal so eben nicht darum den letzten Elo heraus zu kitzeln gegen irgend welche anderen Engines.
Sondern um eine optimale Analyseengine zu haben.

Ich hoffe nicht das da irgend etwas geändert wird und eher versucht wird das Stockfish diesen gigantisch guten Stil halten kann.

Übrigens, wegen Deiner Frage zu den Verlusten.
Ich habe das jetzt während des laufenden Round Robin wieder so gestaltet wie bei der SWCR2.
In 100ter Stepps dann die Zahlen und Fakten auf meiner Startseite.
Problematisch hier, wenn ein zweiter Rechner hinzukommt und 250 Partien pro Tag produziert werden wird es schwieriger schnelle Updates auf die Seite zu bringen. Sitze nicht rund um die Uhr an meinem PC, muss ja auch noch arbeiten

Aber mal schauen ...

Gruß
Frank
Parent - - By Tom Paul Date 2014-08-11 09:04
Das Problem mit der Remisquote ist doch, dass diese nur so hoch ist, weil Stockfish die Stellungen falsch bewertet.
Entweder spielt die Engine aus 5 möglichen +0.00 Varianten die mit dem 3-Fold Rep in 8 Zügen.
Oder bewertet 5 Varianten mit +0.00 in Wirklichkeit waren aber nur zwei davon +0.00 und der Rest eben besser, was Komodo sieht und Stockfish eben nicht.
Parent - - By Benno Hartwig Date 2014-08-11 09:25
Angenommen du lässt SF spielen, und immer, wenn er einen 0,00-Zug spielen will, darf auch Komodo rechnen, und wenn Komodo einen Zug dann besser als 0,00 bewertet, dann wird eben dieser Zug ausgeführt, und SF spielt danach mit gleichen Regeln weiter.

Würde deiner Meinung nach dadurch wirklich ein stärkeres Spiel entstehen?
Oder wäre ggf. die Komodo-Fehlerquote doch so hoch, dass das Spiel durchschnittlich eher schwächer würde?

Benno
Parent - - By Tom Paul Date 2014-08-11 09:34
Im Moment mache ich es so z.B. bei Analysen:
Stockfish will einen +0.00 Zug spielen dann schaue ich in den MV 5 Modus und sehe aha es gibt nicht nur einen +0.00 Zug, dann nehme ich Komodo im MV 5 Modus und schaue mir an welche Züge übereinstimmen! und welche Komodo davon am besten bewertet und der beste Zug davon wird dann gespielt.
Und das führt zu einer Spielstärkesteigerung, weil sich später oft herausstellt das dieses +0.00 was Stockfish vorgeschlagen hatte eben kein +0.00 war oder eben doch, aber eines der anderen +0.00 war kein +0.00.
Parent - By Benno Hartwig Date 2014-08-11 11:10
Ich will gern glauben, dass es vorkommt, dass SF einen Zug mit 0,00 bewertet und dabei in der Hauptvariante eine Stellungswwiederholung anbietet,
während Komodo demselben Zug eine andere Bewertung gibt und nicht meint, dass das optimale Spiel beider Spieler zu einer Stellungswiederholung führt.

Nur: wer von den beiden hat in solchen Fällen eigentlich häufiger recht? So rein schachlich,
und ohne einen "Ich bin doch eh jedem überlegen!"-Hintergedanken und ohne ein freundschaftliches "Mein Herrchen will doch spielen, da kann ich doch nicht so schnell remisieren!".

Benno
Parent - - By Tom Paul Date 2014-08-11 12:52
Hat Stockfish schon eine Partie verloren?
Gegen Komodo vielleicht?
Parent - - By Frank Quisinsky Date 2014-08-11 19:02
Hallo Tom,

zur Zeit ...

Gewonnen: 117
Remis: 62
Verloren: 1

= 34,4% Remise ... davon 5 unter 40 Zügen.
Von diesen fünf dann zwei vielleicht fraglich.
Zügedurchschnitt wie bei der Version 5 derzeit 80 und mithin ultra gering!

Derzeit laufen die Partien gegen Stockfish, Fire und GullChess ... lass mich mal schauen ...
Gegen Komodo wird Remis, auch gegen GullChess (absolute klare Remisstellungen im Endspiel). Fire wird geschlagen, kurz vor dem Matt.

Gegen Komodo also noch keine Partie gewonnen, 9x Remis und eine verloren.
Habe die letzten Partien nicht verfolgt aber ich denke es schaut nach den dann doch erwarteten 20-30 Elo Gewinn zu der Release Version aus.

Könnte wirklich ein bissel schneller bei mir laufen.
Na ja, bald setzte ich ein zweites System ein, vielleicht ja schon am WE fertig.

Gruß
Frank
Parent - - By Frank Quisinsky Date 2014-08-11 22:48
Hi,

so, die Stats die dann zukünftig genau so erfolgen sind auf den Seiten.
SF hat jetzt nach 204 Partien 2x verloren (gerade gab es gegen GullChess ne Klatsche).

Super Schnitt ... pro 100 Partien eine Verlustpartie!
Wären dann 10 nach den 1.000 Partien ... ob der fantastische Schnitt gehalten werden kann?

Bin mal gespannt ob ein Einbruch kommt ...
Die Stats der beiden 100ter Serien sind fast identisch!
Insofern sieht eigentlich schon recht früh alles nach einem sicheren Ergebnis aus.
Aber es gab bei den ca. 180 ... 100ter Serien die ich aufgenommen habe schon 2x die Situation das zwei gute oder zwei schlechte Serien in Folge produziert wurden.
Bleibt nun die dritte 100ter Serie auch so wie die ersten beiden ... dann sollte das Rating in der Tat recht früh recht sicher sein.

Gruß
Frank
Parent - - By Tom Paul Date 2014-08-12 07:17
Zwei Niederlagen gegen Komodo und eine gegen Gull.
Parent - - By Tom Paul Date 2014-08-12 09:49
3x gegen Komodo?
Parent - - By Frank Quisinsky Date 2014-08-12 10:05 Edited 2014-08-12 10:22
Hallo Tom,

3x gegen Komodo 7a und die dann alle zwischen Zug 70-80 ... wird auch hier wie der 23.5 : 26.5 Niederlage von SF5 gegen Komodo 7a deutlich wo Komodo ansetzt um SF zu bezwingen. Also, Stockfish ist keinesfalls die Überengine und hat Schwächen die Komodo sehr schön aufzeigt. Auch Ansatzweise Zappa, denn SF kann die Spiele durch gutes positionelles Spiel von Zappa im späten Mittelspiel nicht für sich entscheiden. Irgendwie auch klar, dass es Zappa ist hier eine schwäche aufzeigt. Da Zappa zu schwach ist werden aber immerhin viele Remise regelrecht erkämpft.

1x gegen GullChess 3.0
1x gegen Junior

und diese Partie von Junior ist genial.
Poste die gleich!

Gruß
Frank

Übrigens, nach wie vor nur 5 schnelle Remis bis 40 Züge ... daran hat sich nichts geändert.
Gehe davon aus, das die Remisquote noch sinken wird.
Parent - - By Frank Quisinsky Date 2014-08-12 10:59 Edited 2014-08-12 11:05
Hi,

die nächste Niederlage gegen Komodo ...
Da müssen die SF Fans halt mit Leben, wie auch schon bei SF5 - Kom7a (endete mit 23,5 : 26.5) findet SF zumindest im direkten Vergleich den Maestro.

Wird schwierig nun 4 Punkte aufzuholen.

Aber bei schneller Intel Hardware und längeren Zeiten wird's dann doch deutlicher wo die Stärke von Komodo 7a liegt.
Sind heit nicht alles IPP Clones die da mal weggeputzt werden.
Und bei den vielen IPP Clones in den Listen wird auch SF dann deutlicher vorne liegen.

Das ist genau das Problem beim Engine testen, gleiche Engines manipulieren die Stats zu sehr.

Gruß
Frank

Dafür wurde in der Runde Fire, Protector und GullChess bezwungen ...
Dennoch, denke SF spielt gerade eine schlechte 100ter Serie ... mal schauen, wesentlich weniger Remis Partien in der aktuellen Serie zwischen Partiennummer 201-300
Werde heute Abend dann wieder updaten, muss weg (Arbeit ruft).
Parent - - By Benno Hartwig Date 2014-08-12 11:09

> wie auch schon bei SF5 - Kom7a (endete mit 23,5 : 26.5) findet SF zumindest im direkten Vergleich den Maestro.


Das wäre natürlich spannend, wenn sich sowas auf Dauer wirklich bestätigen lässt!
Ich hatte halt auch im direkten Vergleich eher einen kleinen SF-Vorsprung vermutet.
Ein kleiner Vorsprung, der bei 50 Partien aber eben auch der geringfügig schwächeren Engine noch ganz anständige Chancen auf den Sieg lässt.
Benno
Parent - - By Frank Quisinsky Date 2014-08-12 11:17
Hi Benno,

für einen direkten Vergleich sind 50 Partien auch nicht wirklich genug.
Aber bald sind es dann 2x 50 Partien und noch viel interessanter ist was in den Partien dann passiert.

Die Frage welche Engine die wirkliche Nummer 1 ist bleibt auch wenn Stockfish knapp vorne liegen sollte unbeantwortet.

Die Spielstärke gegen Menschen im Übergang zum Endspiel reicht bei beiden Engines aus. Mit taktischen Engines haben Menschen mehr Probleme, übersehen schneller das eine oder andere. Insofern wäre SF auch zu Recht knapp vorne. Aber bei den schwierigen Analysen im späten Mittelspiel scheint Komodo dann doch besser zu sein als Stockfish. Und je mehr Zeit für Analysen daher kommen ... desto deutlicher wird es "vermutlich" werden. Komodo ist taktisch deutlich besser geworden, wer viel für sich sieht, sieht es auch gegen sich. Mit dem Schach welches Stockfish liebt kommt die Engine gegen Komodo nicht durch, weil Komodo es sieht ...

Gruß
Frank
Parent - - By Benno Hartwig Date 2014-08-12 11:35

> Und je mehr Zeit für Analysen daher kommen ... desto deutlicher wird es "vermutlich" werden. Komodo ist taktisch deutlich besser geworden, wer viel für sich sieht, sieht es auch gegen sich. Mit dem Schach welches Stockfish liebt kommt die Engine gegen Komodo nicht durch, weil Komodo es sieht ...


Und so wird die nächste TCEC-Runde (ich hoffe doch, dass die irgendwann kommen wird) wieder Infos zu interessanten Fragen bieten.

Benno
Parent - - By Frank Quisinsky Date 2014-08-12 11:42 Edited 2014-08-12 11:49
Hi Benno,

bei TCEC schlafe ich ein ... Partien dauern zu lange um konzentriert zu verfolgen.
Hatte kurz vor Ende mal ein Turnier gespielt mit 40 Züge in 150 Minuten wiederkehrend.
Mir sehr viel Mühe gemacht vor ca. 3 Jahren aber das Turnier war einfach zum einschlafen, würde ich nie mehr wiederholen.

Auch liegen nicht genug Partien vor um echte Ansatzpunkte zu haben.

Dennoch interessant, guter Ansatz und eine 100%tige Umsetzung.
Aber nichts für mich, kann daraus keine Schlüsse ziehe ... verstehe es aber das einige TCEC mögen.

Außerdem spielen mir dort zu viele Clones und gerade bei solchen Turnieren wie TCEC sollte man diesen keine Bühne geben.
Das verärgert nur wirkliche Entwickler, sorry aber das sind die nackten Tatsachen!

Aber und das ist wichtig ...
Viele Ansatzpunkte erhöhen den Reiz.
Wenn mögliche viele eigene Konzepte aufziehen bleibt es spannend für die Community und von daher finde ich jede echte Arbeit wirklich gut denn diese steht immer im Mittelpunkt ... jemand bemüht sich!

Gruß
Frank
Parent - - By Daniel Riesner Date 2014-08-12 18:32
Hallo Frank,

welche Engines würdest du persönlich auf deine "Clone-Liste" setzen?

Gruß
Daniel
Parent - - By Frank Quisinsky Date 2014-08-12 21:31
Hallo Daniel,

im Grunde so wie ich es ja praktiziere.
Rybka ist strittig, bin hier selbst überfragt ...
Houdini ist klar zu 99,9 ein Robbolito, dass ist alles bekannt.

Würde immer nur den Ursprung einsetzen, so dann Fire, denn aus Robbolite ist Robbolito und dann Fire von der gleichen Person entstanden.

Critter ist im Grunde ein Houdini und Naum ist ein Rybka.
So geht es aus x Diskussionen hervor und ist auch im Clone Vergleich schön zu sehen (siehe Link ganz am Anfang von meinem News-Ticker).

Jetzt stelle Dir mal eine Ratingliste vor ...
Rybka drin, Critter, Houdini, Bouqet, Equinix ... da spielen immer die gleichen Engines.

Aus Rybka soll IPP entstanden sein, aus Fruit dann der Rybka ...

Ich weiß nicht, diese Themen demotivieren Personen die schon länger dabei sind.
Gut ist das ganze Zeug einfach zu blocken, ist eh alles das gleiche.
Dachte Anfangs da auch mal anders und nahm Ivenhoe in die SWCR 1 auf, die Houdini's, Critters ... aber wenn ich mir die Stats anschaue verliere ich dann schnell die Lust.
x-mal das Gleiche, macht mir persönlich keinen Spaß!

Das wäre so als wenn ich eine Ratingliste erstelle und habe bei 20 Programmen 10x TheKing Spielstile drin.
Das verzerrt die ganzen Ergebnisse für die Nicht-Clones.

Was bringen dann tausende von Partien wenn 1 Programm zu 10 Teilen auftaucht. Die ganze Partien sind für die Katz, die ganze Liste verzerrt die Ergebnisse der Nicht-Clones.
Das alles haben wir uns selbst gezüchtet und kommen so richtig nicht mehr raus aus der Geschichte.
Und ich mit meinem Freiheitstrieb alles muss kompatibel werden habe meinen Anteil dazu ja nun auch geleistet und das ärgert mich.
Das wollte ich seinerzeit nie erreichen.

Gruß
Frank
Parent - - By Benno Hartwig Date 2014-08-13 07:57 Edited 2014-08-13 07:59

> Rybka drin, Critter, Houdini, Bouqet, Equinix ... da spielen immer die gleichen Engines


Dass mglw. das eine aus dem anderen entwickelt wurde, auf welchen verschlungenen Pfaden auch immer, und dass man manche Engine dann auch ablehnen möchte, will ich ja gern anerkennen.
Aber z.B. Rybka und Houdini sind aus meiner Sicht doch so sehr unterschiedlich, dass ich aus 'Ähnlichkeitsgründen'  sicher nicht auf Houdini verzichten möchte, nur weil ich bereits Rybka habe.
Beispielsweise weist http://www.husvankempen.de/nunn/5Plus3Rating/5Plus3AllVersion/rangliste.html immerhin 176 ELO Differenz aus. Irgendwas muss da ziemlich unähnlich, verdammt ungleich sein, denke ich.

Benno
Parent - - By Frank Quisinsky Date 2014-08-13 08:33
Hallo Benno,

die ELO Differenz sagt nichts über den grundsätzlich gleichen Aufbau einer Engine aus.

z. B.
Houdini / Fire ...
Die Spielanlage ist und bleibt gleich. Natürlich spielt Houdini ca. 100 ELO besser durch Verbesserungen die eingeflossen sind.
Ein Fritz bleibt auch ein Fritz ob in Version 7 oder 8.

Wir könnten auch ein Round Robin starten in dem z. B. neben Houdini 1 dann Houdini 2, 3, 4 starten.
Das wäre genau so als ob Houdini 1, 3, 4 mit Fire spielt.

Das bringt nichts !!

Die IPP Sourcen sind offenbar aus Rybka entstanden. Sofern ich das noch alles richtig im Kopf habe war der Endspiel Code unklar. So war es dann seinerzeit auch klar, dass die ersten IPPs im Endspiel nicht vergleichbar waren mit Rybka aber andere Verbesserungen eingeflossen sind. Die ersten IPPs spielten genauso passiv nach der Eröffnung wie Rybka, spielten das Mittelspiel gleich und sind im Endspiel hier und da leicht abgefallen. Fruit spielt genauso passiv wie Rybka 1 und ist genauso anfällig für schnelle Angriffe wie Rybka 1. Sämtliche Stats sind immer gleich!

Und was habe ich nun davon wenn ich ein Houdini, ein Fire, ein Equinox, ein Critter etc. in einer Liste habe.
Es wäre vergleichbar als wenn in einem Round Robin z. B. dann Komodo gegen Houdini 1, 2, 3, 4 antreten muss, nur das die Houdini's dann andere Namen haben bei denen dann irgend welche Leute irgend etwas verändert haben.

Erneut ...
Das bringt nichts!

Da werden hier Vorträge gehalten wie viele Partien notwendig sind (Blitzeinschlagtheorie) und im selben Atemzug werden dann die Arbeiten so fragwürdig weil eine Engine zu x Anteilen vorhanden ist. Zugegeben es ist schwierig den guten Mix zu finden und auszusortieren was spielt und was spielt nicht. Eine Möglichkeit ist es, alles zu ignorieren und einfach alles spielen zu lassen. Einige Listenbetreiber gehen so vor. Das ist der einfache Weg aber das bedeutet auch ich gebe den Clonern die Bühne frei und trete mit Füßen auf Entwickler die dann wirklich in Eigenarbeit etwas aufgebaut haben. Das demotiviert wirkliche Entwickler wobei die echten Entwickler sich auch sagen, wir sehen ein dass es schwierig ist auszusortieren.

Das ist z. B. Houdini und Rybka bei mir rausgenommen haben ist selbst bei einigen der hartgesonnenen Clone-Gegner auf Missgefallen gestoßen. Jetzt haben doch die Engines oben keine Gegner mehr. Ja, aber dann ist es so denke ich mir. Rybka und Fruit (Bitboards vorhanden ja / nein und was nicht alles für Diskussionen um dieses Thema. Habe mittlerweile viele Informationen vorliegen von Personen die mir schrieben oder leicht verkündeten, ja wir haben Ideen von Fabien genutzt aber wer hat es seinerzeit zugegeben, wer?

Die schwarzen Schafe sitzen eher bei den Programmieren. Die Anwender nutzen das was da ist und wollen sich mit dem Thema meist auch gar nicht wirklich beschäftigen. Sie schauen auf die Leistung und nutzen. Aber wenn wir etwas messen und wollen es dann auch so gut es geht tun dann stoßen Ratinglistenbetreiber auf dieses Problem, zumindest ich.

Es ist OK wie es ist. In allen mir bekannten Listen spielen die Clones. Also haben wir jetzt eine wo die Clones nicht spielen und können dann auch mal ein wenig vergleichen. Wie gesagt, nicht alle müssen alles gleich machen und nicht alle müssen immer die gleiche Denke mitbringen. Wäre es so, HILFE!

Finde alles ist im grünen Bereich.
Nur ich für meinen Teil habe keine Lust aufgrund der Themen die ich ehrlich gesagt ... schei.. finde mich selbst um das zu bringen was ich mag. Bin mit meiner Liste und den Bedingungen nun sehr zufrieden und habe mächtig Spaß beim zusehen. Zwei Engines hätte ich gerne draußen weil zu alt und der Spieltil gleich ist aber kommt noch.

Einen verfügbaren Sjeng hätte ich gerne drin (die Engine ist aber nirgends mehr verfügbar). Jonny hätte ich gerne drin (aber privater Status). Auch Booot hätte ich gerne wieder drin (Buggy). Ich gehe einfach hart vor wer spielen darf und wer nicht und auch wenn dann einige Engines nicht mehr auftauchen gelingt mir aufgrund der Masse an Programmen immer eine gute Zusammenstellung.

Gruß
Frank
Parent - By Benno Hartwig Date 2014-08-13 09:36 Edited 2014-08-13 10:18
Thanx für deine Ausführungen.
Und es ist schon richtig: Es ist gut, wenn Tester und Listenbetreiber verschiedene Ansätze verfolgen.

> Ein Fritz bleibt auch ein Fritz ob in Version 7 oder 8.


Klar. Allerdings könnte der Spielstärkeunterschied Rybka-Houdini eher zu der Frage motivieren:
"War Fritz 4 auch schon so richtig Fritz wie Fritz 8?"   

Benno
Parent - By Kalle Wirsch Date 2014-08-13 11:34
Ich verstehe nichts....

Kannst Du das bitte mal ins Reine schreiben?
Parent - - By Tom Paul Date 2014-08-12 14:30 Upvotes 1
Zeig uns mal die Niederlage gegen Gull.

Kannst die Partie ruhig als PGN einfügen, wir klicken dann einfach auf Zitieren und schauen uns die Partie an.
Parent - By Frank Quisinsky Date 2014-08-12 21:32
Hallo Tom,

bald läuft eine zweite Hardware und dann stehen die Ergebnisse immer 4 Tage später zum Download.
Es ist zu viel Arbeit noch mehr darzustellen.

Denke ich mache da schon genug und mache ich mehr bleibt es nicht mehr im privaten Rahmen.
Dann wird es Stress und darauf habe ich heute keine Lust mehr.

Gruß
Frank
Parent - By Frank Quisinsky Date 2014-08-12 22:32
Hallo Tom,

habe jetzt das Update nach 300 Partien Online.
Du findest neben den LIVE Link den Download Link für die ersten 300 Partien.
Lade runter und dann kannst Du Dir alle Partien selbst anschauen.

Das so zu gestalten, während ein Round Robin läuft wäre kein Problem.

Gruß
Frank
Parent - - By Tom Paul Date 2014-08-13 07:43
10.c5 war der letzte Vorgabezug.
Danach kam 11. Lb2 mit +0.53/d18
Stockfish schlägt bei mir Sh4 +0.60/d30 und Komodo Sh4 +0.70/d25 vor.
Stockfish Lb2 +0.60/d32 und Komodo Lb2 +0.50/d23.
Dazu kommt noch das weiß jede Figur die er will ganz leicht entwickeln kann und schwarz nicht.
Sieht für mich eindeutig nach zu viel Vorteil aus, da ist es kein Wunder das Gull gewonnen hatte und Stockfishs Chance auf den Sieg genau 2% betrug.
Beim Rückspiel wird Gull eine 1% Chance auf den Sieg haben. Somit steht jetzt schon 2x 1-0 fest.
Bei einer ausgeglichenen Stellung +0.00 beim Hin- und Rückspiel hätte Stockfish aufgrund seiner Spielstärke jeweils eine (75%) Chance auf den Sieg.
Somit wäre das realistische Ergebnis 2 Punkte für Stockfish und 0 für Gull oder bestenfalls 0,5 Punkte für Gull und 1,5 Punkte für Stockfish.

Event:
Ort:
Datum:

Weiss:
Schwarz:

Ergebnis
Board
Parent - By Frank Quisinsky Date 2014-08-13 08:08 Edited 2014-08-13 08:41
Hallo Tom,

gibt kein Rückspiel.
Es wird aus einem Buch gespielt.

Leichte Vorteile +- gleichen sich aus.
Es gibt z. B. zwei Partien in der Datenbank da startet SF mit -1.0 und zeigt sehr schön auf welche Power in der Eröffnung steckt und gewinnt beide Partien.

Diese Eröffnung steht auch nicht auf meiner ToDo Liste.
Die Ergebnisse sind ausgeglichen.

Da gibt es ganz andere die zweifelhaft für Computerschach sind. Viele aus Königsindisch ... die rauben mir den Nerv.
Aber die meisten bleiben drin weil die Eröffnungstheorie nicht nur aus Damengambit besteht.

Das ist Schach ...
Wir haben 500 ECO codes !!
Selten gespielte aus GM Praxis werden auch bei mir selten gespielt ...
Das ist alles schon optimiert und ich denke mir einfach das die GMs hier mehr Wissen haben als die Computerschachprogramme, die wissen was gut ist und was spielbar ist.

Musst das von einer anderen Perspektive sehen.
Computerschach soll uns auch etwas bringen, z. B. beim Zusehen!
Lerneffekt, Zufallseffekt ... so bleiben die Partien beim verfolgen stets spannend.

Ich halte rein gar nichts von Vorgabestellungen bei einer Eng-Eng Liste.
Warum sollte ich mich als User, der das organisiert, einschränken, und immer das Gleiche mir antun?
Schrecklich, ist dann nur noch ein Selbstzweck mit dem Ziel irgend eine dumme Statistik zu erstellen.

Habe mal zu diesem Thema, während das FCT1 Basic Turnier 2 lief, experimentiert.
Alles was über 0.6 ging aus der Theorie an Partien entfernt und dann wieder die Liste ausrechnen lassen.

Hochinteressantes Experiment wie ich finde !!!
Kannst Du selbst machen, alle Partien mit Stellungsbewertungen sind Online !!

Das Ergebnis:
Engines die ganz oben standen (so Stockfish, GullChess und Komodo) haben 2-3 ELO verloren. Engines die ganz unten standen haben ca. durchschnittlich 4 ELO gewonnen.

Das bestätigt ... die Schwächeren werden minimal bevorzugt wenn denn mal ein +0,8 aufs Brett kommt und dann beim Ergebnis ein Remis herauskommt. Die Stärkeren dann um 2-3 ELO benachteiligt. Das ist also der Bucheinfluss bei einer Engine Ratingliste wenn nicht mit langweiligen total ausgeglichenen von Hand verlesenen Vorgabestellungen gespielt wird.

Ich finde das hält sich im Rahmen, zumal ich dann die krassen Eröffnungen durch die vielen Eng-Eng Partien aus der Datenbank herausfische und im Buch deaktiviere, die Partien wiederholen lasse. Ich schrieb es Dir ja schon, mehr Probleme machen mir im Grunde nicht die -0.5 Eröffnungen, sondern eher die die ausgeglichen sind (sind natürlich die Mehrzahl) denn hier entstehen auch oftmals nur 3-4 Züge weiter dann die 1.0 Stellungen. Diese Eröffnungen sind klar übermächtig im Buch.

Arbeite derzeit noch an einer anderen Buchidee ... (siehe Thread mit Günther Höhne).

Dem Thema Eröffnungen schenken wir zu viel Aufmerksamkeit, wohl weil wir als User bei Bücher selbst Hand anlegen können und meinen dann wir hätten die Weisheit gefressen weil wir selbst beeinflussen können was ausgespielt wird. Das ist User typisch aber hat nichts mit den Realitäten zu tun die daraus resultieren. Ist und bleibt ne nette Spielerei die aber zugegeben etwas bringt wenn auf eine Engine ein Buch optimiert wird. Nur dieses hier wird auf alle Engines optimiert und nur weil Stockfish mit 0.7 raus kommt heißt das nicht das andere Engines sehr schnell den Ausgleich haben.

Gruß
Frank

Wenn Du anfängst ein Buch für alle zu optimieren mit Stellungen die nicht größer als 0.5 sind kannst Du gut und gerne 60% der ECO codes rauswerfen (bei Betrachtung 4-5 Züge nach der Buchvorgabe und unter Betrachtung das von jeder Engine genau das zu bewerten wäre). Sagte ja ... dann können wir uns im Grunde auch auf 100 ECO codes beschränken und haben immer das gleiche auf dem Brett. Das muss besser gehen, daher die vielen Arbeiten an diesem Shredder Random Buch.
Parent - - By Tom Paul Date 2014-08-12 14:39
Kannst du bei deiner Seite unter Live auch die Anzahl der Siege, Unentschieden und Niederlagen anzeigen?
Parent - By Frank Quisinsky Date 2014-08-12 21:34
Hallo Tom,

das siehst Du je nach 100 Partien auf meiner Startseite.
Werde gleich updaten, dauert ein Weilchen.

LIVE kann ich das nicht einblenden aber dafür versuche ich genau das 1x täglich auf die Seiten zu bringen.
Zumindest nicht mit der einfachen Technik die ich einsetze.

Das müsste dann Stefan Meyer-Kahlen in seiner Shredder GUI ändern, notwendig halte ich das aber nicht.
Shredder GUI ist gut so wie sie ist.

Gruß
Frank
Parent - By Tom Paul Date 2014-08-13 10:16
Nach 12.h4 beginnt die Vorgabestellung, nach 13.0-0-0 +0.57 zu viel Vorteil.
Lustig, dass Stockfish 14. Kb1 Sxd3 Dxd3 sieht und nicht im geringsten an die Abtauschvermeidung Lc4 denkt.
Die Engine muss endlich mal den Figurenabtausch mit leichtem Nachteil bewerten lernen, dann würde sie auch die Abtauschvermeidung sehen.
19.Kb8 ist vielleicht ungenau. Kb7 wäre vielleicht besser gewesen. Lässt die 8 Reihe für die Türme frei und steht nach vielleicht späterem Sd7 bzw. Dxd6 nicht im Schach.
25.f6 jetzt ist der Bauer viel zu weit vorgerückt und schwarz wird seine dauerhafte Schwäche ständig im Auge behalten müssen.
30.Sd6 und die zwei Bauern verursachen zwei Schwächen.
32.Dd8? Td8 minimal besser.
37.Ka8? Dd6 ist besser.

Event:
Ort:
Datum:

Weiss:
Schwarz:

Ergebnis
Board
Parent - - By Tom Paul Date 2014-08-13 11:07
14.Db8, Stockfish hat ganz professionell seinen Turm auf a8 eingesperrt, anstatt Tac8 zu spielen und somit ganz einfach die letzte nicht entwickelte Figur zu entwickeln.
Vielleicht wollte Stockfish auch nur beweisen, dass er Komodo auch mit einem Turm weniger besiegen kann.
15.Lf7? Lc4 Lxc4 bxc4, a6 ist besser.
17.b6? ist schlecht, weil früher oder später a5 kommt. e6 ist besser.
Und wie ich schon immer sagte, wenn Komodo 1 oder mehrere gedeckte Freibauern (im Zentrum) bekommt gewinnt er.

Event:
Ort:
Datum:

Weiss:
Schwarz:

Ergebnis
Board
Parent - - By Jörg Oster Date 2014-08-13 11:49
[quote="Tom Paul"]
14.Db8, Stockfish hat ganz professionell seinen Turm auf a8 eingesperrt, anstatt Tac8 zu spielen und somit ganz einfach die letzte nicht entwickelte Figur zu entwickeln.
Vielleicht wollte Stockfish auch nur beweisen, dass er Komodo auch mit einem Turm weniger besiegen kann.
15.Lf7? Lc4 Lxc4 bxc4, a6 ist besser.
17.b6? ist schlecht, weil früher oder später a5 kommt. e6 ist besser.
Und wie ich schon immer sagte, wenn Komodo 1 oder mehrere gedeckte Freibauern (im Zentrum) bekommt gewinnt er.

Event:
Ort:
Datum:

Weiss:
Schwarz:

Ergebnis
Board

[/quote]

14. .. Db8 sieht in der Tat nicht gut aus, zumal sie dann im 19. Zug wieder auf d6 zurückkehrt ...
SF wollte die Dame wohl aus der Schusslinie des Läufers nehmen. Und auf c7 steht sie in der Linie des weißen Turms c1.

Die Frage ist, was wie verbessern?
Gedeckte und/oder verbundene Freibauern höher bewerten, hat nichts gebracht.
Doppelbauern auf den Randlinien stärker bestrafen, hier der Doppelbauer auf der a-Linie, hat nichts gebracht.
Eingesperrte Figuren bzw. Figuren mit geringer Mobilität auf den Randfeldern, hier der Turm auf a8, werden schon bestraft.

Generell würde ich sagen, liegen diese Inder Stockfish einfach nicht.
Parent - - By Tom Paul Date 2014-08-13 12:26 Edited 2014-08-13 12:31
Gedeckte und/oder verbundene Freibauern höher bewerten, hat nichts gebracht.

Hast du versucht nur! die .....Freibauern im kleinen Zentrum d4, d5, e4, e5 höher bewerten zu lassen?
Hast du versucht nur! die .....Freibauern im großen Zentrum c3 bis f3 bis f6 bis c6 bis c3 höher bewerten zu lassen?
Bzw. nur kleines + großes Zentrum?

Wenn diese Verbesserung dann keine Steigerung der ELO gegen Stockfish bringt, dann liegt das vielleicht daran, dass Stockfish trotz der .....Freibauern immer alles abtauscht, anstatt den Abtausch zu vermeiden.
Das müsste evtl. zuerst verbessert werden.
Das sieht man ganz deutlich wenn Komodo gegen Stockfish spielt.
Und später im Analysemodus sehe ich dann, dass Stockfish +0.00 wegen späterem Abtausch sieht, was Komodo zwar auch sieht aber gerade deshalb nicht bereit ist den Abtausch zu spielen und stattdessen etwas anderes spielt was Stockfish auch für +0.00 hält, was aber später zur Niederlage führt, weil früher oder später Stockfish wegen dieser Schwäche auseinander gerissen wird und das geschieht oft erst mindestens 80 nach der entstandenen Stellung, deshalb kann Stockfish das auch nicht sehen und somit korrekt bewerten.

Eingesperrte Figuren bzw. Figuren mit geringer Mobilität auf den Randfeldern, hier der Turm auf a8, werden schon bestraft.
Vielleicht etwas stärker bestrafen?
Oder besser: Je nachdem um welche Figur es sich handelt wird stärker bestraft!
Parent - - By Jörg Oster Date 2014-08-13 15:45
Tom Paul schrieb:

Gedeckte und/oder verbundene Freibauern höher bewerten, hat nichts gebracht.

Hast du versucht nur! die .....Freibauern im kleinen Zentrum d4, d5, e4, e5 höher bewerten zu lassen?
Hast du versucht nur! die .....Freibauern im großen Zentrum c3 bis f3 bis f6 bis c6 bis c3 höher bewerten zu lassen?
Bzw. nur kleines + großes Zentrum?

Danke für die Idee, ist zumindest einen Versuch wert. 

Tom Paul schrieb:
Wenn diese Verbesserung dann keine Steigerung der ELO gegen Stockfish bringt, dann liegt das vielleicht daran, dass Stockfish trotz der .....Freibauern immer alles abtauscht, anstatt den Abtausch zu vermeiden.
Das müsste evtl. zuerst verbessert werden.
Das sieht man ganz deutlich wenn Komodo gegen Stockfish spielt.
Und später im Analysemodus sehe ich dann, dass Stockfish +0.00 wegen späterem Abtausch sieht, was Komodo zwar auch sieht aber gerade deshalb nicht bereit ist den Abtausch zu spielen und stattdessen etwas anderes spielt was Stockfish auch für +0.00 hält, was aber später zur Niederlage führt, weil früher oder später Stockfish wegen dieser Schwäche auseinander gerissen wird und das geschieht oft erst mindestens 80 nach der entstandenen Stellung, deshalb kann Stockfish das auch nicht sehen und somit korrekt bewerten.

Eingesperrte Figuren bzw. Figuren mit geringer Mobilität auf den Randfeldern, hier der Turm auf a8, werden schon bestraft.
Vielleicht etwas stärker bestrafen?
Oder besser: Je nachdem um welche Figur es sich handelt wird stärker bestraft!
Parent - By Tom Paul Date 2014-08-13 18:02
Evtl. auch nur c6 bis f6. Ist gut für weiß.
Oder nur d6 und e6 oder d7 und e7.

Müsste man aber immer für weiß und schwarz getrennt betrachten, da für weiß Freibauern auf d6 und e6 mehr Wert sind als auf d3 und e3, für schwarz ist es genau umgekehrt.
Parent - By Tom Paul Date 2014-08-13 18:09
Eingesperrte Figuren bzw. Figuren mit geringer Mobilität auf den Randfeldern, hier der Turm auf a8, werden schon bestraft.

Vielleicht sollte man auch Figuren stärker bestrafen, die nur auf ihren Ausgangsfeldern stehen/dort eingesperrt sind.
Parent - By Tom Paul Date 2014-08-13 12:53 Edited 2014-08-13 13:03
Wie wäre es mit einem kleinen - pro Bauerninsel?

Figurenaufteilung
leichtes + oder - für zwei Springer auf derselben Brettseite, das gleiche auch für Läufer und Türme.
Parent - By Tom Paul Date 2014-08-13 11:24
13.c4? ist schlecht, weil weiß dann einen schwachen Bauern auf a2 erhält. a4 ist besser.
Nach 47.Dxg5 sieht man die verbundenen schwarzen Freibauern mit denen Komodo fast immer gegen Stockfish gewinnt.
Später sieht man auch, dass die zwei verbundenen Freibauern von Komodo mehr wert sind als die 5 Bauerninseln von Stockfish.

Event:
Ort:
Datum:

Weiss:
Schwarz:

Ergebnis
Board
- - By 2phil4u Date 2014-08-12 15:00
Gegen den alten Stocki lässt du nicht spielen.

Wieviel Elo mehr zu Stocki 5 ?

Ich suche mal nach einem downloadlinnk.
Parent - By Frank Quisinsky Date 2014-08-12 21:36
Hallo,

das siehst Du auf meiner Startseite ...
In Fett unter Performance oder in der History siehst Du die Elo immer vom Vorgänger.

Nein, Stockfish - Stockfish bzw. gleiche Engines gegeneinander lasse ich nicht spielen, bringt mir nichts.

Gruß
Frank
Up Topic Hauptforen / CSS-Forum / FCT1: Stockfish 03.08.2014 BMI2 x64 Round Robin gestartet!
1 2 Previous Next  

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill