Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Stockfish 2.0 running for the IPON...
- - By Ingo Bauer Date 2011-01-02 10:13
... and you can follow here:

http://www.inwoba.de

Have fun
Ingo

PS: Server maintenance finished ... return to normal
Parent - - By Kurt Utzinger Date 2011-01-02 11:37
[quote="Ingo Bauer"]
... and you can follow here:

http://www.inwoba.de

Have fun
Ingo

PS: Server maintenance finished ... return to normal
[/quote]

Hallo Ingo
Über solche Resultate wie
Code:
Stockfish 2.0 JA - Deep Junior 12 (2679)    43.0  -  8.0    84.31%    Perf=2971

staune ich immer wieder. Als ob das Programm von Amir Ban ein Patzer wäre ...
Gruss
Kurt
Parent - - By Ingo Bauer Date 2011-01-02 12:05
[quote="Kurt Utzinger"]

Über solche Resultate wie
Code:
Stockfish 2.0 JA - Deep Junior 12 (2679)    43.0  -  8.0    84.31%    Perf=2971

staune ich immer wieder. Als ob das Programm von Amir Ban ein Patzer wäre ...

[/quote]

Ja Kurt, du hast neulich schonmal über Junior gestaunt ... ich kann nichts dafür das dich die Enigne entäuscht ... Es ist ja nicht nur bei mir so, du kannst jede verfügbare Rangliste nehmen, die Engine liegt immer so in diesem Bereich. Egal welche Zeitkontrolle, egal ob MP oder nicht, die Engine ist nirgends substanziel wirklich besser als bei mir (z. B: CEGT 40/20 J12 mit 4 Kernen: 181 Elo zu Stockfish 1.9 und 218 Elo zu R4, immer ungefähr das selbe, überall)

Ich glaube du mußt dich von zwei Dingen lösen:

1. Mindestens die Top 20 Enigne in meiner Liste spielen auf einem Niveau dem Menschen nicht mehr wirklich folgen können. Im Vergleich mit Menschen ist Junior ohne Zweifel ein Super GM.
2. Die Enigne lebt (im Moment) von ihrem Ruf. Alleine das du nach Junior schaust, den gleich starken Toga II oder Hanibal 1.0 wirklich praktisch niemand beachtet spricht dafür. Junior IST gut 200 Elo hinter den Top 3. 200 Elo sind nunmal ein Gewinnwahscheinlichkeit von NUR 24% oder niedriger.

Tatsächlich glaube ich das das was früher gelobt wurde, nämlich das Junior ab und zu einen spektakulären Zug erzeugt, der Engine nicht wirklich hilft. Diese Spekulationen werden gegen die Top Engines sofort abgestraft und resultieren in relativ schlechten Ergebnissen. Vielleicht macht jemand mal eine Rangliste für "Schönschach", dann ist Junior 12 vielleicht weit vorne mit dabei (Wenn nur jemand "schön" endlich ordentlich definieren würde )

Gruß
Ingo
Parent - - By Kurt Utzinger Date 2011-01-02 12:27
Hallo Ingo
Irgendwie tut mir Junior leid, der ganz offensichtliche Schwächen hat, die
von den Top-Engines gnadenlos aufgedeckt werden. Mir hat Junior immer
gefallen wegen seiner doch vielfach anderen [spekulativen] Spielweise.
Als Linux User kann ich allerdings selbst UCI-Junior nicht mehr verwenden,
weil das Programm verschiedene DLL-Dateien verwendet, die man (ich) selbst
unter wine nicht zum Laufen bringen kann. Junior weicht hier vom üblichen
Standard einer UCI-Engine ab, denn normalerweise laufen alle UCI-Engines
unter meiner Lieblings-GUI, nämlich Scid Linux 4.2.2, ohne Probleme. Wie
würde wohl ein Mihail Tal heute gegen die Top-GM's abschneiden, das frage
ich mich immer wieder ... und natürlich ohne zu einem Ergebnis zu kommen.
P.S. Bin eben zur Zeit am Studium seiner spannenden, aber vielfach sehr
unklaren Partien.
Gruss
Kurt
Parent - By Ingo Bauer Date 2011-01-02 12:50
Hallo Kurt,

Ja, das mit der Junior-DLL-Hölle ist furchtbar und nicht zeitgemäß. Es ist sogar unter Windows die einzige Engine die ich NICHT vom Netzlaufwerk laufen lassen kann. Auch hier erfordert es Klimmzüge um alles ordentlich zum laufen zu bringen (aber zugegebenermaßen ist meine Konfiguration weit weg vom Standard!)

Gruß
Ingo
Parent - By Frank Quisinsky Date 2011-01-02 12:28
Hallo Ingo,

ich erinnere mal an die Partie Junior 2010 - Rybka 3, die zur Jahreswende in der SWCR gespielt wurde. Die Partien war so dynamisch und voller Glanzpunkte, dass ich GM Jörg Hickl vorschlug diese in seiner Schachwelt zu publizieren. Er war erst richtig skeptisch und schrieb mehr oder weniger ... eine komplette Comp-Comp Partie Frank? Dann druckte er ab mit wenigen Partiekommentaren. Der Zuspruch war Wahnsinn, er berichtete später das selbst GM Kollegen von dieser Partie restlos begeistert waren und er selbst auch mal nahspielte und kaum glauben konnte das dies von einem Computer produziert wurde.

Bislang immer noch die mir bekannte sehenswerteste Comp-Comp Partie die ich bislang in der SWCR gesehen habe. Seinerzeit wurde die Partie auch hier im Forum publiziert. Es gab einige sehr schöne Kommentare von CSSlern.

Allerdings ...
Solche Partien sind recht selten, wie auch taktisch starke Programme wie Spark 1.0 oder Stockfish selten in der Lage sind solche Comp-Comp Partien zu erzeugen. Bei Spark waren z. B. 28 Kurzpartien bei dem 1000er Spießroutenlauf dabei. Das war Rekord, vorher gehalten von Spark 0.5, und von den 28 waren es auch nur 13 dabei die einfach schön sind anzuschauen.

13 von 1.000
Zeigt auf wie schwierig ist es überhaupt solche Dinge herauszufinden und wie schwierig es ist das dann zu beurteilen. Damit meine ich die Stärken und Schwächen von Engines herauszufilten bei der enormen Grundspielstärke der TOP-26 in der SWCR ist nur deswegen möglich, weil viele Partien vorliegen.

Jemand der sich z. B. nur mit Rybka beschäftigt wird begeistert sein und immer schreiben, die Nummer 1 war Rybka und von daher muss die Engine doch bei allen Statistiken vorne liegen, weil die Nummer 1. Nun, ein Spark liegt 200 ELO dahinter und produziert dennoch ca. 4x mehr Kurzpartien als Rybka.

Also, es passiert nur selten, dass wir augenscheinlich mit Stärken und Schwächen von Engines konfrontiert werden. Wir erkennen das auch sehr selten, weil die Spielstärke der TOP-26 bis zu 1.200 ELO höher ist als die Spielstärke der meisten Schachspieler. Ohne Statistiken und den gewaltigen Möglichkeiten von Datenbanken ist das alles überhaupt nicht mehr möglich festzustellen und blanke Resultate wundern uns ...

Jetzt hier ...
Stockfish 2.0 - Junior 12.0 beim Test von Ingo.

Spielen wir 10 Partien gegen Gaviota und verlieren das vielleicht mit 2.0 : 8.0
Dann lassen wir Gaviota in einer Ratingliste mitspielen und sehen was gerade beim laufenden SWCR-64 Turnier passiert.

Wir denken uns, is die Engine schwach und in Wirklichkeit haben wir schon gegen Gaviota kaum noch eine reale Chance. Gaviota spielt z. B. auf Yace Level. Als Yace erschienen ist waren wir begeistert. Ist die Engine stark ...

Glaube auch nicht das hat mit unserem Anspruchsdenken zu tun oder mit der Jagd nach Höchstleistungen. Die Leistungen der Engines liegen vielmehr über unserem Horizont und von daher sind auch viele Diskussionen rund um ELO und Engines sehr ... wie soll ich sagen ... spekulativ. Denn alles was wir denken festzustellen ist spekulativ weil es über unserem Horizont liegt.

Viele Grüße
Frank
Parent - By Harald Faber Date 2011-01-04 05:03
[quote="Kurt Utzinger"]
Hallo Ingo
Über solche Resultate wie
Code:
Stockfish 2.0 JA - Deep Junior 12 (2679)    43.0  -  8.0    84.31%    Perf=2971

staune ich immer wieder. Als ob das Programm von Amir Ban ein Patzer wäre ...
Gruss
Kurt
[/quote]

Ist Junior natürlich nicht, wie ich schon diverse Male in Thüringen bewies und auch in diesem Jahr wieder zeigen werde.  (Ich weiß, die Erbsenzähler werden wieder auf die statistisch irrelevante Partienanzahl verweisen, aber dieses "Argument" wirkt langsam einfach lächerlich)
Meines Erachtens zeigen solche Resultate nur zweierlei: Juniors Abschneiden hängt stark vom verwendeten Buch und der verwendeten Bedenkzeit ab, auch wenn das einige hier ebenfalls nicht wahr haben wollen.

Übrigens spielte ich die IECG-Turniere bis zum Erreichen des WM-Finals mit Junior als Hauptengine - noch Fragen?

Gruß,
Harald
Parent - - By Wolfgang Battig Date 2011-01-02 12:13
[quote="Ingo Bauer"]
... and you can follow here:

http://www.inwoba.de

Have fun
Ingo

PS: Server maintenance finished ... return to normal
[/quote]

Hallo Ingo,

danke wie immer für den Service!

CEGT-Blitz läuft auch, momentan sind wir noch fast 40 Punkte auseinander. Bei Dir plus 22 nach etwa der Hälfte, bei mir minus 19 nach 320 von 1000.

Ich denke am Ende wird das irgendwo in dem Bereich enden wie vom SF-Team erwartet: keine wesentliche Veränderung!

Gruß + frohes neues Jahr!
Wolfgang
Parent - - By Ingo Bauer Date 2011-01-02 12:22
Hallo Wolfgang,

[quote="Wolfgang Battig"]
...
CEGT-Blitz läuft auch, momentan sind wir noch fast 40 Punkte auseinander. Bei Dir plus 22 nach etwa der Hälfte, bei mir minus 19 nach 320 von 1000.

Ich denke am Ende wird das irgendwo in dem Bereich enden wie vom SF-Team erwartet: keine wesentliche Veränderung!
...
[/quote]

Das klingt aber bitter.

Ich glaube schon, das die 2.0 etwas besser wird als die 1.9 und ja, die letzten Versionen sind fast identisch in der Spielstärke. Sollte nichts substanzielles herrauskommen, habe ich 4 Stockfish innerhalb von 8 Monaten in meine Liste eingespielt. Das ist viel zu viel und verzerrt den Rest (Übrigens auch eurer Problem mit verschiedenen Rybkas, Naums, Stockfishen ...) . Wenn also die 2.0 in meiner finalen Liste nicht besser als 2915 abschneidet (+30 Elo zur 1.7.x), werde ich die Spiele von Stockfish 1.7.x aus meiner Liste löschen. Wie ein Gärtner muß man ab und zu "Unkraut" jäten um den Garten hübsch zu halten

Gruß
Ingo
Parent - - By Frank Quisinsky Date 2011-01-02 13:22
Hi Ingo,

bekommst Du so aber auch nicht raus. Und Ergebnisse zu entfernen ist schade weil die Entwicklung einer Engine in einer Ratingliste nicht mehr nachvollzogen werden kann.

Wesentlich interessanter ist daher eine "Jeder gegen Jeden" Ratingliste zu erzeugen und dann die Ratingliste aller Partien demgegenüber zu stellen. So gehe ich bei der SWCR vor und das hat sich bewährt. Wie bei so vielen Dingen im Leben, die Masse macht es nicht sondern die Qualität. Diese kannst Du bei Deinem Testverfahen auch erzeugen und hin - und wieder beglückst Du uns ja mit einer "Jeder gegen Jeden" Ratingliste.

Wie gesagt die Schwelle liegt bei 40 Partien Matches bei 26 Engines. Bei Deinen 100 vielleicht 25 oder gar 24 Engines. Das hatte ich schon mehrfach beschrieben, Experiment mit Pseudo Partien um festzustellen ab welche Anzahl von Gegnern die Liste hinsichtlich Abweichungen von größer als 5 ELO kaum noch betroffen ist.

Die Kurve geht bei Engine 27 nur noch sehr geringfügig nach unten. Wie gesagt, keine Ahnung wie es bei 100 Partien-Matches ausschaut. Vielleicht sind dann gar nur noch 24 oder 25 Engines notwendig.

Bei 20 Engines hatte ich bei 40-Partien Matches ausgerechnet das es zu Veränderungen von bis zu 15 ELO kommen kann. Das wurde minimiert auf 4 ELO bei 26 Engines. Das heißt z. B. bei der SWCR das die Ratingliste bei 26 Engines (unabhängig von der Partieanzahl) um 11 besser wird (Vergleich 20 zu 26 Engines bei gleicher Partieanzahl).

Solche Experimente kann aber auch jeder selbst gerne mal durchführen ... macht Spass!

Gruß
Frank
Parent - - By Frank Quisinsky Date 2011-01-02 13:45 Edited 2011-01-02 13:51
vergessen ...

Übrigens, streng genommen alles sehr irrsinnig was die Ratinglistenbetreiber so machen.

Beispiel:
Wir nehmen die TOP-26 der GMs zur Jahrhundertwende.
Simulieren wir auch hier einfach ein paar Partien dazu oder nehmen Partien (z. B. Rubinstein) und teilen diese auf 26 Pseudo-Gegner-Namen auf. Wir simulieren also nur die Gegner.

Frage:
Wie stark wäre Rubinstein heute?

Problem:
Wir haben keine aktuellen Gegner, natürlich auch nur Gegner von damals.

Sprich, simulieren wir ein Kasparaov hinzu erhalten wir kein aussakräftiges Ergebnis. Kasparov hatte mehr Wissen zu den modernen und alten Eröffnungssystemen.

Optimal wäre es:
Kasparov spielt gegen 26 Gegner aus Vorgabestellungen gegen Gegner der damaligen Zeit um dann hinsichtlich genauer Messung der Spielstärke weniger Beeinflussungsfaktoren zu haben.

Geht leider nicht ...

Verbleibt:
Wir nehmen die heutigen TOP-26 bei den Computerschachprogrammen. In 10 Jahren sehen die TOP-26 sicherlich völlig anders aus. Kein Vergleich möglich!

These:
Hätten wir heute weitere 26 Programme die sich im Spielstil total voneinander unterscheiden aber letztendlich ca. gleich stark wären zu den derzeit getesteten Engines würden wir eine andere Liste produzieren.

Eine Ratingliste "Jeder gegen Jeden" bei 26 Engines sagt leider auch nur folgendes aus (egal wie viele Partien):
Wie stark sind diese 26 Engines im direkten Vergleich untereiander.

Diese Liste sagt nicht aus ...
Wie stark ist eine Engine in ELO.

Eine grundsätzliche Aussage:
Engine A spielt mit 2.700 ELO ist leider nicht möglich.
Gar ... Engine A spielt mit 2.700 ELO +-25 wäre demnach genauso falsch!

Schwierig nachzuvollziehen, schwierig daran zu glauben ... ich weiß!
Schwierig daran zu glauben, dass vielleicht ein Tarrasch deutlich stärker gewesen ist als ein Kasparov!

Kann sein, muss nicht sein ...
Das anhand von einer großen Ratingliste zu messen ... funktioniert so leider nicht ... ist nur Spielerei.

Genau wie eine Ratingliste die 4 Jahre alt ist und dort Engines auftauchen die seit 3 Jahren nicht mehr gespielt haben. Würden diese Engines heute gegen die aktuellen TOP-26 spielen wäre die ELO nicht gleich oder zumindest besteht nicht eine 100%ige Wahrscheinlichkeit eine gleiche ELO +-100 zu erzeugen weil die Gegner zu unterschiedlich waren.

Alles Probleme der ELO-Berechnungen!

Aber, aber ... je mehr Gegner hinzukommen (egal wie unterschiedlich der Spielstil) desto genauer wird es unabhängig von der Partieanzahl. Insofern behaupte ich entgegen eigener Meinung (oben beschrieben) ... im Zweikampf zu "Jetziger Meinungen" folgt noch ... das auch eine ELO die vor 100 Jahren erzeugt worden ist genau ist ... wenn seinerzeit viele unterschiedlichen Gegner vorhanden waren.

Also interner Quisinsky Wiederspruch!
Die Wahrheit liegt glaube ich nach meinen Analysen wirklich darin versteckt das eine Wertungszahl genau gemessen werden kann auf +-4 / hinzu kommt die normale Abweichung von +-10 = 30 ELO wenn 26 Engines Jeder gegen Jeden 40 Partien gespielt haben.

So mein Ergebnis!


Ob diese eigene Denke überhaupt nachvollziehbar für einen Zweiten ist bleibt die große Frage

Gruß
Frank
Parent - - By Ingo Bauer Date 2011-01-02 14:02
Hi
[quote="Frank Quisinsky"]

Frage:
Wie stark wäre Rubinstein heute?

Problem:
Wir haben keine aktuellen Gegner, natürlich auch nur Gegner von damals.

[/quote]

Kein Problem, 'einfaches' Rückrechnen mit vorhandenem Partiematerial: [url]http://db.chessmetrics.com/CM2/PlayerProfile.asp?Params=200203SSSSSFS112008000000111000000000000010100

In in langer Sicht: http://db.chessmetrics.com/CM2/MonthlyLists.asp?Params=1900CCSSSSSFS112008000000111000000000000010100
(Das Grau von Rubinstein geht leider etwas unter, man muß sich die 2789 aus dem Juni 1913 merken und dann im Kopf übertragen)

Bye
Ingo
[/url]
Parent - By Frank Quisinsky Date 2011-01-02 14:09 Edited 2011-01-02 14:17
Hallo Ingo,

schaue mir das mal an.
Also ich stehe im Wiederspruch zu mir selbst weil ich mir nicht sicher bin.

Und das alles trotz meiner Analysen und Berechnungen.
Glaube mir sicher zu sein mit der Aussage, dass je mehr Engines ... siehe Berechnungsbeispiel (neues Posting).

Gruß
Frank

Nur wenn die Anzahl der Gegner nicht mit einberechnet wurden ist taugen die Berechnungsbeispiele wenig.
Das ist der eigentliche Aufhänger warum ich glaube, dass ELOs von früher mit denen von heute oder einfach nur bei verschiedenen Gegnern kaum eine Aussagkraft haben. Denn der Faktor: Anzahl der Gegner ist ganz erheblich und findet bei den Berechnungsprogrammen kaum Berücksichtigung.
Parent - - By Frank Quisinsky Date 2011-01-02 14:06
Also,

um es klarer auszudrücken ...

1.000 Partien wurden erzeugt bei 40 Partien Matches gegen 25 Gegner ... Energebnis liegt noch um ca. 4 ELO daneben (Berechnung jetzt nur ELO-Abweichung zu Anzahl der Gegner).

1.000 Partien wurden erzeugt bei 24 Gegner ... sind wir bei 6 ELO Abweichung
1.000 Partien wurden erzeugt bei 23 Gegner ... sind wir bei 7 ELO Abweichung

... das ist immer die durchschnittliche Abweichung und von daher sind 7 ELO enorm!

1.000 Partien wurden gespielt bei 22 Gegner ... sind wir bei 8 ELO Abweichung
1.000 Partien wurden gespielt bei 20 Gegner ... sind wir bei 11 ELO Abweichung
1.000 Partien wurden gespielt bei 4 Gegner ... wird sind bei sage und schreibe 38 ELO Abweichung

Zu diesen Abweichungen kommen noch die ELOs hinzu die er ErrorBar gleichen!
Also in einem von 52 Fällen größer als 20 bei mehr als 600 Partien

Also bei 1.000 Partien ca. +- 8 ... bis zu 16 ELO in einem von 52 Fällen.

So sollte demanch eine genaue Prognose aussehen:

Engine A spielte gegen 4 Gegner 1.000 Partien und das Resultat ist 2.700 ELO

Prognose:
Engine A = 2.700 +- 8 / +- 38 = 2.700 ELO

Und so schaut es nach meinen Berechnungen aus wenn zwei Engines 100 Partien gespielt haben:

Engine A = 2.700 +- 48 / +- 64 = 2.700 ELO
+- 48 = 96 und +-64 = 128
96 und 128 = 224 ELO

Ein Resultat zweier Engine bei 100 Partien könnte noch eine ELO-Abweichung von 224 ELO produzieren!
Wenn die Anzahl der Gegner einberechnet werden würde!

Hoffe jetzt ein wenig deutlicher bei meinem WirrWarr.
So genug.

Gruß
Frank
Parent - - By Frank Quisinsky Date 2011-01-02 14:28
Hi,

schon wieder vergessen ...

Code:
Engine A = 2.700 +- 48 / +- 64 = 2.700 ELO
+- 48 = 96 und +-64 = 128
96 und 128 = 224 ELO

Ein Resultat zweier Engine bei 100 Partien könnte noch eine ELO-Abweichung von 224 ELO produzieren!
Wenn die Anzahl der Gegner einberechnet werden würde!


Würden aber jetzt die 100 produziert werden gegen 25 unterschiedliche Gegner ...
Das hatte ich vergessen ...

Engine A = 2.700 +-48 / +- 12 = 2.700 ELO
+- 48 = 96 und +-12 = 24
96 und 24 = 120 ELO

Das Ergebnis wurd um 104 ELO genauer.

Tja und die +-12 sind nicht +-4 wie im Beitrag beschrieben, das muss natürlich auch wieder in ein Verhältnis zu der Anzahl der Partien gesetzt werden.
Also wird bei 25 Gegnern und 40 Partien Matches aus +-4 bei 25 Gegnern und 4-Partien Matches ein +-12. Deutlich geringer Abweichung hier wie bei der ErrorBar.

Würde aber jetzt zu weit gehen, dies auch noch irgendwie in wenigen Minuten gut zu erklären.

Gruß
Frank
Parent - By Frank Quisinsky Date 2011-01-02 14:37 Edited 2011-01-02 14:43
Und so müsste demnach eine ELO-Berechnungsprogramm für Computerschach abfragen.

1. Name PGN FILE ... Eingabe
2. Durchschnittliche ELO ... Eingabe (zwecks Eichung)
3. Level der Liste (Level 1-5, Bullet - Turnier aufgeteilt in Level 1-5, je höher das Level desto weniger Partien, muss berücksichtigt werden).
4. Anzahl der Gegner berücksichtigen ja / nein (die von mir beschriebene Berechnung)
5. Anzahl der doppelten Gegner, neueste Version berücksichtigen, ältere ausschließen ja / nein
6. Durch mehr Remisen Rating heruntersetzen um Faktor ja / nein ... bei ja
7. Faktor 1 / 1.75, 1 / 1.5, 1 / 1.25 / 1 / 1.15
8. Automatische Berechnung zu Vorgängerversionen ... ja / nein

etc..
Das wäre wirklich gut!

Und insofern ...
Was wir haben ist auch gut aber nichts ist wirklich perfekt auch kein Houdini wie sicherlich die nächsten Jahre zeigen werden, wenn Houdini 1.5 z. B. in 5 Jahren noch Platz 20 in einer ELO-Liste einnimmt. Erinnern wir uns an Ruffian ... heute vielleicht noch die Nummer 30-35!

Gruß
Frank
Parent - - By Werner Mueller Date 2011-01-02 14:33
[quote="Frank Quisinsky"]...
Übrigens, streng genommen alles sehr irrsinnig was die Ratinglistenbetreiber so machen.
...
[/quote]
Ja - und faszinierend, dass trotzdem etwas einigermaßen Sinnvolles dabei herauskommt.
Parent - By Frank Quisinsky Date 2011-01-02 18:42
Werner,

wissen wir denn ob es wirklich sinnvoll ist was wir so hinsichtlich ELO produzieren?
Was aber sinnvoll ist, ist es so gut es irgend geht die Unterschiede in ELO zwischen den Engines festzustellen.
Bin der Meinung, dass genau das noch deutlich verbessert werden kann!

Gruß
Frank
Parent - - By peter struwel Date 2011-01-02 14:50
Code:
Übrigens, streng genommen alles sehr irrsinnig was die Ratinglistenbetreiber so machen.


kommt darauf an, wie man es sieht und welche schlussfolgerungen daraus zieht

Code:
Eine Ratingliste "Jeder gegen Jeden" bei 26 Engines sagt leider auch nur folgendes aus (egal wie viele Partien):
Wie stark sind diese 26 Engines im direkten Vergleich untereiander.


auch du, als urgestein der computerschachgeschichte, hast nun endlich mal begriffen was eine ratingliste aussagt.
hat bei dir nur unendlich lange gedauert!


Code:
Diese Liste sagt nicht aus ...
Wie stark ist eine Engine in ELO.


endlich mal begriffen was eine eloliste aussagt

Code:
Eine grundsätzliche Aussage:
Engine A spielt mit 2.700 ELO ist leider nicht möglich.
Gar ... Engine A spielt mit 2.700 ELO +-25 wäre demnach genauso falsch!


s.o.

Code:
Alles Probleme der ELO-Berechnungen!


immer noch nicht verstanden, was prof. elo ausagen will. schade. aber vielleicht schnallst du das auch noch. ich habe hoffnung noch nicht aufgegeben

trotzalledem viele grüsse

peter struwel
Parent - By Frank Quisinsky Date 2011-01-02 18:47
Hallo Peter,

wobei wenn wie gesagt, viele Engines gegeneinander gespielt haben die Aussage:
Programm X hat X ELO schon sehr gut sein kann.

Wie gut diese letztendlich ist, bleibt fraglich weil das ELO-System selbst schon fraglich ist.

Wirklich ein sehr kompliziertes Thema, aber ich denke schon wir sind gerade bei der Messung und neueren Erkenntnissen wieder etwas moderner aufgestellt. Dr. Frank Schubert (Programmierer von ELOstat) hat das seinerzeit schon richtig gut gemacht. Mehr ging nicht, es fehlten Erkenntnisse die wir vielleicht heute hinzugewonnen haben.

Ist wie mit allen anderen Dingen auch.
Nur weil die alten Ägypter kein Tarkappenbomber hatten waren die nicht dumm
Hätten wir die Erkenntnissen der vielen Hochkulturen nicht, hätten wir wahrscheinlich heute noch keinen Tarnkappenbomber!
Wissenschaft baut aufeinander auf. Ein Mosaiksteinchen zum Nächsten = das was wir heute haben!

Gruß
Frank
Parent - - By Wolfgang Battig Date 2011-01-02 17:40
[quote="Ingo Bauer"]

Das klingt aber bitter.

...
[/quote]

ich weiß zwar nicht, was da bitter klingt, aber wenn, dann war es nicht so gemeint...

Rating steigt bei mir leicht, derzeit noch -15, wenn ich die Performance gegen Houdini reinrechnen würde etwa -10.
Parent - - By Ingo Bauer Date 2011-01-02 18:45
[quote="Wolfgang Battig"]
...
Rating steigt bei mir leicht, derzeit noch -15, wenn ich die Performance gegen Houdini reinrechnen würde etwa -10.
[/quote]

Wann rechnet ihr ...?

Grß
Ingo
Parent - By Wolfgang Battig Date 2011-01-02 20:16
[quote="Ingo Bauer"]
[quote="Wolfgang Battig"]
...
Rating steigt bei mir leicht, derzeit noch -15, wenn ich die Performance gegen Houdini reinrechnen würde etwa -10.
[/quote]

Wann rechnet ihr ...?

Grß
Ingo
[/quote]

gute Frage - nächste Frage...
Parent - - By Wolfgang Battig Date 2011-01-04 10:33
[quote="Wolfgang Battig"]
[quote="Ingo Bauer"]

Das klingt aber bitter.

...
[/quote]

ich weiß zwar nicht, was da bitter klingt, aber wenn, dann war es nicht so gemeint...

Rating steigt bei mir leicht, derzeit noch -15, wenn ich die Performance gegen Houdini reinrechnen würde etwa -10.
[/quote]

nach 1000 Partien hat sich Stockfish 2.0 weiter verbessert und das Niveau der 1.9 fast exakt erreicht (+2). Inclusive
der 200 Partien gegen Houdini wären es +9. Ich lasse jetzt noch 500 Partien spielen, gehe aber nicht davon aus, dass
sich noch viel tut.

http://cegt.foren-city.de/topic,536,-testing-stockfish-2-0.html
Parent - - By Ingo Bauer Date 2011-01-04 11:20
Hallo Wolfgang,

CEGT-Blitz halt!
Nicht falsch verstehen, gegen Blitz ist nichts zu sagen, es ist aber schwieriger auszubalancieren. Wenn man dann alles mögliche an Hardware mit und ohne Zeitanpassung, Eröffnungsstellungen und Bücher in eine Liste mischt wird es eben schwierig.

Gruß
Ingo
Parent - - By Wolfgang Battig Date 2011-01-04 15:36 Edited 2011-01-04 15:44
[quote="Ingo Bauer"]
Hallo Wolfgang,

CEGT-Blitz halt!
Nicht falsch verstehen, gegen Blitz ist nichts zu sagen, es ist aber schwieriger auszubalancieren. Wenn man dann alles mögliche an Hardware mit und ohne Zeitanpassung, Eröffnungsstellungen und Bücher in eine Liste mischt wird es eben schwierig.

Gruß
Ingo
[/quote]

Hi Ingo,

ich weiß, dass Du - speziell seit unserem Shredder 12-Test - Vorbehalte gegen die Blitzliste hast. Warum in dem speziellen Fall bei 1+2 CPU je ca. 30 ELO Differenz zwischen 32 und 64bit sind, bei 4CPU nicht - keine Ahnung. Jedenfalls stimme ich Dir zu, dass das "eigentlich" nicht sein kann.

Ansonsten bin ich - naturgemäß - etwas anderer Meinung...

Hardware: immer ein Problem bei einer Testergruppe. Das bekommst du nicht unter einen Hut, selbst bei aktuell nur 2 Testern nicht. Ich kann GS nicht vorschreiben, was er kaufen soll und er mir umgekehrt auch nicht. Je größer die Gruppe, desto größer das Problem. Trotzdem glaube ich, dass wir das ganz gut im Griff haben, denn unsere (GS/WB) Rechner weichen nur wenig voneinander ab (alle im Bereich von 2,3 bis 2,6 GHZ). 10% Unterschied? Sind mir völlig egal, ganz ehrlich!

Anpassung: hier haben wir uns geeinigt nicht unter 40/3 zu gehen, obwohl das auf den o.g. Rechnern möglich wäre (40/2). Zu kurz sollte es nicht werden, sonst spielen wir bald mit 40/30 (Sekunden!) oder so...

Eröffnungen: ähnliches Problem wie bei Hardware. Dass alle in einer Gruppe immer mit derselben 50er-Suite spielen ist nicht drin. Ich finde das übrigens nicht so schlimm, denn Schach (auch Computerschach) besteht für mich aus mehr als nur 50 Eröffnungssystemen. Allgemeine Eröffnungsbücher machen übrigens nur einen sehr geringen Teil aus. Ich habe das zwischenzeitlich mal gemacht, nutze aber mittlerweile ausschließlich Testsuites und da (zurzeit) die SilverSuite mit 50 Stellungen. GS nimmt soviel ich weiß immer dieselbe Suite, die ich auch öfter mal nutze.

Fazit: Einzeltester habens leichter...

Gruß
Wolfgang

PS: Im aktuellen Stockfish-Fall liegen wir (IPON - CEGT) doch gar nicht so weit auseinander, daher taugt das Beispiel m.E. nicht für Listenkritik...
Du hast +20 nach 2200 Partien, bei mir sind es +9 (Houdini muss ich ich ja reinrechnen weil er bei dir auch drin ist), allerdings nach "nur" 1200 Partien. 11 Pünktchen auseinander - where is the problem?
Parent - - By Ingo Bauer Date 2011-01-04 15:59
Hallo Wolfgang,

[quote="Wolfgang Battig"]
...
Fazit: Einzeltester habens leichter...
[/quote]

Ohne Zweifel, und die Gründe warum das so ist bei euch kenne ich auch, aber für meinen Geshcmak sind das zu viele Kompromisse. AM schlimsten eigentlich das ihr die unvollkommene Hardwareanpassung nicht mal mehr durchzieht. De fakto haben einig eEnignes bei euch einfach mal 50% mehr Zeit als andere ... eigentlich geht das nicht für einen sauberen Test.

[quote="Wolfgang Battig"]
PS: Im aktuellen Stockfish-Fall liegen wir (IPON - CEGT) doch gar nicht so weit auseinander, daher taugt das Beispiel m.E. nicht für Listenkritik...
Du hast +20 nach 2200 Partien, bei mir sind es +9 (Houdini muss ich ich ja reinrechnen weil er bei dir auch drin ist), allerdings nach "nur" 1200 Partien. 11 Pünktchen auseinander - where is the problem?
[/quote]

Ob er die noch rausholt ... ich bin skeptisch. Nichtsdestotrotz vergleiche ich mich bestimmt nicht mit erurer Blitzliste, die IPON ist sowohl zeitlich als auch im Ergebniss VIEL dichter an der CEGT 40/20 als an der CEGT Blitz.
Gruß
Ingo
Parent - - By Wolfgang Battig Date 2011-01-04 17:13 Edited 2011-01-04 17:15
[quote="Ingo Bauer"]...
Ohne Zweifel, und die Gründe warum das so ist bei euch kenne ich auch, aber für meinen Geshcmak sind das zu viele Kompromisse. AM schlimsten eigentlich das ihr die unvollkommene Hardwareanpassung nicht mal mehr durchzieht. De fakto haben einig eEnignes bei euch einfach mal 50% mehr Zeit als andere ... eigentlich geht das nicht für einen sauberen Test.


ja, Ingo, aber die Bedingungen in den Matches sind doch immer gleich, weil auf einer Maschine gespielt wird. Wir spielen doch nicht "Engine A auf 3GHZ gegen Engine B auf 1,5 GHZ" wie es die SSDF macht.

Meine Hardware ist seit ca. 1,5 Jahren unverändert (bin nicht ganz sicher, hab aber auch keine Lust die Kaufbelege rauszusuchen...), Gerhard hat seinen Quad und seinen Laptop auch schon recht lange im Einsatz, m.W. sogar länger als ich. Also haben die Engines, die wir in den letzten ca. 18-20 Monaten getestet alle die gleichen Voraussetzungen gehabt und daran wird sich auch in den kommenden Monaten kaum etwas ändern. Also mindestens für 2 Jahre - eher länger - sind die Bedingungen gleich geblieben. Davor hatten die Engines weniger Zeit (gleich Bedenkzeit aber langsamere Hardware) keine Frage. Aber wen interessiert heute noch Fritz 10, Shredder 10 usw.? Sie würden heute bzw. auf heutiger Hardware genau da stehen, wo sie jetzt auch stehen, denn sie selbst hätten zwar XY % mehr Zeit, ihre Gegner aber auch!

Bei einer Rangliste mit mittlerweile fast 1000 Engines/Versionen/Varianten, die über Jahre entstanden ist musst du Kompromisse machen. Alternative ist allein zu testen und 20-25 Engines in der Liste zu haben. Jeder wie er mag. Ich jedenfalls hatte die "Alleinetesterei" satt und habe mich deshalb der CEGT angeschlossen, wohlwissend, dass ich nicht mit allem einverstanden sein würde, aber: Vorteile > Nachteile, ganz einfach!

Zitat:

Ob er die noch rausholt ... ich bin skeptisch. Nichtsdestotrotz vergleiche ich mich bestimmt nicht mit erurer Blitzliste, die IPON ist sowohl zeitlich als auch im Ergebniss VIEL dichter an der CEGT 40/20 als an der CEGT Blitz.
Gruß
Ingo


mag alles sein, trotzdem passen die Ergebnisse und über 10 ELO diskutiere ich nur sehr ungern...

Gruß
Wolfgang
Parent - By Ingo Bauer Date 2011-01-04 17:39
Hi Wolfgang,

[quote="Wolfgang Battig"]

Bei einer Rangliste mit mittlerweile fast 1000 Engines/Versionen/Varianten, die über Jahre entstanden ist musst du Kompromisse machen. Alternative ist allein zu testen und 20-25 Engines in der Liste zu haben. Jeder wie er mag. Ich jedenfalls hatte die "Alleinetesterei" satt und habe mich deshalb der CEGT angeschlossen, wohlwissend, dass ich nicht mit allem einverstanden sein würde, aber: Vorteile > Nachteile, ganz einfach!
...
[/quote]

Nichts anderes sage ich doch, es sind mir nur zu viele Kompromise (Vorteile < Nachteile) aufgrund derer in eurer Blitzliste die meisten Ungereimtheiten auftauchen ...

Und um das auch klar zu sagen, die 40/20 ist recht gut. Ich kann zwar immer noch an der Duchführung rumkritteln, aber das Ergebniss kann sich sehen lassen.

Bye
Ingo
Parent - - By Benno Hartwig Date 2011-01-04 17:51
[quote="Ingo Bauer"]De fakto haben einig eEnignes bei euch einfach mal 50% mehr Zeit als andere ... eigentlich geht das nicht für einen sauberen Test.[/quote]Da aber dies immer beide Kontrahenten betrifft, ist die Verzerrung nicht wirklich gravierend.
Es ist dann halt so, als ob man auf gleicher Hardware mal die Partien mit 3 Min/Partie und mal mit 6 Min/Partie spielt.
Soo gravierend erscheint mir solch ein Kritikpunkt nicht.

Benno
Parent - By Ingo Bauer Date 2011-01-04 18:18
Hallo Benno

[quote="Benno Hartwig"]
[quote="Ingo Bauer"]De fakto haben einig eEnignes bei euch einfach mal 50% mehr Zeit als andere ... eigentlich geht das nicht für einen sauberen Test.[/quote]Da aber dies immer beide Kontrahenten betrifft, ist die Verzerrung nicht wirklich gravierend.
Es ist dann halt so, als ob man auf gleicher Hardware mal die Partien mit 3 Min/Partie und mal mit 6 Min/Partie spielt.
Soo gravierend erscheint mir solch ein Kritikpunkt nicht.

Benno
[/quote]

Weil du das auch nochmal bringst hierzu doch meinen Senf.

Mal 3 und mal 6 Minuten sind soger sehr gravierend, falls es Enignes gibt die von mehr Bedenkzeit profitieren (unbewiesen!) .... mein Problem ist eher das evtl. die selbe Engine auch von anderen Testern mit anderer Bedenkzeit zugemischt werden (auf anderen CPUs deren Zeitanpassung auch nicht optimal ist) und Beziehungen zu Enignes gesetzt werden die eben nur 3 oder 4 oder 6 oder sonstwas hatten. Es ist prinzipiel nicht richtig. Wenn man schon Zeit anpasst hätte man auch dabei bleiben sollen, egal wie kurz es wird.
Wolfgang schrieb auf der einen Seite das niemand sich für uralte Shredder 10 interessiert und eine falsches Rating "egal" ist. Dem kann ich nur erwieder das mindestens ER sich dafür interessiert, schließlich will er eine Liste mit tausend Engines erhalten ... nur leider ist sein Ergebniss von früher zu heute nicht wirklich vergleichbar. (oder wenn es niemanden interessierrt kann man auch die alten Spiele wegschmeißen und eine neue saubere Blitzliste aufstellen... wen störts), Dazu kommt noch, das es eben nicht nur die falsche Bedenkzeit ist, es wurden und werden in einer Teamliste auch noch andere Dinge zusammengeworfen die nicht zusammen gehören. Eines davon alleine ist sicherlich vernachlässigbar, alles zusammen läßt mich an der CEGT Blitz zweifeln weil es da im Extrem auftritt.
Und zu guter letzt noch der Hinweis das die Blitzliste diejenige ist, die bei genauerem hinsehen die meisten Ausreisser produziert. Da ich, wenn ich es mit sauberen Blitzlisten vergleiche (GS fällt ein) kein Problem am Blitz an sich sehe, muß ich im Moment die Bedinungen verantwortlich machen.

Aber auch hier wieder, will man eine große Blitzliste mit vielen Leuten erstellen sind Kompromisse nötig, das sehe ich genau so. Sie gehen mir im Fall der CEGT Blitz nur zu weit - und auch nochmal, ich kann an manchem der CEGT 40/20 rumkritteln, das Ergebniss ist schlüssig (immer wieder zu meiner Verwunderung ).

Gruß
Ingo
Parent - - By Frank Quisinsky Date 2011-01-04 16:24
Hallo Wolfgang,

das ist alles absolut richtig.

Mir gefällt zwar einiges bei der CEGT nicht, versuche das z. B. besser zu machen aber das hat nichts mit der außergewöhnlich guten Arbeit der CEGT zu tun. Ein Einzeltester hat es sehr viel einfacher und kann frei entscheiden, auch mal Ideen die sich bewährt haben direkt nutzen bzw. hat es wesentlich einfacher zu organisieren.

Insofern gibt es auch keinen Grund einen Schwachpunkt einer anderen Listen an die große Glocke zu hängen. Es wird immer viel über Unstimmigkeiten diskutiert und nicht zu knapp von mir. Aber zunächst mal liegt mir nichts daran die Arbeiten anderer anzugreifen. Das wäre total kontraproduktiv, würde nur Unruhen auslösen und macht auch keinen Sinn.

Allerdings bin ich der Meinung das neue Erkenntnisse auch mal genutzt werden sollten. Auch eine Ratingliste muss hin- und wieder mal reformiert werden. Dinge müssen überdacht werden oder können wirklich besser gestaltet werden. Nun seit Ihr bei der CEGT ja auch alles alte Hasen und habt das wirklich gut im Griff.

Mein Problem ist z. B:
Ich muss irgend wann mal etwas anderes machen. Mich an einer Sache zu lange aufzuhalten macht mich unruhig. Könnte mir heute gar nicht mehr vorstellen etwas für die Arena Entwicklung zu tun oder eine Winboard Seite weiter zu pflegen oder laufend neue Interviews zu erarbeiten, Buchrezensionen zu schreiben. Das wäre mir alles viel zu eintönig. Und genau das ist auch wieder schlecht weil es an einer gewissen Konstanz fehlt. Nur was ich heute schon noch konstant?

Viele Grüße
Frank
Parent - - By peter struwel Date 2011-01-04 16:33
[quote="Frank Quisinsky"]
... Nur was ich heute schon noch konstant?

Viele Grüße
Frank
[/quote]
ich weiss es, das chaos ist die naturkonstante 
Parent - By Frank Quisinsky Date 2011-01-04 18:02
Ein gepflegtes und gut organisiertes Chaos gestaltet das Leben abwechslungsreicher. Natürlich gibt es gewisse Bereiche da ist ein Chaos ... wie gepflegt dieses Chaos auch immer sein mag ... eher hinderlich!
Parent - - By Ingo Bauer Date 2011-01-03 21:50
The final Stockfish 2.0 result is online:

http://www.inwoba.de

Sorry for the delay, I wanted to finish the full run.

Bye
Ingo
Parent - - By Frank Rahde Date 2011-01-03 22:43
Ich sehe weder die Stockfish-Ergebnisse noch das neue Rating auf Deiner HP. Sieht nach dem alten Stand aus. Strg+F5 brachte keine Besserung.

Gruß, Frank
Parent - - By Ingo Bauer Date 2011-01-03 22:47
[quote="Frank Rahde"]
Ich sehe weder die Stockfish-Ergebnisse noch das neue Rating auf Deiner HP. Sieht nach dem alten Stand aus. Strg+F5 brachte keine Besserung.

Gruß, Frank
[/quote]

Moin Frank

Browsercache! Ganz Sicher! Versuch mal nur F5, ohne CTRL.

Gruß
Ingo
Parent - By Frank Rahde Date 2011-01-03 22:53
Ja, nur F5 hat geholfen.

Danke+Gruß, Frank
Parent - - By Ernest Bonnem Date 2011-01-03 23:50
Hallo Ingo,

Nach dem Stockfish 2.0 Test, bei wieviel haben sich Houdini und Rybka geändert?
Parent - - By Ingo Bauer Date 2011-01-04 00:20
Bone soiree Ernest.

[quote="Ernest Bonnem"]
Hallo Ingo,

Nach dem Stockfish 2.0 Test, bei wieviel haben sich Houdini und Rybka geändert?
[/quote]

Houdini ist 2 Elo runter, Rybka 1 Elo. Das erschient mir normal, wenn ich mehr Engine mit 2900+ Elo hätte, würden die jetzigen Top Enignes alle ein wenig fallen. Aber du kannst das vielleicht mathematischer Begründen als ich mit meinem Bauchgefühl
Wobei die 2 Elo vielleicht auch BAyeselo geschuldet sind. Wie du sehen kanns ist die Errorbar mit Bayes bei so einer Topengine höher als gleich viele Spiele eine Mittelfeldengine ...

Gruß
Ingo
Parent - By Ernest Bonnem Date 2011-01-04 01:08
Naja, ich konnte es fühlen, weil Stockfish 2.0 gut gegen Houdini gemacht hat...
Parent - - By Benno Hartwig Date 2011-01-07 09:10 Edited 2011-01-07 09:13
Auf den IPON-Seiten steht zur relativen Häufigkeit der Stockfish-Updates:
"This is for sure the most frequent updated engine in the IPON and bit too much of one flavor."

Ich sehe ein, dass ein Listen-Erzeuger damit ein praktisches Problem hat, zu dem er sich dann was Praktikables überlegen muss.

Ich als Anwender finde hingegen ohne jede Einschränkung richtig gut, wenn häufige Updates zu einer Engine kommen!
Ich finde klasse, wenn ich an der Weiterentwicklung sehr zeitnah teilhaben kann.
Darum aus meiner Sicht: bitte sehr gern weiter so mit den häufigen Updates für Stockfish (und für andere Engines)!

Benno
Parent - - By Ingo Bauer Date 2011-01-07 10:54
Moin Benno,

[quote="Benno Hartwig"]
Auf den IPON-Seiten steht zur relativen Häufigkeit der Stockfish-Updates:
"This is for sure the most frequent updated engine in the IPON and bit too much of one flavor."

Ich sehe ein, dass ein Listen-Erzeuger damit ein praktisches Problem hat, zu dem er sich dann was Praktikables überlegen muss.
[/quote]

Ja, das Problem ist einfach das ich mit X Versionen einer Engine den Rest der Liste verzerre. Es gibt einen Durchschnittliches Perfomance gegen Stockfish. Alle Engines die unterdurchschnittlich performen werden duch diese häufigen Updates nach unten geschoben, alle überdurchschnittlichen nach oben gezogen. Das ist so lange kein Problem für eine Rangliste, so lange die verschiedenen Engineversionen auch verschieden sind und dann ein Problem, wenn die Engines praktisch identisch sind (Stockfish 1.7, 1.8, 1.9, 2.0). Zugegeben, die 2.0 hebt sich wieder ein bischen ab, aber 4 Versionen mit 30 Elo Differenz, die nach Aussage der Entwickler größtenteils nur Codebereinigungen und Vereinfachungen enthalten schieben eine Rangliste schon zurecht. Das benachteiligt die Engines, die eben nicht genauso häufig "updaten".

[quote="Benno Hartwig"]
Ich als Anwender finde hingegen ohne jede Einschränkung richtig gut, wenn häufige Updates zu einer Engine kommen!
Ich finde klasse, wenn ich an der Weiterentwicklung sehr zeitnah teilhaben kann.
Darum aus meiner Sicht: bitte sehr gern weiter so mit den häufigen Updates für Stockfish (und für andere Engines)!

[/quote]

Das sei dir unbenommen, weiß aber auch nicht ob man so etwas als Anwender überhaupt ordentlich überblicken kann und nochmal, für eine Rangliste kann so etwas verzerrend wirken. Bsp: Die Ivanhoes. Du darfst gerne versuchen einen 'täglichen Build' zu testen, das wird dir nicht ordentlich gelingen. (Wobei das ja ruhiger wird wie es scheint, eine Woche nach Houdini hat der erste ja schon aufgegeben, und sogar seine einen Neucompilierungsversuche "zurückgezogen ..."!) Sicherlich ist Stockfish nicht mit den Ivanhoes zu vergleichen. Bei Stockfish wird tatsächlich entwickelt und nicht nur mit einer geändertem Tabbreite compiliert, aber wenn es zuviel werden muß man als Ranglistenbetreiber eingreifen.
Im CCC habe ich das Bild eines Gärtners benutzt, ab und zu muß man Unkraut jäten
De fakto hat sich ja nicht viel geändert. Ich testete alle Stockfishe und habe einen, für den sich keiner mehr interessiert, wieder entfernt. Kein Beinbruch.

Gruß
Ingo
Parent - - By Benno Hartwig Date 2011-01-08 10:21
[quote="Ingo Bauer"]Du darfst gerne versuchen einen 'täglichen Build' zu testen, das wird dir nicht ordentlich gelingen... [/quote]Klar, versuche ich auch nicht.
Mir gefällt halt nur die Idee, dass man mir die neuesten kleinen Verbesserungen schnell gibt und nicht erst sammelt (und mich warten lässt).

Zu deinem Listen-Erzeuger-Problem:
Setze dir doch bei solchen Update-fleißigen Engines eine Zeitspanne (ein Kalenderjahr oder so), und nimm immer die erste Engine, die nach Beginn der Spanne veröffentlicht wird (oder bei Beginn bereits veröffentlicht ist).
Dann hast du prima Test-Rahmenbedingungen auch für diese Engine.
Und du musst dann nur eben damit leben, dass es immer mal wieder neuere Versionen gibt, über die in den Foren gesprochen wird, die in deiner Liste aber nicht auftauchen. Darüber darfst du dich dann natürlich nicht ärgern. Solltest diese Version den an ihr Interessierten aber auch nicht 'missgönnen'.

Benno
Parent - - By Ingo Bauer Date 2011-01-08 10:41 Edited 2011-01-08 10:44
Moin moin,

[quote="Benno Hartwig"]
...
Zu deinem Listen-Erzeuger-Problem:
Setze dir doch bei solchen Update-fleißigen Engines eine Zeitspanne (ein Kalenderjahr oder so), und nimm immer die erste Engine, die nach Beginn der Spanne veröffentlicht wird (oder bei Beginn bereits veröffentlicht ist).
Dann hast du prima Test-Rahmenbedingungen auch für diese Engine.
Und du musst dann nur eben damit leben, dass es immer mal wieder neuere Versionen gibt, über die in den Foren gesprochen wird, die in deiner Liste aber nicht auftauchen. Darüber darfst du dich dann natürlich nicht ärgern.
[/quote]

Ich praktiziere doch schon eine Mischung. Eine Top-Engine wie Stockfish ist einfach ein muß; ich muß wissen ob diese Version jetzt an irgendeiner Prominenz vorbeigezogen ist - dafür muß ich dann halt irgendwann mal etwas löschen. Andere Engines werden "relaxter" gehandhabt weil da sowohl mein, als auch das öffentliche INteresse fehlt. Kurz: Bei meine Liste ist es wie im Leben. Manche Dinge bekomen zu viel, andere zu wenig Aufmerksamkeit und hinterher ist man immer schlauer. So ist das eben!

[quote="Benno Hartwig"]
Solltest diese Version den an ihr Interessierten aber auch nicht 'missgönnen'.
[/quote]

Habe ich das irgendwann, irgendwo? Wenn ja so ist es ein Missverständniss.

Gruß
Ingo
Parent - By Benno Hartwig Date 2011-01-08 16:42
[quote="Ingo Bauer"][quote="Benno Hartwig"]Solltest diese Version den an ihr Interessierten aber auch nicht 'missgönnen'.[/quote]Habe ich das irgendwann, irgendwo? Wenn ja so ist es ein Missverständniss.[/quote]Sorry, das "and bit too much of one flavor" (miss)verstand ich als die Aufforderung, wenigner häufig mit neuen Stockfischen zu kommen.
Benno
Up Topic Hauptforen / CSS-Forum / Stockfish 2.0 running for the IPON...

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill