Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Thementurnierserie: Eure Meinung ist gefragt
- - By Timo Haupt Date 2014-04-21 12:58
Hallo zusammen,

einige werden sich vielleicht noch erinnern, dass ich hier vor einiger Zeit (inzwischen dürften es 2 Jahre sein) ein Projekt angekündigt hatte, welches Eröffnungsstellungen /-systeme auf Tauglichkeit für Computer abklopfen sollte. Dabei sollte möglichst hochwertiges Partiematerial gesammelt werden, damit die Qualität der Züge ein gutes Niveau aufweist. Damals hatte ich schon mal um Vorschläge gebeten bzgl. Bedenkzeit, Ponder etc. Von September 2012 bis ca. Januar 2013 ließ ich auch eine ganze Menge Partien (ich glaube so um die 22.000) bei langen Bedenkzeiten (110/40 und 50+1 für den Rest) spielen. Mein Fehler damals war allerdings - und da muss ich dem Einwand von Ingo Bauer Recht geben, der davor gewarnt hatte - dass ich mehr oder weniger versucht habe, Ranglistenmaßstäbe an mein Experiment anzulegen. D.h. ich wollte einerseits perfekte Laborbedingungen schaffen (jeder gegen jeden auf gleicher Hardware bei gleicher BZ auf 1 core, ponder=off), was dann zu einer guten Rangliste bei langer BZ geführt hätte, aber andererseits war es ja gar nicht mein Ziel, eine neue Rangliste aufzubauen (es gibt einfach schon so viele gute, warum noch mehr produzieren?), sondern Eröffnungen zu untersuchen und was Computer daraus machen. Ingos Einwand war nun, dass ich nach Ranglistenmaßstäben das Problem haben würde, die Partien nicht schnell genug produzieren zu können, um mit den Versionsständen der Engines einigermaßen aktuell zu bleiben. Das traf voll ins Schwarze, denn als die Partien von ca. 10 Engines vorlagen, waren 3-4 davon schon aktualisiert worden, so dass die Ergebnisse veraltet wirkten. Ich habe die Partien u.a. aus diesem Grund nie veröffentlicht - mein eigener Ärger über die suboptimale Vorgehensweise war ebenfalls viel zu groß.

Nun habe ich mir eine neue Vorgehensweise überlegt:
Meine 250 Eröffnungsstellungen, die ich zusammen mit einem Fernschachmeister und Eröffnungskenner in mühevoller Kleinarbeit ausgesucht habe, benutze ich für 250 Thementurniere. Dies hat gleich mehrere Vorteile aus meiner Sicht:
- Man beschäftigt sich viel intensiver mit den individuellen Ergebnissen einer Stellung, als wenn gleich die Ergebnisse / Partien aller 250 Stellungen vorliegen.
- Ich kann pro Eröffnung immer die zu diesem Zeitpunkt aktuellste Engineversion einsetzen, denn das Ziel ist ja keine Rangliste über alle Eröffnungen, sondern maximal eine Übersicht, welche Engine bei dieser spezifischen Stellung am besten scort.
- Ich kann mehr Engines einsetzen, da das Turnier nur aus einer "Runde" (Hin- und Rückspiel mit vertauschten Farben) besteht. Dadurch wird die Untersuchung der einzelnen Stellung viel genauer. Der Gesamtzeitraum aller 250 Stellung ist völlig egal, selbst wenn es 3 Jahre sein sollten.

Nun habe ich mir weitere Gedanken darüber gemacht, wie ich ein möglichst homogenes Teilnehmerfeld hinbekomme bzw. ob das überhaupt erforderlich ist. Man kann ja die Meinung vertreten, dass es für diese Art von Test (welche zugegebenermaßen sehr speziell ist) erstrebenswert ist, dass die Gegner alle auf einem möglichst gleichen Niveau spielen oder aber dass die übliche Spannbreite der Spielstärkeunterschiede, die es nunmal bei Engines gibt, bewusst in Kauf genommen wird. Falls letzteres zutrifft, würde ich einfach meine bislang verwendeten Konditionen beibehalten (1 core, ponder=off, Turnierbedenkzeit) - damit sind Voraussetzungen geschaffen, die wirklich jede Engine erfüllt. Somit brauche ich mir keine Gedanken über MP-Fähigkeit, Schwierigkeiten bei Ponder=On oder sonstiges Gedanken machen. Ich könnte mir einfach 25-30 Engines heraussuchen und loslegen. Wenn allerdings das Ziel wäre, die Spielstärkeunterschiede nicht zu groß werden zu lassen, könnte man anderweitig eingreifen. Ein paar Ideen:
- Man macht verschiedene Gruppen auf, damit innerhalb einer Gruppe der Elo-Unterschied bespielsweise maximal 250 beträgt. Wenn ich z.B. die IPON als Referenz hernehme, dürften in der ersten Gruppe nur Engines von 3110 (Houdini 4) bis ca. 2860 (Hannibal 1.4b) mitspielen. Die nächste Gruppe liegt dann zwischen 2610 und 2860 Elo. Zwei Gruppen würden wahrscheinlich schon genügen, wobei es wohl eine Ungleichverteilung gäbe, da es deutlich mehr Engines in Gruppe 2 als in Gruppe 1 gäbe. Ich möchte nämlich nicht zuviele Derivate in einer Gruppe haben, weil das die Untersuchungen eventuell verzerren könnte. Vorteil von zwei Gruppen wäre auch, dass ich unterschiedlich starke Versionen einer Engine reinnehmen könnte (einmal in Gruppe 1, einmal in 2). Bei Fritz habe ich das ohnehin vor, da es von 13 auf 14 aus meiner Sicht zwei völlig eigene Engines sind (Quest und Pandix). Auch Critter ist so ein Kandidat, der sich laut simtest seit ca. Version 0.9 stark in Richtung Houdini entwickelt hat, ältere Versionen weisen da deutlich weniger Ähnlichkeit auf. Nachteil des Gruppengedanken ist natürlich, dass nicht jeder gegen jeden spielt und somit auch wieder weniger Partiematerial am Ende vorliegt.
- Man stärkt schwächere Engines durch mehr Bedenkzeit, am besten in Form von "echter linearer Zeit" (gibt es eine GUI, die einer Engine mehr BZ geben kann als einer anderen?) oder notfalls in Form von mehr Cores (hier könnte ich von 6 bis 1 Core stufenweise skalieren). Das hat allerdings mehrere Nachteile: Es ist deutlich mehr Aufwand bzgl. Durchführung und es führt eventuell zu Verwirrungen beim Betrachten der Ergebnisse. Wenn man allerdings eine relativ homogene Spielstärke der Engines als die optimale Voraussetzung für das Experiment festlegt, wäre das wohl egal und man müsste diesen Aufwand akzeptieren, um möglichst gute Ergebnisse zu erhalten.

Mich würde nun eure Meinung zu dem Projekt inklusive der Spielbedingungen interessieren. Vielleicht hat ja jemand noch weiterführende gute Ideen dazu, die ich unterbringen kann. Oder vielleicht zeigt mir euer Meinungsbild auch auf, dass ich hier völlig auf dem Holzweg bin mit meiner Vorgehensweise. Ist sowas überhaupt für die Öffentlichkeit interessant? Bin mal gespannt auf eure Reaktionen!

Ich wünsche noch einen schönen Ostermontag und grüße alle herzlich,
Timo
Parent - - By Peter Martan Date 2014-04-21 13:39 Edited 2014-04-21 13:50
Hallo Timo!

Tatsächlich mache ich ziemlich genau all das, was dir da so vorschwebt seit Jahr und Tag, nur völlig ungeordnet, was die engines und die Hardwarezeit angeht, weil mein Hauptinteresse immer den Eröffnungsstellungen galt.
Bei denen habe ich mich hingegen schon früh auf das spezialisiert, was mein eigenes Eröffnungsbuch angeht, und in dem war mein Interesse immer den Systemen gewidmet, die relativ wenig Varianz haben, den Gegner auf möglichst enge Wege festlegen und so möglichst viel Wahrscheinlichkeit haben, dass das aus dem Buch auch gegen verschiedene Gegner auch wirklich aufs Brett kommt.
Mich würde es persönlich sehr reizen, einzelne Varianten im Forum (wie wär's mit einem eigenen Eröffnungstheorie- Forum? ) gemeinsam zu analysieren. Wenn du da aus guten Enginepartien Stoff lieferst, immer her damit, mir ziemlich egal, wie du's organisierst.

Eröffnungstheorie mit engines testen und umgekehrt ist sicher das Hauptinteresse von Fern- und Nahschachspielern beim Auswählen der engines und der Eröffnungen.
So gesehen müsstest du dann voll im Trend liegen, wenn es dir gelingt, für die Stellungen, die du spielen lässt, Interesse zu wecken.
Welche engines mit welchen selektiven Stellungen wie gut zurecht kommen, hängt sicher sehr davon ab, wie lange du die Bedenkzeiten wählst und auf welcher Hardware.
Die Zeiten und oder die Kernzahl der einen gegen die andere engine ungleich zu verteilen, mache ich auch immer wieder und halte ich durchaus auch für interessant, manche Stellungen und manche engines brauchen einfach mehr als andere.
Das Ergebnis sollte für mich eben auch nicht eine weitere Rangliste sein, sondern möglichst gute Varianten von möglichst viel schachlichem Interesse.
(Ob das dann überhaupt immer ganze Partien sein müssen und ob nur die ganzen und halben Punkte zählen oder auch schon interessante Varianten allein, wenn sie auf genug schachliches Interesse stoßen?
Ob eine zwanzig Züge lange Variante, die von einer ausgeglichenen Eröffnungsstellung zu einer mit eindeutigem Vorteil einer Seite führt oder zu einer, die immer noch unklar ist, sagt doch oft auch schon genug, nämlich, was die reine Eröffnungsbehandlung der engine angeht.
Ob sie dann im späten Mittel- und im Endspiel aus ganz anderen Gründen, die mit der Eröffnung eigentlich oft gar nichts mehr zu tun haben, zu einem gerade bei ähnlich starken engines oft genug reinem Zufallssieg oder Zufallsremis kommt, ist doch eigentlich sowieso eine ganz andere Frage, findest du nicht auch?)

Kurzum, mit allem, was du da so skizzierst, rennst du bei mir offene Türen ein, und eigentlich ist mir wirklich praktisch egal, wie du es genau durchziehst, wenn dabei gute Varianten herauskommen.
Viele  Schachspieler machen halt gern ein Geheimnis daraus, was sie so alles gespeichert haben, muss man auch verstehen, es sollte dann halt möglichst so sein, dass man darauf aufbauen kann, die berühmten Killervarianten waren sowieso gestern oder funktionieren heute nur mehr im reinen Enginespiel bei kurzen Bedenkzeiten. Hingegen hat wahrscheinlich kein guter Fernschachspieler ein Problem damit, etwas beizutragen an einzelnen Varianten, wenn's nicht gerade die aktuelle heißumkämpfte Mittelspielstellung des laufenden Turniers ist, besonders, wenn dafür von Anderen auch etwas zurückkommt an verwertbaren Gegenvarianten.

Auch dir noch schönen Ostermontag!
Parent - - By Timo Haupt Date 2014-04-21 14:36
Hallo Peter,

vielen Dank für das Teilen deiner Gedanken zu diesem Thema. Ja, die Stellungen würde ich schon ausspielen wollen, selbst wenn man per GUI auch nach einer bestimmten Anzahl Züge oder auch schon bei +/-1.5 Bauerneinheiten abbrechen lassen könnte. Aber da alle Engines unterschiedlich hoch bewerten, wäre das +1.5 bei der einen Engine vielleicht schon ein gewinnbringender Vorteil, bei der anderen würde noch zu beweisen sein, ob das wirklich gewinnträchtig ist oder einfach nur zu optimistisch bewertet.

Aber schön, dass dieser Projekt, wie es auch immer letztendlich durchgeführt wird, bei dir auf reges Gegeninteresse stoßen wird.

Viele Grüße
Timo
Parent - By Peter Martan Date 2014-04-21 16:23 Edited 2014-04-21 16:33
Timo Haupt schrieb:

Ja, die Stellungen würde ich schon ausspielen wollen, selbst wenn man per GUI auch nach einer bestimmten Anzahl Züge oder auch schon bei +/-1.5 Bauerneinheiten abbrechen lassen könnte. Aber da alle Engines unterschiedlich hoch bewerten, wäre das +1.5 bei der einen Engine vielleicht schon ein gewinnbringender Vorteil, bei der anderen würde noch zu beweisen sein, ob das wirklich gewinnträchtig ist oder einfach nur zu optimistisch bewertet.


Drum würde ich auch nicht nach den numerischen Evals einzelner engines abbrechen, sondern nach einer bestimmten Zugzahl.
Anstatt der Endeval, bei der dann wieder die Frage wäre, traue ich ihr oder der einer anderen engine, könnte man ja die Relation zur Ausgangseval  nehmen, ist die in einer bestimmten range, sagen wir, hat sie sich mindestens versechsfacht (0.25 für leichten Vorteil zu 1.50 für entscheidenden), wird ein ganzer Punkt gezählt, sind sich die zwei engines  innerhalb dieser Range nicht einig, wird so lang weitergespielt, bis sie es sind. Remis ist weniger als Verdopplung (von 0.25 auf weniger als 0.50), Vorzeichenumschlag wird doppelt gerechnet (-0.25 zu 0.25 ist zweifach, zu 0.75 ist 6fach).
So bricht das GUI nicht nach numerischer Eval ab, sondern entweder nach einer bestimmten Mindestanzahl, oder wenn sich die beiden engines über den Evalverlauf nach diesen fixen Zügen relativ zu ihrer eigenen Ausgangseval geeinigt haben.
Wäre eine, scheint mir, leichte Aufgabe für einen GUI- Programmierer und würde die jeweilige "Partie" auf diejenige Phase beschränken, die jeweils interessiert, in unserem (und wahrscheinlich für die Meisten häufigsten) Fall, die Eröffnung.
Du weißt, das ist eine alte Spinnerei von mir. Ich kann aber verstehen, wenn du lieber ganz ausspielen lassen willst, kostet ja wahrscheinlich auch nicht gar sooo viel mehr Zeit, wenn du viel Material gewinnen willst, und ich habe dich so verstanden, dass es dir in erster Linie darauf ankommt, könntest du schon um das, was du dir Endspiel- und Remisschieberei ersparst, sehr viel öfter neu anfangen.

Jedenfalls finde ich deine Idee von den Thementurnieren gut, lass dir wegen der Eröffnungen keine grauen Haare wachsen, wenn wer besonders gute Vorschläge hat, was viiiel interessanter wäre, als das, was dir vorschwebt, soll er einfach selber auch engine- Varianten dazu zeigen, dann kannst du ja immer noch diskutieren (lassen), ob du das aufnehmen sollst und willst.
Parent - - By Ingo B. Date 2014-04-21 13:42
So ad hoc scheinen mir die Bedinungen (1C, Turnierbedenkzeit) völlig ok.

Ich kenne deine Eröffnungen nicht, aber wenn du doppelrundig spielst sollte der Elounterschied nicht zu groß sein, weil in diesem Fall vielleicht Engine A so viel besser ist, das sie mit Weiß und Schwarz gewinnt (kann auch so passieren, passiert aber bei 250 Elo Abstand mit größerer Wahrscheinlichkeit). In dem Fall ist dein Erkenntnissgewinn über die Eröffnung ziemlich niedrig. (250 Elo sind zu viel, schau dir mal Shredder beim TCEC im Moment an ...)
Ebenso ist die Frage ob die Spiele einer zweiten, vermeintlich schwächeren Gruppe noch etwas bringen. Bundesliga ist halt etwas anderes als Kreisklasse ...
Andererseits besteht die Gefahr, dass du zu ähnliche Engines gegeneinander spielen läßt (z.B. mit Littokern). Der Erkenntnissgewinn ist dann auch geringer weil eben keine Engine einen wirklich anderen Blick auf die Eröffnung bietet ...

Engines die du ruhigen Gewissens im Moment nehmen könntest wären:

Houdini/Stockfish/Gull/Komodo

und dann ist aber auch schon Lücke bzw die zugrunde liegende Engine ist zu ähnlich oder zu schwach ...

Eigentlich weiß ich nicht genau was du willst. Wenn es dir um die Eröffnungen geht ist die klassische Analyse wahrscheinlich noch am besten. Wenn es dir um "Behandlung von Eröffnungen durch Engines" geht muß dein Enginepool kleiner oder die Bedenkzeit kürzer werden.

Schwieriges Thema das du dir da ausgesucht hast, aber gerne nehme ich die ein oder andere Eröffnung von dir, um mal auf dem Server zwei Partien (auch mit einem Kern) zu spielen. Wir finden schon ein Enginepaar das spannend ist.

Gruß
Ingo

PS:
Rumgesponnen:
Mach doch ein Top 5 Turnier das du immer mit den Top 5 aktuell hälst. Engines darunter interessieren sich für die Eröffnungsbehandlung sowie nur noch die Programmierer und ein paar "Frea... Fans".

3 Jahre Gesamtzeit sind auch OK? Rechne dir mal den Strompreis mit deinen Rechnern in drei Jahren aus ...
Ich finde Kabini echt nett
Parent - - By Timo Haupt Date 2014-04-21 16:03
Hi Ingo,

danke auch dir für die Anregungen.

- Dass nicht zuviele ähnliche Engines spielen sollten sehe ich genauso. Deshalb schrieb ich schon, dass ich Derivate weitestgehend vermeiden möchte. Ganz vermeiden lassen wird sich das nicht, weil ich dann z.B. auch auf Critter ab ca. Version 1 komplett verzichten müsste (ist dann Houdini sehr ähnlich), was ich aber nicht gerne möchte, da Critter für mich irgendwie dazu gehört.

- Auf schwächere Engines ganz zu verzichten widerspricht erstens dem Gedanken, dass ich möglichst breit testen möchte. Der Erkenntnisgewinn wäre mir zu gering, wenn ich nur Top-Engines nehmen würde, denn davon gibt es ja nur eine handvoll. Und zweitens möchte ich ja auch von den schwächeren gerne wissen, welche Eröffnungstypen diesen gut oder eben weniger gut liegen.

- Deinen Einwand, dass man die Elospanne nicht zu hoch wählen sollte, kann ich nachvollziehen. Ähnliche Gedanken kamen mir ja auch schon (siehe Ausgangsposting) - doch bin ich mir nicht sicher, ob dies wirklich zutrifft. Und wenn doch, könnte man dies durch unterschiedliche Bedenkzeiten wieder ausgleichen bzw. damit die Spielstärken einander angleichen. Wäre nur vom Gefühl her alles sehr "asymmetrisch" und geht mir deshalb zunächst mal gegen den Strich. Doch vielleicht ist es für dieses Experiment einfach notwendig, um ein homogenes Teilnehmerfeld zu schaffen.

- Ich verstehe folgende Aussage nicht:
Ingo Bauer schrieb:
Wenn es dir um "Behandlung von Eröffnungen durch Engines" geht muß dein Enginepool kleiner oder die Bedenkzeit kürzer werden.

Der Enginepool muss meiner Meinung nach dann gerade größer werden, weil ich sonst doch nur von ein paar Engines hinterher weiß, wie sie diese Eröffnungen behandeln. Und warum die BZ kürzer werden muss, kannst du mir das erklären?

- Top 5 Turnier: Dann könnte ich zu meiner ursprünglichen Spielweise zurückkehren und hätte innerhalb von ein paar Wochen alle 250 Stellungen durch. Wäre halt ein völlig anderes Projekt, hätte aus meiner Sicht zu wenig den Schwerpunkt auf den Eröffnungen selbst, sondern eher darin, welche der Top5 sich bei langer BZ und breit angelegten Eröffnungsvorgaben am besten gegen die anderen Tops durchsetzen kann.

Gruß
Timo

P.S.: Das mit den 3 Jahren war selbstverständlich nicht so gemeint, dass ich 3 Jahre lang nonstop meine Rechner durchgehend damit auslaste. Dann bräuchte ich allein dafür einen zweiten Job, nur um die Stromrechnung zu begleichen. 3 Jahre Gesamtzeit eher deshalb, weil es zwischendurch immer mal wieder längere Pausen geben wird, in denen ich nichts mache und / oder auf das Release einer neuen Engine warte, die dann beim nächsten Thementurnier eine andere ersetzen soll o.ä. Wenn es tatsächlich ca. 30 Engines werden, die pro Runde mitspielen, kommt man am Ende auf fast 220.000 Partien, falls man jeder gegen jeden spielt. Das könnte sich durchaus auch auf noch mehr Jahre verteilen, denn für die ca. 22.000 vormals gespielten waren es schon ca. 3 Monate.

Meine Rechner nun alle auf Kabini umzurüsten, dafür fehlt mir auch leider Zeit, Geld und die Lust. Sind zwar weitaus stromsparender, so dass sich das am Ende wohl sogar rechnen würde, aber die Anfangsinvestition wäre mir zu hoch. Noch halte ich die Phenom II X4 bzw. X6 auch noch nicht für so altes Eisen. Gut, der Stromhunger ist wirklich nicht gerade effizient...
Parent - By Michael Scheidl Date 2014-04-21 16:11
Ich habe zuerst geglaubt, Kabini wäre eine neue Schachengine.
Parent - - By Ingo B. Date 2014-04-21 19:05
Timo Haupt schrieb:


- Ich verstehe folgende Aussage nicht:
Ingo Bauer schrieb:
Wenn es dir um "Behandlung von Eröffnungen durch Engines" geht muß dein Enginepool kleiner oder die Bedenkzeit kürzer werden.

Der Enginepool muss meiner Meinung nach dann gerade größer werden, weil ich sonst doch nur von ein paar Engines hinterher weiß, wie sie diese Eröffnungen behandeln. Und warum die BZ kürzer werden muss, kannst du mir das erklären?


Vom schachlichen Standpunkt aus hast du sicher Recht, mir ging es nur um eine praktikable Durchführbarkeit. Wobei ich mir wieder dachte wie lange es dauert bis alle 250 Thementurniere durch sind. Darum geht es dir aber wohl gar nicht.

Timo Haupt schrieb:


- Top 5 Turnier: Dann könnte ich zu meiner ursprünglichen Spielweise zurückkehren und hätte innerhalb von ein paar Wochen alle 250 Stellungen durch.
...


und im Ursprungsposting schriebst du:

Timo Haupt schrieb:

- Ich kann pro Eröffnung immer die zu diesem Zeitpunkt aktuellste Engineversion einsetzen, denn das Ziel ist ja keine Rangliste über alle Eröffnungen, sondern maximal eine Übersicht, welche Engine bei dieser spezifischen Stellung am besten scort.
- Ich kann mehr Engines einsetzen, da das Turnier nur aus einer "Runde" (Hin- und Rückspiel mit vertauschten Farben) besteht. Dadurch wird die Untersuchung der einzelnen Stellung viel genauer. Der Gesamtzeitraum aller 250 Stellung ist völlig egal, selbst wenn es 3 Jahre sein sollten.

Meine Rechner nun alle auf Kabini umzurüsten, dafür fehlt mir auch leider Zeit, Geld und die Lust. Sind zwar weitaus stromsparender, so dass sich das am Ende wohl sogar rechnen würde, aber die Anfangsinvestition wäre mir zu hoch. Noch halte ich die Phenom II X4 bzw. X6 auch noch nicht für so altes Eisen. Gut, der Stromhunger ist wirklich nicht gerade effizient...


Die IPON bis Hanibal sind 10 Engines. Doppelrundig wären das 90 Partien. Ich bin mir nicht sicher ob du mit 90 Partien eine einzelne Stellung "viel genauer" untersuchen kannst. Immerhin sind 18 Partien einer Engine mit der selben Eröffnung aber doch ein Fingerzeig was eine Engine kann (aber nicht unbedingt eine Untersuchung der Eröffnung)!

Ein Einzelturnier ist ok, der Aufwand um irgendwann alle 250 Eröffnungen durchzuspielen ist enorm. Ich finde dein Projekt toll, habe aber Zweifel ob man das mit einer so langen Bedenkzeit machen muß ...

Ich weiß nicht welche Bedenkzeit du spielen willst, einmal sprichst du davon 110/40 und 50+1 für den Rest beizubehalten, dannn wieder von klassischer Turnierbedenkzeit (für mich 40/120+40/120+60 Rest / 600min max).
Aber ok 110 und 50. Worst case ist also 320min für die ganze Partie.
90 Partien pro Runde und das 250 mal sind 22500 Spiele.
22500 * 320min sind 7200000 Rechenminuten.
3 Spiele gleichzeitig an einem Rechner sind 2400000 Minuten oder 40000h mit einem Rechner.
Nehmen wir an dein Ph2 braucht 150 Watt/h unter Volllast (Mit mehr Rechnern kannst du die Zeit verkürzen, der Gesammtenergieverbrauch bleibt gleich):
40000h*150W=6000kW
1 kW = 25 Cent (billig!)
6000kw * 0,25€ = 1500€
(Realistisch sind einige Partien schneller um, sagen wir mal 1000€)

Wenn du das dann noch weiter machen willst mit einer unteren Engineklasse wird es entsprechend teurer.

Und jetzt rechne da mal einen Kabini der mit 4 Kernen, Board, CPU, RAM und (wichtig) richtigem Netzteil vielleicht 200€ kostet, aber unter Vollast nicht 150, sondern 20 Watt verbraucht ... (Wer will darf das natürlich auch mit einer neuen Intel CPU machen, da wird das Paket im Grundpreis aber teurer)

Ich jedenfalls bin am grübeln seit ich hier ein Kabini Netbook (genial!) habe (aber der Kabini Nachfolger ist auch schon wieder angekündigt...)

Gruß
Ingo

PS: Für diejenigen die Kabini immer noch für eine Engine halten:
http://www.computerbase.de/2014-04/amd-athlon-5350-kabini-sockel-fs1b-test/
Wer den Test liest, sollte noch bedenken das die Benchmarks mit GPU (Grafikkarte) sind. Wenn die nicht benutzt wird, wie im Schach, dürfte da entweder der Verbrauch sinken oder es ist noch etwas Raum für OC ohne dass das Ding deutlich mehr verbraucht. Sicherlich, die Einzelleistung von Kabini kommt nicht mit einem i7 mit, aber die CPU - Sorry APU heißt das jetzt - im Ganzen ist durchaus interessant.
Parent - - By Timo Haupt Date 2014-04-23 14:50
Hallo Ingo!

Ingo B. schrieb:

Ich weiß nicht welche Bedenkzeit du spielen willst, einmal sprichst du davon 110/40 und 50+1 für den Rest beizubehalten, dannn wieder von klassischer Turnierbedenkzeit (für mich 40/120+40/120+60 Rest / 600min max).
Aber ok 110 und 50. Worst case ist also 320min für die ganze Partie.
90 Partien pro Runde und das 250 mal sind 22500 Spiele.
22500 * 320min sind 7200000 Rechenminuten.
3 Spiele gleichzeitig an einem Rechner sind 2400000 Minuten oder 40000h mit einem Rechner.
Nehmen wir an dein Ph2 braucht 150 Watt/h unter Volllast (Mit mehr Rechnern kannst du die Zeit verkürzen, der Gesammtenergieverbrauch bleibt gleich):
40000h*150W=6000kW
1 kW = 25 Cent (billig!)
6000kw * 0,25€ = 1500€
(Realistisch sind einige Partien schneller um, sagen wir mal 1000€)


Im Grunde stimmt deine Rechnung, nur dass ich bei Ponder=Off ja 6 Spiele gleichzeitig an einem Rechner machen kann, somit muss man schon mal alles durch 2 dividieren. Die 150W müsste ich mal nachmessen - ich habe die CPUs extra per Undervolting etwas sparsamer konfiguriert. Aber selbst wenn es nur 130W sein sollten, ist es immer noch teuer genug. Also wenn wir dann 500€ für 22.500 Partien annehmen darf ich gar nicht darüber nachdenken, welcher Betrag dann für das 10-fache an Partien (so viele würden es, wenn ich 30 Engines, jeder gegen jeden und das dann für alle 250 Stellungen, nehmen würde) am Ende zu Buche steht. Mein Energieversorger wird sich freuen. Schade, dass Photovoltaik zur Selbstnutzung (also mit einer entsprechend großen Hausbatterie) noch so teuer ist. Wenn das für 5000€ zu haben wäre, könnte sich das lohnen... 

Ingo B. schrieb:
Und jetzt rechne da mal einen Kabini der mit 4 Kernen, Board, CPU, RAM und (wichtig) richtigem Netzteil vielleicht 200€ kostet, aber unter Vollast nicht 150, sondern 20 Watt verbraucht ... (Wer will darf das natürlich auch mit einer neuen Intel CPU machen, da wird das Paket im Grundpreis aber teurer)

Ich jedenfalls bin am grübeln seit ich hier ein Kabini Netbook (genial!) habe (aber der Kabini Nachfolger ist auch schon wieder angekündigt...)

Gruß
Ingo

PS: Für diejenigen die Kabini immer noch für eine Engine halten:
http://www.computerbase.de/2014-04/amd-athlon-5350-kabini-sockel-fs1b-test/
Wer den Test liest, sollte noch bedenken das die Benchmarks mit GPU (Grafikkarte) sind. Wenn die nicht benutzt wird, wie im Schach, dürfte da entweder der Verbrauch sinken oder es ist noch etwas Raum für OC ohne dass das Ding deutlich mehr verbraucht. Sicherlich, die Einzelleistung von Kabini kommt nicht mit einem i7 mit, aber die CPU - Sorry APU heißt das jetzt  - im Ganzen ist durchaus interessant.

Na, das hat mich dann doch neugierig gemacht. Vor allem, weil so ein Mini-ITX System viel schneller zusammengeschustert werden kann als meine anderen Micro-ATX-Würfel. Habe mir jetzt mal die Komponenten für ein System mit Kabini und eines mit dem 4-Kern Bay Trail Celeron bestellt. Arbeiten ja beide mit 2 GHz und liegen beide so bei ca. 20W im Verbrauch. Werde mal testen, welches sich besser für Schach eignet (das andere bekommt dann meine Frau als Arbeitssystem). Wenn mir das dann gefällt, werde ich wohl sukzessive umrüsten - langfristig wird sich das Portemonnaie bedanken. Außerdem muss ich sowieso 3 der Systeme kurzfristig ersetzen - die sind inzwischen 4 Jahre alt und haben die ersten Macken.

Viele Grüße
Timo
Parent - - By Tom Paul Date 2014-04-23 15:29
5000€, wie viel kostest das System aktuell?
Parent - - By Timo Haupt Date 2014-04-23 18:31
Tom Paul schrieb:

5000€, wie viel kostest das System aktuell?


Meinst du eine Photovoltaikanlage mit Hausbatterie? Habe keine genauen Zahlen, mich aber vor ca. 2 Jahren mal erkundigt. Eine Anlage in der Größenordnung, dass es zur Versorgung der Rechner reicht, wird wohl momentan noch um die 30.000-35.000€ kosten. Vielleicht reicht das noch nicht mal...

Oder meinst du einen einzelnen Bay Trail bzw. Kabini Rechner? Da liegt man bei ca. 200€. Wenn ich mir 16 Stück von den Dingern kaufen würde, um meinen bestehenden "Mini-Cluster" zu ersetzen, käme ich also auf 3200€. Gesamtenergiebedarf bei Volllast momentan (geschätzt): 1,4 KW. Nach Umrüstung vielleicht noch 350W. D.h. momentan verbrauche ich das Vierfache an Energie. Wenn man also die Energiekosten des Projektes tatsächlich auf ca. 5000€ beziffert, würde ich mit den Kabinis nur noch bei 1250€ liegen. Plus Anschaffungskosten liege ich also bei 4450€. Somit ist eine sofortige Umrüstung sinnvoll. Brauche nur noch jemanden, der mir meine Phenom II X4 bzw. X6 Rechner abkauft... 

Naja, man darf nicht vergessen, dass dieses Projekt insgesamt mehrere Jahre dauern wird. Gehen wir mal von 4 Jahren aus, dann liege ich in etwa bei 100€ im Monat für das Gesamtprojekt. Soviel ist mir das Hobby wert. Allerdings habe ich noch keine Preissteierungen beim Strom mit berücksichtigt, die sehr wahrscheinlich kommen werden.
Parent - By Ingo B. Date 2014-04-24 06:42
Timo Haupt schrieb:

... Allerdings habe ich noch keine Preissteierungen beim Strom mit berücksichtigt, die sehr wahrscheinlich kommen werden.


Die kannst du vernachlässigen, weil sie dich sogar stärker mit deinen Phenoms treffen würden. Jede Preiserhöhung macht dein System rentabler- du kannst dich dann über Preiserhöhun gen freuen

Pro Takt und absolut verlierst du schon mit den Kabini/Trails. Wenn du es ganz genau machen willst müsstest du eigentlich
noch eine verlängerte Bedenkzeit mit einrechnen

Gruß
Ingo
Parent - - By Ingo B. Date 2014-04-24 06:36
Hallo Timo,

Das du P-OFF mit langen Bedenkzeiten spielen wolltest wußte ich nicht und halte ich, gerade für dein Experiment, für suboptimal und Schade.

Timo Haupt schrieb:


Ingo B. schrieb:
Und jetzt rechne da mal einen Kabini der mit 4 Kernen, Board, CPU, RAM und (wichtig) richtigem Netzteil vielleicht 200€ kostet, aber unter Vollast nicht 150, sondern 20 Watt verbraucht ... (Wer will darf das natürlich auch mit einer neuen Intel CPU machen, da wird das Paket im Grundpreis aber teurer)

Ich jedenfalls bin am grübeln seit ich hier ein Kabini Netbook (genial!) habe (aber der Kabini Nachfolger ist auch schon wieder angekündigt...)

Gruß
Ingo

PS: Für diejenigen die Kabini immer noch für eine Engine halten:
<a class='ura' href='http://www.computerbase.de/2014-04/amd-athlon-5350-kabini-sockel-fs1b-test/'>http://www.computerbase.de/2014-04/amd-athlon-5350-kabini-sockel-fs1b-test/</a>
Wer den Test liest, sollte noch bedenken das die Benchmarks mit GPU (Grafikkarte) sind. Wenn die nicht benutzt wird, wie im Schach, dürfte da entweder der Verbrauch sinken oder es ist noch etwas Raum für OC ohne dass das Ding deutlich mehr verbraucht. Sicherlich, die Einzelleistung von Kabini kommt nicht mit einem i7 mit, aber die CPU - Sorry APU heißt das jetzt  - im Ganzen ist durchaus interessant.

Na, das hat mich dann doch neugierig gemacht. Vor allem, weil so ein Mini-ITX System viel schneller zusammengeschustert werden kann als meine anderen Micro-ATX-Würfel. Habe mir jetzt mal die Komponenten für ein System mit Kabini und eines mit dem 4-Kern Bay Trail Celeron bestellt. Arbeiten ja beide mit 2 GHz und liegen beide so bei ca. 20W im Verbrauch. Werde mal testen, welches sich besser für Schach eignet (das andere bekommt dann meine Frau als Arbeitssystem). Wenn mir das dann gefällt, werde ich wohl sukzessive umrüsten - langfristig wird sich das Portemonnaie bedanken. Außerdem muss ich sowieso 3 der Systeme kurzfristig ersetzen - die sind inzwischen 4 Jahre alt und haben die ersten Macken.

Viele Grüße
Timo


Ich habe ja einen 1GHz Kabini. Ich schick dir heute Abend mal ein paar Benchmarks. Den Celeron halte ich für etwas schneller pro Takt, aber glaube auch das ein vergleichbares Gesamtsystem teurer ist und habe Zweifel ob der 20W im CPU Lastbetrieb ...
Wie im Test zu lesen ist das Netzteil wichtig. Wollte ich nur nochmal erwähnen, nicht das das untergeht.
Ansonsten bin ich auf die Bay Trail Ergebnisse gespannt! Schick mir die mal.

Gruß
Ingo
Parent - By Timo Haupt Date 2014-04-24 09:54
Hi Ingo!

Ingo B. schrieb:

Das du P-OFF mit langen Bedenkzeiten spielen wolltest wußte ich nicht und halte ich, gerade für dein Experiment, für suboptimal und Schade.


Ich weiß, dass du Ponder=On Verfechter bist und ich bin es prinzipiell auch, weil es die "natürliche Art" des Schachspielens repräsentiert (welcher Mensch würde in einer Partie auf die Idee kommen, mit dem Denken aufzuhören, weil der Gegner am Zug ist?). Nur muss ich mir genau überlegen, wie ich bei diesem Langzeitexperiment die Ressourcen einsetze (=Kosten!) und da muss man halt Kompromisse eingehen. Da ich ja nicht primär Enginestärke messen will, kommt es auf Ponder in der Turnierserie halt nicht so stark an. Wenn wir insgesamt von einer Ponderhitrate von 50% ausgehen (keine Ahnung, ob das hinkommt, war einfach nur geschätzt), habe ich immer noch 25% der Gesamtrechenzeit "verschwendet". 25% von den vormals angesprochenen 1000€ sind immerhin 250€. Ok, ganz verschwendet ist es nicht, da ja auch sinnvolle Hasheinträge in der umsonst geponderten Zeit hinzukommen, aber grundsätzlich stehen dabei für mich Aufwand und Ertrag nicht mehr im richtigen Verhältnis. Für kürzere Projekte würde ich immer Ponder=On spielen, allein schon deshalb, weil es beim Zuschauen viel mehr Spaß macht!

Ingo B. schrieb:

Ich habe ja einen 1GHz Kabini. Ich schick dir heute Abend mal ein paar Benchmarks. Den Celeron halte ich für etwas schneller pro Takt, aber glaube auch das ein vergleichbares Gesamtsystem teurer ist und habe Zweifel ob der 20W im CPU Lastbetrieb ...
Wie im Test zu lesen ist das Netzteil wichtig. Wollte ich nur nochmal erwähnen, nicht das das untergeht.
Ansonsten bin ich auf die Bay Trail Ergebnisse gespannt! Schick mir die mal.

Die Teile sind soeben eingetroffen und ich werde nun zusammenbauen (hab Urlaub). Schicke dir gerne die Ergebnisse, sobald sie vorliegen.

Gruß
Timo

P.S.: Falls du z.Zt. auch Urlaub hast, melde dich ruhig - dann können wir gerne mal die Partie auf dem Server ansetzen, über die wir neulich gemailt haben.
Parent - - By Ingo B. Date 2014-04-24 06:50
Timo Haupt schrieb:

... und liegen beide so bei ca. 20W im Verbrauch. Werde mal testen ...


Eine Sache habe ich vergessen. Ich habe einen 6Kerner Bulldozer hier den ich als Server für Turniere und Medienrechner am Fernseher benutze. Den habe ich auf 1400 MHz untertaktet. Dann wollte ich die CPU Spannung runtersetzen bis die CPU nicht mehr mitmacht. Leider hörte das Bord bei 0.85V auf ... und meine CPU lief immer noch.
Das Problem ist nun, das mein "Billigpowermeter" zw. 3,7, und 20W schwankt. Der einzelne Computer verbraucht so wenig, das ich das nciht ordentlich nachmessen kann. Je nachdem was du zum nachmessen benutzt/hast, könntest du da auch Probleme bekommen ...

Gruß
Ingo
Parent - - By Timo Haupt Date 2014-04-24 20:09
Hi Ingo,

hab inzwischen die Messwerte. Ich poste sie mal hier, weil sie eventuell auch andere Leute im Forum interessieren.

Leistungsmäßig sind Kabini und Bay Trail (jeweils mit 2 GHz) ziemlich exakt auf dem gleichen Niveau. Im Fritz Benchmark (mit einem Thread) erreichen beide ca. 1000 kN/s, im Stockfish-Bench (gemessen mit SF 2.31, weil ich gerade keine andere Version zur Hand hatte) ca. 500kN/s und eine Gesamtzeit von ca. 10000ms. Die Abweichungen liegen bei 1-2% im Rahmen der Messungenauigkeit. Ein Phenom II Kern bei 3 GHz erreicht beim Fritzmark Werte um die 1800 kN/s und ist beim Stockfish-Bench ziemlich exakt doppelt so schnell wie Kabini / Bay Trail (Gesamtzeit ca. 5000ms und 1000 kN/s). Schon erstaunlich, dass die kleinen Dinger so gut mithalten können, wenn man bedenkt, dass der Phenom 50% höher getaktet ist. Vermutlich hat der Phenom nur noch deshalb eine höhere ProMHz-Leistung, weil er im Gegensatz zu den Winzlingen einen L3-Cache besitzt.

Nun kommt das Entscheidende, nämlich der Energieverbrauch: Mein Powermeter misst auch im niedrigen Bereich offenbar recht gut, somit konnte ich die Werte ermitteln. Mein Vorgehen: SF 2.31 jeweils 4mal (auf dem Phenom 6mal) in der Konsole gestartet, auf 1 Thread und 1024MB Hash gesetzt und dann go depth 40.
Ergebnisse:
Phenom II X6 @ 3GHz (Undervolted): 120W
Kabini @ 2GHz: 26W
Bay Trail @ 2GHz: 20W

Jetzt kann man die Werte von Kabini und Bay Trail nicht zu 100% miteinander vergleichen, da ich zwei verschiedene MiniITX-Gehäuse verwendet habe (eines mit 60W Netzteil, eines mit 90W Netzteil). Könnte sein, dass das Bay Trail Netzteil etwas effektiver ist - allerdings sind das trotzdem noch 30% mehr Energieverbrauch unter Volllast. Denke mal, dass man das nicht komplett aufs Netzteil schieben kann. Trotzdem sind beide Plattformen deutlich sparsamer als der Phenom und lohnen sich deshalb für Dauereinsatz bei Computerschach-Tests.

Hier nochmal die Komponenten des Bay Trail Systems (Preise von Alternate):
GIGABYTE GA-J1900N-D3V inkl. Intel® Celeron® J1900, Mainboard € 87,90*
MS-TECH CI-57, Gehäuse schwarz, inkl. 60-Watt-Netzteil € 51,90*
Mushkin SO-DIMM 8 GB DDR3-1333 Kit, Arbeitsspeicher 996647, Essentials-Serie € 61,90*

So kommt man auf ca. 200€. Wenn man nun noch eine kleine SSD für ca. 50€ hinzunimmt (ich hatte noch eine aus dem ersetzten Phenom II X4 System), hat man für 250€ einen kompletten 4-Kern Rechner.

Viele Grüße
Timo
Parent - - By ? Date 2014-04-24 21:45
Timo Haupt schrieb:


Mein Powermeter misst auch im niedrigen Bereich offenbar recht gut, somit konnte ich die Werte ermitteln. Mein Vorgehen: SF 2.31 jeweils 4mal (auf dem Phenom 6mal) in der Konsole gestartet, auf 1 Thread und 1024MB Hash gesetzt und dann go depth 40.
Ergebnisse:
Phenom II X6 @ 3GHz (Undervolted): 120W
Kabini @ 2GHz: 26W
Bay Trail @ 2GHz: 20W



Na ja, in dem verlinkten Test war der Unterschied NUR wegen Netzteil von rund 20W zu 35W. Sicher wissen wir es erst wenn du die Netzteile mal tauscht ...
Das die beiden zienlich gleich auf sind freut mich, insbesondere wenn man sieht das der Kabini ein paar Sächelchen mehr kann die der Bay Trail nicht so will (CPU Funktionen). Ob man die braucht sei mal dahingestellt, für Schach sicher nicht.

Bin auf weiteres gespannt
Ingo
Parent - - By Timo Haupt Date 2014-04-25 12:44
Weitere Zwischeninfo:

Mir ist gerade aufgefallen, dass bei Bay Trail standardmäßig der Turbo eingeschaltet ist und die Kerne mit 2,4 GHz statt mit 2,0 GHz laufen. Schalte ich den Turbo im BIOS ab, dann liegen 2,0 GHz an, aber im Fritzbenchmark sind es dann nur noch 850 statt 1000 kN/s. Somit  ist also die ProMHz-Leistung bei Kabini doch höher als bei Bay Trail! Weiterhin unterstützt Kabini im Gegensatz zu Bay Trail AVX, was aber bei Schach keine Rolle spielen dürfte. Vorteil bei Bay Trail ist dann lediglich, dass er trotz "Übertaktung" auf 2,4 GHz weniger Strom verbraucht. Außerdem ist es im Prinzip ein passiv gekühltes System (im Gehäuse befinden sich zwar zwei langsam drehende Lüfter, aber die bräuchte man wohl nicht unbedingt).

Ich würde gerne einfach die Netzteile tauschen, doch die haben leider unterschiedlichen Output (einmal 12V, einmal 19V), das heißt die Spannungswandler-Platine in den einzelnen MiniITX-Gehäusen sind unterschiedlich. Somit leider nicht direkt vergleichbar. Ist also gut möglich, dass ein Teil des höheren Verbrauchs auf das Netzteil zurückzuführen ist. In dem verlinkten Test war es allerdings einmal ein externes und einmal ein internes (quasi ein "richtiges" ATX-Netzteil) Netzteil - da wird der Unterschied schon deutlich größer ausfallen als bei mir - hier sind es beides externe Netzteile.

Weitere Infos folgen!
Timo
Parent - - By ? Date 2014-04-25 16:14
Timo Haupt schrieb:

...

Ich würde gerne einfach die Netzteile tauschen, doch die haben leider unterschiedlichen Output (einmal 12V, einmal 19V), das heißt die Spannungswandler-Platine in den einzelnen MiniITX-Gehäusen sind unterschiedlich. Somit leider nicht direkt vergleichbar. Ist also gut möglich, dass ein Teil des höheren Verbrauchs auf das Netzteil zurückzuführen ist. In dem verlinkten Test war es allerdings einmal ein externes und einmal ein internes (quasi ein "richtiges" ATX-Netzteil) Netzteil - da wird der Unterschied schon deutlich größer ausfallen als bei mir - hier sind es beides externe Netzteile.



Na ja, auch im von mir verlinkten Test war der Kabini egal welches Netzteil immer ein kleines bisschen "hungriger". Aber, egal auf dem Niveau!

Was für ein Board, Lüfter, Gehäuse ... hast du den für den Kabini, geht das was im Bios mit OC und wenn ja wie sieht es dann mit Energieverbraus aus?

Ich merke schon, ich rede mir das Ding schön

Gruß
Ingo
Parent - By Ingo B. Date 2014-04-25 16:56
Zitat:


Ich merke schon, ich rede mir das Ding schön



Nein nein, im Sommer trette ich immer etwas kürzer, und auch wenn ich nichts davon halte "zu warten", warte ich das doch nochmal den Sommer über ab:

http://www.computerbase.de/2014-04/beema-amds-kabini-nachfolger-wird-dienstag-enthuellt/

Bin gespannt!

Gruß
Ingo
Parent - - By Michael Scheidl Date 2014-04-21 14:23
Man kann in Fritz Engines zusätzliche Zeit von bis zu 200% gewähren. - Jedoch leider nur in Enginematches, nicht in Turnieren, zumindest nicht bis Version 13.

Ist die Einschränkung auf eine Elobandbreite von max. 250 je Gruppe wirklich erforderlich? Ich habe mit Großtests und sehr detaillierter Betrachtung solcher Faktoren keine eigene Erfahrung. Vielleicht wird es einfacher, wenn Du drei statt zwei Gruppen einteilst?

Eine erwünscht große Anzahl von Partien ließe sich dennoch erreichen, wenn Du die Gruppen zweimal, jedoch mit deutlich verschiedener Bedenkzeit, spielen läßt. Vielleicht im Verhältnis 3:1 falls das die Zeit erlaubt. Über die Anzahl Cores wird das wohl nicht gehen, zumal mehrere recht starke Engines kein SMP unterstützen.

Bei TCEC treten zwar ziemlich viele an die sogar mindestens 8 Cores benützen können, die jedoch zu Beginn über eine sehr große Bandbreite der Spielstärke gestreut sind. Leider finde ich momentan keine Gesamtliste für S6/Stufe 1 mit Ratings.

Die Ergebnisse wären bestimmt (mindestens) zur Gestaltung eines hochwertigen Sets von Eröffnungsvorgaben interessant.

Haben diese 250 Varianten alle eine bestimmte Länge, oder werden sie bis zu einer "kritischen Stellung" oder wie das heißt, geführt?

(Ich bin zwar Eröffnungs-Neandertaler habe mich aber natürlich zeitweilig schon näher mit der Theorie befaßt. Aber nicht in große Tiefen.)

Viel Freude mit dem Projekt!
Parent - - By Hauke Lutz Date 2014-04-21 14:30
Auf Arena kann man einstellen, dass eine Engine nur noch z.B. 20% der regulären Spielzeit bekommt.
Parent - By Timo Haupt Date 2014-04-21 15:38
Hallo Hauke,

danke für den Hinweis. Das funktioniert tatsächlich, man kann bis auf 1% der regulären Zeit runtergehen. Habe das gerade getestet: 5min pro Partie, SOS vs. Spike, Spike bekommt 20% der Zeit. Einziger Wermutstropfen: Die Uhr zeigt trotzdem für beide Seiten die reguläre Spielzeit. Die zeitlich beschnittene Engine nimmt sich davon aber maximal das, was ihr über die Prozentwerte vorgegeben wurde.

Viele Grüße
Timo
Parent - By Timo Haupt Date 2014-04-21 14:52
Hallo Michael,

die Idee mit den unterschiedlichen Zeiten hatte ich auch schon. Ist auf jeden Fall interessant, testet jedoch eher etwas anderes (welche Engine profitiert von mehr Bedenkzeit ggf. stärker als andere).

Die Stellungen haben alle unterschiedliche Längen und enden in einer Position, in der es mehrere gute Möglichkeiten gibt, die Partie fortzusetzen. Deshalb war es auch soviel Arbeit, die Stellungen auszuwählen. Wesentlich einfacher wäre es gewesen, immer stur nach z.B. 8 Zügen abzubrechen. Aber dann hat man eben auch viele Stellungen, in denen es einen eindeutig besten Zug gibt (eventuell sogar eine fast erzwungene Serie von besten Zügen). Das eignet sich eher für einen "Stellungstest" - ich wollte aber, dass die Engine selbst einen "Plan" entwickelt bzw. sich für eine von mehreren aussichtsreichen Möglichkeiten entscheidet.

Die Positionen sind fast alle in einer recht frühen Eröffnungsphase (ähnlich wie im TCEC) angesiedelt, so dass die Engines genügend Freiraum haben, ihr Spiel zu entfalten. Insofern ist das Grundset der 250 Stellungen vielleicht für Fernschachspieler erst einmal nicht so interessant, da alles noch innerhalb der Theorie ist. Erst wenn eine Engine in dieser frühen Phase vielleicht mal eine spielbare Neuerung errechnet, wird es für Fernschach vielleicht interessant. Wichtig war mir eine breitangelegte Spreizung über die verschiedenen ECO-Codes. Wenn die Sache auf größeres Interesse stößt, kann man natürlich im Nachhinein weitere Stellungen hinzunehmen, die auch deutlich tiefer in die Theorie rein gehen. Am Anfang geht es jedoch erst einmal über einen ersten Überblick über die ECO-Systeme. Eventuell lassen sich auch Tendenzen ablesen, welche Systeme für Engines mit welcher Farbe generell nicht so geeignet sind (z.B. sagte man das mal von Königsindisch mit Schwarz, doch man wird sehen, ob das heutzutage auch noch gilt). Oder aber ob bestimmte Engines Vorlieben für bestimmte Systeme haben - der Naum-Autor hat das für seine Engine damals mal angedeutet, ich finde jedoch den entsprechenden Thread im Talkchess-Forum nicht mehr.

Viele Grüße
Timo
Parent - - By Clemens Keck Date 2014-04-21 15:19
Hallo Timo

die Idee ist sehr interessant. Jedoch mit einer Dopperunde wirst Du nicht viel erfahren über Deine Eröffnungsvorgaben.
Spiele nur mal eine oder zwei Stellungen mit den Top 4 engines durch. Wiederhole das gante mehrere Mal, und es könnte durchaus sein das Du weniger weist als vorher.
Wenn es allerding eh nicht so supergenau drauf ankommt, und der Spielspaß im Vordergrund steht, dann leg doch einfach los
Man kann ja hinterher mal kucken ob sich bestimmte Muster aus den Eröffnungvorgaben wiederholen.

Schöne Ostern noch

Clemens
Parent - - By Timo Haupt Date 2014-04-21 15:40
Clemens Keck schrieb:

Hallo Timo
die Idee ist sehr interessant. Jedoch mit einer Dopperunde wirst Du nicht viel erfahren über Deine Eröffnungsvorgaben.
[snip]


Hallo Clemens,

naja, wenn man wirklich viele Engines hernimmt, finde ich schon, dass man viel herausfinden kann.
Rechenbeispiel:
30 Engines, jeder gegen jeden, doppelrundig: 870 Partien. Finde ich für eine einzige Eröffnungsvorgabe schon eine Menge an Partiematerial.

Viele Grüße
Timo
Parent - By Clemens Keck Date 2014-04-21 15:59
Streng genommen, wenn es rein um die Eröffnungen geht, sollte immer die selbe engine gegen sich spielen. Dann sollte es am genausten werden.
Oder die Elos sollten sehr eng beieinander liegen. Dann spielen aber schon die Stärken und Schwächen der einzelnen engines eine große Rolle.

Sedats Buchturnier , da spielen auch nur die Bücher die Hauptrolle. Die engine ist immer nur die Selbe.
Parent - By Kurt Utzinger Date 2014-04-21 15:44
Hallo Timo
Hier meine klaren Präferenzen aus Deiner Sicht (ab-)geschrieben:

Meine 250 Eröffnungsstellungen, die ich zusammen mit einem Fernschachmeister und Eröffnungskenner in mühevoller Kleinarbeit ausgesucht habe, benutze ich für 250 Thementurniere. Dies hat gleich mehrere Vorteile aus meiner Sicht:
- Man beschäftigt sich viel intensiver mit den individuellen Ergebnissen einer Stellung, als wenn gleich die Ergebnisse / Partien aller 250 Stellungen vorliegen.
- Ich kann pro Eröffnung immer die zu diesem Zeitpunkt aktuellste Engineversion einsetzen, denn das Ziel ist ja keine Rangliste über alle Eröffnungen, sondern maximal eine Übersicht, welche Engine bei dieser spezifischen Stellung am besten scort.
- Ich kann mehr Engines einsetzen, da das Turnier nur aus einer "Runde" (Hin- und Rückspiel mit vertauschten Farben) besteht. Dadurch wird die Untersuchung der einzelnen Stellung viel genauer. Der Gesamtzeitraum aller 250 Stellung ist völlig egal, selbst wenn es 3 Jahre sein sollten.

Man kann ja die Meinung vertreten, dass es für diese Art von Test (welche zugegebenermaßen sehr speziell ist) erstrebenswert ist, dass die die übliche Spannbreite der Spielstärkeunterschiede, die es nunmal bei Engines gibt, bewusst in Kauf genommen wird. Falls letzteres zutrifft, würde ich einfach meine bislang verwendeten Konditionen beibehalten (1 core, ponder=off, Turnierbedenkzeit) - damit sind Voraussetzungen geschaffen, die wirklich jede Engine erfüllt.

All übrigen Gedankenspiele sind m.E. zu kompliziert.

Mfg
Kurt
Parent - - By Timo Haupt Date 2014-04-23 15:08
Nochmal lieben Dank an alle, die sich zu dem Thema geäußert haben!

Ich habe mich noch nicht final entschieden, aber es wird wohl darauf hinauslaufen, dass ich mit ca. 25 Engines (jeder gegen jeden) testen werde. Dann gibt es immerhin 600 Partien pro Eröffnungsstellung, was schon recht genau ausleuchten sollte, wo Stärken und Schwächen liegen (der Engines bzw. auch der Eröffnung). Jeder gegen jeden hat den Vorteil, dass man jederzeit aus den dann vorliegenden Ergebnissen Subsets bilden kann. Z.B. kann ich mir die Ergebnisse der Top 6 untereinander herausgreifen oder aber 12 Engines aus dem Mittelfeld, die spielstärkemäßig alle recht dicht beieinander liegen. Somit kann jeder nach seiner Präferenz das Partiematerial und die Ergebnisse nutzen, um seine eigenen Statistiken zu erstellen.

Eventuell mache ich noch eine zweite Runde mit verkürzter BZ, in welcher ich versuchen werde, die Spielstärken der Engines über unterschiedliche Bedenkzeitverteilung einander anzugleichen (Arena erlaubt das, darauf wies Hauke Lutz weiter oben hin). Allerdings stoße ich dort auf das Problem, dass bei einer angenommenen 70 Elo Steigerung pro BZ-Verdoppelung trotzdem noch sehr lange BZ für die schwächeren Engines zusammenkommen. Angenommen, mein schwächster Teilnehmer hat ca. 2690 Elo (IPON), dann besteht eine Differenz von ca. 420 Elo zur Spitze. Um die auszugleichen, müsste ich 6mal die BZ verdoppeln. Angenommen, die Grundzeit beträgt 2min / Partie (für die Spitze), dann bekäme die schwächste Engine volle 128min / Partie! Das wäre schon ein krasse Missverhältnis und vom Gefühl her so ungerecht, dass man sich nicht wirklich vorstellen kann, dass z.B. Houdini 4 dann mit 2min einem MinkoChess 1.3 mit 128min ebenbürtig wäre. Aber wer weiß?!

Viele Grüße
Timo
Parent - - By Ludwig Buergin Date 2014-04-23 16:54
Hallo Timo

Deine Schreiben und auch die Schreiben zu Deinem Vorhaben habe ich allesammt ein oder gar mehrmals durchgelesen.Leider praktisch nix verstanden.
Vermutlich bringt mich meine Beschäftigung mit dem Anpassen von  Eröffnungzügen an eine jeweilige Engine in einen gedanklichen Tunnel.
  Bin auf jeden Fall an den Ergebnissen Deiner kommenden Arbeit interessiert, wobei 3 Jahre schon eine lange Zeitspanne ist.

Gruß Ludwig
Parent - - By Timo Haupt Date 2014-04-23 18:39
Hallo Ludwig,

gerne will ich versuchen, das ganze Projekt nochmal vereinfacht darzustellen.

Ich habe insgesamt 250 Vorgabestellungen gesammelt (jeweils recht frühe Eröffnungsphase, verteilt über alle ECO-Codes). Nun werde ich diese nacheinander abarbeiten, indem ich für jede einzelne dieser Stellungen ein separates Turnier mit ca. 25 Engines spielen werde. Das nennt man dann Thementurnier, da das Thema des Turniers diese einzelne Eröffnungsvorgabe ist, die jede teilnehmende Engine gegen jede andere einmal mit Weiß und einmal mit Schwarz spielen muss. Bei 25 Engines kommen so für ein einzelnes Thementurnier 600 Partien zusammen. Wenn ich irgendwann (in x Jahren) für alle 250 Stellungen ein Thementurnier veranstaltet habe, sind somit 600 x 250 = 150.000 Partien gespielt worden. Die teilnehmenden Engines werden sich aber über die Zeit verändern, sie bleiben nur innerhalb eines Thementurniers gleich. Ist ein Turnier mit einer Stellung beendet, wird geschaut, ob es von den teilnehmenden Programmen Updates gibt bzw. ob neue Programme in den Spielstärkebereich vorgedrungen sind, um andere Programme zu ersetzen. Somit nehmen an einem Turnier immer die zu diesem Zeitpunkt aktuellen Engineversionen teil, damit es interessant bleibt.

Viele Grüße
Timo
Parent - By Ludwig Buergin Date 2014-04-25 12:09
Hallo Timo

Danke Dir für die Aufschlüsselung.Habe es jetzt weitgehend verstanden.Mein Augenmerk geht vordergründig eher auf Partien in ihrer Gesamtheit ,egal ob von Mensch oder Maschine gemacht.Im Moment sind die Spiele von  Carlsen recht interessant.

Gruß Ludwig
Up Topic Hauptforen / CSS-Forum / Thementurnierserie: Eure Meinung ist gefragt

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill