Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Bruderkämpfe
- - By Benno Hartwig Date 2012-01-26 09:16
Die Ratinglisten nutzen nach meiner Kenntnis keine Partien zwischen unterschiedlichen Versionen einer Enginelinie. (kein Fritz10 gegen Fritz11)

Haben wir eigentlich eine Vorstellung davon, in welchem Sinne solche Bruder-Partien die Liste verfälschen würden?
Liefern solche Duelle durchweg eine zu große ELO-Differenz, vielleicht als Ergebnis der so durchgeführten Tuning-Maßnahmen?
Oder ist die ELO-Differenz im Durchschnitt zu klein?
Oder gibt es Enginelinien, die durchweg zu große Differenzen liefern, während andere zu kleine Differenzen liefern?

Benno
Parent - By Werner Mueller Date 2012-01-26 10:09
[quote="Benno Hartwig"]
Die Ratinglisten nutzen nach meiner Kenntnis keine Partien zwischen unterschiedlichen Versionen einer Enginelinie. (kein Fritz10 gegen Fritz11)

Haben wir eigentlich eine Vorstellung davon, in welchem Sinne solche Bruder-Partien die Liste verfälschen würden?
Liefern solche Duelle durchweg eine zu große ELO-Differenz, vielleicht als Ergebnis der so durchgeführten Tuning-Maßnahmen?
Oder ist die ELO-Differenz im Durchschnitt zu klein?
Oder gibt es Enginelinien, die durchweg zu große Differenzen liefern, während andere zu kleine Differenzen liefern?

Benno
[/quote]
Die zu Recht befürchtete Verfälschung läge wohl weniger in dem 'Bruderkampf' (relativ wenige Partien) an sich, sondern vielmehr darin, dass, z.B. im Falle von Fritz 10 UND Fritz 11, quasi die Engine Fritz ('Bruder' = ähnlich bis fast gleich) als Gegner-Engine mit einer jeweils doppelten Partienanzahl gewichtet würde.
Und da das Rating ja bekanntlich von der Gegnerschaft abhängt...
Parent - By Peter Martan Date 2012-01-26 11:03 Edited 2012-01-26 11:11
Das alles kommt immer drauf an, wer die beiden oder verschieden verschiedenen engines sind, die mitspielen, je nachdem, wie groß du das Kollektiv machst und wie du es zusammenstellst.

P.S. Dass die Differenzen zahlenmäßich auch davon abhängen, was für einer Eichengine du wieviel Elo als Startrating völlig willkürlich gibst, muss ja wohl nicht extra erwähnt werden.
Parent - - By Stefan Pohl Date 2012-01-26 11:05
[quote="Benno Hartwig"]
Die Ratinglisten nutzen nach meiner Kenntnis keine Partien zwischen unterschiedlichen Versionen einer Enginelinie. (kein Fritz10 gegen Fritz11)

Haben wir eigentlich eine Vorstellung davon, in welchem Sinne solche Bruder-Partien die Liste verfälschen würden?
Liefern solche Duelle durchweg eine zu große ELO-Differenz, vielleicht als Ergebnis der so durchgeführten Tuning-Maßnahmen?
Oder ist die ELO-Differenz im Durchschnitt zu klein?
Oder gibt es Enginelinien, die durchweg zu große Differenzen liefern, während andere zu kleine Differenzen liefern?

Benno
[/quote]

Hallo Benno,

bei Bruderkämpfen hat man das Problem, daß oft verzerrende Ergebnisse produiziert werden. Hat z.B. eine Engine irgendwo ein "Loch" in der Selektion der Varianten (alle Engines rechnen heutzutage stark selektiv) und dieses wird dann in einer neuen Version gestopft, so kann es passieren, daß die Nachfolgeversion gegen den Vorgänger sehr stark zulegt, gegen andere Gegner aber nur eine sehr kleine Verbesserung eintritt.
Es gibt auch den gegenteiligen Effekt, daß eine Engine in einer neuen Version noch selektiver rechnet, als in der alten und damit gegen andere Gegner besser scort, aber gegen den direkten Vorgänger, der nicht ganz so selktiv rechnet, sogar schlechter abschneidet.

Ausgehend von deiner Anregung zum Bruderduell habe ich mal Stocki 2.2.1 gegen 2.2.2 unter der LittleBlitzerGUI gegeneinander spielen lassen (1'+500ms, Frank Q-Vorgabestellungen, je 1 Core, kein Pondern).  Das Ergebnis ist sehr interessant, besonders, wenn man die Anzeigen, die die LittleBlitzerGUI noch bietet, betrachtet:

Das Ergebnis ist z.Zt. genau bei 50% (27+ 27- 111=). Das scheint auf gleiche Spielstärke hinzudeuten. Aber jetzt wird es erst richtig interessant, nämlich bei der durschnittlichen Rechentiefe, die die LittleBlitzerGUI dankenswerterweise anzeigt: Version 2.2.1: 20.4 ply und Version 2.2.2: 21.5 ply (bei praktisch identischer durchschnittlicher Zugzeit und vernachlässigbar minimal besserer Knotenleistung der neuen Version (+4%)).

Das heißt, daß die neue Version unter gleichen Bedingungen einen Halbzug tiefer rechnet, was im Klartext natürlich bedeutet, daß sie noch selektiver geworden ist, als die alte Version, sonst könnte sie unter identischen Bedingungen nicht tiefer rechnen - logisch.

Das beweist nun eindeutig, daß hier mehr als nur ein bugfix zum Verhindern zu schneller Züge stattgefunden hat. Entweder haben die Autoren das bewußt verschwiegen, oder der Compilator Jim Ablett hat hier eigenmächtig im Code nachgebessert und das für sich behalten (das sind ja dann Zustände wie bei Ivanhoe, was Ingo?!...).

Auf jeden Fall ein sehr interessantes Experiment, danke daß du das angeregt hast. Normalerweise mache ich keine Bruderkämpfe wegen der oben angesprochenen Probleme, aber dieser war wirklich sehr lehrreich (auch dank der tollen Ausgaben der LittleBlitzerGUI (ich liebe das Teil - bei mir schon über 11000 Partien und kein einziger Hänger)).

Beste Grüße - Stefan
Parent - - By Werner Mueller Date 2012-01-26 12:19
[quote="Stefan Pohl"]
...
Das Ergebnis ist z.Zt. genau bei 50% (27+ 27- 111=). Das scheint auf gleiche Spielstärke hinzudeuten. Aber jetzt wird es erst richtig interessant, nämlich bei der durschnittlichen Rechentiefe, die die LittleBlitzerGUI dankenswerterweise anzeigt: Version 2.2.1: 20.4 ply und Version 2.2.2: 21.5 ply (bei praktisch identischer durchschnittlicher Zugzeit und vernachlässigbar minimal besserer Knotenleistung der neuen Version (+4%)).

Das heißt, daß die neue Version unter gleichen Bedingungen einen Halbzug tiefer rechnet, was im Klartext natürlich bedeutet, daß sie noch selektiver geworden ist, als die alte Version, sonst könnte sie unter identischen Bedingungen nicht tiefer rechnen - logisch.
...
[/quote]
Nein, das heißt es nicht. Es heißt immer noch und nur: im Schnitt einen Halbzug tiefer.

Und dies KANN lediglich der Effekt eines veränderten Zeitmanagements sein (an dem wurde ja wohl herumgeschraubt). Je 'gleichmäßiger' die Bedenkzeit auf die einzelnen Züge verteilt ist, desto höher ist die durchschnittliche Suchtiefe.
Parent - - By Benno Hartwig Date 2012-01-26 13:59 Edited 2012-01-26 14:06
[quote="Werner Mueller"]Und dies KANN lediglich der Effekt eines veränderten Zeitmanagements sein (an dem wurde ja wohl herumgeschraubt). Je 'gleichmäßiger' die Bedenkzeit auf die einzelnen Züge verteilt ist, desto höher ist die durchschnittliche Suchtiefe.[/quote]Stimmt schon. 1 ply Differenz erscheint mir aber schon ganz schön viel.
Drei Suchen verbrauchen wohl ungefähr gleich viel Zeit, wenn sie beispielsweise
10ply, 10ply, 10ply (durchschnittlich also 10 plys)
benötigen, wie wenn sie
9ply, 9ply, 11ply (durchschnittlich also 9,66 plys)
brauchen.
(freche Faustregel: der letzte ply braucht so viel Zeit, wie alle anderen zusammen.)

Um auf 1 ply Differenz zu kommen, bedarf es wohl ganz erheblicher(!) 'Ungleichmäßigkeiten'.
Wäre das von Stefan beobachtete Phänomen wirklich so erklärbar?

Benno
Parent - By Stefan Pohl Date 2012-01-26 14:19
[quote="Benno Hartwig"]

Um auf 1 ply Differenz zu kommen, bedarf es wohl ganz erheblicher(!) 'Ungleichmäßigkeiten'.
Wäre das von Stefan beobachtete Phänomen wirklich so erklärbar?

Benno
[/quote]

Das sehe ich auch so. Im Prinzip ist der Einwand zwar vollkommen berechtigt, aber einen ganzen Halbzug kann man damit nur erklären, wenn man bei der alten Version 2.2.1 ein extrem ungleichmäßiges Zeitmanagement hätte. Das ist aber m.E. nicht der Fall, zumindest habe ich das unter der FritzGUI nicht beobachten können. Zudem sind alle wichtigen Zeitmanagement-Parameter bei Stocki unter den Engine-Optionen einstell- und einsehbar und bei beiden Engineversionen defaultmässig gleich.

Gruß - Stefan
Parent - - By Werner Mueller Date 2012-01-26 14:39
[quote="Benno Hartwig"]
[quote="Werner Mueller"]Und dies KANN lediglich der Effekt eines veränderten Zeitmanagements sein (an dem wurde ja wohl herumgeschraubt). Je 'gleichmäßiger' die Bedenkzeit auf die einzelnen Züge verteilt ist, desto höher ist die durchschnittliche Suchtiefe.[/quote]Stimmt schon. 1 ply Differenz erscheint mir aber schon ganz schön viel.
Drei Suchen verbrauchen wohl ungefähr gleich viel Zeit, wenn sie beispielsweise
10ply, 10ply, 10ply (durchschnittlich also 10 plys)
benötigen, wie wenn sie
9ply, 9ply, 11ply (durchschnittlich also 9,66 plys)
brauchen.
(freche Faustregel: der letzte ply braucht so viel Zeit, wie alle anderen zusammen.)

Um auf 1 ply Differenz zu kommen, bedarf es wohl ganz erheblicher(!) 'Ungleichmäßigkeiten'.
Wäre das von Stefan beobachtete Phänomen wirklich so erklärbar?

Benno
[/quote]
Dein Beispiel ist völlig richtig.

Und (und aber) selbst dieses Minimalst-Beispiel (bei 3 Zügen gibt es etwas weniger zu 'managen' als sagen wir bei 40 Zügen und der eine Zug nahm sich gerade mal 1 ply über den Durst) liefert schon eine um 1/3 ply reduzierte durchschnittliche Suchtiefe.

So kann man sich (jedenfalls ich mir ) mit wenig Phantasie vorstellen, dass eine 1-ply-Differenz der durchschnittliche Suchtiefe (eine eher rein rechnerische Größe) schon durch sehr geringe Änderungen im Zeitmanagement hervorgerufen werden kann.   
Parent - - By Peter Martan Date 2012-01-26 15:29
[quote="Werner Mueller"]
So kann man sich (jedenfalls ich mir ) mit wenig Phantasie vorstellen, dass eine 1-ply-Differenz der durchschnittliche Suchtiefe (eine eher rein rechnerische Größe) schon durch sehr geringe Änderungen im Zeitmanagement hervorgerufen werden kann.   
[/quote]

Ich mir nicht, wenn ich Stefan richtig verstanden habe, dass es eine 1-ply-Differenz der durchschittlichen Suchtiefe pro Zug ist.
Stimme dir zwar zu, dass das Zeitmangement allein eine große Rolle spielt, eine so große, dass sie sich um einen ganzen Halbzug bei jedem einzelnen gezählten Zug über viele Züge im Durchschnitt erhöht, nicht. Das würde sich ja so über den Daumen um 30 Halbzüge/Partie handeln.
Parent - By Peter Martan Date 2012-01-26 15:45
[quote="Peter Martan"]
Das würde sich ja so über den Daumen um 30 Halbzüge/Partie handeln.
[/quote]
Eben nicht, sondern um 30 ganze oder 60 halbe Züge Rechentiefe.
Parent - - By Werner Mueller Date 2012-01-26 15:54
[quote="Peter Martan"]
[quote="Werner Mueller"]
So kann man sich (jedenfalls ich mir ) mit wenig Phantasie vorstellen, dass eine 1-ply-Differenz der durchschnittliche Suchtiefe (eine eher rein rechnerische Größe) schon durch sehr geringe Änderungen im Zeitmanagement hervorgerufen werden kann.   
[/quote]

Ich mir nicht, wenn ich Stefan richtig verstanden habe, dass es eine 1-ply-Differenz der durchschittlichen Suchtiefe pro Zug ist.
Stimme dir zwar zu, dass das Zeitmangement allein eine große Rolle spielt, eine so große, dass sie sich um einen ganzen Halbzug bei jedem einzelnen gezählten Zug über viele Züge im Durchschnitt erhöht, nicht. Das würde sich ja so über den Daumen um 30 Halbzüge/Partie handeln.
[/quote]
Klar pro Zug - pro was denn sonst?

Das mit dem sich_nicht_vorstellen_können geht mir oft auch so - z.B. kann ich ich mir selbst mit viel Phantasie nicht vorstellen, was Du wohl mit "einen ganzen Halbzug bei jedem einzelnen gezählten Zug über viele Züge im Durchschnitt" gemeint haben könntest.
Parent - - By Peter Martan Date 2012-01-26 19:09
[quote="Werner Mueller"]
Das mit dem sich_nicht_vorstellen_können geht mir oft auch so - z.B. kann ich ich mir selbst mit viel Phantasie nicht vorstellen, was Du wohl mit "einen ganzen Halbzug bei jedem einzelnen gezählten Zug über viele Züge im Durchschnitt" gemeint haben könntest.
[/quote]
So redet man oft aneinander vorbei.
Ich meinte, das Beispiel mit den 3 Zügen, das du mit Benno hattest, ist, wie du ja auch schon meintest, ein anderes, als eines mit einer durchschnittlich langen Partie. Ich meine eben, dass ein ganzer Halbzug pro Zug im Schnitt über eine ganze Partie mehr ist als nur über drei Züge. Statistisch betrachtet jedenfalls, weil das mit 3 einzelnen Züge noch gar nichts sagen würde, viele Partien mit vielen Zügen sagen schon etwas mehr, du verstehst jetzt?
Parent - By Peter Martan Date 2012-01-26 19:55
Auf der anderen Seite ist ein Halbzug von 20 auf 21 im Schnitt, weil es kommt ja darauf an, wieviel er relativ zur Gesamtdurchschittsrechentiefe in der Bedenkzeit zählt, eh nicht viel mehr, als der Steigerung der Knotenzahl entspricht.

[quote="Stefan Pohl"]
Version 2.2.1: 20.4 ply und Version 2.2.2: 21.5 ply (bei praktisch identischer durchschnittlicher Zugzeit und vernachlässigbar minimal besserer Knotenleistung der neuen Version (+4%)).
[/quote]
Parent - By Stefan Pohl Date 2012-01-27 08:16
[quote="Peter Martan"]

Ich mir nicht, wenn ich Stefan richtig verstanden habe, dass es eine 1-ply-Differenz der durchschittlichen Suchtiefe pro Zug ist.

[/quote]

Da hier wohl viele Leute die LittleBlitzerGUI nicht zu kennen scheinen, was ein echtes Versäumnis ist, denn zum Testen ist die GUI Spitze, erkläre ich das mal:
Die GUI zeigt immer für jede mitspielende Engine eines Testruns an, wie viel Zeit pro Zug verbraucht wurde, wieviel ply Rechentiefe erreicht wurde und wieviel Knoten pro Sekunde berechnet wurden. Diese drei Werte sind dabei die Durchschnittswerte der Engine bei allen bis dahin ausgeführten Zügen aus allen bis dahin gespielten Partien. Spielt eine Engie also 100 Partien und rechnet dabei ca. 70 Züge lang selbstständig, dann sind es die Durchschnittswerte aus ca. 7000 Zugberechnungen, also sehr, sehr verläßliche, stabile Werte.

Gruß - Stefan
Parent - - By Benno Hartwig Date 2012-01-26 17:01
[quote="Werner Mueller"]So kann man sich (jedenfalls ich mir ) mit wenig Phantasie vorstellen, dass eine 1-ply-Differenz der durchschnittliche Suchtiefe (eine eher rein rechnerische Größe) schon durch sehr geringe Änderungen im Zeitmanagement hervorgerufen werden kann. [/quote]Mein Mini-Beispiel ergab nur 1/3 ply Differenz, immerhin bei konsequenter Ablüsung von 10,10,10 zu 9,9,11
Versuche doch mal ein möglichst kleines Beispiel zu konstruieren, bei welchem ein ganzer ply Differenz bei der durchschnittlichen Tiefe herauskommt.
Ich befürchte doch, dass das nur mit recht extrem anmutenden ply-Verteilungen möglich ist.

Benno
Parent - By Werner Mueller Date 2012-01-27 08:31
[quote="Benno Hartwig"]
[quote="Werner Mueller"]So kann man sich (jedenfalls ich mir ) mit wenig Phantasie vorstellen, dass eine 1-ply-Differenz der durchschnittliche Suchtiefe (eine eher rein rechnerische Größe) schon durch sehr geringe Änderungen im Zeitmanagement hervorgerufen werden kann. [/quote]Mein Mini-Beispiel ergab nur 1/3 ply Differenz, immerhin bei konsequenter Ablüsung von 10,10,10 zu 9,9,11
Versuche doch mal ein möglichst kleines Beispiel zu konstruieren, bei welchem ein ganzer ply Differenz bei der durchschnittlichen Tiefe herauskommt.
Ich befürchte doch, dass das nur mit recht extrem anmutenden ply-Verteilungen möglich ist.

Benno
[/quote]
Deine Befürchtung ist absolut zutreffend, meine Annahme war dada (und das Vorstellungsvermögen vom Peter im grünen Bereich ).

Z.B. -2,-2,-2,-2,+2 (für jeden 5. Zug gönnte man der Engine 4 plies extra) ergäbe eine Differenz von 1,2 ply - aber alles in dieser Richtung ist nicht mal ansatzweise der Fall, die Suchtiefen sind (jedenfalls im Blitz) mehr oder weniger gleichmäßig verteilt.

@ Stefan Pohl
Ich habe mir gestern ein paar Blitzpartien 2.2.1 vs. 2.2.2 angesehen - für mein unbewaffnetes Auge ist da kein Unterschied in den Suchtiefen zu erkennen. 
Parent - - By Michael Scheidl Date 2012-01-26 18:49
Zitat:
Das heißt, daß die neue Version unter gleichen Bedingungen einen Halbzug tiefer rechnet, was im Klartext natürlich bedeutet, daß sie noch selektiver geworden ist, als die alte Version, sonst könnte sie unter identischen Bedingungen nicht tiefer rechnen - logisch.

Wenn ich nicht alles mißverstehe was ich als Laie über Schachprogrammierung gelesen habe, gibt es mehrere Möglichkeiten um unter identischen Bedingungen tiefer zu rechen:

- mehr Pruning
- mehr Reductions (LMR ist offenbar ein Hauptthema in der aktuellen Schachprogrammierung)
- weniger bzw. weniger tiefe Extensions (d.h. weniger selektive Erweiterungen, nicht mehr)
- im Schnitt schnellere Stellungsbewertung (z.B. öfter lazy eval oder Wegfall von Bewertungskriterien)
- Codeoptimierungen


Aber bei Stockfish 2.2.1/2.2.2 ginge ich an sich nicht von solchen Unterschieden aus... vielleicht ist 2.2.2 einfach nur besser compiliert worden und/oder die Bugfixes beseitigten irgendwelche kleinen Bremsen.
Parent - - By Stefan Pohl Date 2012-01-27 08:10
[quote="Michael Scheidl"]
Zitat:
Das heißt, daß die neue Version unter gleichen Bedingungen einen Halbzug tiefer rechnet, was im Klartext natürlich bedeutet, daß sie noch selektiver geworden ist, als die alte Version, sonst könnte sie unter identischen Bedingungen nicht tiefer rechnen - logisch.

Wenn ich nicht alles mißverstehe was ich als Laie über Schachprogrammierung gelesen habe, gibt es mehrere Möglichkeiten um unter identischen Bedingungen tiefer zu rechen:

- mehr Pruning
- mehr Reductions (LMR ist offenbar ein Hauptthema in der aktuellen Schachprogrammierung)
- weniger bzw. weniger tiefe Extensions (d.h. weniger selektive Erweiterungen, nicht mehr)
- im Schnitt schnellere Stellungsbewertung (z.B. öfter lazy eval oder Wegfall von Bewertungskriterien)
- Codeoptimierungen


Aber bei Stockfish 2.2.1/2.2.2 ginge ich an sich nicht von solchen Unterschieden aus... vielleicht ist 2.2.2 einfach nur besser compiliert worden und/oder die Bugfixes beseitigten irgendwelche kleinen Bremsen.


Hallo Michael,

ja davon ging ich auch nicht aus, daher meine Überraschung, als ich den Zuwachs der Rechentiefe sah. 2.2.2 ist besser compiliert, aber läuft nur ca. 4% schneller als die 2.2.1, das bringt praktisch gar nichts, was Rechentiefe und/oder Spielstärke angeht. Und das Bugfix soll ja nur den selten auftretenden Fall, daß Stocki zu schnell zieht, beheben. Beide Faktoren können auf keinen Fall einen Rechentiefenzuwachs von über 1 ply (1.1 ply ganz genau) erklären. Auch ein anderes Zeitmanagement nicht. Das muß mit Veränderungen im Programmcode bzgl. der von dir hier sehr schön aufgelisteten Faktoren zusammenhängen. Das beweist eindeutig, daß die 2.2.2 viel mehr als nur ein bugfix ist...

Gruß - Stefan
Parent - - By Peter Martan Date 2012-01-27 08:49
Naja, Stefan, eindeutig würde ich auch wieder nicht sagen.
Ich dachte zuerst auch, wow, ein ganzer Halbzug, dann hab ich zu rechnen angefangen, und eigentlich sind die 4% Knotenzahlsteigerung ja nur rund ein Prozent weniger als der eine Halbzug Tiefenzuwachs ist, wenn du ihn als auch "nur" ca. 5% betrachtest, ausgehend von der durschnittlichen Rechentiefesteigerung von 20 auf 21 laut LittleBlitzerGUI bei deinen Bedenkzeiten, oder?
Parent - - By Michael Scheidl Date 2012-01-27 14:46
Ohne obiges nachgerechnet zu haben: Ein zusätzlicher Halbzug RT. benötigt doch derzeit üblicherweise die doppelte, also rund +100% Zeit (unabhängig von der konkreten Tiefe).

Mittlerweile glaube ich, daß der Wegfall von Sofortzügen den Unterschied (nahezu) erklären kann, etwa wie folgt:

21,21,21,21,21,21,21,21,21,11 --> Ø 20

21,21,21,21,21,21,21,21,21,21 --> Ø 21

Vielleicht lassen sich 2.2.1-Partien finden wo kein solcher Sofortzug passierte, und dann wäre meine Hypothese daß in diesen Partien der RT.-Durchschnitt sehr nahe dem von 2.2.2 ist. Leider gibt es hierbei das Problem daß die RT. einzelner Partien sich mitunter sehr unterscheiden, aufgrund unterschiedlicher Endspielphasen mit z.T. extrem hohen Tiefen...
Parent - - By Peter Martan Date 2012-01-27 18:05 Edited 2012-01-27 18:09
Obiges nachzurechnen ist leicht, Michael: 1HZ von 20 ist ein Zwanzigstel, also 5%.
Mit den Sofortzügen kannst du natürlich durchaus auch Recht haben, kommt drauf an, um wieviel öfter die bei 2.2.1 als bei 2.2.2 vorgekommen sind.
Parent - - By Michael Scheidl Date 2012-01-27 18:28
Zitat:
1HZ von 20 ist ein Zwanzigstel, also 5%.

Den Denkfehler habe ich befürchtet ohne es diskreterweise aussprechen zu wollen, denn von 20 auf 21 Halbzüge braucht man eben um ~100% mehr Zeit, nicht nur um 5%. Oder verstehe ich etwas vollkommen miß?

(Ist aber unwichtig...)
Parent - By Peter Martan Date 2012-01-27 21:29
[quote="Michael Scheidl"]
Zitat:
1HZ von 20 ist ein Zwanzigstel, also 5%.

Den Denkfehler habe ich befürchtet ohne es diskreterweise aussprechen zu wollen, denn von 20 auf 21 Halbzüge braucht man eben um ~100% mehr Zeit, nicht nur um 5%. Oder verstehe ich etwas vollkommen miß?


Ich glaube indiskreter Weise schon, dass du etwas vollkommen missverstehst, Michael.

Wieviel Zeit man für einen Halbzug mehr braucht, variiert, mag sein, dass es oft 100% mehr ist, es sind aber trotzdem nur 5% mehr Rechentiefe, wenn du von 20HZ noch einen dazu rechnest.
Parent - - By Benno Hartwig Date 2012-01-27 11:12
[quote="Stefan Pohl"]Das beweist nun eindeutig, daß hier mehr als nur ein bugfix zum Verhindern zu schneller Züge stattgefunden hat. [/quote]Möglicherweise war ich zu ungläubig. Es hängt schon ab von der Häufigkeit jener 'schnellen Züge' bei 2.2.1, ob damit die 1 Ply Differenz erklärbar sind.

Wenn 2.2.2. beispielsweise für 5 Züge rechnet 10plys, 10plys, 10plys, 10plys, 10plys (Durchschnitt 10 Plys)
und 2.2.1 gönnte sie einen schnellen Zug (wie schnell? ist 4plys möglich? 'Sofortzüge'?), dann kommt das ungefähr hinaus auf 4plys 10plys, 10plys, 10plys, 11plys (Durchschnitt 9 Plys)
Wie oft schnelle Züge vorkommen, und wieviel weniger Plys sie dann nutzen, ist entscheidend dafür, dass tatsächlich 1 Ply durchschnittliche Differenz herauskommen kann.

Benno
Parent - - By Ludwig Bürgin Date 2012-01-27 12:22
Hallo Stefan

Habe Stockfish sowohl 221 und auch 222 im Maschinenraum gespielt.221 hat des Öfteren auch auf Zeit verloren.Im Gegensatz dazu hat 222 oft in der Zeit verloren.Mach immer wieder gerne mal so was,um zu sehen. wo ein Programm im Verhältnis zur Spitze etwa steht.

Gruß Ludwig
Parent - By Kurt Utzinger Date 2012-01-27 12:49
[quote="Ludwig Bürgin"]
Hallo Stefan

Habe Stockfish sowohl 221 und auch 222 im Maschinenraum gespielt. 221 hat des Öfteren auch auf Zeit verloren. Im Gegensatz dazu hat 222 oft in der Zeit verloren. Mach immer wieder gerne mal so was,um zu sehen. wo ein Programm im Verhältnis zur Spitze etwa steht.

Gruß Ludwig
[/quote]

Also haben beide Versionen noch immer denselben (Zeit-)Bug?
Kurt
Parent - - By Stefan Pohl Date 2012-01-28 14:50
[quote="Ludwig Bürgin"]
Hallo Stefan

Habe Stockfish sowohl 221 und auch 222 im Maschinenraum gespielt.221 hat des Öfteren auch auf Zeit verloren.Im Gegensatz dazu hat 222 oft in der Zeit verloren.Mach immer wieder gerne mal so was,um zu sehen. wo ein Programm im Verhältnis zur Spitze etwa steht.

Gruß Ludwig
[/quote]

Hallo Ludwig,

war V2.2.2 denn der Intelcompile? Dieser hat bei mir in 1600 Partien insgesamt 8 timelosses produziert. Das geht eigentlich, auch wenn es nicht ganz OK ist, da ich ja immer mit Fischerbonus spielen lasse. Aber ich teste ja auch ohne Pondern, vielleicht gibts da ein Problem?

Gruß - Stefan
Parent - By Ludwig Bürgin Date 2012-01-28 15:27
Hallo Stefan

Wenn hier im Forum von einer neuen Engine was zu lesen ist, versuche ich die runter zu laden und teste sie im Maschineraum.Woher oder von wem weiss ich meistens nicht.Zur Zeit teste ich nochmals Stockfish 221 .Scheint mir etwas stärker als 222 zu sein.Mit der Hash-Größe muss man allerdings sehr behutsam umgehen.Wenn man zuviel gibt, dann kann er schon manchmal auf Zeit Verlieren. Dumm ist nur, dass er mit mehr Hash etwas stärker spielt.

Gruß Ludwig
Up Topic Hauptforen / CSS-Forum / Bruderkämpfe

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill