Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / NEBB-Ranglisten: RobboLito 0.10
1 2 Previous Next  
- - By Stefan Pohl Date 2012-01-21 10:05
Hallo zusammen,

Hier nun die neueste Version der NEBB-Ranglisten (Naked Engine Bullet und Blitz).
Zur Erinnerung zunächst nochmals die genauen Testbedingungen:
50 Ultrakurzvorgabestellungen (1.a3 a6, 1.a3 b6 etc. (ohne Stellungen mit gezogenem f-Bauer, weil Engines das aufgrund der Königssicherheit als schlecht bewerten, außer der symmetrischen Stellung 1.f3 f6, weil ich sonst nur auf 49 Stellungen gekommen wäre). 256 MB Hash, 1 Core (Intel Q9550 2.83 GHz Quad, no SSE support, Vista 64bit) pro Engine, LittleBlitzerGUI (keine Partieaufgabe, Remis erst bei 200 Zügen), kein Pondern, keine Tablebases, nur die allerbesten Engines, wobei hier z.Zt. unterhalb von Stockfish eine große Spielstärkelücke besteht, was sich aber in der Zukunft natürlich ändern kann.
Als Bedenkzeiten habe ich für die Bulletliste 1 Minute Basiszeit + 500 ms Fischerbonus gewählt. Die Blitzliste spielt unter identischen Bedingungen, aber mit der 4fachen Zeit, nämlich 4 Minuten Basis + 2 Sekunden Fischerbonus. Beide Ranglisten werden mit bayeselo erstellt und an der schwächsten Engine der Blitzliste gefixt (z.Zt. Stockfish 2.1.1), weil ja die möglichen Elo-Abweichungen in den zwei Listen natürlich auf den Spitzenplätzen besonders interssant sind. Der Fixpunkt wurde auf 3000 Elo gesetzt, einfach weil man damit unten in der Liste mit einer glatten 000er-Zahl beginnt, was besonders den Vergleich beider Listen vereinfacht. Entscheidend sind aber natürlich nicht die Absolutwerte, sondern die Differenzen...
Die beste Freeware-Engine wird als solche gekennzeichnet, außerdem werden alle Engines, die nicht Multi-Core fähig sind, gekennzeichnet, weil letzteres in der heutigen Zeit der Multicoreprozessoren m.E. einen schwerwiegenden Mangel darstellt.

Hier nun die NEBB-Ranglisten mit den Ergebnissen von RobboLito 0.10:

Blitzliste (4'+2'')

Rank Name                       Elo    +    - games score oppo. draws
   1 Houdini 2.0c x64          3110   17   16  1000   61%  3038   39%
   2 Houdini 1.5a x64          3100   17   17  1000   60%  3038   40% (best freeware)
   3 Critter 1.4 64-bit        3082   17   17   900   56%  3047   46%
   4 Komodo 4 x64              3070   16   16  1000   53%  3049   43% (singlecore)
   5 Critter 1.2 64-bit        3055   18   18   800   51%  3049   45%
   6 Ivanhoe B46fa x64         3041   15   15  1100   49%  3050   53%
   7 Stockfish 2.2.1 JA 64bit  3036   18   18   800   47%  3059   42%
   8 Komodo 3 x64              3031   19   19   700   47%  3050   46% (singlecore)
   9 Rybka 4.1 x64             3026   15   15  1100   46%  3051   47%
  10 RobboLito 0.10 x64        3024   19   19   700   43%  3066   49%
  11 RobboLito 0.09 x64        3016   16   16  1000   44%  3055   50% (singlecore)
  12 Stockfish 2.1.1 JA 64bit  3000   17   17   900   41%  3059   42%


Bulletliste (1'+500 ms)

Rank Name                       Elo    +    - games score oppo. draws
   1 Houdini 2.0c x64          3122   17   17  1000   63%  3036   36%
   2 Houdini 1.5a x64          3103   17   17  1000   60%  3036   37% (best freeware)
   3 Critter 1.4 64-bit        3092   17   17   900   57%  3045   43%
   4 Critter 1.2 64-bit        3067   18   18   800   53%  3047   43%
   5 Komodo 4 x64              3053   17   17  1000   51%  3051   38% (singlecore)
   6 Ivanhoe B46fa x64         3042   15   15  1100   49%  3050   48%
   7 RobboLito 0.10 x64        3034   19   19   700   45%  3065   47%
   8 Komodo 3 x64              3024   20   20   700   46%  3052   37% (singlecore)
   9 Rybka 4.1 x64             3021   16   16  1100   45%  3052   40%
  10 Stockfish 2.2.1 JA 64bit  3020   19   19   800   44%  3060   37%
  11 RobboLito 0.09 x64        3009   16   16  1000   43%  3054   45% (singlecore)
  12 Stockfish 2.1.1 JA 64bit  3000   18   17   900   41%  3059   38%

Das Ergebnis im Bullet ist ordentlich, auch wenn Ivanhoe knapp vorne bleibt. Das Blitzergebnis ist enttäuschend, anscheinend wurde bei der Entwicklung von RobboLito 0.10 (ähnlich wie bei Houdini 2) zu viel mit ultrakurzen Bedenkzeiten gearbeitet, um die Engine zu verbessern bzw. zu testen. Im Blitz nur 8 Elopünktchen mehr - das ist zu wenig. Immerhin ist RobboLito nun endlich multicore-fähig, was ja auch überfällig war.
Das Fazit fällt dennoch eher ernüchternd aus, zumal auch immer noch keine Triple- bzw. Tablebaseunterstützung implementiert wurde.

Grüße an alle - Stefan
Parent - - By Stefan Pohl Date 2012-01-21 14:47
Hallo nochmal,

kurz zur Info:

Nachdem Jim Ablett nun auch eine Version von Stockfish 2.2.2 für Intel compiliert hat, die keine (bzw. fast keine) Zeitüberschreitungen mehr produziert, werde ich die Version 2.2.1 aus den NEBB-Listen entfernen/rausrechnen und die Testläufe (Bullet und Blitz) mit der neuen Version wiederholen. Diese ist zwar "nur" ein bugfix, läuft aber auch etwas schneller und scheint so um die 7-10 Elo besser zu sein als die 2.2.1., was für ein bugfix ja durchaus bemerkenswert wäre.
Ergebnisse wahrscheinlich am Montag.

Grüße an alle - Stefan
Parent - - By Timo Haupt Date 2012-01-21 20:38
Hallo Stefan,

kurze Frage:Du schriebst im CCC, dass du die Intel "No SSE" Version von Stockfish verwendest. Gibt es mit der SSE-Version nachwievor Probleme mit Zeitüberschreitungen oder waren das die GCC-Compiles?

Bei mir konnte ich feststellen, dass die GCC-Compiles sich teilweise vollkommen anders verhalten als Intel-Compiles (andere HVs, Rechentiefen). Bei den Intel-Compiles (SSE42 und noSSE) konnte ich einen ganz kleinen Geschwindigkeitsvorteil zugunsten der SSE-Version feststellen, ansonsten rechnen sie anscheinend vollkommen identisch.

Viele Grüße
Timo
Parent - - By Klaus S. Date 2012-01-21 21:14
GCC-Compiles,  Intel-Compiles,   steige da nicht durch...

von der 2.2.2 habe ich nur diese hier:

[64]
pthreadGC2-w64.dll                   42.496  05.06.2010
stockfish-222-64-ja.exe           999.936  14.01.2012
stockfish-222-sse42-ja.exe    1.000.448  14.01.2012

[32]
stockfish-222-32-ja.exe         345.600  14.01.2012

im 64bit Ordner ist offensichtlich das GCC-compile, und welches compile ist die 32bit version?

Wo gibt es denn das 64bit Intel-Compile?

ratlos...

Viele Grüße
Wilfried
Parent - By Kurt Utzinger Date 2012-01-21 21:36

Computerschach ist leider komplizert geworden, den richtigen
und kompletten Überblick hat niemand mehr

Kurt
Parent - - By Stefan Pohl Date 2012-01-22 07:00
Hallo zusammen,

Hier mal der aktuelle Stand der Stockfish 2.2.2 Version - Compiles, sofern er mir bekannt ist. Damit wird die Ratlosigkeit hoffentlich beendet:

1. Auf der offiziellen Stockfish-Homepage gibt es nur den GCC-Compile (z.Zt. zumindest), der zumindest bei mir ohne Ende Zeitüberschreitungen produziert.
2. Auf Jim Abletts Seite gibt es die Intel-Compiles (mit und ohne SSE support).
http://jimablett.net63.net/

Diese Intelcompiles sind besser, weil sie a) die Zeit (fast) nie mehr überschreiten, b) keine blöde extra .dll-Datei benötigen c) schneller sind & ca. 5-10 Elo besser scoren, als die 2.2.1-Version.
Das setzt natürlich einen Intel-PC voraus...

Gruß - Stefan
Parent - - By Jens Schmidt-Wilke Date 2012-01-22 09:15
...setzt keinen Intel-PC voraus: habe AMD 1090T und läuft problemlos.
Der Zusatz -intel ist etwas irreführend und bezieht sich hier auf den Intel-Compiler der benutzt wurde.
Parent - - By Stefan Pohl Date 2012-01-22 14:03
[quote="Jens Schmidt-Wilke"]
...setzt keinen Intel-PC voraus: habe AMD 1090T und läuft problemlos.
Der Zusatz -intel ist etwas irreführend und bezieht sich hier auf den Intel-Compiler der benutzt wurde.
[/quote]

Ja danke, ich habe davon gerade gehört. Wirklich etwas irreführend (für mich zumindest). Aber umso besser, denn ich hatte schon ein schlechtes Gewissen diesen Compile in meine NEBB-Listen aufzunehmen, wenn er denn auf AMD nicht läuft.
Nachdem der Bullettestlauf durch und der Blitzdurchlauf halb durch ist, kann ich (ziemlich) sicher prognostizieren, daß diese Version doch meßbar besser (um 10 Elo) als die 2.2.1 Version zu sein scheint. Zumindest gegen die ausschließlich starken Gegner bei meinen Tests.

Gruß - Stefan
Parent - - By Jens Schmidt-Wilke Date 2012-01-22 19:21
Bei meinen Tests mit 25min + 10sek spielt SF 2.2.2 JA intel deutlich erfolgreicher. Ich kann das nicht belegen wegen zu geringer Partienanzahl, aber ich schätze ca. +15 ELO zur 2.2.1.
Falls Ingo Bauer (sehr gute Tests übrigens!) mal lange Weile hat kann er ja die SF 2.2.2 JA intel mal durchlaufen lassen...

schönen Sonntagabend noch allerseits...
Parent - - By Stefan Pohl Date 2012-01-23 11:56
[quote="Jens Schmidt-Wilke"]
Bei meinen Tests mit 25min + 10sek spielt SF 2.2.2 JA intel deutlich erfolgreicher. Ich kann das nicht belegen wegen zu geringer Partienanzahl, aber ich schätze ca. +15 ELO zur 2.2.1.
Falls Ingo Bauer (sehr gute Tests übrigens!) mal lange Weile hat kann er ja die SF 2.2.2 JA intel mal durchlaufen lassen...

schönen Sonntagabend noch allerseits...
[/quote]

Hallo Jens,

gute Schätzung! Siehe dazu mein neues Posting mit der neuesten Version der NEBB-Ranglisten!!!
Ingo hat einen Test der Version 2.2.2 übrigens mir gegenüber kategorisch abgelehnt, er glaubt lieber den Autoren, die meinen, die Version sei nicht meßbar stärker, und listet die Version 2.2.2 jetzt in der IPON ohne sie getestet zu haben, statt der Version 2.2.1. (Leider kein dummer Scherz meinerseits, er macht das wirklich so!).
Gute Nacht IPON, kann ich da (leider) nur sagen.

Gruß - Stefan
Parent - - By Michael Scheidl Date 2012-01-23 13:26
Da sich Ingo hier unlängst eine Schreibpause auferlegt hat, welche vermutlich erst im Februar endet, könnte Kritik seiner Tests derzeit als etwas unfair aufgefaßt werden.

Inwischen hat er übrigens ermittelt, daß Tornado 4.88 um ~55 Elo stärker als Version 4.80 ist, und sich nun klar vom IPON-Rangletzten (Crafty) abgesetzt hat.
Parent - - By Stefan Pohl Date 2012-01-23 13:48
[quote="Michael Scheidl"]
Da sich Ingo hier unlängst eine Schreibpause auferlegt hat, welche vermutlich erst im Februar endet, könnte Kritik seiner Tests derzeit als etwas unfair aufgefaßt werden.

[/quote]

Hallo Michael,

ich kommuniziere per PM mit Ingo. Und mit berechtigter Kritik muß er leben (und kann er auch), denn er betreibt nun mal eine der größten und wichtigsten Ranglisten und hat daher auch eine Verantwortung für das Computerschach (freiwillig) übernommen. Wenn er dann durch solche Fehlentscheidgungen die IPON vor die Wand fährt, so werde ich für meinen Teil das nicht einfach kommentarlos hinnehmen. Ivanhoe und Robbo zu bokykottieren ist eine Sache, aber das wichtigste und beste OpenSource-Projekt des aktuellen Computerschachs kann und darf man nicht so behandeln.
Darüberhinaus kannst du ganz beruhigt sein: mich im Allgemeinen und meine Tests im Besonderen nimmt er sowieso nicht ernst und macht schon aus Prinzip das Gegenteil von dem, was ich empfehle.
Es wäre daher dringend anzuraten, daß auch andere Leute hier mal monieren, daß man nicht Engineversionen listen kann, die man gar nicht getestet hat. Sowas geht gar nicht!!!

Gruß - Stefan
Parent - - By Kurt Utzinger Date 2012-01-23 16:03
Hi Stefan
Als Aussenstehender kann man so etwas nicht wissen, denn auf seiner Homepage steht
doch - man sehe unten - dass offenbar Stockfish 2.2.2 JA gespielt hat. Du meinst also,
dass Ingo "2.2.1" einfach auf "2.2.2" geändert hat?
Mfg
Kurt

Code:
7 Stockfish 2.2.2 JA SSE42  : 2956  2500 (+1450,=847,-203), 74.9 %

Zappa Mexico II               : 100 (+ 68,= 29,-  3), 82.5 %
Naum 4.2                      : 100 (+ 47,= 45,-  8), 69.5 %
Loop 2007                     : 100 (+ 78,= 19,-  3), 87.5 %
Deep Onno 1-2-70              : 100 (+ 74,= 21,-  5), 84.5 %
Deep Shredder 12              : 100 (+ 59,= 34,-  7), 76.0 %
Crafty 23.3 JA                : 100 (+ 80,= 18,-  2), 89.0 %
Jonny 4.00 32b                : 100 (+ 81,= 17,-  2), 89.5 %
Deep Sjeng c't 2010 32b       : 100 (+ 53,= 39,-  8), 72.5 %
spark-1.0 SSE42               : 100 (+ 58,= 38,-  4), 77.0 %
HIARCS 13.2 MP 32b            : 100 (+ 67,= 25,-  8), 79.5 %
Protector 1.4.0               : 100 (+ 61,= 33,-  6), 77.5 %
Strelka 2.0 B                 : 100 (+ 72,= 26,-  2), 85.0 %
Spike 1.4 32b                 : 100 (+ 57,= 37,-  6), 75.5 %
Gull 1.2                      : 100 (+ 52,= 44,-  4), 74.0 %
Deep Rybka 4.1 SSE42          : 100 (+ 32,= 49,- 19), 56.5 %
Deep Junior 12.5              : 100 (+ 62,= 29,-  9), 76.5 %
Hannibal 1.1                  : 100 (+ 57,= 41,-  2), 77.5 %
Umko 1.2 SSE42                : 100 (+ 83,= 16,-  1), 91.0 %
Houdini 2.0 STD               : 100 (+ 19,= 46,- 35), 42.0 %
Fritz 13 32b                  : 100 (+ 49,= 41,- 10), 69.5 %
Chiron 1.1a                   : 100 (+ 43,= 47,- 10), 66.5 %
Tornado 4.80                  : 100 (+ 82,= 17,-  1), 90.5 %
Komodo 4 SSE42                : 100 (+ 28,= 52,- 20), 54.0 %
Critter 1.4a SSE42            : 100 (+ 15,= 59,- 26), 44.5 %
Tornado 4.88 SSE42            : 100 (+ 73,= 25,-  2), 85.5 %
Parent - - By Thomas Müller Date 2012-01-23 16:49
Hallo Kurt,

scheint tatsächlich so.
Denn in der "Full List" ist die 2.2.1 nicht mehr aufgeführt.
Dort würde sie aber stehen wenn er einen testlauf gemacht hätte.

Ob die beiden versionen einen unterschied zu tage bringen kann nur ingo selbst feststellen.
Darauf zu schließen, dass in einer anderen testumgebung ein unterschied festgestellt wurde, und dies bei ingo auch der fall sein müsste, ist meiner meinung nach auch falsch.
Jede liste hat seine eigene aussagekraft und gesetze, auch wenn letztlich doch zu 98% das gleiche rauskommt 

grüße thomas
Parent - - By Stefan Pohl Date 2012-01-24 12:25
[quote="Thomas Müller"]

Ob die beiden versionen einen unterschied zu tage bringen kann nur ingo selbst feststellen.
Darauf zu schließen, dass in einer anderen testumgebung ein unterschied festgestellt wurde, und dies bei ingo auch der fall sein müsste, ist meiner meinung nach auch falsch.
Jede liste hat seine eigene aussagekraft und gesetze, auch wenn letztlich doch zu 98% das gleiche rauskommt 

grüße thomas
[/quote]

Hallo Thomas,

ich habe nie gesagt, daß bei einem Testlauf in der IPON auch unbedingt eine Steigerung raus kommt. Kann durchaus sein, daß gegen mehr und schwächere Gegner keine rauskommt. Der Skandal ist doch, daß erst gar kein Testlauf gemacht wurde und dennoch die neue Version gelistet wird. Für mich ist die IPON jedenfalls nicht mehr ernstzunehmen, solange der Testlauf nicht gemacht wird, oder in der Liste Version 2.2.2 wieder durch 2.2.1 ersetzt wird.
Eine Version zu listen, die man gar nicht getestet hat und bei der es durch andere Tests zumindest sehr ernsthafte Hinweise darauf gibt, daß es eine Steigerung gegeben hat, das geht gar nicht.

Gruß - Stefan
Parent - - By Thomas Müller Date 2012-01-24 16:04
Hallo Stefan,

ok...das habe ich dann falsch verstanden.
War nicht böse gemeint

Ja Ingo könnte testen, dauert bei ihm eigentlich nur 2 tage oder so.
Aber das ist sein ding.

grüße thomas
Parent - By Stefan Pohl Date 2012-01-25 11:41
[quote="Thomas Müller"]

War nicht böse gemeint

grüße thomas
[/quote]

Hatte ich auch nicht so verstanden.

Gruß - Stefan
Parent - By Bernhard Meister Date 2012-01-23 22:25
Hallo Kurt,

ja, er schreibt dies so auf seiner Homepage.

Die NEBB zeigt ja eine positive Veränderung von SF 2.2.1 auf SF 2.2.2
Auch in anderen Foren ist von einer positiven Veränderung von SF zu lesen.

Schade das die Version 2.2.1 einfach so ersetzt wurde, die IPON ist wohl vermutlich an dieser Stelle fehlerhaft.
Ein "Testen" ist ja der Sinn und Zweck einer Rangliste sowie natürlich das Darstellen der Ergebnisse.

Grüße
Bernhard
Parent - - By Stefan Pohl Date 2012-01-24 12:21
[quote="Kurt Utzinger"]
Hi Stefan
Als Aussenstehender kann man so etwas nicht wissen, denn auf seiner Homepage steht
doch - man sehe unten - dass offenbar Stockfish 2.2.2 JA gespielt hat. Du meinst also,
dass Ingo "2.2.1" einfach auf "2.2.2" geändert hat?
Mfg
Kurt

[/quote]

Hallo Kurt,

das hat Ingo auf seiner Startseite stehen. Zitat:"Stockfish 2.2.1 is substituted with 2.2.2 according to the authors ...". Ich habe das hier im Forum nur mal geposted, eben weil ich - anscheindend zu Recht - befürchtet habe, daß das einige gar nicht mitkriegen, welch unglaublicher Vorgang hier in der IPON stattgefunden hat (und übrigens nicht zum ersten Mal).

Gruß - Stefan
Parent - - By Michael Scheidl Date 2012-01-24 12:30
Ich glaube nicht daß man das so dramatisieren sollte. Man kann davon ausgehen daß die Programmautoren gute Gründe haben, um eine Versionsnummer nur im Hundertstelbereich weiterzuschreiben. Wenn so ein Update sich als meßbar stärker erweist - umso besser, aber zu verlangen jede "Unterversion der Unterversion" extra zu testen ist recht anspruchsvoll. Natürlich auch dankenswert wenn es jemand dennoch macht!

Stockfish 3.0 wird ein wichtigeres Thema.
Parent - - By Stefan Pohl Date 2012-01-24 14:06
[quote="Michael Scheidl"]
Ich glaube nicht daß man das so dramatisieren sollte. Man kann davon ausgehen daß die Programmautoren gute Gründe haben, um eine Versionsnummer nur im Hundertstelbereich weiterzuschreiben. Wenn so ein Update sich als meßbar stärker erweist - umso besser, aber zu verlangen jede "Unterversion der Unterversion" extra zu testen ist recht anspruchsvoll. Natürlich auch dankenswert wenn es jemand dennoch macht!

Stockfish 3.0 wird ein wichtigeres Thema.
[/quote]

Hi Michael,

Es geht doch darum, daß eine Version gelistet wird, die gar nicht getestet wurde. Wenn 2.2.1 gelistet bleibt und Version 2.2.2 nicht getestet wird, ist das zwar schade, aber OK. So ist es eine glatte Listen-Fälschung. Und das ist ein Skandal. Zumindest meiner unmaßgeblichen Meinung nach.

Gruß - Stefan
Parent - - By Bernhard Meister Date 2012-01-24 21:00
Hallo Stefan,

finde ich auch. Wenn eine bestimmte Version in einer Liste geführt wird, muß diese Version auch getestet worden sein.

Vorallem bei SF 2.2.2 scheint es eine kleine Verbesserungen (genügend Hinweise gibt es ja) zu geben, daher ist ein nachträglicher Test hier "Pflicht".

Vielleicht holt Ingo den Test ja nach, dann sehen wir die tatsächliche Verbesserung -  oder eben auch keine, dann hätten die Programmierer Recht etc. Mich interessiert der Test auf jeden Fall. Für mich war die IPON bisher immer eine wichtige Rangliste.

Grüße
Bernhard
Parent - - By Stefan Pohl Date 2012-01-25 11:40
[quote="Bernhard Meister"]

Vielleicht holt Ingo den Test ja nach, dann sehen wir die tatsächliche Verbesserung -  oder eben auch keine, dann hätten die Programmierer Recht etc. Mich interessiert der Test auf jeden Fall. Für mich war die IPON bisher immer eine wichtige Rangliste.

Grüße
Bernhard
[/quote]

Hallo,

ganz meine Meinung. Bisher war die IPON eine wichtige Rangliste. Im Moment ist sie es nicht. Und die Programmierer haben eben nicht immer recht. Als Beispiel sei an Houdini 1.5 erinnert. Als diese Version released wurde, rechnete R.Houdart mit ca. 35 Elo Zuwachs, de facto waren es über 70...
Und die Moral von der Geschicht: Man darf als Tester nicht auf die Meinung der Entwickler hören. Das ist und bleibt eine Todsünde für jedweden Test, nicht nur im Computerschach!!!

Gruß - Stefan
Parent - - By Frank Rahde Date 2012-01-25 15:32
[quote="Stefan Pohl"]
Bisher war die IPON eine wichtige Rangliste. Im Moment ist sie es nicht. ...
Gruß - Stefan
[/quote]

Das halte ich für starken Tobak von Dir! Wortbeiträge mit Maß sehen anders aus in meinen Augen. Die IPON ist und bleibt eine wichtige Rangliste, zumindest für mich. Die von Dir genannte und gar offiziell bekanntgegebene Testschwäche bei Stockfish, die eventuell sich bald wieder auflöst, entwertet die komplette Rangliste keineswegs.

Gruß, Frank
Parent - - By Wolfgang Battig Date 2012-01-25 18:03
[quote="Frank Rahde"]
[quote="Stefan Pohl"]
Bisher war die IPON eine wichtige Rangliste. Im Moment ist sie es nicht. ...
Gruß - Stefan
[/quote]

Das halte ich für starken Tobak von Dir! Wortbeiträge mit Maß sehen anders aus in meinen Augen. Die IPON ist und bleibt eine wichtige Rangliste, zumindest für mich. Die von Dir genannte und gar offiziell bekanntgegebene Testschwäche bei Stockfish, die eventuell sich bald wieder auflöst, entwertet die komplette Rangliste keineswegs.

Gruß, Frank
[/quote]

mag sein, dass Stefan was die Schlussfolgerung angeht übertreibt. In der Sache hat er m.E. zu 100% Recht!
Parent - - By Thomas Mayer (Quark) Date 2012-01-25 21:11 Edited 2012-01-26 11:21
[quote="Wolfgang Battig"]
[quote="Frank Rahde"]
[quote="Stefan Pohl"]
Bisher war die IPON eine wichtige Rangliste. Im Moment ist sie es nicht. ...
Gruß - Stefan
[/quote]

Das halte ich für starken Tobak von Dir! Wortbeiträge mit Maß sehen anders aus in meinen Augen. Die IPON ist und bleibt eine wichtige Rangliste, zumindest für mich. Die von Dir genannte und gar offiziell bekanntgegebene Testschwäche bei Stockfish, die eventuell sich bald wieder auflöst, entwertet die komplette Rangliste keineswegs.

Gruß, Frank
[/quote]

mag sein, dass Stefan was die Schlussfolgerung angeht übertreibt. In der Sache hat er m.E. zu 100% Recht!
[/quote]

Hallo Wolfgang,

betrachten wir mal die Vergangenheit: Ingo hat DANN Versionen zusammengeschmissen, wenn durch eine hinreichende Anzahl an Partien sichergestellt war, dass es keine nennenswerten Unterschiede gibt. Ich sehe keine Veranlassung anzunehmen, dass Ingo von dieser Vorgehensweise abgewichen ist. Ingo hat sich hier in diesem Forum eine freiwillige Schreibpause verordnet, dies heißt aber noch lange nicht, dass einer XXXXXXXXXXX im Computerschach plötzlich überall recht hat (Hinweis: Du bist nicht gemeint) - so lange Ingo sich nicht dazu geäußert hat gibt es nichts weiter dazu zu sagen.

Gruß, Thomas

MOD: die Passage mit XXX wurde entfernt
Parent - By Stefan Pohl Date 2012-01-26 00:35 Edited 2012-01-26 11:23
[quote="Thomas Mayer (Quark)"]

Hallo Wolfgang,

betrachten wir mal die Vergangenheit: Ingo hat DANN Versionen zusammengeschmissen, wenn durch eine hinreichende Anzahl an Partien sichergestellt war, dass es keine nennenswerten Unterschiede gibt. Ich sehe keine Veranlassung anzunehmen, dass Ingo von dieser Vorgehensweise abgewichen ist. Ingo hat sich hier in diesem Forum eine freiwillige Schreibpause verordnet, dies heißt aber noch lange nicht, dass einer XXXXXXXXXXX im Computerschach plötzlich überall recht hat (Hinweis: Du bist nicht gemeint) - so lange Ingo sich nicht dazu geäußert hat gibt es nichts weiter dazu zu sagen.

Gruß, Thomas
[/quote]

Dann schlage ich vor, du fragst ihn mal per PM, dann wird dir sicher bestätigen, daß er eben keine Partien mit der neuen 2.2.2 gemacht hat. Auf meine PMs zu diesem Thema hat er jedenfalls geantwortet, sonst hätte ich das Thema hier nie eröffnet. Und wenn er mit XXXXXXXX wie mir per PM kommuniziert, wird er einem so vergeistigten und niveauvollen Menschen wie dir sicher auch antworten. Denn wenn man Ingo bzgl. seiner Tests eines zuguten halten kann und muß, dann daß er auf inhaltsbezogene Nachfragen immer geantwortet hat - zumindest mir.

XXXXXXXXX
P.S: Sollten hier weitere beleidigende Schimpfworte gegen mich verwendet werden, so werde ich das Forum verlassen.

MOD: auch hier wurde XXXXXX editiert
Parent - - By Wolfgang Battig Date 2012-01-26 09:37 Edited 2012-01-26 11:27
Hallo Thomas,

[quote="Thomas Mayer (Quark)"]
Hallo Wolfgang,

betrachten wir mal die Vergangenheit: Ingo hat DANN Versionen zusammengeschmissen, wenn durch eine hinreichende Anzahl an Partiensichergestellt war, dass es keine nennenswerten Unterschiede gibt.


ja, aber dann hat er diese "hinreichende Anzahl" spielen lassen, sich ein Bild gemacht und gehandelt. DAS ist völlig ok und so haben wir es bei CEGT auch schon gemacht, wenn 2 direkt aufeinander folgende Versionen nach "hinreichend vielen Partien" ein paar wenige ELO auseinanderlagen. Kommt aber extrem selten vor!

Für Tester ist es m.E. aber ein absolutes "No Go", Versionen ohne Test umzubenennen, nur weil der Autor sagt, es gäbe keinen Unterschied. Zumal die bisherigen, allerdings noch nicht "hinreichend" unterlegten Ergebnisse, z.B. aus unserer 40/20, eher ein halbwegs nennenswertes Plus erwarten lassen. Kann sich aber auch alles in Wohlgefallen auflösen. Aber das sollte man zumindest abwarten (wenn man schon selbst nicht testet), bevor man so eine Aktion macht.

Auf Autoren-Aussagen verlasse ich mich nie, die liegen zu oft falsch. Allerdings meist in die andere Richtung, nämlich dass sie ihre Engine überschätzen...

Zitat:
Ich sehe keine Veranlassung anzunehmen, dass Ingo von dieser Vorgehensweise abgewichen ist.


doch, er schreibt es sogar wörtlich auf seiner Internetseite. "... is substituted... due to the authors..." (incl. Link zum Talkchess-Thread, wo Marco eine entsprechende Äußerung Graham Banks gegenüber machte)

Für mich bedeutet das, dass Ingo die 2.2.2 nicht getestet hat, sondern sich auf die Aussage der Autoren verlässt.
Sollte ich falsch liegen und Ingo hätte - quasi im Hintergrund - eine hinreichende Anzahl gespielt, nehme ich alles zurück und behaupte ab sofort das Gegenteil...

Zitat:
Ingo hat sich hier in diesem Forum eine freiwillige Schreibpause verordnet,


sorry, aber das ist sein Problem.
Wäre er aus welchem Grund auch immer hier gesperrt (wie z.B. vor einigen Monaten Gerhard Sonnabend), würdest Du kein personenbezogenenes Wort von mir zu dem Thema lesen, weil das wirklich unfair wäre, aber so kann er ja antworten, er will halt nur gerade nicht.

Zitat:
...dies heißt aber noch lange nicht, dass einer XXXXXXXX im Computerschach plötzlich überall recht hat (Hinweis: Du bist nicht gemeint) - so lange Ingo sich nicht dazu geäußert hat gibt es nichts weiter dazu zu sagen.


auch wenn Du mich nicht gemeint hast: Musste das jetzt sein? Ich denke nicht...

Gruß
Wolfgang

MOD: XXXXXX wurde editiert
Parent - - By Thomas Mayer (Quark) Date 2012-01-27 00:34
Hallo Wolfgang,

[quote="Wolfgang Battig"]
Hallo Thomas,

[quote="Thomas Mayer (Quark)"]
betrachten wir mal die Vergangenheit: Ingo hat DANN Versionen zusammengeschmissen, wenn durch eine hinreichende Anzahl an Partiensichergestellt war, dass es keine nennenswerten Unterschiede gibt.


ja, aber dann hat er diese "hinreichende Anzahl" spielen lassen, sich ein Bild gemacht und gehandelt. DAS ist völlig ok und so haben wir es bei CEGT auch schon gemacht, wenn 2 direkt aufeinander folgende Versionen nach "hinreichend vielen Partien" ein paar wenige ELO auseinanderlagen. Kommt aber extrem selten vor!

Für Tester ist es m.E. aber ein absolutes "No Go", Versionen ohne Test umzubenennen, nur weil der Autor sagt, es gäbe keinen Unterschied. Zumal die bisherigen, allerdings noch nicht "hinreichend" unterlegten Ergebnisse, z.B. aus unserer 40/20, eher ein halbwegs nennenswertes Plus erwarten lassen. Kann sich aber auch alles in Wohlgefallen auflösen. Aber das sollte man zumindest abwarten (wenn man schon selbst nicht testet), bevor man so eine Aktion macht.

Auf Autoren-Aussagen verlasse ich mich nie, die liegen zu oft falsch. Allerdings meist in die andere Richtung, nämlich dass sie ihre Engine überschätzen...

Zitat:
Ich sehe keine Veranlassung anzunehmen, dass Ingo von dieser Vorgehensweise abgewichen ist.


doch, er schreibt es sogar wörtlich auf seiner Internetseite. "... is substituted... due to the authors..." (incl. Link zum Talkchess-Thread, wo Marco eine entsprechende Äußerung Graham Banks gegenüber machte)

Für mich bedeutet das, dass Ingo die 2.2.2 nicht getestet hat, sondern sich auf die Aussage der Autoren verlässt.
Sollte ich falsch liegen und Ingo hätte - quasi im Hintergrund - eine hinreichende Anzahl gespielt, nehme ich alles zurück und behaupte ab sofort das Gegenteil...


Du liegst falsch, so wie Du hier schreibst und Herr Pohl behauptet, ist es eben nicht gelaufen. Herr Pohl nutzt lediglich die Abwesenheit von Ingo um hier "rumzustänkern" und irgendwelche Behauptungen aufzustellen. Eigentlich sollte jedem klar sein, der Ingo's Arbeit in den letzten Jahren mitverfolgt hat, das es so nicht gelaufen sein kann. Da sieht man mal wieder wie schnell Zweifel gesät werden können.

Gruß, Thomas
Parent - - By Wolfgang Battig Date 2012-01-27 12:07 Edited 2012-01-27 12:10
Hallo Thomas,

nur kurz um das Thema nicht überzustrapazieren und wartend auf Ingos "CSS-Forum-Urlaubsende"...

[quote="Thomas Mayer (Quark)"]
...
Du liegst falsch, so wie Du hier schreibst und Herr Pohl behauptet, ist es eben nicht gelaufen.


weißt Du mehr oder vermutest Du? Denn dem einen (!) dürren Satz auf der Homepage folgend sehe ich das so wie ich es beschrieben habe. Ich stimme Dir allerdings in dem Sinne zu, dass ich es - Ingos "normale" Arbeitsweise beurteilend - eigentlich auch kaum glauben kann, dass er so vorgeht.

Zitat:
Herr Pohl nutzt lediglich die Abwesenheit von Ingo um hier "rumzustänkern" und irgendwelche Behauptungen aufzustellen.


Ingos Abwesenheit ist selbstgewählt, von daher hält sich mein Mitleid in Grenzen. Zudem haben die beiden doch offenbar Kontakt per PM.

Zitat:
Eigentlich sollte jedem klar sein, der Ingo's Arbeit in den letzten Jahren mitverfolgt hat, das es so nicht gelaufen sein kann.


ah, ok, Du weißt also auch nicht mehr...

Zitat:
Da sieht man mal wieder wie schnell Zweifel gesät werden können.


Wer - wie Ingo - fast jede Gelegenheit nutzt andere Ranglistenersteller teilweise wg. Kleinigkeiten zu kritisieren (CEGT hat da schon einiges abbekommen), muss auch mal mit Gegenwind leben. Denke das kann er auch. Zweifel an seiner Arbeit habe ich nicht, an seiner Behandlung des akutellen Falls allerdings schon!

Gruß
Wolfgang
Parent - - By Thomas Mayer (Quark) Date 2012-01-27 12:22
Hallo Wolfgang,

Zitat:
Zitat:
Du liegst falsch, so wie Du hier schreibst und Herr Pohl behauptet, ist es eben nicht gelaufen.

weißt Du mehr oder vermutest Du? Denn dem einen (!) dürren Satz auf der Homepage folgend sehe ich das so wie ich es beschrieben habe. Ich stimme Dir allerdings in dem Sinne zu, dass ich es - Ingos "normale" Arbeitsweise beurteilend - eigentlich auch kaum glauben kann, dass er so vorgeht.


ja, ich weiß mehr, Ingo hält mich auf dem laufenden. Der Unterschied bei ihm beträgt derzeit 2 Elo zwischen den Versionen. (800 Partien 2.2.2)

Zitat:
Zitat:
Eigentlich sollte jedem klar sein, der Ingo's Arbeit in den letzten Jahren mitverfolgt hat, das es so nicht gelaufen sein kann.

ah, ok, Du weißt also auch nicht mehr..

Zu dem Zeitpunkt als ich Herrn Pohl das erste Mal geantwortet hatte, wußte ich NICHT mehr, mittlerweile schon. Jedoch wußte ich, daß Ingo nicht so arbeitet, wie ihm da unterstellt wird.

Gruß, Thomas

P.S.: Keine Frage, Ingo muß auch mal einstecken können. Hanebüchene Vermutungen aus denen dann noch weitere rein spekulative Schlüsse gezogen werden haben aber mit Kritik nichts zu tun.
Parent - By Frank Rahde Date 2012-01-27 12:51
[quote="Thomas Mayer (Quark)"]

Gruß, Thomas

P.S.: Keine Frage, Ingo muß auch mal einstecken können. Hanebüchene Vermutungen aus denen dann noch weitere rein spekulative Schlüsse gezogen werden haben aber mit Kritik nichts zu tun.
[/quote]

Wir als Moderatoren sehen in Behauptungen, Vermutungen, Spekulationen oder Unterstellungen in der Sache aber noch lange keine persönliche Beleidigung. Du warst nicht in der Lage, Thomas´ Äußerungen nur zu kritisieren, sondern hast ihn persönlich verunglimpft mit dem von Dir verwendeten Schimpfwort. Es hätte mich gefreut, wenn Du ein Einsehen gehabt hättest und Dich für diese verbale Entgleisung entschuldigt hättest. Deine Meinung hingegen sei Dir unbenommen. Ich hoffe, da kommt noch etwas von Dir. Jeder von uns Mitgliedern verdient einen gewissen Respekt, erst recht, wenn er sich in Ranglisten-Arbeit abmüht, stimmt´s?!

Gruß, Frank
Parent - By Wolfgang Battig Date 2012-01-27 13:01
[quote="Thomas Mayer (Quark)"]
...ja, ich weiß mehr, Ingo hält mich auf dem laufenden. Der Unterschied bei ihm beträgt derzeit 2 Elo zwischen den Versionen. (800 Partien 2.2.2)


danke für die Info. Wundert mich, dass er es nicht einfach schreibt. Wenn nicht hier, dann auf seiner Seite oder im CCC. Da wird er sich ja keine Schreibpause auferlegt haben...

Zitat:
...Hanebüchene Vermutungen aus denen dann noch weitere rein spekulative Schlüsse gezogen werden haben aber mit Kritik nichts zu tun.


Nach dem was öffentlich war, waren die Vermutungen nicht so sehr hanebüchen, sondern eher logisch. Aber ok, lassen wir es gut sein. Letztlich ist das alles zu unwichtig um sich ernsthaft zu streiten,

Gruß
Woflgang
Parent - - By Thorsten Czub Date 2012-01-27 13:39
sind schon mehr als 2 ELO zwischen 2.1.1 und 2.2.
Parent - - By Wolfgang Battig Date 2012-01-27 13:41
[quote="Thorsten Czub"]
sind schon mehr als 2 ELO zwischen 2.1.1 und 2.2.
[/quote]

es geht aber um den Unterschied zwischen 2.2.1 und 2.2.2...
Parent - By Thorsten Czub Date 2012-01-27 21:25
ach so. sorry das war hier ein ganz langer thread und ich hatte keine lust alles durchzulesen.
Parent - - By Simon Gros Date 2012-01-27 20:44
800 Spiele hört sich so an, als wenn Ingo Bauer erst deutlich nach der Kritik hier angefangen hat die Version 2.2.2 zu testen. Sonst dauern bei ihm 800 Spiele ein paar Stunden! Er hat also deutlich vor seinem jetzigen Tests die Engine auf seiner Seite in 2.2.2 umbenannt!
Simon_G
Parent - - By Thomas Müller Date 2012-01-27 20:51
Hallo,

bitte keine spekulationen mehr über ingos vorgehensweise.
Das bringt gar nichts solange er sich nicht dazu äussert.
Danke!

gruß thomas
Parent - By Werner Mueller Date 2012-01-28 06:39
[quote="Thomas Müller"]
Hallo,

bitte keine spekulationen mehr über ingos vorgehensweise.
Das bringt gar nichts solange er sich nicht dazu äussert.
Danke!

gruß thomas
[/quote]
Ich halte die 'Diskussion' zum Thema 2.2.2 für albern und mehr als lächerlich. Deshalb will ich dazu auch gar nichts weiter schreiben.

Und weil 'Kritik', je bescheuerter sie ist, desto mehr anätzt und sozusagen aus einem leicht gefühlten Anflug von Fremdschämen heraus: an dieser Stelle mein ausdrücklicher Dank an Ingo für seine Arbeit.

ABER:
Nur weil sich jemand nicht äußert, Spekulationen zum Tabu erklären zu wollen?! Das kann es doch auch nicht sein.
Parent - - By Thomas Müller Date 2012-01-26 11:19
Hallo Thomas,

für dieses Wort gegenüber einem anderen Forumsmitglied bekommst du von mir direkt einen Verweiß!
Das geht gar nicht! Was soll das?!
Noch so ein Posting und dein Account wird gelöscht!
Dein Posting wird editiert, habe es leider erst jetzt gelesen sonst hätte ich es direkt rausgenommen!

Können sich Erwachsene Leute nicht nornmal "streiten" ?
Man-o-man.

Gruß Thomas
Parent - - By Thomas Mayer (Quark) Date 2012-01-27 00:26
Hallo Thomas,

also beleidigt wurde in diesem Thread nur eine einzige Person, nämlich derjenigen, dem man irgendwelche Dinge unterstellt hat, unseriöses arbeiten vorgeworfen hat und dann aus nicht nachgewiesenen Behauptungen irgendwelche wirren Schlüsse gezogen hat. Und dies von jemandem, der hier über irgendwelche Gen-Pools fabuliert und damit praktisch alle Schachprogrammierer beleidigt und ansonsten über irgendwelche inzestiösen Bulletranglisten philosophiert. Irgendwann geht eben auch mir mal der Hut hoch, mag sein, daß ich mit meiner Wortwahl hier etwas über das Ziel hinausgeschossen bin, sollte dies so wahrgenommen worden sein, entschuldige ich mich  - bei Dir bzw. dem restlichen Forum, jedoch nicht bei der angesprochenen Person.

Gruß, Thomas
Parent - - By Thomas Müller Date 2012-01-27 10:36
Hallo Thomas,

jo...das macht die Sache jetzt nicht einfacher dieses Posting.
Toll wäre es gewesen wenn du trotz aller Kritik eine andere Wortwahl getroffen hättest.
Es mag nicht nur so sein das du übers Ziel hinaus bist, das ist so!
Das du Stefans Sachen nicht gut finden musst ist ja nicht das Problem, sondern eben diese Wortwahl.
Wenn es in einem "hochkocht" sollte man besser die Finger wieder von der Tastatur nehmen und mal durchschnaufen.
Musste ich auch schon öfters machen

Stefan hat Ingo unserer Meinung nach nicht beleidigt, er hat die vorgehensweise kritisiert.
Da Ingo sich hier eine selbsterlegte Schreibpause gönnt, bleibt das allerdings momentan unbeantwortet im Raum.
Was die beiden per PM ausgetauscht haben ist deren Sache.
Aber vielleicht wäre es auch besser in diesem Punkt über die Vorgehensweise von Ingo nicht weiter zu spekulieren.
Ich schätze ihn als besonnen ein und er wird sich dabei schon was gedacht haben?!

Toll wäre es gewesen wenn du dich einfach entschuldigt hättest und die Sache wäre gegessen.
So wirds blöd! Auch das "nachtreten" mit dem Sack Reis trägt nicht dazu bei.

Bitte etwas runterfahren auch wenn schwer fällt

Also...ich bzw wir Moderatoren bitten dich die Sache nun Ruhen zu lassen.
Ich hoffe das du das so annimmst.
Danke!

Gruß Thomas
Parent - By Frank Rahde Date 2012-01-27 11:09
Unterschreib.
Parent - By Thomas Mayer (Quark) Date 2012-01-27 11:09
Hi Thomas,

[quote="Thomas Müller"]
Also...ich bzw wir Moderatoren bitten dich die Sache nun Ruhen zu lassen.
Ich hoffe das du das so annimmst.
Danke![/quote]

es gäbe manches anzumerken, aber ich bin einverstanden und lasse die Sache mal ruhen.

Gruß, Thomas
Parent - - By Stefan Pohl Date 2012-01-27 08:44
[quote="Thomas Müller"]
Hallo Thomas,

für dieses Wort gegenüber einem anderen Forumsmitglied bekommst du von mir direkt einen Verweiß!
Das geht gar nicht! Was soll das?!
Noch so ein Posting und dein Account wird gelöscht!
Dein Posting wird editiert, habe es leider erst jetzt gelesen sonst hätte ich es direkt rausgenommen!

Können sich Erwachsene Leute nicht nornmal "streiten" ?
Man-o-man.

Gruß Thomas
[/quote]

Hallo Thomas,

Ich bin erleichtert zu sehen, daß die Moderation doch noch reagiert hat.
Schade, daß der Betreffende nicht die menschliche Größe besitzt, sich zu entschuldigen, dann hätte ich sofort gesagt Schwamm drüber, jeder hat mal einen schlechten Tag. So muß ich leider sagen, daß diese Person für mich hier nicht mehr existent ist.
Unnötig das Ganze, völlig unnötig...ich beneide euch Moderatoren wirklich nicht, aber danke für eure Arbeit.

Gruß - Stefan
Parent - By Thomas Mayer (Quark) Date 2012-01-27 09:24
[quote="Stefan Pohl"]
So muß ich leider sagen, daß diese Person für mich hier nicht mehr existent ist.[/quote]

Jo, in China ist sicher auch ein Sack Reis umgefallen... Hast's gehört ?!

Gruß, Thomas
Parent - By Stefan Pohl Date 2012-01-26 00:47
[quote="Wolfgang Battig"]

mag sein, dass Stefan was die Schlussfolgerung angeht übertreibt. In der Sache hat er m.E. zu 100% Recht!
[/quote]

Hallo Wolfgang,

bin schon sehr gespannt auf euer Testergebnis von Stockfish 2.2.2.

Bitte kommuniziere doch mal mit Ingo und versuche ihn zu überzeugen, daß er den 2.2.2 Test nachholt oder aber wieder die alte Version 2.2.1. listet. Auf mich hört er nicht (habe ihn zu oft genervt!), aber du hast doch eine gute Reputation in der Szene im allgemeinen und als Tester im besonderen, auf dich hört er vielleicht.
In unser aller Interesse (IPON ist zu wichtig für die Community) wäre das sehr nett von dir.

Gruß - Stefan
Parent - - By Stefan Pohl Date 2012-01-26 00:41
[quote="Frank Rahde"]
[quote="Stefan Pohl"]
Bisher war die IPON eine wichtige Rangliste. Im Moment ist sie es nicht. ...
Gruß - Stefan
[/quote]

Das halte ich für starken Tobak von Dir! Wortbeiträge mit Maß sehen anders aus in meinen Augen. Die IPON ist und bleibt eine wichtige Rangliste, zumindest für mich. Die von Dir genannte und gar offiziell bekanntgegebene Testschwäche bei Stockfish, die eventuell sich bald wieder auflöst, entwertet die komplette Rangliste keineswegs.

Gruß, Frank
[/quote]

Hallo Frank,

Du mußt bedenken, daß sich der Fehler beim Ranking von Stockfish 2.2.2 (durch das nicht-Testen und das direkte Übernehmen der Elozahl der 2.2.1) leider nicht auf Stockfish 2.2.2 beschränken wird solange der Test nicht nachgeholt und die Elozahl entsprechend korrigiert wird. Denn: Wenn andere Engines in Zukunft in der IPON getestet werden, so spielen sie ja auch gegen Stockfish 2.2.2 und die Erfolgsquote der Engine gegen Stockfish wird dann mit der falschen Elozahl von Stockfish 2.2.2 zu einer falschen Eloleistung der Engine gegen Stockfish 2.2.2. Das verfälscht dann wiederum auch die Ergebnis-Elozahl der getesteten Engine. Zwar nur geringfügig, weil die Rankings der anderen Gegner ja stimmen, aber immerhin. Da Ingo viel (Hardware-)Aufwand betreibt um viele Partien absolvieren zu können, um eben möglichst genaue Ergebnisse zu erhalten, konterkariert er durch diese Fehlentscheidung bzgl. Stockfish 2.2.2 hier seinen eigenen Qualitätsanspruch.

Gruß - Stefan
Parent - - By Benno Hartwig Date 2012-01-26 07:15
[quote="Stefan Pohl"]...Das verfälscht dann wiederum auch die Ergebnis-Elozahl der getesteten Engine. Zwar nur geringfügig, weil die Rankings der anderen Gegner ja stimmen, aber immerhin. [/quote]Wenn 2.2.2 eine andere Erfolgsquote als 2.2.1 hat, dann stimmt das natürlich. Es korumpiert dann zumindest ein wenig die gesamte Liste.

Mich würde daher jetzt doch ein eigentlich verpöhnter Bruderkampf interessieren: Zeichnet sich in einer Begegnung 2.2.1 - 2.2.2 ab, dass 2.2.2 ein erkennbares Stück stärker ist? Oder lässt sich die These "die sind schon gleichstark!" so nicht widerlegen?
Aber schon klar: wer sicher die 2.2.2-Stärke abschätzen will, der darf nur 2.2.2 testen.

Benno
Parent - - By Peter Martan Date 2012-01-26 08:56
[quote="Benno Hartwig"]
Mich würde daher jetzt doch ein eigentlich verpöhnter Bruderkampf interessieren: Zeichnet sich in einer Begegnung 2.2.1 - 2.2.2 ab, dass 2.2.2 ein erkennbares Stück stärker ist? Oder lässt sich die These "die sind schon gleichstark!" so nicht widerlegen?
Aber schon klar: wer sicher die 2.2.2-Stärke abschätzen will, der darf nur 2.2.2 testen.
[/quote]

Hallo Benno!
So ganz klar ist dir, dass jedes rating immer davon abhängt, wer gegen wen spielt, aber anscheinend doch immer noch nicht, oder jedenfalls willst du dich nicht und nicht so ganz damit abfinden?
Up Topic Hauptforen / CSS-Forum / NEBB-Ranglisten: RobboLito 0.10
1 2 Previous Next  

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill