[quote="Thorsten Eckhardt"]
Hi Benno,
Oh Mann, wenn ich dieses ewige "nur 50 Partien, dass sind zu wenig... bla,bla,bla" schon höre.
Das zeigt doch ganz klar die Tendenz. Und mehr soll es ja auch gar nicht. Fällt dir nix besseres ein als solch ein überflüssiger Kommentar?
Dann mach du dir doch mal die Arbeit und teste 1000 Partien oder mehr per Engine. Damit es endlich aussagefähige Tests gibt und wir alle nicht dumm sterben müssen.
[/quote]
braucht Benno nicht...
Aussagekräftige Zahlen gibt es bei CEGT, konkret hier:
http://www.husvankempen.de/nunn/40_4_Ratinglist/40_4_AllVersion/rangliste.html32bit - 1CPU (also entsprechend dem was Orlando testet)
Code:
62 Deep Shredder 12 w32 1CPU 2967 13 13 2060 64.1% 2866 32.9%
72 Rybka 2.3.2a w32 1CPU 2955 9 9 3372 65.4% 2844 37.0%
Nach 2060 (DS12) bzw. 3372 Partien (Rybka) liegt Shredder 12 ELO vor Rybka bei Fehler-Bandbreiten von 13 bzw. 9 ELO. Ich würde da von "etwa gleich stark" sprechen!
Mit
64bit-1CPU sieht es sogar ganz anders aus:
Code:
23 Rybka 2.3.2a x64 1CPU 3026 16 16 1506 77.4% 2812 29.9%
34 Deep Shredder 12 x64 1CPU 3009 12 12 2300 65.1% 2901 33.3%
Jetzt ist plötzlich Rybka mit 17 vorne, was aufgrund Rybkas Stärke bei 64bit logisch ist.
Orlandos Ergebnis legt nahe, dass Shredder 11 ca. 70 ELO besser ist als Rybka 2.3.2a. Und das ist eben NICHT der Fall!!
Von
"klarer Tendenz" wie von Dir bzw.
"scheint deutlich stärker zu sein" wie von Peter Schneider behauptet kann also nicht die Rede sein und Bennos Bedenken sind grundsätzlich durchaus gerechtfertigt.
Bei uns war das Einzelergebnis bei 32bit übrigens:
55,5:45,5 für Shredder, also 55,5% = ca. +38 ELO, also nur die Hälfte des Unterschieds bei Orlando. Am Ende war es noch viel weniger (s.o.).
Fazit: Aus
einem 50-Partien-Match Spielstärkeunterschiede der Beteiligten herauslesen zu wollen, ist totaler Unsinn. Erst
viele Matches gegen möglichst viele
unterschiedliche Gegner ermöglichen eine halbwegs klare Aussage "Engine X ist stärker als Engine Y".