[quote="Benno Hartwig"]
[quote="Ingo Bauer"]Hehe, ja, das +/-42 gilt aber auch für H2, im ungüstigsten Fall ist es also ein + von 10 Elo mit einer 5% Wahrschienlichkeit das es noch kleiner ist
[/quote]Sind es nicht 2,5%, dass H3 um mindestens 42ELO schwächer ist als gemessen?
Und sind es nicht 2,5%, dass H2 um mindestens 42ELO stärker ist als gemessen?
Dann ist die Wahrscheinlichkeit für <=10ELO-Differenz doch 0,025*0,025=0,000625=0,0625%.
Mit eben dieser (Un)Wahrscheinlichkeit ist H3 auch um mindestens 178 ELO stärker als H2.
Ok, ganz so kann man nicht argumentieren, denn diese Messergebnisse sind ja nicht unabhängig. Wenn eine Engine einfach zufällig mehr gewinnt, als es ihrer eigentlichen Stärke entspricht, dann werden andere weniger gewinnen müssen, als es deren Stärke entspräche.
Benno
[/quote]
[quote="Robert Houdart"]...
If you're interested, below the BayesElo output:
Code:
Rank Name Elo + - games score oppo. draws
1 Houdini3 47 21 21 120 64% -47 48%
2 Houdini20c -47 21 21 120 36% 47 48%
...[/quote]
Nicht nur nicht ganz so, sondern genau so eben nicht (wird man argumentieren können). Eben weil (im direkten Vergleich) die jeweiligen Ergebnisse völligst
voneinander abhängen.
Mit einer Wahrscheinlichkeit von weniger als 5% ist H3 nicht (47-21)-(-47+21) = 2*26 = 52 Punkte besser als H2.
Oder anders formuliert: die Wahrscheinlichkeit dafür, dass H3 nicht mindestens 52 Punkte besser ist als H2, beträgt lediglich 5%.
Mit derselben (Un-)Wahrscheinlichkeit von 5% ist H3 um (47+21)-(-47-21) = 2*68 = 138 Punkte besser als H2.
Selbstverständlich gilt dies alles nur für den
direkten Vergleich.