Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Statistik Frage
- - By Max May Date 2015-02-20 11:49
Statistik Frage

Komodo 8.0 x64 4CPU hat in der aktuellen CEGT 40/20 ein Rating von 3265 +15/-15.

Ist so eine Angabe eigentlich äquivalent zu, sagen wir, 3250 +30/-0?
Sprich: Komodo hat mindestens 3250 Elo mit der Option auf maximal 3280 

Danke,
-Max
Parent - By Karl Heinz Krasser Date 2015-02-20 12:10
Ein schlichtes NEIN - so funktioniert Statistik nicht (ist nicht so einfach)
Parent - - By Benno Hartwig Date 2015-02-20 12:41 Edited 2015-02-20 12:52
3265 +15/-15 bedeutet:
Das Schätzverfahren liefert dir ein Intervall, welches mit Wahrscheinlichkeit 0,95 die tatsächliche Spielstärke (in ELO ausgedrückt) überlappt. In unserem Fall lieferte es das Intervall (3265-15, 3265+15)
Lax und etwas unsauber ausgedrückt: "Die Spielstärke liegt mit 95% in diesem Intervall."

Trotzdem kann unsere Schätzung mit kleiner Wahrscheinlichkeit auch so falsch gewesen sein, dass die wahre Spieltärke (in ELO ausgedrückt) weniger als 3250 oder auch mehr als 3280 hat.
Kommt in der Regel nur nicht so oft vor.
Wenn jemand andererseit z.B. 100 Engines derart testet, dann werden davon vermutlich einige so falsch beurteilt worden sein, dass diese Grenze gesprengt wurde.
Niemand kann Garantien für irgendwas geben.

Mit welchen Wahrscheinlichkeiten man wie dicht am Erwartungswert liegt, skizziert die folgende Zeichnung:

Und im Computerschach hantiert man gern ungefähr mit (mü-2*sigma, mü+2*sigma), weil die Wahrscheinlichkeit hier ungefähr handliche 95% ergibt.

Benno
Parent - By Max May Date 2015-02-20 18:12
Besten Dank Benno für deine detaillierte Erläuterung!

-Max
Up Topic Hauptforen / CSS-Forum / Statistik Frage

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill