Hallo Gerhard,
GS:
Frank, der o.g. Vergleich würde genau so ausfallen wie er es heute bereits tut.
FQ:
Könnte in der Tat sein (muss aber nicht, glaube eher an "muss aber nicht") zudem ...
Wie würde es sich auf alle anderen Engines in der Liste niederschlagen.
Das ist die doch entscheidende Frage.
GS:
Abstrakt: es spielen "2 Zahlen" gegeneinander, die eine ist (ELO) 2700 und die
andere (ELO) 2750. Nach dem Match hat man ein Ergebnis. Das ELO-System ist sehr
gut für Engines geeignet (noch besser als für Menschen !), da diese ihre
Spielstärke bei entsprechendem Testaufbau (ohne Buch, ohne Lernen etc. etc.)
im Laufe der Zeit nicht verändern.
Ein "schlimmes" Beispiel für eine Liste ist z.B. die SSDF, da hier:
a.) unterschiedliche Hardware gegeneinander spielen "darf"
b.) unterschiedliche Bücher (sogar mit Lernwerten) benutzt werden
FQ:
Zustimmung !!
Und noch weitere Punkte ...
Die SSDF war nie für mich ein Maßstab ...
Erinnere mich noch an Ruffian oder Gandalf.
Die wurden gar über 100 ELO schwächer beurteilt als in allen anderen gängigen Listen.
Keine Ahnung was die SSDF seinerzeit getestet hat, aber egal.
Dort haben auch viele Leute Spass und das ist die Hauptsache !!
GS:
Und behaupte jetzt bitte nicht, dass unterschiedliche Hardware lediglich was mit
unterschiedlicher Zeit zu tun hat. Das wäre viel zu kurz gegriffen.
FQ:
Ist aber auch ein Punkt der zu der Liste der anderen Faktoren hinzu kommt.
GS:
Ich würde es sehr begrüssen wenn Du und Andere endlich "Nägel mit Köpfen" machen
würden und Listen "nach Deiner Art" ins Leben rufen.
Nach eigener Zeit könnten wir dann miteinander vergleichen.
FQ:
Besser wäre es noch wenn umdisponiert wird.
Vielleicht aufgrund der bisherigen Erkenntnisse die großen Listen überdacht werden und ein komplett neuer Aufbau erfolgt.
Das wäre mit Einsicht besser als jetzt weitere 200.000 Partien mit dem bestehenden Konzept hinzuzufügen.
Glaube auch das die Tester der Listen mehr Spaß daran hätten.
Gruß
Frank
PS:
Eine andere Frage die mich gerade stark beschäftigt ...
Fällt mir bei meinem Qualle Turnier auf.
Dort spielen derzeit 12 Engines, jeder gegen jeden 20 Partien.
OK, sind nur 240 Partien aber ...
Jetzt kommen zwei neue Engines, zwei alte fliegen raus.
Plötzlich steht Engine x nicht mehr auf Platz 5 sondern auf Platz 8 !!
Nur weil völlig andere Gegner hinzukommen.
Das ist OK und nicht neu aber ...
Es stellt sich die Frage ...
Wie viele unterschiedlichen Programme sind überhaupt notwendig um eine klare Liste zu erstellen.
Anderes Beispiel:
Nehme ich CEGT oder CCRL Partien und picke nur 10 Engines heraus die gegeneinander gespielt haben.
Egal jetzt wie viele Partien ... können auch mehr als 1.000 sein.
Und kommen zwei neue hinzu ...
Und vorbei ist es mit der ErrBar denn diese zwei Engines können alles verändern.
Insofern für mich neu und derzeit interessant:
Frage:
Wie viele unterschiedliche Engines benötigt ein genauer ELO-Wert einer Engine ?
Daraus ergibt sich folgendes:
Bei einer Liste von 10 Engines müssen in der Tat dann 1.000 Partien pro Engine gespielt werden.
Bei einer Liste von 12 Engines müssen vielleicht nur 800 Partien pro Engine gespielt werden.
Bei einer Liste von 14 Engines müssen vielleicht nur 600 Partien pro Engine gespielt werden.
Wahrscheinlich ist das so !!
Nur zu sagen ...
Engine x hat 1.000 Partien gespielt und das Rating ist sicher ... ist zu flach wenn z. B. noch 10 Engines für die 1.000 Partien verwendet wurden.
Funktioniert so offenbar nicht !!
Kannst ja auch nicht hingehen und eine ELO-Liste mit 2 Engines machen.
Diese dann 1.000x gegeneinander antreten lassen und behaupten die ELO ist sicher
)
Hast Du Dich mal mit dieser Frage beschäftigt ?
Gruß
Frank