[quote="Benno Hartwig"]
Ich hatte naiv gedacht, wenn eine neue Engine kommt, die dem bisherigen Spitzenreiter um 50 ELO überlegen ist, dann ist sie es im Durchschnitt auch um diese 50 mehr gegenüber jeder anderen Engine im Feld. Und sie hat in der Bewertung am Ende dann auch diese 50 ELO mehr. (Erwartungswert)
Und das würde sich dann so fortsetzen mit jeder neuen Engine, die dem bisherigen Spitzenreiter um z.B. 50 ELO überlegen ist.
Ein kontinuiertliches ELO-Wachstum ganz gemäß der Überlegenheit z.B. ggü. dem bisherigen Spitzenreiter. Keine Verlangsamung, keine Verkleinerung der Fortschritte. Stetiges ungebremstes Wachstum.
Falls du dem widersprechen möchtest, wäre vielleicht ien kleines vorgerechnetes Beispiel hilfreich.
[/quote]
Hättest du recht, wäre es völlig egal, welche engine du gegen welche spielen lässt, wie groß dein Pool ist, und mit wieviel du das Startrating willkürlich bezifferst.
Ist das alles so?
Ich bringe dir gern 1 Beispiel:
Ich mache eine Rangliste, bei der ich mir willkürlich die 10 besten Ivans aussuche und sie gegen Houdini antreten lasse. Mich interessiert einfach nur diese eine Familie, man spricht gern von ausgelutscht im Zusammenhang mit diesen sourcen, nun will ich wissen, bevor niemand mehr weiß, an welchen genau er weiterlutschen soll, welcher der beste Ansatz war, und selbst wenn ich das schon zu wissen glaube, welcher der zweitbeste, und wie groß der Unterschied interfamiliär wohl sei.
Ist doch auch eine Aufgabe für Elos Formel, nein?
Dazu wähle ich als Startrating vom Ururivan 2600, einfach weil ich der Meinung bin, es gibt immer noch ein paar Menschen, die besser spielen und nur nicht die Nerven haben und oder die Sponsoren, das unter Beweis zu stellen.
Ich meine, was soll's, kann doch jeder glauben was er will, wie die Beziehung zwischen Elo Mensch und Elo engine ist, oder?
Und dass mich die Ivans und ihr momentaner Spitzenreiter am meisten interessieren, ist doch auch legitim, würde ich Houdini nur gegen Crafty, Fritz 10 und Shredder 8 spielen lassen, könnte es mir doch auch keiner verbieten und mit welchen wissenschaftlichen Argumenten du ein x-beliebiges anderes Kollektiv als das einzig richtige und ein x-beliebiges anderes Ausgangsrating ebenso postulieren könntest, müsstest du mir erst einmal anhand eines Gegenbeispieles so unter Beweis stellen, dass man daran dann nicht auch aussetzen könnte, es sei unkomplett oder unnötig bunt und dein Startrating wäre viel zu hoch oder viel zu niedirig, richtig?
Was wir aber anhand meines ersten Beispieles herausfinden wollten, sosehr das manch einer wenig vernünftig, aussgagekräftig und interessant finden mag, dass die zahlenmäßigen Ergebnisse davon abhängen, wie wir testen, ich glaube, das haben wir schon vorher gewusst.
Wie groß der Unterschied zu z.B. Ingos Liste sein mag, habe ich natürlich keine Ahnung, würde mir aber aus den Fingern saugen, 50 Elo, die Houdini bei ihm noch voran ist (sind's noch so viel?), bevor H3 kommt, werden's bei mir vielleicht nur 20 sein gegen den zweitbesten Ivan, der dann aber sehr knapp von den anderen 8 verfolgt werden dürfte.
Relativiert haben wir die Elo jetzt langsam genug, finde ich, lass uns zur Kernfrage kommen, ob die Fortschritte so weiter zu erwarten und zu dokumentieren sind in Elo wie zuvorletzt, weil zuletzt hat sich ja ganz oben eh schon nicht mehr ganz so viel getan seit Houdini 1.5.
Wäre es nicht einfach logisch anzunehmen, dass das Schachspiel, das wahrscheinlich ohne nachweisbare Fehler einer Seite meistens remis enden dürfte, je stärker und je ähnlicher zueinander die engines spielen, der Elozugewinn geringer würde, weil die Remishäufigkeit steigt?
Immer hört man von Grenzwertnutzen, sollte es den gerade im Schach, was Programmierkunst und Zeithardwareeinsatz angeht, wirklich nicht geben?
Sollte sich die Remishäufigkeit, die man in allen anderen Spitzensportbereichen des Schachs sieht, im engines- Schach nicht steigern, je besser die engines werden?
Ich will ja nicht behaupten, dass sie einander programmtechnisch immer ähnlich werden müssen, momentan sieht's aber halt so aus, als wäre auch das der Fall, nein?
Wieviele der in den anerkannten Listen geführten 10 Spitzenreiter sind keine bitboard- engines?
Dass man von solchen nicht nur aus der großen glücklichen, wenn auch ausgelutschten Familie der Ivans gut und gern noch 10 weitere hineinquetschen könnte in die honorigen Listen, liegt daran, dass man auch von den Stockfishen noch einmal soviele interessant finden könnte und kann, wieviele Critter-, Komodo-, Gull- und Vitruviusähnliche bald noch dazu kommen werden, hängt hauptsächlich davon ab, ob man demnächst neben Houdini, der ja angeblich (Strelka) auch schon längst ziemlich komplett disassambliert ist, auch mehr den oder jenen Anderen klonen wird, die Stockfish- und Ivansourcen haben halt den großen Vorteil, dass sie direkt einsehbar sind, wenn man mal ein paar Houdini- Geheimnisse auch offener eine Weile gehandelt wird haben, werden die in die open source Programme auch mehr eingehen, dann fängt das Lutschen erst so richtig an, wer weiß?
Wenn wir jetzt schon gesehen haben, dass sich die Zahlenwerte der Elorankings mit dem Kollektiv ändern, sollten sie sich nicht mit zunehmder Ähnlichkeit und Spielstärke des Kollektivs insgesamt auch der steigenden Remishäufigkeit wegen ändern?
Man würde dann vielleicht auch ab einem bestimmten Zeitpunkt gar nicht mehr sicher sagen können, steigt die Remishäufigkeit und sinken die Elogewinne der gleichmäßig bei allen Verglichenen steigenden Stärke wegen, oder mehr deshalb, weil sie einander immer mehr ähneln und mit immer ähnlicher werdendem Spiel immer mehr remis deshalb spielen.
Vielleicht hast du recht, und ich bin unnötigi besorgt, eigentlich macht mir das alles aber überhaupt keine Sorgen, weil ich es ohnehin schon vor langer Zeit habe so kommen sehen.
Insbesondere bin ich weit davon entfernt, mir deshalb Sorgen um den Weiterbestand und die Weiterentwickllung des Computerschachs oder gar des Schachspiels selbst zu machen.