Guenter Stertenbrink schrieb:
> Auf die Frage, wieso hat das alles so lange gedauert, kann man eigentlich immer nur sagen,
> weil es davor schon zu spät war für das, was du früher rechtzeitiger gefunden hättest.
versteh ich nicht
Ein Beispiel zur Erklärung:
Schüler kommt zu spät zum Unterricht. Lehrer: Warum? Schüler: weil ich zu spät aufgestanden bin.
Lehrer: Warum nicht früher aufgestanden?
Schüler: Weil es, als ich aufstand, schon zu spät war, rechtzeitig aufzustehen.
Haha
Du verstehst vielleicht den Witz auch nicht, nämlich in seinem Haha- Wert, aber was ich nur sagen wollte, war: die Frage, warum etwas nicht früher passiert ist, stellt sich immer erst später und meistens ist es eine rhetorische Frage. Dass du fragst, warum dieses und jenes nicht früher passiert ist, kann man eigentlich auch nicht wirklich als informative Frage beantworten, ich interpretierte sie daher im Sinne von: das hätte alles schon längst passieren können! (und sollen?)
Darauf wäre die Antworte einfach: richtig! Es sei denn, man nimmt die Feststellung bzw. Frage zum Anlass zu rekapitulieren, was alles anstatt dessen, was man gerne früher gehabt hätte, passiert ist. Ich dachte irgendwie, dass es dir auch hauptsächlich um die Aufarbeitung dessen ging.
Guenter Stertenbrink schrieb:
das ist ja nur die Ueberschrift. In Wirklichkeit tischte er "Evidenz" auf, dass die GMs werden
mithalten koennen. Das war ja der Tenor der ganzen Serie. Die ganze Diskussion muesste
noch im Usenet sein, und irgendwo auf einer meiner Festplatten.
Es wird nix "bewiesen" , nur Evidenz, Wahrscheinlichkeitsprognosen
Die, wie man anhand des Beispiels sieht, immer auch mal falsch sein können, sind sie es, steht dennoch, wenn es sich um quantitative Fragen handelt, die nächste im Raum: um wieviel sind sie falsch, und um wieviel sind sie richtig, oder könnten es zumindest sein.
Guenter Stertenbrink schrieb:
> Was ist, wenn ich einfach behaupte, die Spielstärke von Computern und erst recht
> die von GMern sei zu einem ganz überwiegenden Teil auf "Eröffnungswissen" aufgebaut.
testest du sie einfach mit unbekannten Eroeffnungen oder Zufallsstellungen
Warum ich?
Du weißt doch ohnehin schon, dass es genau so oder so ausgehen würde. Wolltest du das bezweifeln und quantifizieren, müsstes du das Testen.
Du müsstest die Stellungen aussuchen oder den Zufall aussuchen lassen, und viel Spaß dabei mit den schon verstorbenen GMern.
Um die geht's ja auch, dachte ich, um die Menschen, nämlich im Vergleich zu den Maschinen.
Jetzt lass mal den GM, der noch lebt, und dem du das bezahlen kannst, eine ausreichend große Zahl von Stellungen deiner oder der Wahl des Zufalls, unter Bedingungen, die du auch recht willkürlich wählen musst, im Vergleich zum Engine ausspielen oder sonstwie evaluieren. Dabei solltest du eigentlich, um Fairness mit der Maschine herzustellen, den GM seines Schachwissens entkleiden, weil der hat ja schon viel mehr biologische Stellungsmuster gespeichert als die Engine, selbst die NN- Engine, weil deren "Stellungsmuster" ja ganz andere sind.
Und zum Kern dieser Frage, die du durch die Methode, die du willkürlich vorschlägst, noch nicht beantwortet hast: glaubst du wirklich, das brächte auf ein paar einzelne Elo auf oder ab dasselbe Ergebnis, wie das, das du auf "herkömmlichem Weg" errechnet hast?
Und wie groß wird die Errorbar sein?
Und wie schaut eigentlich dein "herkömmlicher Weg" aus, mit dem du die Evidenz des Artikel- Autors widerlegst?
Nimmst du genau seine Partiensammlung, vertraust du der blindlings? Nimmst du deine eigene? Was hast du für Selektionskritierien? Woher weißt du, dass seine Daten nicht nur denseöben Erhebungsbias haben wie deine, oder beide haben ganz verschiedene, aber beide haben welche, die eine mehr, die andere weniger, du weißt nicht einmal, welche mehr.
Anders gefragt, wie schaut's mit der Randomisierung deiner und seiner Daten aus?
Und sag jetzt nicht wieder, dass das meine Aufgabe wäre, das alles zu untersuchen.
Ich bin mir ja meiner Meinung nach eh sogar mit dir über den eigentlich Kern unserer Diskussion einig: so, wie das der Autor gemacht hat, hätte man das halt wahrscheinlich nicht machen sollen, ich sehe dabei halt auch noch, vermutlich mehr als du, die Fragestellung als solche nicht wirklich repräsentativ und reproduzierbar beantwortbar.
Du wirst mir aber sich das Gegenteil mit einer ordentlichen Studie widerlegen, der ordentlich gesammelte und randomisierte Daten zugrunde liegen, in ausreichender Zahl dokumentiert und innerhalb einer noch so großen Errorbar, die aber jedenfalls natürlich, wenn sie nicht innerhalb des üblichen 95%- Konfidenzintervallls läge, dazu ausgewiesen wird werden.
Guenter Stertenbrink schrieb:
> Und womit beweist du, dass das Spiel der GMs nicht auch um ungefähr so viel besser
> geworden ist, wie das der Computer?
> Deren Elo sind ebenso relativ zueinander, wie die der Computer. Direkt miteinander
> verglichen wurden und werden sie nicht wirklich.
werden sie doch. Es gibt immer auch etliche Partien von neu gegen alt
Werden sie nicht. Es gibt keine Partien von verstorben gegen noch lebend, es gibt keine Partien von neu, der nicht will, gegen alt, der will, aber nicht mehr kann, und es gibt jedenfalls keine halbwegs vernünftige Partienzahl, die eine vernünftige Errobar hätte, schon gar nicht, wenn die Partien alle unter halbwegs vergleichbaren Bedingungen gespielt werden müssten.
Du zweifelst ja sogar schon die statistische Verlässlichkeit einer Turnierperformance unter lebenden GMs an, die gerade alle gegeneinander gespielt haben. Siehe deine, von mir zunächst fälschlich als Scherz missverstandene Frage nach der Errobar in dem Genke- Thread:
http://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=121120#pid121120Guenter Stertenbrink schrieb:
> Ja, irgendwie so ungefähr wird's schon stimmen, was du dir da hinmalst, aber wie
> sehr genau und wie sehr daneben die Zahlen sind, mit denen du dauernd auftrumpfst,
> das weißt du eben absolut nicht.
es funktioniert doch. Die Ergebnisvorhersagen an Hand der Elos sind ziemlich zuverlaessig.
Die verschiedenen Ratinglisten zeigen im Wesentlichen dieselben Resultate.
Natürlich, sie gehen ja auch alle von ziemlich denselben überlieferten Ausgangswerten aus.
Und ab welchen Partiezahlen stimmen die Vorhersagen "ziemlich genau". Was ist "ziemlich genau" für dich?
Und nun kannst du ja auch recht haben, dass die Relationen trotz alledem ziemlich genau stimmen, es kann aber auch genau so gut ziemlich falsch sein. Und natürlich sind die Relationen sowieso nur so genau richtig oder ziemlich falsch, wie die Absolutwerte, die du zugrunde legst.
Weil 100 Elo zu 2000 addiert, ist eine Relation von 100 Plus, aber eine von 100/2000 als Quotient, der Absolutwert bestimmt bei entsprechend relevanter Rechenart auch die Relation.
Self fulfilling prophecy ist ansonsten einfach, was du machst.
Guenter Stertenbrink schrieb:
> glaubst du wirklich, dass jetzt gerade eine explosionsartige Acceleration stattfindet,
> und wenn ja, wohin?
NNs
Upps, die NNs accelerieren die Elo- Fortschritte der Engines?
Ich dachte, wir sind, seit es sie gibt, immer noch (in Relation zu dem, was sich vorher so alles an Fortschritt zahlenmäßig beweisen ließ) am SF- Niveau, nein?
Kann sein, die Explosion findet jetzt dann demnächst endlich wirklich statt, kann sein auch nicht, kann sein, wir werden's der Remisquote wegen nicht mehr wirklich beweisen können.
Guenter Stertenbrink schrieb:
> Zum Remis doch wohl höchstens vermutlich, oder?)
zum drawkiller , zu immer extremeren Noomen-Sets
Also weg von der Grundstellung und weg vom eigentlichen Schach. Ok. Nennen wir es Günter- Schach, du musst aber dann genau die Bedingungen, die für Günter- Schach gelten, definieren. Sonst stehst du zwar immer noch solide auf den Schultern von Riesen, aber deine Aussichten sind um nichts besser als die von denen, auf denen du ruhst, weil du die Grundlage deiner eigenen Erkenntnisse nicht mehr kennst und sie dich auch nicht mehr interessieren. Du siehst immer noch gut nach oben, nach unten verschwimmt dir die Sicht zusehends.
Guenter Stertenbrink schrieb:
Sag konkret, welche Elo(s) deiner Meinung nach falsch sind, dann koennen wir das gezielt untersuchen
Guenter
Du glaubst an die Verlässlichkeit von Elo, du musst konkrete Zahlenbeispiele mit entsprechend verlässlichen Untersuchungen unter reproduzierbaren Bedingungen bringen. Dir geht's um bestimmte Zahlenwerte, du musst sie nennen, die Abolutwerte, die Relationen, die Quellen aus denen du schöpfst, die Art der Berechung und die zahlenmäßgen Ergebnisse, gemeinsam mit der Errorbar.
Ich bin ja damit zufrieden, dass es sehr relative Werte sind, die mir einfach viel weniger sagen als dir.
Ich gebe zu, du hast es etwas schwerer, dein Theorem zu beweisen als ich meines. Du müsstest vor allem mal eines zahlenmäßig eingegrenzt aufstellen, sonst redest du einfach auch immer nur von "ziemlich falsch" und "ungefähr richtig".
Du müsstest die Behauptung, alle Schwäne seien weiß, dadurch beweisen, dass du alle Schwäne auf ihrer Farbe untersuchst, und übersieh bloß keine Schwan, und definiere möglichst genau die Farbe weiß.
Am Elo- Beispiel: alles, was so durch die "Literatur" geistert, z.B. auch der chessbase- Artikel, muss auf den quantitativen Wahrheitsgehalt überprüft werden, um zu einer exakten und velässlichen Summary zu kommen.
Ich muss nur einen einzigen schwarzen Schwan anschleppen und dein Theorem vom uneingeschränkt weißen Schwan ist widerlegt. Sagst du, ok, ich habe einen einzelnen schwarzen Schwan übersehen, aber alle anderen sind sicher weiß, muss ich nur einen zweiten zum Widerlegen deines neuen Zahlentheorems bringen.
Am Elo- Beispiel: eigentlich hat schon dein chessbase- Artikelt gezeigt, wie falsch gerade Statistiker mit ihren Zahlen, Prognosen, Wahrscheinlichkeitsberechnungen in Punkto Elo (und jedem anderen Rating- Maß) liegen können.
Du musst per exclusionem argumentieren, um Beweiskraft zu haben, und du musst die Kraft deiner Beweise und die Ergebnisse zahlenmäßig verteidigen, ich muss nur berechtigte Zweifel begründen, für meinen Geschmack habe ich das in den letzten Jahrzehnten ausreichend getan, ich kann ja nichts dafür, dass dir das noch immer nicht reicht.