Houdini von der Spitze abgelöst???

By Rainer Maikowski Date 2011-10-05 15:56

wo???
Raner Maikowski

By Christian Schmidt Date 2011-10-05 16:03

Eher das Gegenteil dürfte der Fall sein. Nach dem größeren Rückzug von Marco Costalba und Joona Kiiski dürfte Stockfish langsam zurückfallen, wenn keine neuen Leute an Bord kommen.

By Werner Schüle Date 2011-10-05 16:17

[quote="Bert Rinzel"]
Neuer Spitzenreiter und die Erbsenzähler wissen von nix....

Seit gestern gibts nen neuen Stockfish, der offensichtlich stärker als Houdin ist.
Mal sehen obs durch eure Test bestätigt wird....Falls Ihr es denn mal mitbekommt.

[/quote]

Stimmt,
genau so hat es Marco im CCC beschrieben

"No release for now given that the increase in ELO terms from 2.1.1 is very small, especially for single core case"
Gruß
Werner

By Benno Hartwig Date 2011-10-05 17:10

[quote="Bert Rinzel"]Seit gestern gibts nen neuen Stockfish, der offensichtlich stärker als Houdin ist.[/quote]Mensch, teile dein Wissen doch blos endlich mal den Leuten von
http://www.stockfishchess.com/download/all/
mit.
Und auch
http://blog.stockfishchess.com
schlummert noch auf dem Stand vom Mai.

(wie zaghaft wirkt mein Lächeln neben deinem Rumgekugele.)
Benno

By Bert Rinzel Date 2011-10-05 17:16

Auf dem Schachserver spielen derzeit 7 von den neuen "Stockfischen"

Es wird doch wohl einen geben, der es sich dort ansehen will???

By Ingo Bauer Date 2011-10-05 17:31 Edited 2011-10-05 21:53

Ja gut das ein Erbsenzähler auch mal einen Google Translate bemühen kann:

Aus dem Readme:

Stockfish VE_01
Basados en Codigos de Stockfish 2.1.1:
http://www.talkchess.com/forum/viewtopic.php?t=40610
[url]https://github.com/mcostalba/Stockfish [/url]

Ninguna modificación.

En Carpeta, \IntelC++Optimizados\
Ejecutables de 32 y 64 bits, con PGP minimo.

En Carpeta, \MicrosoftVisualC++\
Ejecutable de 32 bits.

Schlüsselwort ist: "Ninguna modificación."

Mit Glück hat da jemand ein paar Prozentchen durch den Intel-Compile rausgequetscht.

Es ist wie immer, wenn man etwas sehen will weil man zu faul zum testen (oder lesen) ist. Wie gut das es Erbsenzähler gibt!

Gruß
Ingo

By Andreas Luettke Date 2011-10-05 18:01

Zitat:

Ja gut das ein Erbsenzähler auch mal einen Google Translate bemühen kann:

Das ist zwar nicht besonders viel aber immerhin ein Anfang

Zitat:

Es ist wie immer, wenn man etwas sehen will weil man zu faul zum testen (oder lesen) ist. Wie gut das es Erbsenzähler gibt!

Richtige Computerschächer können eben doch etwas mehr als nur die "Erbsenzählerei", könnte der Computer sich selber ein und ausschalten und auch noch die Liste selber aktualisieren wäre der Erbsenzähler als solches sogar überflüssig

Wie gut dass es demzufolge auch völlig anders geartete Computerschächer gibt

Gruss Andreas

By Ingo Bauer Date 2011-10-05 18:40 Edited 2011-10-05 18:42

Moin Andreas,

[quote="Andreas Luettke"]
... könnte der Computer sich selber ein und ausschalten und auch noch die Liste selber aktualisieren wäre der Erbsenzähler als solches sogar überflüssig

[/quote]

Meine Computer schalten sich von selbst ein (zumindest fast, da remote) und auch die Liste aktualisiert sich mit ein paar BAtches von selbst ... leider kannst du offensichtlich nicht Ahnen wie viel Arbeit trotzdem noch drin steckt.

[quote="Andreas Luettke"]
Wie gut dass es demzufolge auch völlig anders geartete Computerschächer gibt

[/quote]

Ja, da gebe ich dir Recht. Auch wenn ich es nicht verstehe, gönne ich unumwunden jedem Tierchen sein Pläsierchen. Wenn es dir Spaß macht Oldies zu beschäftigen kann ich da nicht wirklich folgen, freue mich aber das du deine Nische gefunden hast!

Gruß
Ingo

By Andreas Luettke Date 2011-10-05 19:46

Guten Abend Ingo,

Zitat:

Meine Computer schalten sich von selbst ein (zumindest fast, da remote)

Ja ich hatte auch schon mal einen Lottogewinn (zumindest fast per Brieftaube)

Zitat:

und auch die Liste aktualisiert sich mit ein paar BAtches von selbst ...

... und dann steckt immer noch soviel Arbeit drin ???

Zitat:

leider kannst du offensichtlich nicht Ahnen wie viel Arbeit trotzdem noch drin steckt.

Für einen so erfahrenen Erbsenzähler wie Dich dürfte das doch mit den Jahren nun nur noch ein Klacks sein oder nicht ? Die meiste Arbeit macht doch ohnehin der Computer ...

Zitat:

Wenn es dir Spaß macht Oldies zu beschäftigen kann ich da nicht wirklich folgen, freue mich aber das du deine Nische gefunden hast!

Hättest Du geschrieben mich interessieren, Schachstudien, Schach auf dem CB-Server spielen, Schachbücher selber basteln, interessante Schachspiele analysieren oder Fernschach spielen, dann wäre ich sogar Deiner Meinung gewesen ... ! Aber mit dieser Deiner unumwundenen Aussage (siehe Zitat) kann ich überhaupt gar nichts anfangen ... ?!?

Allerdings stimme in einem Punkt mit Dir überein, selbst wenn es völlig wertlose Erbsenzählerei für mich und andere ist, so gönne auch ich jedem Tierchen sein Pläsierchen

Gruss Andreas

P.S.
Nun fang schon mal an mit Testen sonst sind die anderen womöglich noch schneller als Du

By Wolfgang Battig Date 2011-10-05 20:08 Edited 2011-10-05 20:10

[quote="Ingo Bauer"]
... Wenn es dir Spaß macht Oldies zu beschäftigen ....

Gruß
Ingo
[/quote]

da meinst Du wohl den Andreas Wutzke (nicht Lüttke). Der Andreas W. ist der mit M-Chess (was ich gut finde) und der Andreas L. ist der, der immer dann, und (fast) nur dann
auftaucht, wenn es gerade mal wieder angesagt ist, auf die "Erbsenzähler" einzudreschen (was ich schlecht finde). Serverfuzzies halt, Bert R. inclusive...

Gruß
Wolfgang

By Bert Rinzel Date 2011-10-05 20:34

Im Gegensatz zu deinem Busenfreund GS hat von den "Serverfuzzies", die sich im Gegensatz zu den "Erbsenzählern" wenigstens mit richtigem Computerschach beschäftigen, noch keiner einem anderen "Dresche" angeboten. Auch Andreas Lüttke nicht.

Die Arbeit an den Eröffnungsbüchern ist mit Sicherheit um ein Vielfaches interessanter als überflüssige Statistiken zu erstellen, die für lange Games mit MP keinerlei Aussagekraft haben. Aber wenns euch Freude bereitet: Nur weiter so.

By Wolfgang Battig Date 2011-10-06 00:05

[quote="Bert Rinzel"]
Im Gegensatz zu deinem Busenfreund GS hat von den "Serverfuzzies", die sich im Gegensatz zu den "Erbsenzählern" wenigstens mit richtigem Computerschach beschäftigen, noch keiner einem anderen "Dresche" angeboten. Auch Andreas Lüttke nicht.

Die Arbeit an den Eröffnungsbüchern ist mit Sicherheit um ein Vielfaches interessanter als überflüssige Statistiken zu erstellen, die für lange Games mit MP keinerlei Aussagekraft haben. Aber wenns euch Freude bereitet: Nur weiter so.
[/quote]

Bert,

ganz im Ernst und mit Verlaub: Laber nicht so einen Unsinn!

1. kenne ich GS noch nicht mal persönlich, also "Busenfreund"?!
2. beurteilst Du jetzt, was "richtiges" Computerschach ist? Und das ist dann für alle gültig? Träum weiter...
3. weißt Du genau, wie "eindreschen" gemeint ist, also interpretier nicht etwas in mein Posting hinein, von
dem Du weißt, dass ich es anders gemeint habe
4. fand ich die Geschichte damals mit GS vs. ME alles andere als ok, allerdings gilt das für beide "Kontrahenten" (ME kann auch sehr gut provozieren!)

Im übrigen formuliere ich Deinen letzten Satz mal um: Die Arbeit an Ranglisten ist mit Sicherheit um ein Vielfaches interessanter als überflüssige Serverspielchen zur machen, die keinerlei Aussagekraft haben. Aber wenns euch Freude bereitet: Nur weiter so.

Alles eine Frage der Sichtweise!

By Bert Rinzel Date 2011-10-06 01:48

Code:

Im übrigen formuliere ich Deinen letzten Satz mal um: Die Arbeit an Ranglisten ist mit Sicherheit um ein Vielfaches interessanter als überflüssige Serverspielchen zur machen, die keinerlei Aussagekraft haben.

Keine eigenen Argumente gefunden???

Schon mal was von Computerschach-Turnieren und sogar Weltmeisterschaften gehört???
Wann kommt das erste Ranglisten-Turnier in Leiden oder sonstwo? Wann die erste Weltmeisterschaft???

Das ist so als wenn die Autos für die Testzeitschriften und nicht für die Autofahrer gebaut würden. Alberne Vorstellung.

By Wolfgang Battig Date 2011-10-06 08:53 Edited 2011-10-06 08:55

[quote="Bert Rinzel"]
....
Schon mal was von Computerschach-Turnieren und sogar Weltmeisterschaften gehört???
Wann kommt das erste Ranglisten-Turnier in Leiden oder sonstwo? Wann die erste Weltmeisterschaft???
....
[/quote]

Du bist echt ein Meister des Verdrehens, Bert.

Mein Satz bezog sich auf "überflüssige Serverspielchen", so wie Du immer über "überflüssige Ranglisten" schreibst.
Turniere wie Leiden, die WM, Thüringen usw. habe ich ausdrücklich nicht gemeint, sonst hätte ich das geschrieben,
denn die finde ich durchaus sinnvoll und interessant - Aussagekraft hin oder hier, aber darum geht es da ja auch nicht.

Vielleicht nimmst Du einfach mal zur Kenntnis und akzeptierst, dass es verschiedene Arten gibt sich mit Computerschach zu beschäftigen.
Egal ob Server-Spiele, Ranglisten erstellen, Eröffnungsbücher bauen, Fernschachunterstützung, Analysen usw. usw. Alles sind
verschiedene Facetten eines Hobbies und sollten akzeptiert werden (man muss es ja nicht gut finden). Ich z.B. finde die
"Serverspielerei" mit riesigen Büchern und (meist) gleichen Engines gegeneinander uninteressant, akzeptiere es aber, wenn jemand
meint, sein Hobby so betreiben zu wollen.
Wenn ich dann mal von "Serverfuzzies" spreche, ist das meist eine Reaktion (siehe weiter oben im Thread) auf die "Erbsenzählervorwürfe"...

Problematisch wird es, wenn jemand meint, seine - ganz spezielle/individuelle - Art sich mit Computerschach zu beschäftigen, sei
die einzig wahre. DAS ist albern!

Benno schreibt weiter unten: "Niemand hat die Deutungshoheit darüber, was interessanter ist als anderes."
Dem ist nichts hinzuzufügen!

Gruß
Wolfgang

By Bert Rinzel Date 2011-10-06 09:06

Habe ich jemals gesagt ihr sollt aufhören damit?

Selbstverständlich könnt ihr die gleichen varianten auch zum 100.000sten mal durchnudeln.

Ich behaupte nur dass die tests überflüssig sind, da sie keinerlei aussagekraft für lange games mit mp versionen und einer entsprechend guten eröffnung haben.

Computerschach ist mehr als die gleichen varianten mit einem core immer wieder rauf und runter zu spielen.

Was glaubst du womit sich die Großmeister beschäftigen? Deren ganze vorbereitung besteht darin den gegner mit neuen eröffnungsvarianten zu überraschen.

By Werner Mueller Date 2011-10-06 10:32

[quote="Bert Rinzel"]
Habe ich jemals gesagt ihr sollt aufhören damit?

Selbstverständlich könnt ihr die gleichen varianten auch zum 100.000sten mal durchnudeln.

Ich behaupte nur dass die tests überflüssig sind, da sie keinerlei aussagekraft für lange games mit mp versionen und einer entsprechend guten eröffnung haben.

Computerschach ist mehr als die gleichen varianten mit einem core immer wieder rauf und runter zu spielen.

Was glaubst du womit sich die Großmeister beschäftigen? Deren ganze vorbereitung besteht darin den gegner mit neuen eröffnungsvarianten zu überraschen.
[/quote]
Hallo Bert,

Engines testen und mit Engines auf dem Server spielen sind einfach zwei Paar Stiefel. Und wenn Du immer mit 'Erbsenzählern' herumpöbelst ist das a) kindisch und b) zeigt es, dass Du diesen Unterschied nicht mal ansatzweise verstanden hast.

Beides ist mehr oder weniger ein Privatvergnügen, und um auch mal böse zu sein: Spielen eher mehr - Testen eher weniger.

(soooviel 'weniger' allerdings auch nicht, dass mancher in seinem Größenwahn gleich annimmt, die Welt bräche ohne seine Liste zusammen

)

By Ludwig Bürgin Date 2011-10-06 12:26

Hallo Werner

Es gibt schon einen Unterschied.

Im Maschinenraum kann man bei entsprechendem Einsatz(Vorarbeit)und guter Hardware einen Gewinn erzielen.

Beim Engine testen bekommt man ein Ergebnis.

Gruß Ludwig

By Peter Martan Date 2011-10-06 12:47

Sehr gut, Ludwig!

Was du damit aber vor Allem denen, die sich darüber so gar nicht einigen können, nicht sagst, ist das:
Was zählt der einzelne Gewinn am server und was zählt das Ergebnis, das du in der Rangliste hast, für wen?

By Werner Mueller Date 2011-10-06 13:17

[quote="Ludwig Bürgin"]
Hallo Werner

Es gibt schon einen Unterschied.
[/quote]
Sag ich doch, es gibt deutlich mehr Unterschiede als Gemeinsamkeiten.

[quote="Ludwig Bürgin"]
Im Maschinenraum kann man bei entsprechendem Einsatz(Vorarbeit)und guter Hardware einen Gewinn erzielen.
[/quote]
Ich vermute fast, auch von diesem Unterschied hat der Bert noch nicht viel wahrnehmen können - ansonsten wäre er in der Beurteilung anderweitiger Aktivitäten etwas großzügiger.

By Peter Martan Date 2011-10-06 11:00 Edited 2011-10-06 11:03

Hallo Bert!

[quote="Bert Rinzel"]
Ich behaupte nur dass die tests überflüssig sind, da sie keinerlei aussagekraft für lange games mit mp versionen und einer entsprechend guten eröffnung haben.
[/quote]

Obwohl ich in meinem jünsten Elaborat dazu in eben diesem thread Benno Hartwig antwortend trotz der unnötig vielen Worte oder gerade deshalb missverstanden werden könnte in genau dem Sinn deines Zitates, möchte ich das gern relativieren.

(Nebenbei: es schadet aber auch weniger und weniger, je öfter ich genau denselben Inhalt wieder und wieder mit mehr und mehr Wortaufwand erzähle, umso weniger muss das irgendjemand, der so etwas Ähnliches schon mal von mir gelesen hat, wirklich im Detail noch einmal lesen, es ist eh echt immer wieder dasselbe.
Nur einige wenige plakative Kraftausdrücke kommen immer wieder mal neu vor, die hebe ich dann eh meist extra fett gedruckt hervor, alles Andere kann man getrost überfliegen.

Die Tests sind nicht überflüssig, sie werden nur überinterpretiert, meistens aber auch gar nicht von den Ranglistenerstellern selbst.
Es sind die Fanboys, um ein dazu gern missbrauchtes neuhochdeutsches Vokabel passend zu verwenden, die aus Ranglisten das machen, was ihnen an Schachverständnis, Zeit, selbst zu spielen, hard- und software- Kenntnis oder an sonst was fehlt, bei Vielen wahrscheinlich ohne, dass sie es wissen, bei vielleicht noch Mehreren, weil sie sich einfach das Alles nicht antun wollen, an Grübelei und Eigenarbeit, was notwendig ist, um das Spiel selbst und erst recht, das, was der Computer daraus gemacht hat, so zu verstehen wie ein guter Schachprofi oder erst recht ein guter Computerschachprofi.

Man kann es nicht den Ranglistenerstellern vorwerfen, dass die Arbeit, die sie machen, von denen, die sich genau diese notwendige und auch immer aufwendiger werdende Arbeit nicht antun wollen aber trotzdem bei jeder "neuen" Version sofort nach ordentlich erstellten Eloauswertungen schreien und sich bitter beklagen, dass das, was sie dann eh sofort geliefert bekommen, nicht genau das ist, was sie sich gewünscht haben, dass diese Arbeit einer ordentlichen Rangliste von den Unmengen von guten Programmen, die es halt mittlerweile so preisgünstig oder frei gibt, mittlerweile vielleicht nur mehr in einzelnen Speziallisten nach Spezialfragestellungen gesplittet genau genug machbar ist.
Es liegt nicht an den Ranglisten, dass nicht mehr alle EOI (engines of interest) auf eine von wirklich allgemeinem oder gar universellem Interesse passen, es sei denn, man interessiert sich halt nicht mehr für jeden neuen Stockfish, wenn der jetzt auch ein community- Projekt wird, geschweige denn nicht für jeden Ivan.

[quote="Bert Rinzel"]

Computerschach ist mehr als die gleichen varianten mit einem core immer wieder rauf und runter zu spielen.
[/quote]

Da hast du einfach völlig recht, ich rufe seit Jahr und Tag hauptsächlich danach, dass die Eröffnungsstellungen zu Testzwecken (und das müssen ja dann für mich absolut keine allgemein für jedes Unserinteresse unanzweifelbaren Listen sein, die man damit macht, das müssen überhaupt keine Elo sein, die das auswirft, und die müssen überhaupt keine Anspruch erheben, pro Stellung über mehr als diese eine Stellung hinaus Bedeutung zu haben) bunter sein sollten, damit man wieder einen etwas bunteren engine- Tierpark wahrnähme.
Vorhanden ist er ja, die Elosion macht halt alles platt an Geltung, was nicht unmittelb nach 5-8 Zügen und einer dann hundertprozentig ausgeglichenen Eröffnungsstellung sofort auf den Bäumen ist und in Sicherheit vor jedem Raubtier, dass da nicht so schnell hinterherklettern kann und fürchten muss, die Kokosnuss auf den Kopf geschossen zu bekommen von dem Affen, der mit affenartiger Geschwindigkeit schon den Übergang ins Endspiel berechnet hat, der in dem ruhigen Fahrwasser, in den das Schiff eigentlich nach diesen 8 Zügen auch schon von selbst hätte steuern können, dann das einzig entscheidende Vorteilchen bringt, das den Gegner noch versenken kann.

[quote="Bert Rinzel"]
Was glaubst du womit sich die Großmeister beschäftigen? Deren ganze vorbereitung besteht darin den gegner mit neuen eröffnungsvarianten zu überraschen.
[/quote]

Das heißt jetzt zwar auch noch überhaupt nicht, dass es die engines genau so machen sollen, wie im talkchess, ich glaube Bob Hyatt einmal gemeint hat, es ist eher unwahrscheinlich, dass die menschliche Art, Schach erfolgreich zu spielen, genau diejenige sein sollte, mit denen engines erfolgreicher spielen könnten.

Wenn aber die Eröffnungstheorie, wie sie Menschen verständlich, praktikabel und erfolgreich spielen, mit engine- Unterstützung nicht mehr dem menschlichen Verständnis entsprechend weiterentwickelt werden kann, weil die engines dazu nicht mehr im (menschlich-)eröffnungstheoretisch anspruchsvollen Sinn weiterentwickelt werden, dann haben sie ebensowenig Sinn wie irgenein anderes Spiel- oder Werkzeug, das nur mehr gegen sich selbst spielt oder werkt.

By Christian Schmidt Date 2011-10-08 11:03

[quote="Bert Rinzel"]
Habe ich jemals gesagt ihr sollt aufhören damit?

Selbstverständlich könnt ihr die gleichen varianten auch zum 100.000sten mal durchnudeln.

Ich behaupte nur dass die tests überflüssig sind, da sie keinerlei aussagekraft für lange games mit mp versionen und einer entsprechend guten eröffnung haben.

[/quote]

Sehr gewagte Thesen und die gerade aus dem Maschinenraum, wo fast nur die stärkste Engine mit überdurchschnittlicher Hardware spielt. Man kann einen einfachen Test machen: Weiß mit f2-f3 beginnen lassen, dafür eine doppelt so schnelle Hardware und Houdini 1.5 geben. Schwarz spielt mit Fritz 13 auf der unterlegenen Hardware. Dann wird man sehr schnell sehen, wie wichtig eine Eröffnung tatsächlich ist. Zudem muss man sehen, dass im Maschinenraum häufig nur sehr kurze Matches gespielt werden. Wenn ich dem PC kaum Zeit gebe, dann darf ich mich nicht wundern, wenn der Spieler mit dem längeren Eröffnungsbuch (vielleicht sogar durch mit den PC vorgenerierten Zügen) gewinnt.

Ach ja, ich habe den Test bei einer Bedenkzeit von 4+2 selbst durchgeführt. Der Sieger war (natürlich) der Entfesselungskünstler.

By Benno Hartwig Date 2011-10-06 08:41 Edited 2011-10-06 08:43

[quote="Bert Rinzel"]Die Arbeit an den Eröffnungsbüchern ist mit Sicherheit um ein Vielfaches interessanter als überflüssige Statistiken zu erstellen, [/quote]Welches Interesse die Menschen entwickeln, solltest du ganz sicher den Menschen überlassen, welche eben dieses Interesse entwickeln!

Was dich interessiert, darfst du hingegen gern selbst entscheiden.

Niemand hat die Deutungshoheit darüber, was interessanter ist als anderes.
Benno

PS:
Natürlich ist das Buch-Erstellen eine interessante und anspruchsvolle Aufgabe (je nach dem, wie man es betreibt).
Ich bin aber auch froh, dass die Ratinglisten gepflegt werden, denn sie interessieren mich auch.

By Wolfgang Battig Date 2011-10-06 09:00

[quote="Benno Hartwig"]
...Niemand hat die Deutungshoheit darüber, was interessanter ist als anderes....[/quote]

+1

By Peter Krug Date 2011-10-06 19:08

"Deutungshoheit"

Das hätte eine
1 mit Sternterl verdient, wegen des gelehrten Ausdrucks

By Benno Hartwig Date 2011-10-07 06:54

[quote="Peter Krug"]1 mit Sternterl verdient, wegen des gelehrten Ausdrucks[/quote]BTW:
Kennst du einen 'weniger gelehrten' Ausdruck, der treffend die Anmaßung eines Menschen beschreibt, etwas verbindlich für andere bewerten zu können?
Benno
(ich möchte schließlich auch dazulernen)

By Ingo Bauer Date 2011-10-05 20:41

[quote="Wolfgang Battig"]
...
da meinst Du wohl den Andreas Wutzke (nicht Lüttke). Der Andreas W. ist der mit M-Chess (was ich gut finde) und der Andreas L. ist der, der immer dann, und (fast) nur dann
auftaucht, wenn es gerade mal wieder angesagt ist, auf die "Erbsenzähler" einzudreschen (was ich schlecht finde). Serverfuzzies halt, Bert R. inclusive...

[/quote]

Ups, dann entschuldige ich mich zuerst für die Verwechslung bei Andreas Wutzke* und kann dir, die Relpys hier lesend, nur zustimmen. Die beiden scheinen etwas kompensieren zu müssen. Schade eigentlich.

Gruß
Ingo

* habe mich auch schon gewundert, so aggresiv habe ich den Andreas W(!) in Thüringen gar nicht kennengelernt ...

Freudsche Fehlleistung.

By Peter Krug Date 2011-10-06 19:03

Mir ist gar noch nicht aufgefallen, dass Ingo ein Savant ist und sich mit Erbsenzählen beschäftigt.

By KArl Sontheimer Date 2011-10-05 18:10

Google hat einen Link zum DL gefunden.

https://github.com/mcostalba/Stockfish Stockfish VE 01 (w32/x64) http://www.megaupload.com/?d=ROZB2Q44

By Peter Martan Date 2011-10-05 18:23 Edited 2011-10-05 18:25

[quote="Ingo Bauer"]
Es ist wie immer, wenn man etwas sehen will weil man zu faul zum testen (oder lesen) ist. Wie gut das es Erbsenzähler gibt!
[/quote]

Du sagst es, Ingo!

Die werden's nur wieder noch eine Nummer schwerer haben, demnächst, wenn jetzt außer den vielen inoffziellen Ivans auch noch ständig neue inoffiziell- offizielle Stockfische auftauchen werden, weil sich jeder, der mal ein bisschen dran rumprobiert hat, mit seinem eigenen compile wird einen Namen machen wollen.

Genau genommen ging das ja immer schon, da hatten die bisherigen Eltern aber wenigstens den Kindern ihren Namen gegeben, man kann gespannt sein, wie sich das auf die Stockfish- Entwicklung weiter auswirken wird.

Schade um dieses Team, hoffentlich hören sie nicht ganz auf.

Das Weiterentwickeln eines Elo- Spitzenreiters dürfte wohl wirklich immer schwerer geworden sein, vielleicht auch nur immer schwerer kontrollierbar.

By Ingo Bauer Date 2011-10-05 18:35 Edited 2011-10-05 18:41

Hi,

[quote="Peter Martan"]

Die werden's nur wieder noch eine Nummer schwerer haben, demnächst, wenn jetzt außer den vielen inoffziellen Ivans auch noch ständig neue inoffiziell- offizielle Stockfische auftauchen werden, weil sich jeder, der mal ein bisschen dran rumprobiert hat, mit seinem eigenen compile wird einen Namen machen wollen.
...
[/quote]

Ja, ohne Zweifel! Ich bat im CCC Forum ja auch die Entwickler vielleicht ihren letzten komplett eigenen Code mit einer neuen Versionsnummer zu versehen. Vielleicht klappt das ja noch.
Ansonsten ist mir aber nicht bange. Es ist halt so und wird sich wie mit den Littos regeln. Man muß Augenmaß beweisen. Den täglich Build der Ritter muß man ignorieren. Man kann sich natürlich die Rangliste mit so etwas zukleistern, oder aber sich auf wesentliche sKonzentrieren und nach bestem Wissen und Gewissen eine (den besten) einer Familie mitnehmen. Ich versuche das so gut es geht, so werde ich es auch mit den möglichen Stockfishen halten. Zu ANfang wird das vielleicht etwas wilder, aber das pendelt sich schon ein. Gut Ding will Weile haben.

Gruß
Ingo

By Thorsten Czub Date 2011-10-05 19:11

sagte der teetrinker der leutselig auf shredder13 wartete. prost.

By Willi Prinz Date 2011-10-05 19:33

Ich hätte da mal eine Frage,nehmen wir an,(Utopisch!) Shredder 13 hat 4000 Elos.
Dann spielen alle im Computerraum auf Schach.de mit Shredder 13.
Soweit so gut,da ja alle das Programm haben ,wird der beste immer noch der mit der besten Hardware sein.
Es ist eine generelle Frage,wenn Shredder 13 ,4000 Elos haben sollte,( unmöglich) was ändert das am Computerschach???????????
Gruß Willi

By Andreas Luettke Date 2011-10-05 20:12

Hallo Willi,

Deine Behauptung

Zitat:

Soweit so gut,da ja alle das Programm haben ,wird der beste immer noch der mit der besten Hardware sein.

ist schlichtweg nicht korrekt sondern vielmehr als falsch einzustufen!
Eine sehr gute Hardware ist leider NUR die halbe Miete und beileibe nicht alles auf dem Schachserver.
Was nutzt schon eine sehr starke HW wenn man KEIN vernünfiges Eröffnungsbuch besitzt denn auch im Computerschach ist die Eröffnung das A und O, ich habe persönlich dort schon des öfteren gesehen wie ein 8 Core Rechner gegen einen 2 Core Rechner den kürzeren zog ...
Die HW allein wird keinen Besten dort hervorbringen, ähnliches gilt auch im Fernschach wobei man hier natürlich noch viel mehr Möglichkeiten zur Verfügung hat.

Gruss Andreas

By Bert Rinzel Date 2011-10-05 20:43

Du scheinst jedenfalls mit keinerleit Sachkenntnis über Computerschach gesegnet zu sein. Die HW ist zwar wichtig aber keinesfalls entscheidend.

Auf dem Server gabs in den letzten Tagen etliche Games, in denen der mit der halb so schnellen HW gewonnen hat, weil die Buchvariante besser war. Was übrigens nach Ende der Buchzüge keineswegs offensichtlich war. Übrigens spielten beide mit der neuesten Houdini Version.

By Benno Hartwig Date 2011-10-05 23:04

[quote="Willi Prinz"]Es ist eine generelle Frage,wenn Shredder 13 ,4000 Elos haben sollte,( unmöglich) was ändert das am Computerschach???????????[/quote]Das ist einfach: dann würde die stärkste Engine ein nochmals weitaus stärkeres Schach spielen als heute.
Ein kleiner Schritt vielleicht für Willi, ein Riesensatz aber für das Computerschach!
(Dass Computerschach aber eigentlich total unwichtig ist, könnte ja trotzdem sein.)
Benno

By Willi Prinz Date 2011-10-06 20:52

Ok,nehmen wir an Shredder 13 knackt die 4000 Elos.
Das wird nicht passieren.
Wenn das passieren sollte ( unmöglich) was wird dann geschehen ?
Nichts ,warum auch?
Alle Freaks kaufen dann Shredder 13,weil sie ja die beste Engine brauchen,obwohl sie keine 1500 Elos haben.
Im Moment haben wir ja glück,weil die beste Engine nichts kostet.
Aber wie gesagt,wenn Shredder 13, 4000 Elos haben sollte,werden keine Kosten und Mühen gescheut das Programm zu haben.
Wenn ich es dann endlich habe,stelle ich fest das ich nicht dagegen gewinnen kann.
Ok,das geht auch mit 2600 Elos Programmen nicht.
Dann habe ich den grossen Triumpf,ich spiele auf Schach de. und mache alle fertig mit meinem persönlichen Shredder 13!!!!!!!!!!!!!!!
Nach kurzer Zeit stelle ich dann fest,das andere auch Shredder 13 haben,ich spiele dann sozusagen nicht mehr mit meinem Shredder 13,der Stefan hat das Programm auch noch an andere verkauft,unglaublich,ich dachte ich wäre der erste.
Dann kommt die Idee,wenn schon alle Shredder 13 haben,was kann ich da machen um mich zu profilieren?
Erstens ,ich kann an meiner Hardware arbeiten,arbeiten eigentlich nicht,ich brauche nur Geld,villeicht kann meine Oma mit einer Spende helfen.
Falls meine Oma schon gestorben ist,kann ich auch am Buch arbeiten,also ich stelle schon bekannte Stellungen nach zwei oder drei Zügen in Frage .und lasse meinen Rechner Tage oder Wochen über diese Stellung nachdenken.(Rechnen).
Wenn er dann nach 4740 Kilowatt etwas neues gefunden hat,nehme ich das in mein Eröffnungsbuch auf,und steige von Platz 38 auf Platzt 24 auf.
Das ist dann was ich brauche,endlich eine Anerkennung.
Ich habe damit bewiesen,wenn man genug Zeit investiert um am Buch zu arbeiten,kann ich selbst schnellere Hardware schlagen.
Damit bin ich persönlich besser als jeder Gm,weil die waren ja zu dumm die Varianten zu finden.
Fritz 5 ,Shredder 13,alles der gleiche, ( wollte Mist schreiben) Versuch etwas zu versuchen was eigentlich nicht geht,die Möglichkeiten sind einfach zu viele.
Aber lasst euch nicht abhalten von eurem Hobby,ist ja auch meins,aber es wird immer langweiliger.
Gruß Willi
,

By Benno Hartwig Date 2011-10-06 21:10

[quote="Willi Prinz"]Ok,nehmen wir an Shredder 13 knackt die 4000 Elos.
Das wird nicht passieren.[/quote]Dann ist ja auch das für das Computerschach Bedeutsame bereits passiert:
Die stärkste Engine ist ein erhebliches Stück stärker geworden!
Sie hat an Stärke so viel gewonnen, wie es sonst nur in deutlich längerer Zeit geschieht!

Mehr wird voraussichtlich nicht passieren.
Warum sollte es auch. Es wird sich damit niemand (außer Stefan, der dann diese programmiertechnische Meisterleistung erbrachte) profilieren können.
Mehr ist bislang ja beim Erscheinen einer neuen stärksten Engine ja auch nie pasiert. Es konnte sich damit stets niemand außer der Enwickler profilieren.
Es gab nie Grund, mehr zu erwarten.
Und du bist vermutich der einzige, der davon überrascht wirkt.

Aber in dem von dir skizzierten Szenario ist eben das überraschende, sensationelle, noch nie Dagewesene im Computerschach bereits passiert:
Die stärkste Engiene hat nun eine deutlich bessere Spielstärke als bisher, und sie erreicht die Steigerung in einer sehr ungewöhnlich kurzen Zeit.

Benno

By Thorsten Czub Date 2011-10-05 23:30

mir wuerde schon reichen wenn shredder13 besser wäre als das shredder12, das ich auch gekauft hatte.

allerdings möchte ich schon das man mir als shredder12 käufer einen updatepreis gibt, d.h. honoriert das ich schon die vorversion gekauft habe. so ist das bei hiarcs und anderen programmen ja auch.

By Benno Hartwig Date 2011-10-06 00:28

[quote="Willi Prinz"]Soweit so gut,da ja alle das Programm haben ,wird der beste immer noch der mit der besten Hardware sein.[/quote]Um welchen Faktor mag eine reale Spitzenhardware auf dem Schachserver schneller sein als ein ganz normaler guter i7 oder 4-Kern-i5?
Wieviel ELO-Differenz entsteht denn tatsächlich durch solch eine Hardwareüberlegenheit?
Benno

By Peter Martan Date 2011-10-06 07:10 Edited 2011-10-06 07:17

[quote="Benno Hartwig"]
Wieviel ELO-Differenz entsteht denn tatsächlich durch solch eine Hardwareüberlegenheit?
[/quote]

Da muss ich dich dann aber doch mal wieder an die Überlegungen, die du selber so gern zu den Elo- Messungen an und für sich angestellt hast, erinnern, Benno.

Kannst du derlei, (je nach Teilnehmerfeld

) noch für ansonsten genau definierte aber auch randomisierte Testbedingunen mit großen Zahlen berechnen, gelingt dir das mit einigen wenigen Partien (z.B. am server) sicher absolut nicht mehr so, dass es über das momentan gerade dort spielende Kollektiv hinaus irgend eine Vergleichbarkeit hätte, übrigens genau so, wie bei allen anderen Testbedingungen.

Hier hast du die wirkliche Schwäche, eigentlich aber Stärke des Elo- Systems.
Das war und ist nicht dazu da, statistisch exakte Aussagen über 1000- Partien- Matches zwischen immer genau denselben Gegnern in exakt reproduzierbarer Anordnung zu messen, dazu wird es nur missbräuchlich verwendet, um die Elosion der längst völlig absurden Vergleiche mit menschlichen Elo mit Gewalt am Leben zu erhalten.

Wenn wir uns davon nicht endlich verabschieden, wird es genau das sein, was uns auf den Kopf fällt, weil die Weiterentwicklung von engines, die in diesem Maßstab demnächst völlig unkontrollierbar werden, keine Entwicklungskontrolle mehr abgibt.
Das muss offenbar von mir immer weiter gebetsmühlenartig repetiert werden, bevor auch nur irgendjemand anfängt, da mal nicht mehr krampfhaft wegzuschauen.

Elo ist eine Näherungsgleichung, die Werte gehen asymptotisch gegen einen theoretischen Maximalwert, wo der ist, richtet sich danach, wo man die Ausgangswerte ansetzt.
Eicht man ständig nach unten nach, damit die Werte oben nicht astronomisch werden, muss man sich nicht wundern, wenn die fortschreitende Spielstärke oben immer mehr in den praktisch unerreichbaren Bereich, der theoretisch nur in der Unendlichkeit erreicht wird, geht, sich also zusehends praktisch nicht mehr ausdrückt.

Das muss gar nicht hauptsächlich an der wahrscheinlich irgendwann auch gegen 100% gehenden Remishäufigkeit liegen (die kommt noch dazu, wenn man weiter in erster Linie Grundstellungsspezialisten unter den engines selektiert, in dem man sie ausschließlich an grundstellungsnahen Teststellungen gegeneinander spielen lässt!), das kommt aber sicher auch immer mehr dazu.

Ich kann wirklich nicht sagen, was mehr schuld ist:

1.Das krampfhafte willkürliche Selektieren von gerade noch irgendwie ausreichend ähnlich und ausreichend unählich starken engines als Kollektiv, damit nicht schon das die Werte völlig uninteressant macht. Einfachstes Beispiel hatte wir auch schon oft genug, eigentlich interessieren nur die ersten 5, gerade die liegen aber mittlerweile so knapp beieinander, dass nur die gegeneinander antreten zu lassen, was logischer Weise der direkte Weg wäre, genau die gegeneinander zu messen, schon kein Mensch mehr veröffentlicht, weil es die breiter gestreut gemessen Werte ad absurdum führt, auch etwas, was am server usus ist, in Ranglisten absolut pfui.

2. Das krampfhafte, auch wieder um vergleichbar zu bleiben, natürlich auch notgedrungene Festhalten an den 5-8 Zügen-Eröffungsstellungen.
Je schneller die engines über 8 Züge wegprunen, desto für sie alle, die das alle gleich machen, praktisch näher der Grundstellung beginnen sie ihre eigenen Eröffnungen zu berechnen.
Als 16 Halbzüge noch eine Welt voller Wunder für engines waren, war das etwas anderes, als jetzt, wo die bitboard- Früchtchen 15 Hz in 5 Sekunden im Arbeitsspeicher haben, nämlich das, was sie alle nur daran interessiert, beginnen sie wirklich verschieden zu rechnen praktisch einfach um diese 5 Sekunden später mit ihrem Match.

3. Das zwanghafte Festhalten an der Eloformel, warum die für sowas absolut nicht von Arpad erdacht wurde, siehst du an diesem unserem momentanen Streit zwischen den Ranglisten- und den Serverfans wieder einmal perfekt:

Geh her und lass einzelne engines in einzelnen Begegungen, wie das ja am server gemacht wird, ihre Elo gewinnen und verlieren, noch krasser: mach ein Turnier, wie darum gerade zwischen ICGA und CSVN gerungen wird, oder mach 2 oder mehrere, wie es wohl mehr und mehr werden wird.

Je weniger Partien du hast, desto mehr zählt natürlich auch die Bedenkzeit und die hardware, vor Allem aber das Buch!
Dass du das wegrechnen kannst, wenn alle dasselbe kurze haben, wissen wir, dass das im wahrsten Sinn des Wortes zu Buche schlägt, siehst du, wenn du ein Turnier mit wenigen Partien von engines mit eigens für das Turnier editierten Büchern machst.

So gesehen haben natürlich wieder beide Seiten völlig recht, das Buch zählt Schachmacht bis Schachmatt im Turnier, nur weil da die Buchspezialisten alle ähnlich was draufhaben und die Bücher für den auch bekannten Gegner alle ziemlich ausgefuchst sind, (werden ja auch ständig gegen die anders derartig erstellten Bücher aktualisiert) lässt es sich auch nur schwer damit so durchkommen, wie's ginge, wenn nur ein Buchmacher gegen lauter Buchschwächler anträte.
Die andere Seite der Ranglistenlister hat natürlich infolgedessen auch völlig recht, dass objektivierbare Vergleiche für Ranglisten so genau nicht gemacht werden.

Was war noch gleich deine Frage?
Wieviel ELO-Differenz entsteht denn tatsächlich durch solch eine Hardwareüberlegenheit?
Das kommt auf's Buch an, Benno.

Übrigens bei Menschen auch, da ist die "hardware" Hirn sicher auch sehr verschieden, was aber schon drin ist und nicht mehr extra berechnet werden muss, macht ab einer gewissen Klasse, fürchte ich, auch den größeren Unterschied.

Vor Allem aber bei engines: ich kann nicht verstehen, dass du, nach Allem, was wir da schon hatten, danach fragst, was an Elo hinten herauskommt, wenn man am server einzelne Partien spielt, das siehts du doch ohnehin dort, am server kannst du das nach jeder einzelnen Partie neu ablesen.

Hast du noch Fragen zu Elo? Ich sage jedenfalls für sowas waren sie noch eher gedacht, als für Ranglisten, Sinn haben sie dort auch mehr, sie zeigen, wer, dem es in erster Linie darauf ankommt, unter den dort herrschenden Bedingungen zu gewinnen, wieviel von den dort gültigen Elo gewonnen hat, ungeachtet der Frage, wie oft und gegen wen musste der dazu spielen.

Kurzum daher noch mal: Elo brauchen jeweils ihr eigenes geschlossenes System zur Vergleichbarkeit.
Als alleinige Entwicklungskontrolle der software- Programmierung sind sie daher weniger und weniger verwendbar.

By Werner Mueller Date 2011-10-06 09:50

[quote="Peter Martan"]
Das (Elo-System) war und ist nicht dazu da, statistisch exakte Aussagen über 1000- Partien- Matches zwischen immer genau denselben Gegnern in exakt reproduzierbarer Anordnung zu messen,
[/quote]
Ja

[quote="Peter Martan"]
dazu wird es nur missbräuchlich verwendet, um die Elosion der längst völlig absurden Vergleiche mit menschlichen Elo mit Gewalt am Leben zu erhalten.
[/quote]
Nein, wird es (eigentlich) nicht - die Ranglisten verwenden ihre eigene Statistik, missbräuchlich verwendet wird lediglich die Bezeichnung 'Elo' (da rede ich, ähnlich wie Du, seit '88 gegen eine Mauer des Ignorierens).

[quote="Peter Martan"]
Je weniger Partien du hast, desto mehr zählt natürlich auch die Bedenkzeit und die hardware, vor Allem aber das Buch!
[/quote]
Mag sein, das ist aber nicht der Punkt.
Der grundlegende Unterschied zwischen Testpartien und Turnierpartien ist der, dass in Testpartien Stärken UND SCHWÄCHEN einer Engine aufgedeckt werden sollten, in Turnierpartien sinnvollerweise versucht wird, die Stärken auszuspielen und die Schwächen möglichst zu kaschieren.
In beiden Fällen spielt das Eröffnungsbuch eine wichtige (und andere) Rolle.

[quote="Peter Martan"]
Kurzum daher noch mal: Elo brauchen jeweils ihr eigenes geschlossenes System zur Vergleichbarkeit.
Als alleinige Entwicklungskontrolle der software- Programmierung sind sie daher weniger und weniger verwendbar.
[/quote]
Ja, z.B. was eine Spielstärkesteigerung im Vergleich Engine vs. Mensch betrifft.

ALLERDINGS:
Solange man weiß was man tut, sind die 'Elos' jedenfalls aussagekräftig und sinnvoll.

By Peter Martan Date 2011-10-06 12:45 Edited 2011-10-06 12:52

[quote="Werner Mueller"]
ALLERDINGS:
Solange man weiß was man tut, sind die 'Elos' jedenfalls aussagekräftig und sinnvoll.
[/quote]

Vollkommen richtig, hab ich im Zweitschlag, der dann Bert Rinzel traf, mit etwas mehr Worten als du, auch gesagt, natürlich nicht nur das.

Das scheint mir nur auch wieder erwähnenswert: wer weiß wirklich, was wer will (das musste jetzt des schönen Stabreimes so formuliert werden), möglichst, bevor er es tut und bei wem ist das, was herauskommt, wirklich genau das, was er erwartet hat?
Und wozu, wenn es das dann wirklich ist, überhaupt noch das Experiment?

Wenn man wirklich weiß, dass man in Elo oder sonstwas nur genau diejenige Maßzahl für nur genau die eine Versuchsanordnung herausbekommt, die man bei der Studienplanung möglichst genau in Fragestellung, erhofftem outcome, Meßmethoden und design defninert hat (PICO= problem, intervention, comparison, outcome), wieso hofft man dann immer noch, aus dieser einen Maßzahl, bei der es dann plötzlich auf den Namen doch wieder unheimlich ankommt, das einzige Verkaufsargument gewinnen zu müssen?

Und dann noch: findest du als Mathematiker nicht auch, dass für die Zwecke der Statistik, die hier an immer größeren Zahlen gemacht werden muss, weil die Merkmalsdifferenz, die untersucht wird, offenbar doch immer kleiner wird, und die engines, die es zu untersuchen gilt, immer mehr,
findest du nicht auch, dass da andere Formeln besser als die zur Eloberechnung wären?
Arpad hat sich das dafür ausgedacht, damit Spieler die selten oder gar nicht direkt gegeneinander spielen, auch irgend etwas vorzuweisen haben im Vergleich.
So, wie die Variablen sind, finde ich immer noch, dass das mittlerweile was für gepaarten oder ungepaarten t-Test, geht man überhaupt von Normalverteilung aus, die auch immer noch nicht bewiesen ist, oder ansonsten für Man-Whitney-U oder Wilkoxon Signed Rank wäre, ich bin kein Statistiker und werde keiner mehr werden und beauftrage keinen Statistiker, der sowas nicht als Computerschachspieler von sich aus anbietet, mir das zu sagen, ich kenne nicht Viele und es ist kein Schachspieler drunter.

Vor Allem aber, finde ich, dass das unbedingt immer weiter so tun müssen, als wären die Elo der Menschen irgendwas Vergleichbares, immer fataler.
Das weißt du auch besser als ich: ist bei der Eloformel nicht das ständig nach unten Korrigieren der Ausgangswerte, damit es im Ergebnis oben noch irgendwie menschlich wirkt, nicht ausgesprochen abwärts dimensionierend geworden?

Ich meine, dass man das bei Menschen im Sinn der Inflation durch immer mehr starke Spieler auch macht, hat andere Dimensionen, das ist natürlicher Zuwachs.
Dass man es aber bei den engines so machen muss, weil man immer noch wenigstens mit Shredder 6 vergleichen will und muss, damit man nicht überhaupt nur noch bitboarder drin hat, heißt doch, dass der relativ zu den oben abgeschnittenen Ivans aufgewertet wird, oder? Du presst ein immer größeres Teilnehmerfeld hinein, die range soll aber gleich bleiben.

Du stauchst die ganze Kurve, um das explosionsartig wachsende Kollektiv hineinzubringen auf eine Flachheit zusammen, dass es oben schon eine Gerade wird und unten die Unterscheidung zwischen Crafty 15 und Shredder 6 auch nicht mehr wirklich relevant ist.
Die Ranglisten- Betreiber und -Historiker werden mir sofort wieder höhnisch die ganz anderen Zahlenwerte der willkürlich gewählten Beispielen sagen, was ich aber meine, ist schon auch klar, oder?

Einfach, wenn schon Elo, warum dann in so willkürlich mit Gewalt noch an die menschlichen angepassten Zahlen, warum nicht längst 50.000 für Hutiwuti und 1500 für die alten Brettcomputer, die diese ja schon auch noch immer haben, nur dass sie niemand gegen Hutiwuti antreten lässt, weil der dann halt 50.000 hätte.
Falsch?

By Michael Scheidl Date 2011-10-06 14:21

Zitat:

Einfach, wenn schon Elo, warum dann in so willkürlich mit Gewalt noch an die menschlichen angepassten Zahlen, warum nicht längst 50.000 für Hutiwuti und 1500 für die alten Brettcomputer, die diese ja schon auch noch immer haben, nur dass sie niemand gegen Hutiwuti antreten lässt, weil der dann halt 50.000 hätte.
Falsch?

Richtig! Das Computerschach benötigt endlich eine eigene Rating-Skala, die sich schon anhand der absoluten Zahlen sosehr von den Verbands- und FIDE-Elo unterscheidet, daß das niemand verwechselt bzw. irrtümlich gleichsetzt. Also entweder viel kleinere oder viel größere Werte. Das hätte ja auf Rangfolge und Abstände keinen Einfluß, oder ich verstehe seit jeher etwas miß.

Man könnte eine solide, "klassische" Crafty-Version stets mitführen und mit Null ansetzen. Dann kämen wir bis auf weiteres nicht auf vierstellige Ratings (und alles darunter hat negative Ratings). Oder auf 10.000. Auch egal, Hauptsache es ist spontan klar daß es nichts mit Elos menschlicher Spieler zu tun hat.

Wenn das alle Listen bzw. Ranglistenbetreiber so tun würden, hätten wir auch eine Art Kalibrierung, was allerdings voraussetzt das die "Eichengine" ständig in das Testgeschehen miteinbezogen wird. Vielleicht muß man eine stärkere Engine dafür nehmen. IPON und The Base haben sich gegenseitig per Shredder 12 = 2800 abgestimmt, ich weiß aber nicht ob dieser Wert irgendwie "durch externe Faktoren" begründbar ist. Aber die Idee an sich ist richtig und macht verschiedene Ranglisten besser vergleichbar.

Die von Dir angeführte willkürliche Anpassung der Zahlen - und zwar im oberen Bereich der Rankings; der untere steht nie im Fokus der Aufmerksamkeit - hat mich schon vor langer Zeit gestört, als die SSDF ihre Ratings linear um 100 Punkte abgewertet hat. Da hatte der Super Constellation plötzlich nur ca. 1630 statt 1730, und ähnliches mehr. Es gab mehrere Wortmeldungen (ich glaube auch von leidgeprüften Clubspielern) daß die "gefühlte" Stärke dieser Geräte dann unterbewertet war. Aber das war ja derselbe Irrtum: Die Ratings wurden mit dem menschlichen Wertungsmaßstab beurteilt. Aber das war schon vor der Abwertung praktisch genauso unbegründet. Es gab irgendwann im Jahre Schnee Eichungsbemühungen mit einer Handvoll Computerpartien gegen schwedische Klubspieler, aber ich glaube das war lange vor der PC-Zeit.

By Werner Mueller Date 2011-10-06 15:07

[quote="Peter Martan"]
...
Und dann noch: findest du als Mathematiker nicht auch, dass für die Zwecke der Statistik, die hier an immer größeren Zahlen gemacht werden muss, weil die Merkmalsdifferenz, die untersucht wird, offenbar doch immer kleiner wird, und die engines, die es zu untersuchen gilt, immer mehr, ...
[/quote]
1. Ich bin kein Mathematiker, ich zehre höchstens ein wenig von den Verfehlungen meiner Jugend.
2. Genau diesen von mir fett markierten Text habe ich in Deiner Argumentation noch NIE verstanden.

By Peter Martan Date 2011-10-07 02:06

Wenn du wissen willst, wie groß die Zahlen sein müssen, die ein statistisch signifikantes Ergebnis erbringen, hängt das neben der Art der Untersuchung vor Allem von Einem ab: wie sehr unterscheiden sich die Größen, die du vergleichen willst.
Hast du beispielsweise auf der einen Seite Eisbären und auf der anderen Teddybären, wirst du mit relativ wenigen Exemplaren beweisen können, dass die einen im Schnitt deutlich größer und gefährlicher sind als die anderen.
Wenn du wieder nur die Größe und die Gefährlichkeit betrachtest, tust du dich bei Himbeeren und Brombeeren einfach schwerer.
Deine Untersuchung bekommt erst nach viel mehr Him- und Bromb. dieselbe Power wie bei den Eis- und Teddyb., das meinte ich mit Merkmalsdifferenz.
Die scheint mir bei den engines, je besser sie werden, auch irgendwie kleiner zu werden, insbesonders wenn sie nur in Elo gemessen wird und die dabei aus erwähnten Gründen nicht zu hoch werden dürfen.

By Werner Mueller Date 2011-10-07 10:21

[quote="Peter Martan"]
Wenn du wissen willst, wie groß die Zahlen sein müssen, die ein statistisch signifikantes Ergebnis erbringen, hängt das neben der Art der Untersuchung vor Allem von Einem ab: wie sehr unterscheiden sich die Größen, die du vergleichen willst.
Hast du beispielsweise auf der einen Seite Eisbären und auf der anderen Teddybären, wirst du mit relativ wenigen Exemplaren beweisen können, dass die einen im Schnitt deutlich größer und gefährlicher sind als die anderen.
Wenn du wieder nur die Größe und die Gefährlichkeit betrachtest, tust du dich bei Himbeeren und Brombeeren einfach schwerer.
Deine Untersuchung bekommt erst nach viel mehr Him- und Bromb. dieselbe Power wie bei den Eis- und Teddyb., das meinte ich mit Merkmalsdifferenz.
Die scheint mir bei den engines, je besser sie werden, auch irgendwie kleiner zu werden, insbesonders wenn sie nur in Elo gemessen wird und die dabei aus erwähnten Gründen nicht zu hoch werden dürfen.
[/quote]
Wenn ich NUR wissen will, OB Engine A besser ist als Engine B, dann ist klar: je weiter sie auseinanderliegen, desto weniger Partien brauche ich um das festzustellen.
Wenn ich aber wissen will, welche 'Elo'-Differenz (bei gegebenen ErrorBars) zwischen beiden besteht, verhält sich die Sache GENAU UMGEKEHRT.

Es dürfte klar sein: um eine Erwartung von z.B. 1/1000 einer Engine A im Vergleich mit Engine B statistisch nachweisen zu wollen, wären 1000 Partien noch nicht mal ein schlechter Witz. Und wenn Dir das nicht genügt, dann nimm eine Erwartung von 1/10000 usw...

Das ist nichts Geheimnisvolles und hat auch gar nichts mit Statistik zu tun, sondern ist ein allgemeines Prinzip:
Nimm z.B. drei Bleistifte - einen fabrikneuen, einen nur einmal angespitzten, einen zum Stummel abgeschriebenen. Und nun kannst Du alle Vergleichsmöglichkeiten je zweier Bleistifte durchgehen.
Einmal mit der Fragestellung: IST der eine Bleistift größer als der andere. Und einmal mit der Fragestellung: UM WIEVIEL größer (z.B. auf 1mm genau) ist der eine als der andere.

By Peter Martan Date 2011-10-07 11:17

Ich glaube, Werner, dass wir eigentlich ganz einig sind, bin mir aber jetzt wieder nicht ganz sicher, dass ich dich in Allem ganz richtig verstanden habe.

Soviel aber jedenfalls, vermute ich jedenfalls, stimmt genau mit dem überein, was ich meinte:

Die Maßzahlen, die herauskommem, hängen einerseits von der Rechenmethode ab und da finde ich Elo einfach schon lange unnötig kompliziert, was das schiere Erringen von Ranglistenplätzen angeht, wenn ich ohnehin Unmengen von Partien von genau einem bestimmten Kollektiv brauche.
Die Frage, welche engine spielt stärker Schach als welche andere, kann ich sowieso nur für mein Verständnis von Schach (Eröffnungstheorie!!) und meiner Meinung nach auch nur im direkten 1:1 Match klären.

Die genaue Fragestellung bedingt natürlich zwingend, wie groß die Differenz der Merkmale, die ich eben messen will, ist, und hat damit den entscheidenden Einfluss auf die Frage, wieviele Partien muss ich spielen.

By Peter Martan Date 2011-10-07 11:48 Edited 2011-10-07 11:58

Und übrigens, das mit der Merkmalsdifferenz und den Elo von dir dazu hab ich mittlerweile auch geschnallt, glaub ich, natürlich, für die ist eine große range zwischen den Gegnern eigentlich der Gipfelpunkt der Intransitivität, schätz ich jedenfalls, es werden also umso mehr Partien notwendig, um ein möglichst stabiles, objektivierbares Ergebnis zu erreichen, das liegt aber nicht an der Merkmalsdifferenz in Hinblick auf die Statistik, das liegt daran, dass du eine Wahrscheinlichkeistrechnung anstellen willst, deren Ergebnis aber prinzipiell nichts über Einzelereignisse aussagt und auch nicht denselben Aussagewert hat, wie eine reine Auflistung von Ergebnissen, wie auch immer du die dann statistisch auswertest. Sie sagt eben nicht dasselbe über die wirkliche (auch nicht relative) Spielstärke aus, wie du sie aus bestimmten Ergebnissen errechnest, andere Fragestellung.

Falsch ist also hier für mein Gefühl wieder nur die Interpretation: engine A mit 3000 Elo ist eben nicht zwangsläufig 3/2 mal stärker als engine B mit 2000 Elo.
Dieses Problem war aber, was ich so lese, Arpad durchaus bewusst, und er hat angeblich selbst als Schachspieler darunter gelitten, was aus seiner Formel im Spielbetrieb dann so alles abgeleitet wurde.

Genau so hatte er es jedenfalls eben nicht vor, schätze ich, dass Gegner, die stärkemäßig weit auseinanderliegen, möglichst oft gegeneinander antreten müssen, damit man sagen kann, soundsoviel Elo hast du dir jetzt redlich verdient.

By Werner Mueller Date 2011-10-07 14:15

[quote="Peter Martan"]
Ich glaube, Werner, dass wir eigentlich ganz einig sind, bin mir aber jetzt wieder nicht ganz sicher, dass ich dich in Allem ganz richtig verstanden habe.