Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Sind die Computer Elo Ratinglisten real? am Beispiel CEGT
1 2 3 Previous Next  
Parent - - By Michael Scheidl Date 2011-11-12 22:25
Wir brauchen eine eigene, unabhängige Skala (die natürlich trotzdem nach Elo bzw. mit EloStat oder Bayes-Elo berechnet werden kann). Ich will eine Skala, die keinen nicht vorhandenen Zusammenhang mit menschlichen Elos suggeriert. Ein solcher Zusammenhang könnte nur auf sehr zahlreiche, methodisch bzw. quasi labormäßig ausgetragene Vergleichspartien zwischen mehreren repräsentativen Meisterspielern (verschiedener Spielstärken) gegen mehrere repräsentative Engines und Computer gegründet werden, die es wohl nicht geben wird...

Vorschlag: Fruit 2.1 einbeziehen und auf Null setzen. Offenbar würden die Zahlen dann, von Fruit 2.1 aufwärts, ungefähr bis 500 reichen.

Es macht auch durchaus Sinn, wenn Engines die schwächer als Fruit 2.1 sind, dann negative Ratings aufweisen. Das stört mich überhaupt nicht und signalisiert eben den Unterschied zu einem logischen Bezugspunkt. Hunderte Postings und Diskussion etc. haben beschrieben, wie grundlegend und Ideen gebend usw.usf. diese Engine von Mitte 2005 für die neuesten Entwicklungen im Computerschach war und ist.
Parent - By Ben Hur Date 2011-11-12 22:54
[quote="Michael Scheidl"]
Zitat:
Wir brauchen eine eigene, unabhängige Skala (die natürlich trotzdem nach Elo bzw. mit EloStat oder Bayes-Elo berechnet werden kann). Ich will eine Skala, die keinen nicht vorhandenen Zusammenhang mit menschlichen Elos suggeriert.


Code:
Wie willst Du das dem gemeinen Fussvolk denn beibringen? Die Vergleiche werden immer angestellt!


Zitat:
Ein solcher Zusammenhang könnte nur auf sehr zahlreiche, methodisch bzw. quasi labormäßig ausgetragene Vergleichspartien zwischen mehreren repräsentativen Meisterspielern (verschiedener Spielstärken) gegen mehrere repräsentative Engines und Computer gegründet werden, die es wohl nicht geben wird...


Code:
Eine mittlere Engine reicht völlig aus. Nimm eine die 1600 Elo hat z.B.
Das hat den sehr grossen Vorteil, dass viele Spieler das Spielverhalten noch beurteilen können.


Zitat:
Vorschlag: Fruit 2.1 einbeziehen und auf Null setzen. Offenbar würden die Zahlen dann, von Fruit 2.1 aufwärts, ungefähr bis 500 reichen.

...

Code:
Das wäre willkürlich und sollte vermieden werden.

Parent - By Ben Hur Date 2011-11-12 22:38
[quote="Thomas Müller"]
Zitat:
welcher engine willst du 1425 geben?!?

Code:
Die CEGT gab: Deep Sjeng 2.5 1CPU elo1000  den Wert von: 1415

Code:
Nach meiner Idee errechnet sich dann für: Deep Sjeng 2.5 1CPU elo1000  eben ca. 1000 Elo;
kannste selber nachrechnen mit ELOSTAT dauert es nur wenige Sekunden!

...

Zitat:
Ich glaub das wird nicht funktionieren bzw halte den gedanken für falsch.
Houdini auf 3000 zu setzen halte ich für "realistischer"!

Code:
Besser ist wenn ein plausibler Mittelwert gesetzt wird; kommt auf das selbe raus!

Zitat:
Aber es fehlt seit jahren ein direkter vergleich, leider!

Code:
stimmt

...

gruß thomas


Oder man nimmt einen alten Brettcomputer z.B. den Superconny, für den dürften zuverlässige Elo Zahlen vorliegen.

MfG

Ben Hur
Parent - - By Benno Hartwig Date 2011-11-13 08:53
[quote="Ben Hur"]Ganz einfach, der Ranglistenerste bekommt die höchste Zahl, die beliebig festlegbar ist, da die menschlich höchste bei 2850 lag, eben dort!.
Das würde eine irgendwie geartete Vergleichbarkeit suggerieren, die du mit deiner Wahl aber gerade ausgeschlossen hast.
Mir würde das sehr missfallen.

[quote="Ben Hur"]Die Werte sind doch relativ, es gibt keinen absoluten Elowert.
Klar. Zwei Listen mit ELO-Werten, die die relativen Stärken innerhalb(!) der Listen angeben. Trotzdem würde ich sie gern so sklaliert sehen, dass gleiche ELO-Werte bedeuten, dann im Durchschnitt ausgeglichen gespielt wird, und dass gegen andere beider(!) Listen im Mittel so gespielt wird, wie es die ELO-Differenzen erwarten lassen.
Wenn sich dass überhaupt wirklich erreichen lässt.
Sich davon zu verabschieden zugunsten irgendeiner willkürlichen 'Angleichung' fänd ich sehr schlecht.

[quote="Ben Hur"]
Zitat:
Bitte? Glaubst du, der Programmierer hat sich besonders viel Mühe gegeben, diese 1000 ELO wirklich zu treffen???
Glaubst du wirklich dass er das hinbekommen hat?
Ja, selbstverständlich. Es gibt eben wissenschaftliche Untersuchungen über Spielstärke und Rechentiefe.Jatzt machst du Späßchen, richtig?

Benno
Parent - - By Chetan Reinhard Date 2011-11-13 09:32
Die ELO Bewertungen im  ELO-System sollten einen konstanten Mittelwert haben. Vermutlich wird nicht darauf geachtet, das Mittelwert aller ELO-Zahlen konstant bleibt. Angenommen der Mittelwert aller Elozahlen im System sei auf 1600 festgelegt. Dann sollte ein Neuling auch exakt diesen Mittelwert als Startwert erhalten. Ist das gegeben,  dann bleibt der Mittelwert im System konstant. Erhält der Neuzugang jedoch von Beginn an, eine höhere Zahl als der Systemmittelwert , dann müssen den anderen Teilnehmern anteilig Punkte entnommen (abgezogen) werden, andernfalls driften die Bewertungen im Gesamtsystem nach oben.     Erhält der Neuzugang jedoch von Beginn an, eine niedrigere Zahl als der Systemmittelwert, dann müssen den anderen Teilnehmern anteilig Punkte dazu gegeben (addiert) werden, andernfalls driften die Bewertungen im Gesamtsystem nach unten.
Parent - By Chetan Reinhard Date 2011-11-13 12:27
Ps.:

Der konstante Mittelwert (Schwerpunkt) über alle ELO-Zahlen im System wäre dann der (gesuchte) Bezugspunkt. Also nicht mehr die Null als Bezugspunkt für den stärksten Spieler bei der alten INGO-ZAHL, sondern der Mittelwert über alle Spieler bei der ELOzahl. In diesem Zusammenhang wär mal intressant zu erfahren, welche ELO-Mittelwerte (Schwerpunkte) aller registrierten Teilnehmer sich ergeben im Vergleich (DWZ & Elo).
Vielleicht gibt es eine Grafik, in welcher die Verteilung von ELO-Zahlen dargestellt wird ?
Parent - - By Benno Hartwig Date 2011-11-13 13:24
[quote="Chetan Reinhard"]Die ELO Bewertungen im  ELO-System sollten einen konstanten Mittelwert haben...[/quote]Ist das für unsere Computerliste unsere Wunschvorstellung?
Meine nicht.
Wünschen möchte ich mir, dass sie möglichst gut (im Sinne von gleiche Stärke <=> gleiche ELO-Zahl) zur menschlichen Liste passt.
Und das hat wohl zur Konsequenz, dass die Computerliste im Mittel immer größere Werte bekommt.
Die Spielstärke der Rechner (im Menschen-Rechner-Vergleich) steigt eben doch schneller als die der Menschen.

Vielleicht schwierig zu realisieren, OK, aber das sollte meiner Meinung nach das Ziel sein und bleiben!
Ein anderes Ziel, mit welchem erreicht wird, dass die Vergleichbarkeit der ELO-Werte gänzlich, prinzipiell und geplant verloren geht, mag ich nicht.
Ich hoffe viel mehr, dass man die Vergleichbarkeit im Auge behält und versucht, die ELO-Listen in diesem Sinne wenigstens grob abzustimmen.
Benno
Parent - - By Chetan Reinhard Date 2011-11-13 14:23
Eine Vergleichbarkeit
Mensch <--> Computer
ist nur dadurch exakt realisierber, indem  der Computer in einen Schachverein eintritt und an den dort üblichen Turnierveranstaltungen teilnimmt. Würden immer mehr extrem spielstarke Computer in solchen Veranstaltungen erscheinen, mit deren spielstärke Menschen nicht mithalten können dann würde sich die ELO-Bewertung zwischen Mensch und Computer einfach nur polarisieren. Die Menschen würden mit Ihrer ELO gegen niedrige ELO-Zahlen gedrängt, während die Computer sich in trauter Eintracht um 3000 bis 3200 ELO gruppieren. Es würde sich das Bewertungssystem sozusagen in der Weise kippen,das die niedrigen ELO-Zahlen die menschliche Gesellschaft repräsentiert und sozusagen die "bessere Gesellschaft" ist. Besser man bildet mit den Computern eine eigene Gruppe mit einer eigenen ELO-Bewertung welche jedoch einen eigenen fest definierten Mittelwert (Schwerpunkt) bekommen soll.  Sagen wir mal 3000 CWZ-Punkte als Mittelwert in dem Computer CWZ-System für "Computer Wertungs Zahl". Die Menschen bleiben weiter in ihren eigenen Spiel-Gruppen mit einem festen ELO-Mittelwert von etwa 1500 Punkten. Eine Vergleichbarkeit zwischen Mensch und Computer  könnte dann mittels einer rechnerischen Transformation geschehen, welche laufend angepasst wird. Eines Tages werden Computer das Schachspiel perfekt spielen und alle Computer würden den CWZ Wert von 3000 bekommen während die Transformationsfaktor zur Umrechnung  CWZ --> ELO so lange gegen UNENDLICH driftet bis zu dem Tage an welchem die ersten Menschen beginnen, das Schachspiel aus eigener Kraft perfekt zu beherrschen...
Grüsse
Che
Parent - By Benno Hartwig Date 2011-11-13 17:28
[quote="Chetan Reinhard"]...Es würde sich das Bewertungssystem sozusagen in der Weise kippen,das die niedrigen ELO-Zahlen die menschliche Gesellschaft repräsentiert und sozusagen die "bessere Gesellschaft" ist...[/quote]Dich würde dies stören. Wenn die relativen Spielstärken so sind, dann möchte ich aber gerade gern, dass die ELO-Zahlen dies auch so beschreiben. Dann landen die guten Engines eben oben, und die Menschen weiter unten. So sind di Spielstärken nun mal, und eben auch die ELO-Zahlen, die sie beschreiben.
Listen, in denen nur Menschen auftauchen, wird man ja dann trotzdem veröffenlichen.

Dass solch eine Anpassung der ELO-Werte in den Menschen- und Computerlisten nur schwer einigermaßen gut abschätzbar ist, weiß ich natürlich.
Ich wünsche mir aber sehr, dass das das Ziel ist.
Menschliche Spielstärke und Computer-Spielstärke haben eben sehr konkretwas  miteinander zu tun.
Und ein gemeinsames System für ihre Beschreibung würde ich sehr gern erhalten sehen.

Benno
Parent - By Chetan Reinhard Date 2011-11-13 14:25
Keine Sorge dieListen werden sicher abgestimmt. Weil  dieHändler von Computerprogrammen wollen doch auch mit vergleichbaren ELO-Zahlen werben .
Grüsse
Che
Parent - By Ben Hur Date 2011-11-13 18:40
Nein Benno,

ich habe erfahren, dass es noch andere Schach-Engines geben soll,
in denen man die Spielstärke in Elo einstellen kann. Ich weiss nur nicht
welche es sind. Ich könnte dann mal einen Vergleich anstellen!

MfG

Ben Hur
Parent - - By Ben Hur Date 2011-11-13 18:01
Hallo Benno,
in meinem Ausgangsposting hatte ich aus meinem Gedächtnis das INGO System erwähnt,
aber keine Quellen mehr dazu gefunden. Hier ist etwas zum Nachlesen:

http://www.uni-protokolle.de/Lexikon/Wertungszahlen_%28Schach%29.html

Code:
Ingo-Zahlen
Der Erfinder der Ingo-Zahlen ist Anton Hößlinger (* 11. Januar 1895 + 1959). Er entwickelte das Verfahren und gab ihm den Namen nach seinem Geburtsort Ingo lstadt . Ab 1974 wurde dieses System in West-Deutschland angewendet bis es 1991/92 durch die DWZ-Wertung abgelöst wurde.

Ein Spieler mit einer niedrigen Ingo-Zahl ist besser als ein Spieler mit einer hohen Ingo-Zahl. Die theoretisch schlechteste Ingo-Zahl ist 300. Diese Zahl erhält ein Spieler der alle Partien verliert. Die theoretisch beste Ingo-Zahl ist 1. Um diese zu erhalten darf man nie eine Partie verlieren.


Hier kannst Du erkennen, dass mein System funktioniert, da eine ELO-INGO Umrechnung jederzeit möglich ist.
Parent - - By Benno Hartwig Date 2011-11-13 19:17
[quote="Ben Hur"]Hier kannst Du erkennen, dass mein System funktioniert, da eine ELO-INGO Umrechnung jederzeit möglich ist.[/quote]
Dass man umrechnen könnte, will ich gern glauben. Und funktionieren wird es wohl auch.
Ohne zwingenden Grund möchte ich halt nicht darauf verzichten, dass man den Spielstärkevergleich auch zwischen Mensch und Engine direkt am ELO-Wert ablesen kann.
OKOK, ich weiß, dass das im Moment auch kaum möglich ist, da die Vergleichbarkeit kaum abgesichert ist.
Wie stehen eigentlich die Schätzungen: Stimmen die Computer-ELO-Werte wenigstens so auf 100 ELO genau im Vergleich zu den menschlichen? Oder sogar durchweg auf 50 ELO genau?
Immerhin(!!!) würde ich dann sagen. Das würde ich nicht gern hergeben wollen.

Benno
Parent - By Christian Schmidt Date 2011-11-13 20:03
[quote="Benno Hartwig"]
Wie stehen eigentlich die Schätzungen: Stimmen die Computer-ELO-Werte wenigstens so auf 100 ELO genau im Vergleich zu den menschlichen? Oder sogar durchweg auf 50 ELO genau?
Immerhin(!!!) würde ich dann sagen. Das würde ich nicht gern hergeben wollen.
[/quote]

Nach den Ausführungen von Frank habe ich ein paar Fälle durchgerechnet:
Bei einem 3.000er-Rating für Houdini ist die Gewinnwahrscheinlichkeit gegen die Nr. 1 Magnus Carlsen, der 2826 Elo hat, rund 73%. Das klingt plausibel. Bei einem 2.900er-Rating ist sie bei rund 60%, das erscheint mir zu niedrig. Bei einem 3.100er-Rating ist sie bei rund 83%. Da müsste man Houdini wahrscheinlich schon auf einem stärkeren Rechner laufen lassen, um das zu erreichen. Die Elo-Berechnungen in der SWCR gefallen mir daher sehr gut.
Parent - By Werner Mueller Date 2011-11-14 01:17
[quote="Benno Hartwig"]
... dass man den Spielstärkevergleich auch zwischen Mensch und Engine direkt am ELO-Wert ablesen kann.
...
[/quote]
Das ist wie mit dem Beischlaf und dem Schwangerschaftstest: wenn Du etwas zuverlässig 'direkt ablesen' willst, solltest Du die zeitliche Abfolge möglichst nicht vertauschen.
Up Topic Hauptforen / CSS-Forum / Sind die Computer Elo Ratinglisten real? am Beispiel CEGT
1 2 3 Previous Next  

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill