Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Systematische Fehler beim Engine Testen
- - By Ben Hur Date 2011-11-18 22:00
Kürzlich wurde nachgewiesen, dass die Engine Ratingliste der CEGT nicht stimmig sind.
Im oberen Bereich sind die Elo Werte viel zu hoch im Vergleich zu Menschlichen Elo Zahlen.
Im unteren Bereich sind die Werte vielleicht zu niedrig.
Der Betreiber räumte das ein. Es ist also unbestritten.

Daher die Frage: Woher kommt das? Ich vermute systematische Fehler im Testablauf.
Welche Fehler kommen dazu in Frage? Und wie lassen sie sich eliminieren?

MfG

Ben Hur
Parent - - By Thomas Mayer (Quark) Date 2011-11-18 23:39
[quote="Ben Hur"]
Kürzlich wurde nachgewiesen, dass die Engine Ratingliste der CEGT nicht stimmig sind.
Im oberen Bereich sind die Elo Werte viel zu hoch im Vergleich zu Menschlichen Elo Zahlen.
Im unteren Bereich sind die Werte vielleicht zu niedrig.
Der Betreiber räumte das ein. Es ist also unbestritten.

Daher die Frage: Woher kommt das? Ich vermute systematische Fehler im Testablauf.
Welche Fehler kommen dazu in Frage? Und wie lassen sie sich eliminieren?
[/quote]

Quatsch, es wurde nachgewiesen, daß Menschen-Elo und Computer-Elo-Listen nicht direkt verglichen werden können - was ja auch logisch ist, weil praktisch keine Überschneidungen vorliegen. In sich sind beide Listen natürlich korrekt. Einzige Methode um Engines eine "menschliche" Elo zu verpassen, wäre deren Teilnahme an Menschenturnieren, was verständlicherweise von den Menschen nicht gewünscht wird.
Deine These war übrigens, daß Smirf maximal 1300 Elo hat - nicht zuletzt der Test der CEGT sollte nachgewiesen haben, daß Smirf unter Computern schon jenseits der 2000 liegt, gegen Menschen ist zumindest bei Aktiv-Schach noch ein höheres Rating zu erwarten.

Gruß, Thomas
Parent - By Frank Rahde Date 2011-11-18 23:47
[quote="Thomas Mayer (Quark)"]
Deine These war übrigens, daß Smirf maximal 1300 Elo hat - nicht zuletzt der Test der CEGT sollte nachgewiesen haben, daß Smirf unter Computern schon jenseits der 2000 liegt, gegen Menschen ist zumindest bei Aktiv-Schach noch ein höheres Rating zu erwarten.

Gruß, Thomas
[/quote]

Stimmt: http://cegt.siteboard.eu/f6t150-testing-smirf-bc-176f-2.html

Gruß, Frank
Parent - - By Werner Mueller Date 2011-11-19 12:55
[quote="Thomas Mayer (Quark)"]
...
... nicht zuletzt der Test der CEGT sollte nachgewiesen haben, daß Smirf unter Computern schon jenseits der 2000 liegt, gegen Menschen ist zumindest bei Aktiv-Schach noch ein höheres Rating zu erwarten.
[/quote]
Das ist so nicht richtig bzw. es kommt auf die Menschen an.

Bei einer menschlichen Gegnerschaft um ca. 1500 würde Smirf sicher eine Performance von um die 2000 erzielen. Ebenso sicher würde er bei einer menschlichen Gegnerschaft um die 2000 nicht über die 1500 hinauskommen.

Ein schönes Beispiel im unteren Bereich (und in DEM Bereich KANN ein ambitionierter Hobbyspieler hinreichend kompetent urteilen) dafür, dass der Vergleich Mensch/Computer das Elosche Modell ad absurdum führt.

Meiner Überzeugung nach ist der untere Bereich keine Ausnahme und es verhält sich insbesondere im oberen Bereich nicht anders (aber in DEM Bereich wären selbstverständlich andere Kaliber gefragt).
Parent - - By Peter Krug Date 2011-11-19 15:34
Ja, Smirf ist interessant, weil es die Elo-Problematik besonders deutlich
aufzeigt.

Smirf hat zum Vergleich zu Fritz 3 viel weniger Verständnis für das Schach.
Dass unsere Hardware möglichweise Fallstricke für Schachspieler stellen kann -möglicherweise - könnt´ich mir vorstellen.
Wenn aber von den Schachspielern nichts grobes übersehen wird,
dürfte das Programm ziemlich regelmäßig gegen Schachspieler mit beispielsweise
1800 den kürzeren ziehen.

Die Computerschach elozahlen waren eigentlich mir im unteren Bereich immer
suspekt, dass heißt, ich konnte denen nicht glauben.

Wenn das im unteren Bereich so ist, dann hat man Grund,
das auch im oberen Bereich anzunehmen.

Peter
Parent - - By Werner Mueller Date 2011-11-19 17:07
[quote="Peter Krug"]
Ja, Smirf ist interessant, weil es die Elo-Problematik besonders deutlich
aufzeigt.

Smirf hat zum Vergleich zu Fritz 3 viel weniger Verständnis für das Schach.
Dass unsere Hardware möglichweise Fallstricke für Schachspieler stellen kann -möglicherweise - könnt´ich mir vorstellen.
Wenn aber von den Schachspielern nichts grobes übersehen wird,
dürfte das Programm ziemlich regelmäßig gegen Schachspieler mit beispielsweise
1800 den kürzeren ziehen.

Die Computerschach elozahlen waren eigentlich mir im unteren Bereich immer
suspekt, dass heißt, ich konnte denen nicht glauben.

Wenn das im unteren Bereich so ist, dann hat man Grund,
das auch im oberen Bereich anzunehmen.

Peter
[/quote]
Fritz 3 kannst Du damit gar nicht vergleichen.

Fritz 2 auf einem 286er hatte ich (im Blitz) noch eindeutig 'im Griff' - trotzdem hatte ich nie den Eindruck, er spiele Gurkenschach. Mit Fritz 3 auf einem Pentium 90 war dann bei mir der Bart ab: selten mal ein Glückstreffer und das war's dann auch.
Parent - - By Ben Hur Date 2011-11-20 11:16
Mir ging es nicht anders! 

F-Q schrieb:
Code:
aber interessant sind die Selbstgespräche "der Trolls" schon, erst Recht wenn immer wieder beobachtet wird mit wie wenig Wissen argumentiert wird.

Frage: Wer ist hier der Troll?

Thomas Mayer (Quark) schrieb:
Code:
In sich sind beide Listen natürlich korrekt.


Ist nicht neu, das habe ich hier bereits mehrfach erwähnt!

Werner Mueller schrieb:
Code:
Bei einer menschlichen Gegnerschaft um ca. 1500 würde Smirf sicher eine Performance von um die 2000 erzielen. Ebenso sicher würde er bei einer menschlichen Gegnerschaft um die 2000 nicht über die 1500 hinauskommen.


Peter Krug schrieb:

Zitat:
Ja, Smirf ist interessant, weil es die Elo-Problematik besonders deutlich
aufzeigt.


Ich will nicht alle mir bekannten Ratinglistenbetreiber in einen Topf werfen, aber mir fällt dazu nur ein wie
uneinsichtig und inkompetent sie sind um eigenes Tun und Handeln zu hinterfragen!

Ebenso einfach ist es aufgrund mangelndem Fachwissen Herrn Professor Elo und
seine Berechnungsmethoden zu kritisieren; Stichpunkt Elo nach Prof.Elo, Elo nach Elostat, Elo nach Bayeselo...

Wer Infos dazu benötigt, den verweise ich auf die Suchfunktion hier im Forum!

Das nur mal zur Kompetenz dieser Herren.

Aber das Thema dieses Threads war ein anderes.

Ich komme mir vor als wenn ein Spieler mit 1000 Elo mir als Trainer das Schachspiel erklärt!

Ich bedanke mich nochmals bei Herrn Werner Mueller, der mit stoischer Gelassenheit
Licht ins Dunkle gebracht hat. Nur gebracht hat das den Wenigsten! Warum ist das so?

MfG

Ben Hur
Parent - - By Frank Rahde (Mod.) Date 2011-11-20 14:39
Dies ist das letzte Posting von "Ben Hur", das wir freischalten werden. Es ist nicht nur wieder provozierend und respektlos verfasst, sondern wir können den Anon anhand der verwendeten IP-Adresse identifizieren als einen alten Bekannten, nämlich "Paul Aner" alias "Peter Struwel" (Echtname unbekannt), der schon früher mehrmals negativ auffiel und verwarnt bzw. ausgesperrt werden musste. Aufgrund seiner aktuellen Postings und der früheren Eskapaden haben wir Moderatoren entschieden, seine Postings ab jetzt bis auf Weiteres zu löschen.

Gruß, Frank
Parent - By Wolfram Bernhardt Date 2011-11-20 14:50
Finde ich in dme Fall gut.

Sowas fällt einem Moderator sicherlich nicht leicht, aber BenHur oder wie er sich nennt, schreibt wirklich (und offenbar mit Vorsatz) nur Unfug und beleidigt grundlos.

Viele Grüße,
    Wolfram
Parent - By Ingo Bauer Date 2011-11-20 14:56
Ahhhh endlich ...

Wie wäre es wenn man Anons die mehrmals schreiben wollen (sagen wir mehr als 4 Postings in Monat) auffordert sich ordentlich anzumelden oder es wird nichts mehr freigeschaltet! Wer ernsthaft eine Frage hat kann sie so stellen und auch ein nachfragen ist möglich, 'Trollen' wird so aber - wenn schon nicht völlig unterbunden - erschwert. Auch das einfache Anworten unter anderem Anon-Namen auf eigene Postings wird so schwierig, weil ja nicht plötzlich hunderte Anons auftauschen können die alle die selbe schräge Ansicht teilen (auch will der Anon ja provozieren. Das mit sich selber zu tun ist aber langweilig ...)
Das ist kein perfekter Vorschlag, aber besser als das was gerade läuft.

Gruß
Ingo
Parent - - By Peter Krug Date 2011-11-20 15:39
Hallo,

"Ben" hatte offensichtlich Grund genug sich zu verstecken.
Immer wieder bin ich so naiv und lasse mich mitreißen, jetzt
tut mir es leid, diesen Ben überhaupt so viel Aufmerksamkeit geschenkt zu haben.
Aber ein bisschen haben solcher Menschenschlag wie Ben etwas gemeinsam.
Sie tauchen mit unbekannten Namen "plötzlich auf", stellen viel in Frage (was ja auch mich zum überdenken brachte) treiben es masslos, zeitlos mit Postings, stellen alles auf dem Kopf.
Bis es zuviel wird....zunächst einigen dann, viele, dann den Moderatoren.
Tja, und dann verschwinden diese wieder... bis sie eines Tages aus der Unterwelt zurückkehren werden!

Aber doch: auch wenn Ben eigentlich selbst recht wenig vom Schach versteht,
hatte er es doch mit seiner Retorik in diesem Forum weit gebracht.
Ich bin ihm neidisch um diese seine Kunst.

Peter
Parent - By Frank Quisinsky Date 2011-11-20 16:52 Edited 2011-11-20 16:55
Hallo Peter,

wir hatten im Arena Forum (seinerzeit Parsimony mit bis zu 700 Mitgliedern) eine Person dabei die unter 6 verschiedenen Namen geschrieben hat. Die Person postet auch hier und hat einen Stammposter-Account. Oder eine Person, die sich immer wieder unter Pseudo Namen angemeldet hat, davon gab es 4 die mir zumindest bekannt waren. Auch diese Person ist hier aktiv, mag mich nicht besonders ... klar warum Mein Gott was es da nicht alles gab für merkwürdige Konstellationen. Personen die Arena rege nutzen und dann unter anderen Namen laufend versuchten in diesem mächtigen Forum für Schwierigkeiten zu sorgen. Das ging so weit, dass eine wirklich ein ruhiger und angenehmer Poster sich so angegriffen fühlte, dass ich Post von einem Rechtsanwalt erhielt. Bei einem Thread der meiner Meinung nach noch recht harmlos ablief ich daber das Problem dann verstehen konnte und entsprechend reagierte (Anwalt und älterer Forumsteilnehmer hatten Recht). Und so zahlte ich dann den Rechtsanwalt, das Parsimony Forum etc..

Zu denken, ich will hier meinen Spass wird dann oftmals zu Lasten derer ausgeübt die sich bemühen.

Die ganze Klamotte endete dann irgendwann in ... wir stellen das Forum mal für einen Monat auf Eis. Später machten wir das Forum dicht. Der eigentliche Nutzen, Arena zu verbesseren war ohne Zweifel vorhanden, wir hatten bis zu 250 Beta Tester und konnten Arena durch diese vielen Hilfen sehr schön entwickeln. Der negative Aspekt waren dann viele Personen die auch oftmals wegen eigenen Initiativen stören wollten, eifersüchtig waren etc.. Nur warum? Arena war Freeware und das Ergebnis kam Allen die sich dafür interessierten wieder zu Gute.

Selbst habe ich immer die Hoffnung, dass durch gute Threads -- davon gibt es hier auch reichlich -- viele auch Anreize erhalten sich mit dem Hobby Computerschach zu beschäftigen. Neuen Ideen nachgehen und sich austauschen im Sinne aller anderen die daraus profitieren können. Dieser positive Effekt ist größer als die negativen Dingen und für mich nach wie vor der Hauptgrund mich an dem Ablauf von einem oder zwei Foren noch zu beteiligen bzw. die Zeit hierfür auch weiterhin zu opfern.

Gruß
Frank
Parent - - By Benno Hartwig Date 2011-11-20 16:53
[quote="Peter Krug"]Sie tauchen mit unbekannten Namen "plötzlich auf", stellen viel in Frage (was ja auch mich zum überdenken brachte) treiben es masslos, zeitlos mit Postings, stellen alles auf dem Kopf...[/quote]Soweit will ich mich auch gar nicht daran stören.
Wenn das auf den Kopf Gestellte nicht widerlegt werden kann, sollte  es zumindest als These seine Daseinsberechtigung haben.
Und wenn sich jemand zur Antwort gedrängt fühlte, ist das dem Fragesteller nicht anzulasten, und sollte den Antwortenden nicht peinlich sein.
Aber natürlich muss man nicht antworten!
Nur: Frechheiten, Unverschämtheiten... "gehen gar nicht!"

Benno
Parent - By Frank Quisinsky Date 2011-11-20 17:14
Hallo Benno,

ich denke das eine hat nichts mit dem anderen zu tun.
Mir ist es persönlich auch egal ob ich einen Ben sonst wem antworte. Aber ich denke es geht eher darum das nicht zu viel in die Lächerlichkeit abdriftet. Es werden mehr Personen abgechreckt als Personen angezogen und bekanntlich haben sich schon sehr viele zurückgezogen aus Schachforen und lesen nur hier und dort noch ein wenig mit. Dafür gibt es Gründe und es wäre doch schade wenn es immer mehr werden und die wenigen deutschen Schachforen auch noch ins lächerliche abdriften, oder?

Ich beneide die Admins hier nicht und sage das aus eigener Erfahrung denn das erste deutsche Computerschachforum überhaupt (das war das Gambit-Soft Forum mit einer Software von Eva Marbach bevor diese mit Parimony bekannt wurde) habe ich selbst als Admin mit geleitet. Seinerzeit unauffällig denn wir mischten uns in den Diskussionen fast nie ein.

Ein wenig Historie:
Es entstand dann das CSS Forum. Berthold meinte zu mir, helfe Dieter Steinwender doch ein wenig und genau das tat ich dann auch. Berthold wollte selbst eine Konkurrenz zu seinem Gambit-Soft Forum. Aber was wurde seinerzeit nicht alles interpretiert. Wie die Leute so sind.

Dann machte Volker Pittlik und meine Wenigkeit das Winboard Forum auf. Das Thema Winboard und Engine Protokolle war nicht wirklich ein Reizthema für ChessBase Native verwöhnte Anwender. Weder mit dem Gambit-Soft Forum noch dem CSS Forum konnten wir Engine Protokolle powern. Falscher Kreis an Interessierten. Die kamen erst als das Thema schon lief und dann letztendlich das UCI Protokoll von Gambit-Soft gepowert wurde (UCI Edition etc..).

Aus dieser Zeit sind immer noch viele heute aktiv die das sicherlich auch noch alles wissen oder auch nicht, keine Ahnung.

Foren wurden immer gestört und meist von den gleichen Personen.
Das ist schon auffällig wie das stetig und immer wieder passiert.
Das Schema ist immer gleich!

Gruß
Frank
Parent - - By Peter Behringer Date 2011-11-20 18:54
Ich meine nicht, daß Bens Beiträge besonders respektlos oder provozierend verfaßt worden wären - selbst wenn: Dies rechtfertigte noch lange keine Ausperrung, bzw. Löschung seiner Beitrage.

Es ist dies eine falsche Rückbesinnung auf finsterste und völlig untaugliche  CSS-Methoden, die überhaupt niemand mochte und unter denen viele gelitten haben.

Zitat:
Aufgrund seiner aktuellen Postings und der früheren Eskapaden haben wir Moderatoren entschieden, seine Postings ab jetzt bis auf Weiteres zu löschen.


Weiterhin erscheinen die Anstrengungen, die unternommen worden sind um öffentlich aufzuzeigen, daß Ben mit Sicherheit hier schon einmal unter einem anderen Pseudonym vorstellig geworden ist, sonderbar (das Interesse am  'Echtnamen' im bürgerlichen Sinne kann ja auch zum Fetisch werden...).

Überdenkt das doch noch einmal, bitte!
Parent - By Benno Hartwig Date 2011-11-20 23:26
[quote="Peter Behringer"]Ich meine nicht, daß Bens Beiträge besonders respektlos oder provozierend verfaßt worden wären - selbst wenn: Dies rechtfertigte noch lange keine Ausperrung, bzw. Löschung seiner Beitrage.[/quote]"respektlos und provozierend" sollte akzeptiert werden? Im Ernst? Warum?
Benno
Parent - By Thomas Mayer (Quark) Date 2011-11-20 14:53
Hallo Werner,

[quote="Werner Mueller"]
[quote="Thomas Mayer (Quark)"]
...
... nicht zuletzt der Test der CEGT sollte nachgewiesen haben, daß Smirf unter Computern schon jenseits der 2000 liegt, gegen Menschen ist zumindest bei Aktiv-Schach noch ein höheres Rating zu erwarten.

Das ist so nicht richtig bzw. es kommt auf die Menschen an.

Bei einer menschlichen Gegnerschaft um ca. 1500 würde Smirf sicher eine Performance von um die 2000 erzielen. Ebenso sicher würde er bei einer menschlichen Gegnerschaft um die 2000 nicht über die 1500 hinauskommen.


Was zu beweisen wäre. Aus eigener Erfahrung kenne ich nur den umgekehrten Fall. Quark hat von Anfang seiner Entwicklung bis heute auf Schachservern gegen Menschen gespielt, erfahrungsgemäß ist die erzielte Elo-Leistung tendenziell gegen stärkere Spieler eher besser als gegen schwächere Spieler. Deshalb glaube ich, daß Smirf auch im Aktivschach auch gegen starke Gegner ein entsprechendes Rating erzielen wird.

Zitat:
Meiner Überzeugung nach ist der untere Bereich keine Ausnahme und es verhält sich insbesondere im oberen Bereich nicht anders (aber in DEM Bereich wären selbstverständlich andere Kaliber gefragt).


Ja, auch im oberen Bereich dürfte die erzielte Elo gegen stärkere Spieler eher besser sein als gegen schwächere. Z.B. die Pablo Restrepo-Methode ist von schwächeren Spielern genauso anwendbar wie von stärkeren. Oder die ruhige Spielanlage, die Kurt Utzinger z.B. anwendet. Eine Spielweise, die ihm gegen starke Spieler wahrscheinlich nichts als Niederlagen einbringen würde.

Du kannst gerne den Gegenbeweis antreten, lass SMIRF doch mal auf einem Schachserver (auf ICC dürfte es leicher sein, entsprechende Gegner zu finden) gegen Menschen spielen. Deine These ist ja schön und ich lasse mich gerne davon überzeugen - aber meine eigenen Erfahrungen sprechen deutlich dagegen.

Gruß, Thomas
Parent - - By Simon Gros Date 2011-11-19 09:46
Zuerst schreiben Sie die ganze Zeit, daß SMIRF viel zu hoch gewertet ist in der CEGT-Blitz-Liste und nun schreiben Sie plötzlich:
"...Im unteren Bereich sind die Werte vielleicht zu niedrig.". Was denn nun? Und wo kann man etwas nachlesen über:"...Der Betreiber räumte das ein"?
Simon_G
Parent - By Werner Schüle Date 2011-11-19 11:44
[quote="Simon Gros"]
Zuerst schreiben Sie die ganze Zeit, daß SMIRF viel zu hoch gewertet ist in der CEGT-Blitz-Liste und nun schreiben Sie plötzlich:
"...Im unteren Bereich sind die Werte vielleicht zu niedrig.". Was denn nun? Und wo kann man etwas nachlesen über:"...Der Betreiber räumte das ein"?
Simon_G
[/quote]
Hallo Simon,
meiner Ansicht nach ist das einfach nur Provokation und es lohnt sich nicht, darauf zu antworten. So wie es aussieht, weiss er nicht einmal wer der "Betreiber" ist und seine Aussage ist auch aus der Luft gegriffen.
Ich wünsche noch ein schönes WE
Gruß
Werner
Parent - - By Wolfgang Battig Date 2011-11-19 11:45
[quote="Simon Gros"]
....Der Betreiber räumte das ein"?
Simon_G
[/quote]

er meint offenbar diesen Satz von mir in einem anderen Thread ("Maronen auf Spatzen", sollte wohl eher "Kannonen" heißen...):

"Unsere Zahlen sind zu hoch, keine Frage, ich gehe mal von ca. 200 Punkten aus". (er sprach von 400)

Sicher etwas suboptimal formuliert von mir, denn ob unsere Zahlen nun 400 oder 200 oder 5000 Punkte zu hoch  oder zu niedrig sind, ist egal.
Wir können morgen eine Liste mit niedrigeren Werten veröffentlichen, indem wir einfach den Startwert in ELOStat um 200 oder 400 Punkte
senken. Was hätten wir davon? Nichts, es sähe nur "realistischer" oder für das Menschenauge bekannter aus, ob es das auch wäre darf bezweifelt werden.

Unsere "Ankerengine" Shredder 9.1 läge dann bei 2550 bzw. 2350 Punkten. Ob das aber in Bezug auf Menschenschach realistisch
ist?? Ich sehe Shredder 9.1 deutlich höher, wenn er auf heutiger Hardware gegen Menschen spielen würde, aber dazu fehlen die Vergleiche.
Das ist seit langem bekannt und von daher ist das Thema eigentlich durch. Und dass Ranglisten an den Rändern "ausfransen" ist auch nicht
wirklich neu.

Zum Rest seiner "Ausführungen" schreibe ich nichts, um ihm keine weiteren Ansatzpunkte zu geben. Das habe ich einmal getan und das war genau einmal zuviel!

Gruß
Wolfgang

PS: Don't feed the troll!! 
Parent - - By Frank Quisinsky Date 2011-11-19 13:16 Edited 2011-11-19 13:21
Hallo Wolfgang,

aber interessant sind die Selbstgespräche "der Trolls" schon, erst Recht wenn immer wieder beobachtet wird mit wie wenig Wissen argumentiert wird. Sicherlich auch ein Grund warum immer mehr und mehr Personen sich von den Foren fern halten und dann lieber versuchen per eMail zu diskutieren. Computerschachforen bauen immer deutlicher ab, finde das schade.

Und zu der CEGT Eichung:
Wie gesagt, ich glaube die feinen Abstufungen liegen im späten Mittelspiel und frühen Endspiel. Bei Schachprogrammen, nicht bei Menschen. Die nehmen nicht mehr wahr wenn sich Programme hier weiter verbessern. Die These mit Shredder 9.1 und der von Dir beschriebenen ELO ist auch nicht von der Hand zu weisen, weil im Grunde im Vergleich zu Menschen nicht messbar. So drücken sich die Zahlen bei Comps höher und höher aber dennoch sind z. B. GMs der Meinung das ein Rybka 3 nicht mehr als 2.900 ELO hat. Weil sich hier auch wenig getan hat, ob nun vor 5 Jahren oder heute, im frühen Mittelspiel hat sich nunmal wenig getan und nach wie vor sind die Menschen hinsichtlich selbst kombinieren auf ein Ziel arbeiten im Vorteil. Das war auch schon so vor 5-10 Jahren.

Nur weil bei den Comps eine Spielphase immer extremer gut wird ist das nicht auf eine ganze Schachpartie anwendbar. Wenn jemand liest ... ein Programm wie Houdini hat 3.000 ELO und nimmt das als festen Wert für eine Gesamtspielstärke hat er nicht verstanden wie Schachprogramme funktionieren. 3000 ELO kann nicht auf alle Spielphasen über eine Engine gestülpt werden.

Insofern und leider ...
Das Ratinglisten dahingend öfters mal angegriffen werden wäre aus dem beschriebenen Grund dann wirklich korrekt. Nur, Ratinglisten werden nicht aus diesem beschriebenen Grund angegriffen weil das warum und weshalb nicht erkannt wird und eher für wilde, ich denke unsinnige, Diskussionen führt.

Nehmen wir einen Stellungstest. Z. B. Mittelspiel-Taktik Positionen. Wenn hier dann aufgrund der Lösungen eine Liste erstellt wird sind die Ergebnisse anders als bei einer Ratinglisten die mit Partien arbeitet. Und dennoch müssen die Erbgebnisse von diesem Stellungstest nicht schlecht sein.

Ich denke das durch immer mehr Analysen von solchen Unstimmigkeiten auch immer klarer wird, dass im Grunde eine völlig korrekte Ratinglisten nur so produziert werden kann wenn die Spielphasen unterteilt werden.

Leider geht das nicht denn eine Schachpartie besteht nunmal aus der ganzen Partie. Zu 70% stellen wir aber die Abstufungen von Engines zwischen Zugnummer 60 und 120 fest. Bei den GM Partien selbst schaut das ganz anders aus. Gerade mal 30-40% werden hier entschieden (Partien werden früher entschieden, meist schon aufgrund von Eröffnungswissen). Insofern begründen GMs oft mit dem wichtigen Eröffnungwissen ... ist doch einem Schachprogramm egal. Kommt es gut aus der Eröffnung baut das Programm auf die Stärke im späten Mittelspiel / frühem Endspiel. Der Mensch ist hoffnungslos unterlegen.

Gruß
Frank
Parent - - By Werner Mueller Date 2011-11-19 13:32
@ FQ

'Ben Hur' hat sicher eine Art zu formulieren, die für manche provokant erscheint. Aber 'Troll' ist etwas anderes.

Und btw.: bei Formulierungen wie 'interessant sind die Selbstgespräche' oder 'wenn immer wieder beobachtet wird mit wie wenig Wissen argumentiert wird' würde Dir ein gewisse Zurückhaltung sicher nicht schlecht zu Gesicht stehen.
Parent - By Frank Quisinsky Date 2011-11-19 16:17
?
Parent - By Christian Schmidt Date 2011-11-20 05:29
[quote="Ben Hur"]
Kürzlich wurde nachgewiesen, dass die Engine Ratingliste der CEGT nicht stimmig sind.
Im oberen Bereich sind die Elo Werte viel zu hoch im Vergleich zu Menschlichen Elo Zahlen.
[/quote]

Dazu nur ganz kurz und knapp:

1. Eine Engine allein kann keinen Elo-Wert haben. Nur die Kombination PC+Engine kann Schach spielen. Je schneller der PC, desto höher der Elo-Wert.

2. Die Listen werden richtig berechnet. Wenn jemand die Elo-Werte für zu hoch empfindet, dann soll er den Gegenbeweis liefern. Im Moment ist aber die Situation so, dass kein Super-Großmeister mehr (verständlicherweise) gegen moderne Rechenmonster antritt.
Up Topic Hauptforen / CSS-Forum / Systematische Fehler beim Engine Testen

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill