Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / R4 again Ivanhoe
- - By Ernst Happe Date 2010-06-12 15:25

Arena Turnier1

PlatzMotorPunkte%IvDeS-B
1IvanMod12cSSE1 7,0/1070,0· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ··01===111=1
2Deep Rybka 4 w323,0/1030,010===000=0· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ·· ··


10 Partien von 80 gespielt

Beginn des Turniers: 2010.06.11, 12:31:54
Letzte Aktualisierung: 2010.06.12, 15:18:18
Ort/ Land: XEON, Deutschland
Spielstufe: Blitz 1/1
Hardware: Intel(R) Xeon(TM) CPU 3.06GHz mit 2.048 MB Speicher
Betriebssystem: Microsoft Windows XP Professional Service Pack 2 (Build 2600)
Bedingungen: Hash: 256MB, Tablebases/Robbobases/Totalbases: Ein, Rechnen auf Gegnerzeit Aus, Anfangsstellung Noomen-Select.pgn
Benchmark: ArenaMark: 20,57 AM, 1,10 EF
Tabelle erstellt mit: Arena 2.0.1


unglaublich, Ivan spielt viel stärker als Fire!
Spielstil ähnlich Ippolit!

wird fortgesetzt

Ernst
Parent - - By Ernst Happe Date 2010-06-12 18:48
50 Partien von 80 gespielt:

Arena Turnier1

PlatzMotorPunkte%
1IvanMod12cSSE1 26,0/5052,001===111=10==101=01==10======10110==000====11==00=
2Deep Rybka 4 w3224,0/5048,010===000=01==010=10==01======01001==111====00==11=


50 Partien von 80 gespielt

Beginn des Turniers: 2010.06.11, 12:31:54
Letzte Aktualisierung: 2010.06.12, 18:41:58
Ort/ Land: XEON, Deutschland
Spielstufe: Blitz 1/1
Hardware: Intel(R) Xeon(TM) CPU 3.06GHz mit 2.048 MB Speicher
Betriebssystem: Microsoft Windows XP Professional Service Pack 2 (Build 2600)
Bedingungen: Hash: 256MB, Tablebases: Ein, Rechnen auf Gegnerzeit Aus, Anfangsstellung Noomen-Select.pgn
Benchmark: ArenaMark: 20,57 AM, 1,10 EF
Tabelle erstellt mit: Arena 2.0.1
Parent - - By Benno Hartwig Date 2010-06-12 20:52
Thanx,
ein schönes Beispiel für die Beliebigkeit der Ergebnisse bei zu kleinen Partienmengen.
Benno
Parent - - By Ernst Happe Date 2010-06-12 21:03
Hi Ben No,

worauf beziehst Du dich?

Du hast wahrscheinlich nur auf die %te geschaut? Gib`s zu!

R4 ist innerhalb des Turnieres nie auch nur an den 50% drangewesen, immer darunter.

Ich ziehe für mich, nicht nur aus dem Punktergebnis, sondern auch aus dem Spielverlauf
den eindeutigen Schluss: Ivan spielt erkennbar besser als R4!

Ernst

P.S.

Auch  Dieter Esser kommt zu dem gleichen Ergebnis!
Parent - By Benno Hartwig Date 2010-06-13 07:17 Edited 2010-06-13 07:22
[quote="Ernst Happe"]Du hast wahrscheinlich nur auf die %te geschaut? Gib`s zu![/quote]Gebe ich nicht.
Ich wollte vielmehr gerade mit Blick auf beide darauf hinweisen, wie sehr abweichend von der Wirklichkeit (angedeutet durch die Ergebnisse der zweiten Liste) diese erste Liste mit 10 Partien ist. (Ich glaube, es ist bereits eine ganze Weile her, dass sich das letzte mal jemand 'traute', 10 Ergebnisse zu einer Liste zusammenzufassen und sie hier zu posten )
Und auch 50 gibt bei ungefähr gleichstarklen Gegnern vor allem Zufall her.

Wenn ich eine schnelle, ugefähre Abschätzung zweier Engines haben möchte, dann laufen bei mir 148 Partien. Und auch dieses Ergebnis darf ich nur als 'gaanz ungefähr' betrachten, sonst würde ich deutlich zu häufig zu einfach falschen Aussagen kommen.

Benno
Parent - - By Hubert Voss Date 2010-06-13 08:14
Wie dämlich sind einige hier?!

Eure ganzen Tests mit Firebird,Hondoni,Ivanhoe usw. könnt Ihr Euch sparen.

Ihr lasst nur Original Rybka gegen "Rybka beta mit einigen veränderten Parametern" spielen.

Es ist zum kotzen.

Hubert
Parent - By Ernst Happe Date 2010-06-13 11:30
Kotzen schreibt man aber groß! 
Parent - By Dieter Esser Date 2010-06-13 11:34
Ah - ein Geschöpf aus Tolkiens Welt.

Never feed them!
Parent - By Ernst Happe Endstand Date 2010-06-12 21:29

Arena Turnier1

PlatzMotorPunkte%
1IvanMod12cSSE1 42,0/8052,501===111=10==101=01==10======10110==000====11==00====1====00=1=1=1=1=0===1====0=
2Deep Rybka 4 w3238,0/8047,510===000=01==010=10==01======01001==111====00==11====0====11=0=0=0=0=1===0====1=


80 Partien gespielt / Turnier beendet

Beginn des Turniers: 2010.06.11, 12:31:54
Letzte Aktualisierung: 2010.06.12, 21:22:10
Ort/ Land: XEON, Deutschland
Spielstufe: Blitz 1/1
Hardware: Intel(R) Xeon(TM) CPU 3.06GHz mit 2.048 MB Speicher
Betriebssystem: Microsoft Windows XP Professional Service Pack 2 (Build 2600)
Bedingungen: Hash: 256MB, Tablebases/Robbobases/Totalbases: Ein, Rechnen auf Gegnerzeit Aus, Anfangsstellung Noomen-Select.pgn
Benchmark: ArenaMark: 20,57 AM, 1,10 EF
Tabelle erstellt mit: Arena 2.0.1
Parent - - By Bert Rinzel Date 2010-06-12 18:51
Welche Argumente haben jetzt noch die, die davon ausgehen, dass Ivan, Fire usw Rybka-Clones sind?

Das Original wesentlich schlechter als die vermeintlichen Clones???....Merkwürdig. Haben die etwa schon den Code von Rybka 15 geklaut???

Bert
Parent - - By Günther Höhne Date 2010-06-12 19:14
Hallo Bert,

es gibt doch immer wieder Leute, die aus einem einzigen Vergleich mit 10. Partien irgendwelche Rückschlüsse ziehen.

Gruß
Günther
Parent - - By Benno Hartwig Date 2010-06-13 07:26
[quote="Günther Höhne"]es gibt doch immer wieder Leute, die aus einem einzigen Vergleich mit 10. Partien irgendwelche Rückschlüsse ziehen.[/quote]
Dass er den Schluss wirklich zieht, glaube ich nicht. Länger als ein paar Tage ist er nun ja doch schon beim Thema.
Er provoziert gern, und dafür ist im kein Anlass zu dusselig. ("Er will nur spielen...")
Benno
Parent - - By Ernst Happe Date 2010-06-13 10:09
Hi Ben No,

fast alle wollen doch hier nur spielen, hoffe ich mal so. Bis auf die Erbsenzähler hier im Forum,
die unvollständige Ratinglisten posten. Wie vielleicht hier schon mal gepostet wurde, sind
10 vershiedene Eröffnungen (S/W =20 Partien) vollständig ausreichend um eine Engine beurteilen
zu können. Geht mir hier nicht um ein paar Elo.

Ernst
Parent - - By Kai Skibbe Date 2010-06-13 16:07
Als Fußballtrainer war Ernst Happel gut, aber als Engine-Tester?!?!
Parent - - By Gerhard Sonnabend Date 2010-06-13 16:54
[quote="Kai Skibbe"]
Als Fußballtrainer war Ernst Happel gut, aber als Engine-Tester?!?!
[/quote]

Der Thorsten ääh... Ernst (?) ist selbst ein Clone.

Viele Grüsse,
G.S.
Parent - By Udo Kaiser Date 2010-06-13 18:42
Die ganze Welt des Computerschachs 
Parent - - By Thomas Müller Date 2010-06-13 18:52
Ach gerhard,
lass doch mal gut sein mit diesem namensdingenszeugs.
Wenn einer unter "horst schlämmer" posten will, dann soll er/sie/es doch!
Wobei der name evtl.  geschützt sein könnte!?!!?
Parent - - By Ingo Bauer Date 2010-06-13 19:05
Moin

[quote="Thomas Müller"]
Ach gerhard,
lass doch mal gut sein mit diesem namensdingenszeugs.
Wenn einer unter "horst schlämmer" posten will, dann soll er/sie/es doch!
Wobei der name evtl.  geschützt sein könnte!?!!?
[/quote]

Ich gebe dir insoweit Recht das Gerhard daruf rumreitet, aber ihr solltet auch mal zusehen das hier nicht "einer" unter "horst schlämmer", "Roland Kaiser", "Ernst Bloch" und "Mario de Monti" - zumindest nicht wenn es offensichtlich ist.

Gruß
Ingo
Parent - By Thomas Müller Date 2010-06-13 19:16
ja das war ein blödes beispiel.
Das mit den seltsamen namen bei den "Gästen" wird zusehends zu einem Problem!
Parent - By Gerhard Sonnabend Date 2010-06-13 23:12
[quote="Thomas Müller"]
lass doch mal gut sein mit diesem namensdingenszeugs.
[/quote]

Dann lasse ichs halt sein.

cu,
G.S.
Parent - - By Benno Hartwig Date 2010-06-13 16:59
[quote="Ernst Happe"]Wie vielleicht hier schon mal gepostet wurde, sind 10 vershiedene Eröffnungen (S/W =20 Partien) vollständig ausreichend um eine Engine beurteilen zu können.[/quote]Ja, Ernst, klar, wirst schon Recht haben, und Männer sind klüger als Frauen, und die Welt ist eine Scheibe.
Und das kleine Einmaleins ist nur was für Mathestudenten.
Benno
Parent - - By Ernst Happe Date 2010-06-13 17:06
Hallo Benno,

klar, gib mir eine von dir gespielte schachpartie gegen deinen schachpartner, der ungefähr genau so
stark spielt, und ich sage dir wie hoch deine spielstärke in nwz (=nationale wertungszahl) ist!

Ernst
Parent - - By Benno Hartwig Date 2010-06-13 19:53
[quote="Ernst Happe"]klar, gib mir eine von dir gespielte schachpartie gegen deinen schachpartner, der ungefähr genau so
stark spielt, und ich sage dir wie hoch deine spielstärke in nwz (=nationale wertungszahl) ist! [/quote]Kannst die hilflose Zunge wieder reinnehmen.
Ich zeige dir die Ergebnisse aus 20 Partien von Engines, die ungefähr gleich stark sind, und du schätzt bitte, welche stärker ist.
Und du wirst reichlich fehleranfällig sein bei deiner Schätzung, welche stärker ist, ob sie überhaupt ungefähr gleichstark sind.
Das ist das kleine Einmaleins der Stochastik, um das du bei der Bewertung von Turniererfolgen ganz sicher nicht herumkommst.
Ergebnisse aus 20 Partien (nicht die Beurteilung der Züge im Einzelnen, reine Punktverhältnisse waren die Basis!) geben sehr wenig her.

Benno

PS:

Falls du auch die Züge in den Partien bewerten willst:
Wenn du zwei Engines A und B hast, bei denen A um 50 ELO (oder 100 ELO) stärker ist als B, bei denen aber in 20 Partien zufällig B erfolgreicher abschnitt als A, vielleicht 8:12 oder so, traust du dir dann trotzdem zu, aus diesen Partien heraus zu lesen, dass aber eigentlich A die stärkere Engine war?
Das würde ich mit Staunen anerkennen. Wenn's stimmt. Reicht dein Selbstbewusstsein zu solch einer Aussage?

Oder einfacher:
Du bekommst nach einem 10:10 die Partien, eine Engine hat aber 50 ELO mehr.
Mit welcher Wahrscheinlichkeit würdest du die stärkere Engine erkennen?
Parent - - By Michael Waesch Date 2010-06-13 20:21
Ich bin mir nicht sicher, ob jemand solche Ergebnisse überhaupt braucht. Man mag Abertausende von Partien spielen lassen, um die Fehlerquote in den zu vernachlässigenden Bereich zu drücken - aber genauso wahr ist es, daß die Wertung, die "hinten" rauskommt, immer nur in Bezug auf die mitspielenden Engines aussagekräftig ist. In logischer Konsequenz, muß jede Liste unvollständig sein, zumal sich hier ja auch jeder weigert, die sog. Klone zu testen. Und wenn ich ein kurzes Bullet mit Eng A vs Eng B mache - und das geht 20-0 aus, dann weiß ich schon, welche Engine, die stärkere ist.

Und wenn wir jetzt mal von der Theorie ganz weg gehen - hin zur Praxis, dann zeigt sich, daß ich mit solchen Listen eh Nullkommagarnichts anfangen kann:

1) Ich brauche eine oder mehrere Engines zur Analyse meiner eigenen Partien. Dabei lege ich Wert darauf, Programme zu haben, deren Varianten ich bei meiner, eher bescheidenen Spielstärke, auch verstehen kann. Die Spielstärke, im Vergleich zu irgendwelchen anderen Engines, die irgend ein Tester willkürlich festgelegt hat, interessiert mich da nicht die Bohne.

2) Ich will auf Playchess zocken, damit ich Material [Partien] für meine Bücher bekomme. Im Rybkaraum werde ich im Wesentlichen nur mit Rybka konfrontiert sein. Dann will ich wissen, welche Parameter meinem Programm einen Vorteil über Rybka geben - und nicht, wie stark mein Programm im Vergleich mit anderen, von einem Tester willkürlich festgelegten Programmen ist.

So einfach ist das.

YMMV,

Mike
Parent - - By Benno Hartwig Date 2010-06-13 20:47
[quote="Michael Waesch"]...immer nur in Bezug auf die mitspielenden Engines aussagekräftig ist.[/quote]Wer wollte das bestreiten. Mit Hilfe anderer Tabellen kannst du dann weitere Abschätzungen versuchen, es steigern sich aber die Unsicherheiten

[quote="Michael Waesch"]Dabei lege ich Wert darauf, Programme zu haben, deren Varianten ich bei meiner, eher bescheidenen Spielstärke, auch verstehen kann.[/quote]Klar, keine Ratingliste und kein Turnierergebnis kann die für dich aussuchen. Versuchen sie ja auch nicht.

[quote="Michael Waesch"]Dann will ich wissen, welche Parameter meinem Programm einen Vorteil über Rybka geben - und nicht, wie stark mein Programm im Vergleich mit anderen, von einem Tester willkürlich festgelegten Programmen ist.[/quote]Ja, richtig, dieses Wissen wirst du nicht aus allgemeinen Ratinglisten erfahren.

Ergo:
Die Ratinglisten und Turniere liefern Ergebnisse, die viele interessieren und dich eher weniger.
Das sollte aus deiner und der Sicht der anderen dann auch OK so sein.

Benno
Parent - By Michael Waesch Date 2010-06-13 20:58
Wow. Megasachliche Antwort. Jetzt bin ich baff.

Ich habe nichts gegen Leute, die denken, daß diese Listen sinnvoll sind. Ich wär nur manchmal dankbar, wenn sie mir sagen würden, warum. Sprich: Welchen Nutzen hat es ihnen gebracht, da reinzugucken, mal abgesehen von der Befriedigung der Neugier. Hiarcs ist ja z.B. auch nicht gerade das allerstärkste "Teil" und dennoch interessiert sich z.B. der Kurt dafür. Aus einer Liste hat er das sicher nicht.

Mike
Parent - - By Ralf Badera Date 2010-06-13 20:24
Hallo Benno,
[quote="Benno Hartwig"]
Ich zeige dir die Ergebnisse aus 20 Partien von Engines, die ungefähr gleich stark sind, und du schätzt bitte, welche stärker ist.[/quote]
Wenn ich richtig lese, ging es nicht um 10 x 2 Ergebnisse, sondern Partien.

[quote="Benno Hartwig"]
Falls du auch die Züge in den Partien bewerten willst:
Wenn du zwei Engines A und B hast, bei denen A um 50 ELO (oder 100 ELO) stärker ist als B, bei denen aber in 20 Partien zufällig B erfolgreicher abschnitt als A, vielleicht 8:12 oder so, traust du dir dann trotzdem zu, aus diesen Partien heraus zu lesen, dass aber eigentlich A die stärkere Engine war?
Das würde ich mit Staunen anerkennen. Wenn's stimmt. Reicht dein Selbstbewusstsein zu solch einer Aussage?

Oder einfacher:
Du bekommst nach einem 10:10 die Partien, eine Engine hat aber 50 ELO mehr.
Mit welcher Wahrscheinlichkeit würdest du die stärkere Engine erkennen?
[/quote]
Weich nicht ständig aus und red nicht drum rum, gib ihm doch einfach 20 Partien und wir werden es sehen.

MfG,
Ralf
Parent - - By Benno Hartwig Date 2010-06-14 13:03 Edited 2010-06-14 13:07
[quote="Ralf Badera"]Wenn ich richtig lese, ging es nicht um 10 x 2 Ergebnisse, sondern Partien.[/quote]Meine Kritik, auf die er dann antwortete, bezog sich nur auf auf Ergebnisse. Ernst präsentierte halt stolz zunächst das 7,0:3,0 und kommentierte postwendend:
"unglaublich, Ivan spielt viel stärker als Fire!" Dass er für diese Aussage die Partien analysiert hat, war mir nicht ersichtlich. Dir?
Vielleicht meinte er aber tatsächlich Partien. Ich bin auf diese Möglichkeit ja in meinem Posting ja auch konkret eingegangen.

[quote="Ralf Badera"]Weich nicht ständig aus und red nicht drum rum,...[/quote]Ralf, wem oder welcher Forderung weiche ich denn aus?
Und jenes bestimmte 'ständig' müsstest du bitte erst recht noch belegen.
Und konkret was von dem, was ich erklärte, war deiner Meinung nach nur 'dumm rumgeredet'? Und wie begründest du das?
Benno
(eigentlich doch recht freundlich, oder, obwohl du mir ziemlich pampig kommst?)
Parent - - By Ralf Badera Date 2010-06-14 17:23
Hallo Benno,
[quote="Benno Hartwig"]
[quote="Ralf Badera"]Wenn ich richtig lese, ging es nicht um 10 x 2 Ergebnisse, sondern Partien.[/quote]Meine Kritik, auf die er dann antwortete, bezog sich nur auf auf Ergebnisse. Ernst präsentierte halt stolz zunächst das 7,0:3,0 und kommentierte postwendend:
"unglaublich, Ivan spielt viel stärker als Fire!" Dass er für diese Aussage die Partien analysiert hat, war mir nicht ersichtlich. Dir?
Vielleicht meinte er aber tatsächlich Partien. Ich bin auf diese Möglichkeit ja in meinem Posting ja auch konkret eingegangen.[/quote]
Aber nicht auf:
[quote="Ernst Happe"]
Wie vielleicht hier schon mal gepostet wurde, sind
10 vershiedene Eröffnungen (S/W =20 Partien) vollständig ausreichend um eine Engine beurteilen
zu können. Geht mir hier nicht um ein paar Elo.[/quote]
[quote="Benno Hartwig"]
[quote="Ralf Badera"]Weich nicht ständig aus und red nicht drum rum,...[/quote]Ralf, wem oder welcher Forderung weiche ich denn aus?
Und jenes bestimmte 'ständig' müsstest du bitte erst recht noch belegen.
Und konkret was von dem, was ich erklärte, war deiner Meinung nach nur 'dumm rumgeredet'? Und wie begründest du das?
Benno[/quote]
Erstens: nicht dumm, sondern drum, s.o. Zweitens: Was soll ich da begründen und warum? Woher soll ich wissen und auch noch begründen, warum du drum herum faselst und ihm nicht einfach die 20 Partien gibst, die ihm ausreichen würden, um eine Engine beurteilen zu können? Du bist mir ja ein Spassvogel. 

MfG,
Ralf
Parent - By Benno Hartwig Date 2010-06-14 18:47
[quote="Ralf Badera"]Erstens: nicht dumm, sondern drum[/quote]Sorry, dein sonstiger Ton hat mich hier auch noch ein 'dumm' lesen lassen. Aber das war falsch.
Wenngleich: wenn du jetzt von 'faseln' sprichst, lag ich ja gar nicht so daneben.
Ausgewichen bin ich auch nicht. Ernst hatte ich gefragt. Und er antwortete nicht. Er würde mich auslachen, wenn ich jetzt was senden würde.
Benno
Parent - By Ingo Bauer Date 2010-06-13 20:25
Hi Benno

[quote="Benno Hartwig"]
...
Du bekommst nach einem 10:10 die Partien, eine Engine hat aber 50 ELO mehr.
Mit welcher Wahrscheinlichkeit würdest du die stärkere Engine erkennen?
[/quote]

50%!

Selbst wenn du ihm 100 mal 10:10 mit unterschiedlichen Enignes vorlegst sollte er bei 50% liegen. Liegt er besser hatte er Glück, liegt er schlechter frage ihn nach Fußballergebnissen und setze auf den Verlierer!

Gruß
Ingo
Parent - - By Johannes Ozymandias Date 2010-06-14 19:31
@ Ernst Happe:

Ich bedaure es ja wirklich sehr, daß solche eigentlich ganz harmlos und
unprätentiös begonnenen Threads für meinen Geschmack viel zu oft in
Aggressivitäten und Beleidigungen umschlagen. Was ist denn schon dabei,
wenn jemand etwas postet, womit ein anderer nicht einverstanden ist?
Daß da gleich kübelweise Hohn und Spott darüber ausgegossen werden
muß, zeugt eigentlich nur von Niveau- und Distanzlosigkeit. Schade!

Ohne mich in die von zahlreichen Animositäten und Peinlichkeiten geprägte
Debatte einmischen zu wollen - das hier interessiert mich:

Zitat:
gib mir eine von dir gespielte schachpartie gegen deinen schachpartner, der
ungefähr genau so stark spielt, und ich sage dir wie hoch deine spielstärke in nwz
(=nationale wertungszahl) ist!


Ist das ernstgemeint - oder nur eine Ironie? Gibt es jemanden auf dieser Welt,
der nur aus einer oder einigen wenigen Schachpartien zwischen zwei halbwegs
gleichstarken Gegnern grosso modo auf die Spielstärke der Gegner rückschließen
kann?

Viele Grüße reihum von

** JO **
Parent - - By Benno Hartwig Date 2010-06-14 19:55 Edited 2010-06-14 20:04
[quote="Johannes Ozymandias"]Ist das ernstgemeint - oder nur eine Ironie? [/quote]Es war wohl mit einiger Bitterkeit ernst gemeint, denn ich erklärte hier schon mehrmals, dass mein Schach nicht gut ist (komme halt aus der EDV, und daher rührt mein Interesse). Natürlich würde er das meiner Partie ansehen. Das wollte er betonen, und da konnte er sich dieses 'Angebot' denn nicht verkneifen.
Dass er dies selbst aber wirklich für ein Argument hielt, bezweifele ich, und das übrigens noch zu seinen Gunsten.

Aber deine Frage finde ich auch sehr interessant:
Angenommen ich habe zufällig 20 (oder 100) Remis-Partien gewählt von Engines die vielleicht 50 (oder 100) ELO auseinanderliegen (CEGT oder CCRL).
Nun analysiert diese ein kundiger Mensch und entscheidet, welche Engine wohl die stärkere war.
Was für eine Trefferquote wäre dann ggf. zu erwarten?

Benno
Parent - By Johannes Ozymandias Date 2010-06-14 20:43 Edited 2010-06-14 20:49
@ Benno Hartwig:

Zitat:
Angenommen ich habe zufällig 20 (oder 100) Remis-Partien gewählt von Engines die
vielleicht 50 (oder 100) ELO auseinanderliegen (CEGT oder CCRL). Nun analysiert diese ein
kundiger Mensch und entscheidet, welche Engine wohl die stärkere war.
Was für eine Trefferquote wäre dann ggf. zu erwarten?


Ich habe sowas Ähnliches schon vor mehr als zehn Jahren mit einem sehr kundigen
Menschen - einem befreundeten Großmeister (damals ~2640 Elo [nomen cuius odiosum],
den ich nicht nur für riesenstark, sondern auch sonst für sehr reflektiert halte) - gemacht:
Vorgeführt habe ich etwa zehn Turnierpartien, verbunden mit der Aufgabenstellung
herauszufinden,
a) ob darunter Partien von Schachprogrammen oder Menschen gespielt wurden,
b) ob man ungefähre Aussagen über die Spielstärke der Kontrahenten machen könne und
c) wie groß schätzungsweise der Spielstärkeunterschied zwischen den Kontrahenten sei.
(Ich hätte gerne mehr Versuche gemacht, aber darauf wollte er sich denn doch nicht
einlassen. )

Im Ergebnis hat er
- zweimal Computerpartien zuverlässig als solche erkannt (wobei ich mich daran
  erinnere, daß er sein Urteil im einen Fall auf einen typischen unmotivierten Figurenausfall
  wie Sf3-g5 stützte, wie sie damals noch charakteristisch für Computerpartien waren,
  und im anderen Fall auf sinnloses Hin- und Herziehen in einer blockierten Stellung;
- zweimal Computerpartien (zwischen Fritz5, Fritz6 und ein Junior, ich meine mich an
  Vers.6 zu erinnern) für schwache Amateurpartien gehalten;
- zweimal Amateurpartien (~1800 bis 2200 Elo) anhand von strategischen Fehlentscheidungen
  und einem taktischen Patzer zuverlässig als solche erkannt und
- viermal Partien starker Großmeister (~2600 bis ~2720 Elo) zu Unrecht als Partien starker
  Amateure (~2200 bis ~2300 Elo) eingeschätzt.

Sonderlich überzeugend fand ich das nicht. Und ich bezweifle deshalb bis zum Erweis
des Gegenteils, daß selbst ein sehr starker menschlicher Schachspieler anhand von
Partien starker, auf potenter Hardware laufender Programme in der Lage ist, eine
verläßliche Aussage über Spielstärkeunterschiede zu machen.

Dazu gehört aber auch, daß ich mich sehr gerne vom Gegenteil überzeugen lasse,
wenn jemand gute Argumente ins Feld führen kann.

Viele Grüße reihum von

** JO **
Up Topic Hauptforen / CSS-Forum / R4 again Ivanhoe

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill