Nochmal kurz: Benötige hier etwas Hilfe ...

By Thomas Müller Date 2010-02-01 22:39

wahnsinn was du alles zusammenstellst!??!?

ok...bei thinker muss es inert heissen
die zappa version wird offiziell mit mexico angegeben
bei loop ist die letzte version eigentlich die M1-T/M1-P gewesen...alle auch die 13.6 sind smp-fähig

bei fruit...
... Es fehlt ein wenig an der persönlichen Note. ...

--
TM

By Frank Quisinsky Date 2010-02-01 22:45

Hi,

das bei Loop lasse ich mal weg.
Glaube die von Dir genannte Version war keine offizielle Version.
Die Loop SMP Version schimpft sich doch MP. Das hatte ich aber ...

Alle anderen Fehler sind korrigiert.

DANKE
Frank

By Thorsten Eckhardt Date 2010-02-01 23:40

Hallo Frank,

saubere Arbeit! Die letzte Version von Zappa hatte den Namen Mexiko II.

Viele Grüße
Thorsten

By Frank Quisinsky Date 2010-02-02 00:12

Hallo Thorsten,

meine ich auch, ändere alles wieder auf Zappa Mexiko II.
DANKE !!

Gruß
Frank

By Thomas Müller Date 2010-02-02 08:31

ja die "II", aber eben mit "c" geschrieben.
Klingt jetzt pedantisch wird aber so angezeigt wenn die engine installiert wird.
Stockfish ist ja auch ohne "sch"

Das mit loop weiß ich auch nicht mehr genau....Gerd wird es wissen.

--
TM

By Frank Quisinsky Date 2010-02-02 12:18

Hi,

ah, na klar.
Jetzt ist alles klar.

So, sind jetzt bei Nummer 10, Onno!

Gruß
Frank

By Frank Quisinsky Date 2010-02-02 00:08

Hi,

übrigens, ganz vergessen.
Schön, dass Du diese Aktion beobachtest.

Wäre auch interessiert daran, Meinungen von anderen Usern in diese "Horror-Datei" aufzunehmen.
Sonst wird alles zu Quisinsky-Lastig.

So, Hiarcs erledigt ...
Hiarcs war schwierig.

Nun Junior ... Junior ist einfach

Gruß
Frank

By Gerhard Sonnabend Date 2010-02-02 12:45

[quote="Frank Quisinsky"]
das bei Loop lasse ich mal weg.
Glaube die von Dir genannte Version war keine offizielle Version.
Die Loop SMP Version schimpft sich doch MP. Das hatte ich aber ...
[/quote]

Hi Frank !

Die bisher letzte offizielle Version von LOOP ist die "M1",
welche es "lediglich" als x64-Variante gibt.
Da liegt Thomas total richtig.

Viele Grüsse,
G.S.

By Gerhard Sonnabend Date 2010-02-02 12:56

Hi Frank !

Noch ein paar zusätzliche Daten.

Die Loop "M1" wurde am 02/06/2007 veröffentlicht.
Diese Version wurde u.a. in Amsterdam 2007 Dritter bei der Computer-WM.
Danach gab es noch die Loop Version für das Nintendo Wii, welche als
"Wii-Chess" auch heute noch erhältlich ist.

Viele Grüsse,
G.S.

By Frank Quisinsky Date 2010-02-02 13:11

Hallo Gerhard,

OK, habe die Informationen eingefügt.

Vielen DANK

Gruß
Frank

By Uwe Kleinschmidt Date 2010-02-02 12:15

Hallo Frank,

im Abschnitt Fruit hat sich ein Fehler eingeschlichen:

Beeindruckend!
Dem interessierten Anwender werden reichlich Möglichkeiten dargeboten.
Mit Glaurung können Sie experimentieren, nicht nur mit den freien Sourcen!

das sollte bestimmt Fruit heissen, oder?

LG Uwe

By Frank Quisinsky Date 2010-02-02 13:06

Hallo Uwe,

ja, gerade verbessert, danke!

Frank

By Gerhard Sonnabend Date 2010-02-02 13:07

Hi Frank !

Kleine Anmerkung zu Deiner Auflistung, welche mir bisher sehr gut gefällt.

Bei Naum würde ich schon von einem Zuwachs von 32- auf 64-Bit sprechen.
20-30 ELO sind es bestimmt, mit der Version 4.2 wird dies noch etwas deutlicher
zu Tage treten.

Bei Stockfish würde ich von ca. 50 Punkten sprechen.

Viele Grüsse,
G.S.

By Frank Quisinsky Date 2010-02-02 13:22

Hi Gerhard,

die Berechnung bei 64-Bit Zuwachs beruht auf Durchschnittswerte mir bekannte Ratinglisten.
Vielleicht hat sich ein Fehler eingeschlichen. Werde mir das ansehen wenn ich die Datei fertig geschrieben habe.

Viele Grüße
Frank

By Gerhard Sonnabend Date 2010-02-02 14:13

[quote="Frank Quisinsky"]
die Berechnung bei 64-Bit Zuwachs beruht auf Durchschnittswerte mir bekannte Ratinglisten.
Vielleicht hat sich ein Fehler eingeschlichen. Werde mir das ansehen wenn ich die Datei fertig geschrieben habe.
[/quote]

Hi Frank !

Welche Deiner Vergleichslisten (ausser der CEGT und der CCRL)
führt denn die o.g. Engines (oder auch generell) überhaupt in
32- und 64-Bit ?
Soweit mir bekannt sind es immer die "2 grossen" Listenbetreiber,
welche überhaupt regelmässig und vor allem im grossen
Umfang 32- und 64-Bit-Versionen der einzelnen Programme testen.

Viele Grüsse,
G.S.

By Frank Quisinsky Date 2010-02-02 14:24

Hi Gerhard,

Christian Koch, Thomas Müller, frühere ATL von mir (habe auch mal 64-Bit gestestet und hier zahlreiche Statistiken erstellt). Wenn ich 64-Bit mit 32-Bit vergleiche (auf einem Rechner habe ich mir Vista Ultimate x64 installiert) komme ich natürlich auch schnell zu eigenen Eindrücken. Ferner bin ich in einem Verteiler einer englischen Test-Gruppe die seit vielen Jahren Engines privat testet. Die Anzahl der Partien ist hier nicht hoch aber die Anzahl der Engine Versionen. Dann habe ich noch Ergebnisse gesammelt die ich in Foren finden konnte (im Oktober). Aus diesen ganzen Eindrücken habe ich den 64-Bit Zuwachs errechnet. Nicht nur aus CEGT und CCRL, weil auch diese Listen, wie alle anderen auch Ihre Schwachpunkte haben.

Dann natürlich noch den Ergebnissen von Ingo.
Ingo kommt erstaunlich stark an meine Durchschnittswerte heran.
So gut wie in keiner anderen mir bekannten Liste bei diversen Einzelergebnissen.

Daher gewichte ich die Ergebnisse von Ingo höher als die von der CEGT und CCRL.

Bevor der gute Ingo jetzt abhebt ... alles Zufall

Gruß
Frank

PS: Damit will ich nicht sagen das CEGT und CCRL schlecht sind, ganz im Gegenteil.
Wir können froh sein, solche Listen zu haben aber nur auf diese Listen zu schauen wäre mir persönlich zu einseitig.

Meine Liste, die SWCR ist derzeit auch, leider, etwas am Schwächeln.
Rybka 3 liegt ca. 20 ELO unter seinem eigentlichen Rating (durchschnittliche Werte der anderen).
Vielleicht relativiert sich das wieder und Rybka 3 steigt wieder an.

Will sagen, auch meine Liste ist nicht perfekt, aber vergleiche mal den errechneten ELO-Zuwachs von 64-Bit mit der Liste von Ingo.
Das passt sehr genau.

So bin ich dann mit der 32-Bit Ratingliste trotz Rybka 3 ganz zufrieden.

By Gerhard Sonnabend Date 2010-02-02 15:04

Hallo Frank !

Alle von Dir genannten Personen testen entweder 32-Bit
oder 64-Bit einer Engine-Version !
Wie in aller Welt willst Du das denn gewichten/vergleichen ?
Und so wie Du schreibst verwendest Du auch noch unterschiedliche
Gewichtungsfaktoren. Da könnte man jetzt auch hergehen und so lange
am Faktor "herumspielen" bis das gewünschte Ergebnis zustande kommt.

Da ist unser (CEGT) Vorgehen doch wesentlich besser. Bei uns spielen
die 32-/64-Bit Versionen z.T. auf dem selben PC gegeneinander. Ich
habe schon sehr viele Spiele in der Art "Fritz 12 vs Zappa MX x64"
oder "DS 12 w32 vs Rybka 2.3.2a x64" etc. etc. etc. durchgeführt.
Werner macht das u.a. auch für die 40/20-Liste, Wolfgang für die
Blitz-Liste + die 40/20 ebenso.

Viele Grüsse,
G.S.

By Frank Quisinsky Date 2010-02-02 15:18

Hi,

Ingo hat glaube ich 3-4 32-Bit Engines in der Liste. Überhaupt fast alle (Fritz, Hiarcs nicht kompatible 64-Bit Engines). In meiner ATL-4 hatte ich z. B. 10.000 Partien mit 32-Bit, 10.000 mit 64-Bit. Das ist alles 3 Jahre her aber bei den 64-Bit Implementationen hat sich bei einigen Engines wenig geregt.

Stimme Dir aber zu das andere Vergleichswerte dann aus CEGT und CCRL kommen. Leider nehmen die Ergebnisse in CEGT bei 32-Bit stark ab aber es gibt immer noch ausreichend Vergleichswerte.

Nein, sind keine gewünschten Gewichtsfaktoren.
Das sind wirklich die durchschnittlichen die ich errechnet hatte und die passen ausgezeichnet wenn ich mit der Liste von Ingo vergleiche.
Nehme den 64-Bit Zuwachs und rechne den bei SWCR drauf, schon hast Du fast ein identisches Ergebnis zu der Liste von Ingo.

Habe gerade bei Naum geschaut, da sehe ich wirklich keinen Vorteil. Maximal 10 ELO wenn ich auf die durchschnittlichen Werte achte. Aber der Programmierer möchte ja jetzt mittels Naum 4.2 die Optimierung starten.

Auch frage ich natürlich die Programmierer.
So schrieb mir z. B. der Sjeng Programmierer das Sjeng mt 64Bit 50% schneller wäre. Das wären dann ca. 30 ELO.
Dieser Anhaltspunkt, sofern vorhanden geht dann auch in die Berechnung ein.

Und wie gesagt ...
Trotz allem handelt es sich um geschätzte Faktoren, die nicht den Anspruch erheben absolut genau zu sein.
Mag sein, dass ich hier und dort um 5 - 10 ELO daneben liege (mehr glaube ich nicht).

Gruß
Frank

By Gerhard Sonnabend Date 2010-02-02 16:12

Ich habe das bewusst so überzogen geschrieben, da Du und Ingo
doch immer so sehr auf PB=on/off herumreiten. Und dies obwohl
der "Unterschied" noch nicht mal messbar ist, was Du übrigens
selbst auch schon mal zugegeben hattest !
Und nun kommt heraus, dass Deine Ratings u.a. auf Schätzungen,
unzulässigen Vergleichen und unterschiedlichen Gewichtungen basieren.

Viele Grüsse,
G.S.

By Frank Quisinsky Date 2010-02-02 16:21

Hallo Gerhard,

bei Ponder On/Off haben wir andere Spiele, andere Remisquoten (sind bei Ponder=off minimal geringer).
Die Statistiken sind vergleichbar, die Ergebnisse sind vergleichbar.

Es gibt nur wenige Fälle wo es wirklich zu Abweichungen bei den Zahlen kommt.

Für einen 32-Bit / 64-Bit Vergleich ist es daher fast unerheblich ob die Engines nun mit oder ohne Ponder gespielt haben.

Gruß
Frank

By Gerhard Sonnabend Date 2010-02-02 17:14

[quote="Frank Quisinsky"]
bei Ponder On/Off haben wir andere Spiele, andere Remisquoten (sind bei Ponder=off minimal geringer).
Die Statistiken sind vergleichbar, die Ergebnisse sind vergleichbar.

Es gibt nur wenige Fälle wo es wirklich zu Abweichungen bei den Zahlen kommt.

Für einen 32-Bit / 64-Bit Vergleich ist es daher fast unerheblich ob die Engines nun mit oder ohne Ponder gespielt haben.
[/quote]

Vielen Dank Frank !
Ich habe diesen Beitrag (man weis ja nie) bereits abgespeichert.

Viele Grüsse,
G.S.

By Frank Quisinsky Date 2010-02-02 17:23

Hi Gerhard,

allerdings verschieben sich auch Ergebnisse.
Das ist eher das Problem.

Ich meine unterschiedliche Einzelergebnisse die aus welchen Gründen auch immer keinen Einfluss auf die Platzierungen in Listen haben.
Dann nehme das auch noch mit.

Das ist nämlich das Hauptproblem bei Ponder on / off Listen.
Ferner die geringe Remisquote, je höher desto besser.

Gruß
Frank

By Gerhard Sonnabend Date 2010-02-02 18:19

[quote="Frank Quisinsky"]
allerdings verschieben sich auch Ergebnisse.
Das ist eher das Problem.
Ich meine unterschiedliche Einzelergebnisse die aus welchen Gründen auch immer keinen Einfluss auf die Platzierungen in Listen haben.
Dann nehme das auch noch mit.
Das ist nämlich das Hauptproblem bei Ponder on / off Listen.
Ferner die geringe Remisquote, je höher desto besser.
[/quote]

Sehe ich anders.
Unterschiedliche Einzelresultate bekommst du selbst bei
Wiederholungen unter sonst völlig identischen Bedingungen.
Mal mehr, mal weniger. Interessant ist aus meiner Sicht was
zum Schluss herauskommt. Und das nach möglichst vielen Vergleichen.
Die Remisquote ist dabei vollkommen gleichgültig.
Ein Match 60-40 mit +50 =20 -30
ist genau so viel "wert" wie
ein Match 60-40 mit +60 =00 -40.

Viele Grüsse,
G.S.

By Frank Quisinsky Date 2010-02-02 20:30

Hi,

ja, bei Einzelresultaten ...

Gruß
Frank

By Ingo Bauer Date 2010-02-02 17:26

Hi
[quote="Gerhard Sonnabend"]
...
Und nun kommt heraus, dass Deine Ratings u.a. auf Schätzungen,
unzulässigen Vergleichen und unterschiedlichen Gewichtungen basieren.
...
[/quote]

Und eure Ratings basieren auf unterschiedlicher Hardware, unterschiedlichen Zeiten, unterschiedlichen Büchern, unterschiedlichen Eröffnungsstellungen, ...

Wer im Glashaus sitzt ...

Gruß
Ingo

By Gerhard Sonnabend Date 2010-02-02 18:14

[quote="Ingo Bauer"]
[...snip...]
Wer im Glashaus sitzt ...
[/quote]

Nun, in Bezug auf "Glashaus" könnte ich jetzt auch mehrere
Beobachtungen und auch Fakten (!) beitragen, und zwar was
Eröffnungsstellungen / verwendete Testsets betrifft.
Ich halte mich aber zurück, da dies (noch) nicht nötig ist.

Viele Grüsse,
G.S.

By Ingo Bauer Date 2010-02-02 18:28

Whuuuuu!

... aber du hast angefangen!

Ingo

By Gerhard Sonnabend Date 2010-02-02 18:46

[quote="Ingo Bauer"]
Whuuuuu!

... aber du hast angefangen!

Ingo
[/quote]

?

Mit Engine-Tests habe ich in der Tat "angefangen",
was uns beide betrifft.
Jedoch nicht mit dieser Diskussion !!

Viele Grüsse,
G.S.

By Ingo Bauer Date 2010-02-02 19:00

Moin,

[quote="Gerhard Sonnabend"]
...
Mit Engine-Tests habe ich in der Tat "angefangen",
was uns beide betrifft.
Jedoch nicht mit dieser Diskussion !!
...
[/quote]

Hier: http://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=20049

Und Speziel das ...:

[quote="Gerhard Sonnabend"]
Und nun kommt heraus, dass Deine Ratings u.a. auf Schätzungen,
unzulässigen Vergleichen und unterschiedlichen Gewichtungen basieren.
[/quote]

... hat mich veranlaßt von Glashaus zu sprechen. Nicht das ich Franks Vorgehen so toll fände, die CEGT ist allerdings keinen Deut besser (wenn auch anders). Wenn dann noch (woanders) von "Groß" gesprochen wird reizt das natürlich meinen Widerspruchsgeist.

Ich bin aber nicht mehr sicher das wir uns hier beide über die selbe Sache erregen.

Gruß
Ingo

By Gerhard Sonnabend Date 2010-02-02 19:05

[quote="Ingo Bauer"]
[...snip...]
Ich bin aber nicht mehr sicher das wir uns hier beide über die selbe Sache erregen.
[/quote]

Ich bin nach wie vor NICHT erregt, wäre ja noch schöner so früh,
muss erst noch was essen ...

Siehe:
http://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=20070#pid20070

Viele Grüsse,
G.S.

By Frank Quisinsky Date 2010-02-02 20:31

Hi,

für solche Anlässe solltest Du immer Frikadellen im Kühlschrank haben.
Sparst Zeit ...

Gruß
Frank

By Ingo Bauer Date 2010-02-02 15:53

Hallo

[quote="Gerhard Sonnabend"]
...
Soweit mir bekannt sind es immer die "2 grossen" Listenbetreiber,
welche überhaupt regelmässig und vor allem im grossen
Umfang 32- und 64-Bit-Versionen der einzelnen Programme testen.
..
[/quote]

Was auch immer Frank schätzt kann man NICHT mit eurer Liste vergleichen, da eine Liste Ponder ON und die andere OFF. Niemand hat jemals verglichen hat ob sich die Gewinne oder Verluste bei diesen unterschiedlichen Bedinungen gleich verteilen. Alles nur Annahmen!

Wobei ich annehme das die Unterscheide nicht so groß sind, aber wissen tue ich es nicht. Sprich alles nur für des Kaiser Bart hier!

Gruß
Ingo

PS; Wieso "groß"? Was ist da "groß". Bekannt ok, aber "groß"?

By Stefan Ratzmann Date 2010-02-02 15:56

Hallo Frank

Sowas habe ich schon lange gesucht.Eine Seite wo mal die Programme nach Spielstil vorgestellt werden und nicht unbedingt nach Spielstärke.Klasse!! Weiter So

Gruß
Stefan

By Ingo Bauer Date 2010-02-02 16:00

Danke, das Lob nehme ich gerne mit!

Gruß
Ingo F. Bauer

By Frank Quisinsky Date 2010-02-02 16:35

Hi,

ich wollte das immer schon mal machen.
Weil die Frage zu Spielstilen auch eine Standardfrage bei den Interviews ist (die ich in der Vergangenheit gemacht habe).
Ferner beobachte ich das lieber als Statistiken anzufertigen.

Problematisch ist nur:
Meine Eindrücken müssen nicht unbedingt stimmen, zumal ich dafür mit ca. 2.000 ELO viel zu schwach spiele.

Aber egal ...
So gut es geht einfach mal etwas erstellen ohne den Anspruch zu erheben, dass alles auch zu 100% stimmen muss.

Ferner gehen ja die Meinungen bekanntlich gerade zu den Spielstilen weit auseinander.

Siehe Spielstil: Kasparow (Paradebeispiel)
Oder Kramnik (da ist echt alles was nur irgendwie denkbar ist vertreten).

So, bin bei Shredder ... noch 7 Engines!
Aufwendig wird es später die Datei aktuell zu halten.
Aber darum mache ich mir jetzt keine Gedanken.

Gruß
Frank

By Gerhard Sonnabend Date 2010-02-02 16:11

[quote="Ingo Bauer"]
[...snip...]
PS; Wieso "groß"? Was ist da "groß". Bekannt ok, aber "groß"?
[/quote]

Hi Ingo !

"Gross" im Sinne von sehr sehr vielen gespielten Games mit sehr sehr vielen
verschiedenen (32- und 64-Bit, 1-, 2- und 4-CPU und das alles auch
noch gemischt) Engines.

Viele Grüsse,
G.S.

By Ingo Bauer Date 2010-02-02 16:38

[quote="Gerhard Sonnabend"]
[quote="Ingo Bauer"]
[...snip...]
PS; Wieso "groß"? Was ist da "groß". Bekannt ok, aber "groß"?
[/quote]

Hi Ingo !

"Gross" im Sinne von sehr sehr vielen gespielten Games mit sehr sehr vielen
verschiedenen (32- und 64-Bit, 1-, 2- und 4-CPU und das alles auch
noch gemischt) Engines.

Viele Grüsse,
G.S.
[/quote]

Moin,

OK, es geht also um Anzahl.
Nur mal die Top 5 Single CEGT und IPON:

   CEGT IPON
Rybka 3x64 1621 3300
Stock 1.6.2    784 2100
Shred 12x64 1215 2900
Naum 4.1 420 1600
Kommodo 1.0    678 1700
...
----------------------------
   4718   11600

Meine Liste ist größer in Bezug auf die gespielten Partien pro gespielte Engine, da habe ich nämlich im Schnitt deutlich mehr als ihr. Ist die IPON dann auch "Groß" und darf mitspielen? In genau dem was du als "Groß" bezeichnest sehe ich auch Nachteile!

Eigentlich will ich es so formulieren: Diese "Groß"-Denke ist völlig sinnlos weil sie unreflektiert auf das achtet auf das man achten möchte oder "Jeder findet seinen Superlativ"!

Gruß
Ingo

By Gerhard Sonnabend Date 2010-02-02 17:17

Hi Ingo !

Ich nehme die Anzahl der Games auch aus der Blitz-Rating-Liste.
Und, um es nicht zu vergessen, vergleiche doch bitte auch
zusätzlich die Anzahl der unterschiedlichen Engines/Versionen !

Ürigens halte ich persönlich Deine IPON auch für "gross".

Viele Grüsse,
G.S.

By Ingo Bauer Date 2010-02-02 17:40

Moin

[quote="Gerhard Sonnabend"]

Ich nehme die Anzahl der Games auch aus der Blitz-Rating-Liste.
Und, um es nicht zu vergessen, vergleiche doch bitte auch
zusätzlich die Anzahl der unterschiedlichen Engines/Versionen !

Ürigens halte ich persönlich Deine IPON auch für "gross".

[/quote]

Nun ja, was ich von eurer Blitzliste halte weißt du, da passt ihr eure Hardware nicht mal mehr an, weil es völlig irrwitzige Zeiten gäbe. Ansonsten passt miene Bedenkzeit am besten zu eurer 40/20 und nicht zur Blitzliste.

Anzahl der Engines habt ihr mehr, kein Zweifel, das hat aber nichts mit der Genauigkeit der gespielten Engines zu tun sondern im Gegenteil, es 'verwässert' die Genauigkeit der oberen Engines (einfach ein Blick auf die +/-)

Danke das du die auch für Groß hälst, ich persönlich halte keine für Groß, dafür sehe ich zu viel Ungenauigkeiten und Kompromisse. Ich sehe höchstens wie GUT eine Liste in Ihrem Rahmen selbstgesteckten Rahmen ist und wenn ich eine fände die ich wirklich gut fände (

) bräuchte ich meine eigene nicht.

Gruß
Ingo

By Gerhard Sonnabend Date 2010-02-02 18:27

[quote="Ingo Bauer"]
Nun ja, was ich von eurer Blitzliste halte weißt du, da passt ihr eure Hardware nicht mal mehr an, weil es völlig irrwitzige Zeiten gäbe. Ansonsten passt miene Bedenkzeit am besten zu eurer 40/20 und nicht zur Blitzliste.
[/quote]

Und trotz allem liefert die Blitz-Liste absolut gute (und richtige) Ergebnisse.
Die Vergangenheit hats bewiesen und weshalb sollte sich das ändern ?
Viele suchen ein Rating und der allererste Blick (und Klick) führt zur CEGT-Blitz-Liste !!

[quote="Ingo Bauer"]
Anzahl der Engines habt ihr mehr, kein Zweifel, das hat aber nichts mit der Genauigkeit der gespielten Engines zu tun sondern im Gegenteil, es 'verwässert' die Genauigkeit der oberen Engines (einfach ein Blick auf die +/-)
[/quote]

Hhm, das verstehe ich jetzt nicht.
Hast Du ein (mehrere) Beispiel(e) zur Hand ?
+/- (95%) im TOP-100 Bereich ist bei der Blitz-Liste extrem gering.
Ausgenommen selbstredend die Engines, welche weniger als 1000 Games haben.

Viele Grüsse,
G.S.

By Ingo Bauer Date 2010-02-02 18:49

Hi

[quote="Gerhard Sonnabend"]
Und trotz allem liefert die Blitz-Liste absolut gute (und richtige) Ergebnisse. ....
[/quote]

Das hatten wir schon ein paar mal, immer wenn du auf das "passt schon" oder "wichtig ist was hinten raus kommt" kommst, bin ich nicht deiner Meinung!

[quote="Gerhard Sonnabend"]
Die Vergangenheit hats bewiesen und weshalb sollte sich das ändern ?
Viele suchen ein Rating und der allererste Blick (und Klick) führt zur CEGT-Blitz-Liste !!
[/quote]

Das da jemand hinklickt hat ja nichts mit der Qualität zu tun.

[quote="Gerhard Sonnabend"]
[quote="Ingo Bauer"]
Anzahl der Engines habt ihr mehr, kein Zweifel, das hat aber nichts mit der Genauigkeit der gespielten Engines zu tun sondern im Gegenteil, es 'verwässert' die Genauigkeit der oberen Engines (einfach ein Blick auf die +/-)
[/quote]

Hhm, das verstehe ich jetzt nicht.
Hast Du ein (mehrere) Beispiel(e) zur Hand ?
+/- (95%) im TOP-100 Bereich ist bei der Blitz-Liste extrem gering.
Ausgenommen selbstredend die Engines, welche weniger als 1000 Games haben.

[/quote]

Ich habe dir schon mehrmal gessagt das ich mich nicht auf die Blitzliste beziehe sondern eure 40/20. Und was das "verwässert" betrifft meinte ich das ihr euch durch das Spielen mit vielen Engines eigener Resourcen beraubt und damit Genauigkeit im oberen Bereich verliert. Das ist OK, Ihr habt andere Prioritäten, aber der Fakt ist da.

Nicht vergessen woran sich das hier entzündet an. An deiner Behauptung die CEGT oder CCRL wären "groß". Ich habe da verschiedene Zweifel die du kennst und die ich nicht nur heute schon mehrmals erwähnt habe.

Gruß
Ingo

By Gerhard Sonnabend Date 2010-02-02 19:02

[quote="Ingo Bauer"]
[...snip...]
Nicht vergessen woran sich das hier entzündet an. An deiner Behauptung die CEGT oder CCRL wären "groß". Ich habe da verschiedene Zweifel die du kennst und die ich nicht nur heute schon mehrmals erwähnt habe.
[/quote]

Ingo, aus meiner Sicht entzündet sich hier rein gar nichts.
Wir reden über ein Thema (wie immer) und sind uns nicht
einig (wie immer ?).
Nicht mehr - nicht weniger.

Ich bleibe aber bei "gross" in Bezug auf die CEGT und die CCRL.
Übrigens auch (heute noch nicht erwähnt) wegen der grossen
(schon wieder) Anzahl an Testern und auch (gerade) wegen
der grossen (zum letzten Mal heute ?) Anzahl an unterschiedlicher Hardware !

Viele Grüsse,
G.S.

By Ingo Bauer Date 2010-02-02 19:20

Hi

[quote="Gerhard Sonnabend"]
... und auch (gerade) wegen der grossen (zum letzten Mal heute ?) Anzahl an unterschiedlicher Hardware !
[/quote]

Den Rest lasse ich mal weg, das ich da anderer Meinung bin ist bekannt, aber warum soll den unterschiedliche Hardware und ein daraus resultierende Anpassung an Bedenkzeiten, sofern sie denn noch stattfindet, dazu führen das eine Liste "Groß" ist (ein Vorteil sein)?

Und nur angenommern (angenommen) die Bedenkzeitanpassung passt für eine Engine, wer sagt das sie für die andere passt? Ich errinnere an den Benchmarkthread vor einigen Monaten in dem festgestellt wurde das Stockfish (1.5.1) auf einem Phenom AMDx4 schneller lief als auf einem gleichgetakteten C2Q (Wobei Fritzbench GANZ anderer Meinung war!). Wer sagt das der Craftybench (den nehmt ihr doch?) für Fritz stimmt, oder Shredder, oder Stockfish, oder Naum, oder Rybka, Zappa, Kommodo, Spark, oder, oder, oder ...

Wenn Ihr AMDs und Intel mischt und/oder unterschiedliche Geschwindigkeiten habt ihr ein Problem, das kann nicht gerecht sein für die ein oder andere Engine! (Ausnahme ist das was die SSDF macht. Die Trennen klar ihre Hardware. Eigentlich haben die zwei Listen die sie ineinander verzahnen. Sehr korrekt in der Methodik - schade das die "lernen-an" benutzen)

Gruß
Ingo

PS: Referenz: http://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=12034;hl=Benchmark OK, es ging um Fritzbench, aber der raftybench kann das selbe Problem haben. Um das noch zusammenzubekommen müßte man es aber Chronologisch lesen - schwierig.

By Gerhard Sonnabend Date 2010-02-02 19:44

Ingo, macht fast Spass heute.

Weshalb nur hängst Du Dich so an dem "Gross" auf ?
Hätte ich "Beste", "Aussagekräftigste", etc. etc.
Liste(n) geschrieben, so würde ich die Aufregung verstehen.

O.K., nehmen wir mal an, dass weder Dein noch Unser (CEGT)
(oder mein bescheidenes) Konzept 100%ig in Ordnung ist.
Diese Annahme ist richtig (meine Sichtweise), da keine RL
100% perfekt sein kann. Dies aus verschiedenen
Gründen, welche ich Dir jedoch nicht aufzählen muss,
nicht wahr ?

Und ?

Fakt:
vergleiche ich z.B. meine QBRL mit Deiner Liste (IPON)
und/oder die CEGT-Blitz-Ratingliste mit Deiner Liste (IPON),
dann gibt es fast überhaupt keine gravierende Unterschiede.
Nicht vergessen, dass die Error-Margin von 95% "immerhin"
auch und u.a. bedeutet, dass 5 von 100 Engines ausserhalb
der Error-Bars liegen (müssen/können) !

Alles in Allem gleichen sich die Listen doch sehr (an),
lediglich die von Frank weist z.Zt. doch einige (zu viele ?)
Abweichungen auf. Das mag aber auch daran liegen, dass er die
erwähnten "Anpassungen" (Vergleiche, Wichtungen... - siehe Thread)
anwendet, welche aus meiner Sicht überflüssig und vor allem
total unrichtig sind.

Mir persönlich sind "echte" Vergleiche lieber und ich glaube
zu wissen, dass Du Dir denken kannst was ich jetzt meine ?

Übrigens kann man die PCs auch ganz anders "ausmessen" als mit
den von Dir erwähnten Benches ! Der Crafty-Bench schneidet jedoch
auch dabei bisher sehr gut ab.

Viele Grüsse,
G.S.

By Frank Quisinsky Date 2010-02-02 20:06

Hi Gerhard,

dem muss ich Dir leider widersprechen.

Ich sehe bis auf Rybka ca. 20 ELO unterbewertet in der SWCR keine Auffälligkeiten.

64-Bit Zuwachs stimmt, auch bei Naum ... ist weniger als 10 im Durchschnitt.

Zu anderen Listen sehe ich Unterschiede "CCRL, CEGT" nicht zu Ipon.
Also kann es nicht von Dir wie geschildert sein, dass auch IPON mit CCRL oder CEGT gleich wären.

Da muss einer von uns beiden Tomaten auf den Augen haben.

Aber:
Die Abweichungen sind aufgrund bekannter Umstände alle zu erklären.
Z. B. Hiarcs blitzt besser, Smarthink schlechter im Blitz ...

Oder von +- 10 durch Remisquoten.
Je höher desto aussagekräftiger.

Darüber habe ich glaube vor zwei Wochen ausführlich geschrieben, möchte das nicht alles wiederholen.

Grundsätzlich:
Ich habe nie geschrieben, das irgend eine Liste ultimativ gut ist.
Damit meine ich auch meine!

Aber es gibt bei den vielen unterschiedlichen Bedingungen auch Abweichungen.

Vertrete offenbar folgende abweichenden Thesen:

- es ist für eine Ratingliste in der "nur" verglichen wird, nicht notwendig wild zu mixen.
1-4 Cores, 64-Bit
Die Unterschiede sind doch absolut klar.
Selbst marginale Unterschiede von +-10 festzustellen, dafür lohnt der Aufwand nicht.
Aber das müssen die Listenbetreiber selbst für sich herausfinden, bestimmen etc..

- Im Grunde reichen schon ca. 500 Partien für ein gutes Rating aus.
Es ist nicht notwendig weitere 1000 folgen zu lassen.

- jede Engine sollte gegen jede Engine die gleiche Anzahl von Partien spielen.
Passiert das nicht kommt es wieder zu kleinen Abweichungen (der Hauptgrund für Abweichungen in den Listen, ganz egal wie viele Partien gespielt wurden

- Ponder on / off sorgt für interne Veschiebungen, die Ergebnisse sind gleich.
Das hängt mit dem Zeitmanagement zusammen. Viele Engines nutzen bei Ponder = off die Zeit nicht korrekt, haben zu viel Zeit übrig.

Wenn ich die Programmierung zum Zeitmanagement richtig verstehe, gibt es immer einen Bonus für Ponder-Treffer die kommen werden.
Kommt dieser Bonus nicht zu Stande, kommt es zu unterschiedlichen Zeiteinteilungen.

Allerdings macht das heute auch kaum noch etwas aus.
Vergleiche ich meine SWCR (Partie dauert 40 Minuten) mit Ingos Liste (Partie dauert 16-18 Minuten) sind die Unterschiede praktisch nicht der Rede wert.
Kann jeder prüfen, beide Listen stehen offen.
Rechne den durchschnittlichen 64-Bit Zuwachs hinzu.

Wie gesagt, es gibt zwischen den Listen nur wenige Abweichungen und es lohnt sich wirklich nicht richtig darüber zu diskutieren.
Ich kann hier einfach nichts mehr feststellen was nicht schon bekannt ist.

Meine Erkenntnisse durch die Vergleiche der Listen untereinander (meine inbezogen) sind fast gleich 0.

Also, worüber reden wir?

Wir können den ja mal umdrehen.
Ingo spielt mit 32-Bit, gleiche Engines wie in SWCR ... ich spiele mit 64-Bit gleiche Engiens wie Ipon.
Die Ergebnisse wären die Selben.

Nur ...
Wenn ich im Detail vergleiche ... SWCR mit IPON sehe ich die meisten Übereinstimmungen, oftmals fast absolut gleiche ELO-Zahlen.
Daher schaue ich gerne auf die Liste von Ingo, zumal sich unsere Bedingungen bis auf 32-Bit / 64-Bit fast angleichen.

Will hier auch niemanden ärgern bzw. herausstellen das nur das Eigene das Wahre ist ... so ticke ich nicht.
Aber ich schreibe über Eindrücke die sich immer wieder bestätigen.

Gruß
Frank

PS:
Ich sage Dir mal was ich für eine optimale Ratingliste halte!
Eine Liste die den ermittelten Ergebnissen von Menschen so nahe wie möglich kommt.

Könnte umgesetzt werden mit z. B. 100 gleichen Schweizer-System Turnieren.
Das hatte ich mal 2001 erspielt (aber nur 20).

So spielen die starken und die schwächeren Engines gegeneinander.
Kommt einer menschlichen ELO am nähesten.

Was die Listen-Betreiber derzeit veranstalten ist Hardcore pur.
Realitätsfremd und für Schachspieler, die nicht unbedingt über ausgeprägtes Computerschach-Wissen verfügen nicht nachzuvollziehen.
So kommt die Frage: Warum wird denn überhaupt ohne Ponder gespielt, verstehe ich nicht.
Das versteht ein Vereinsspieler nicht.

By Ingo Bauer Date 2010-02-02 20:32

[quote="Gerhard Sonnabend"]
Ingo, macht fast Spass heute.
[/quote]

Ich würde sogar beinahe über das 'fast' hinausgehen!

[quote="Gerhard Sonnabend"]
Weshalb nur hängst Du Dich so an dem "Gross" auf ?
Hätte ich "Beste", "Aussagekräftigste", etc. etc.
Liste(n) geschrieben, so würde ich die Aufregung verstehen.
[/quote]

Weil "Groß" aus dem Munde eines Machers sehr nach Eigenlob stinkt. Ich persönlich würde die Listen schlicht "bekannter" nennen.

[quote="Gerhard Sonnabend"]
O.K., nehmen wir mal an, dass weder Dein noch Unser (CEGT)
(oder mein bescheidenes) Konzept 100%ig in Ordnung ist.
Diese Annahme ist richtig (meine Sichtweise), da keine RL
100% perfekt sein kann. Dies aus verschiedenen
Gründen, welche ich Dir jedoch nicht aufzählen muss,
nicht wahr ?

Und ?
[/quote]

Kein Problem mit mir bis jetzt!

[quote="Gerhard Sonnabend"]
Fakt:
vergleiche ich z.B. meine QBRL mit Deiner Liste (IPON)
und/oder die CEGT-Blitz-Ratingliste mit Deiner Liste (IPON),
dann gibt es fast überhaupt keine gravierende Unterschiede.

Nicht vergessen, dass die Error-Margin von 95% "immerhin"
auch und u.a. bedeutet, dass 5 von 100 Engines ausserhalb
der Error-Bars liegen (müssen/können) !
[/quote]

Oh je, aber gut, am WE lege ich mal eure 40/20 und meine IPON von heute ordentlich nebeneinander. Mal sehen.
Allerdings geht es mir wie du weißt mehr um klare Konzepte (und nicht um das "wichtig ist was hinten raus kommt") und da ist deine Liste schon deutlich besser als die CEGT die nun wirklich alles in einen Topf wirft.

[quote="Gerhard Sonnabend"]
Alles in Allem gleichen sich die Listen doch sehr (an),
lediglich die von Frank weist z.Zt. doch einige (zu viele ?)
Abweichungen auf. Das mag aber auch daran liegen, dass er die
erwähnten "Anpassungen" (Vergleiche, Wichtungen... - siehe Thread)
anwendet, welche aus meiner Sicht überflüssig und vor allem
total unrichtig sind.
[/quote]

Apropos Anpassungen, wie war das noch mit den Zeiten und der HW der CEGT (+ verschiedene Bücher und Stellungen)!? Na wenigstens kannst du dir vorstellen wie es mir geht

[quote="Gerhard Sonnabend"]
Mir persönlich sind "echte" Vergleiche lieber und ich glaube
zu wissen, dass Du Dir denken kannst was ich jetzt meine ?

Übrigens kann man die PCs auch ganz anders "ausmessen" als mit
den von Dir erwähnten Benches ! Der Crafty-Bench schneidet jedoch
auch dabei bisher sehr gut ab.
[/quote]

Vielleicht mache ich mal am WE was mit dem Craftybench, die tatsächlichen Speedups für Shredder und Rybka von C2Q zu I7 habe ich noch hier, mal sehen was der Craftybench ermittelt und wie das für die beiden völlig verschiednen Engines passt.
Übrigens reagieren die beiden Engines verschieden sensitiv von C2Q zu i7 (R läuft noch besser auf dem i7, 20% Speedupgewinn Differenz zw. den beiden Enignes). Wie das EIN Benchmark hinkriegen soll ist mir ein Rätsel!!!! Wenn dann auch noch ein AMD da reinspielt, und wenn dann eine Mittelklasseengine hauptsächlich auf älter Hardware mitläuft und R4 demnächst nur die neusten Kisten bekommt haben wir einen 'Missmatch'.
Ich habe mich nicht wirklich mit dem Craftybench beschäftigt aber ich kann mir nicht vorstellen das er es wirklich schafft für Stockfish, Fritz, Naum + ALLE anderen Engines und verschiedene Leute die compiliert haben mit verschiedenen Compilern und Optimierungen ein ordentliches Ergebnis für den Speedup/down zu bringen!?

Gruß
Ingo

By Frank Quisinsky Date 2010-02-02 20:10

Hi Ingo,

AMD / Intel ...
Auch so ein Ding !!

Wenn Zappa auf AMD 30% schneller ist, sind dass ca. 15 ELO.
So kommt es zu einer Verschiebung wenn gemixt wird.

Und je mehr gemixt wird, desto mehr Verschiebungen.
Auch einer der Faktoren, richtig !!

Einen optimale Ratingliste wird auf gleichen Systemen erspielt.

Gruß
Frank

Und nun ...
Ziehen wir alle diese Faktoren zusammen:
Zeit, Ponder, Prozessor, 64-Bit, mehrere Cores, gar die Größe der Hash-Tabellen oder Nalimov etc.
werden die Listen immer geringfügig voneinander abweichen.
Das ist so.

By Frank Quisinsky Date 2010-02-02 20:25

Witzig ist:

Vor ca. 10 Jahren haben wir uns um 100 ELO Differenzen debattiert
Cor ca. 5 Jahren waren es 40 ELO Differenzen
Derzeit vielleicht 20 ELO Differenzen

In 10 Jahren sitzen wir mit unseren 4 32Core Notebooks im Park und debattieren über 1-ELO Differenzen von 3.500 ELO starken Engines

Hoffe das liest hier alles kein Vereinsspieler mit, der hält uns allesamt für restlos bescheuert und denkt sich ... lassen wir die mal lieber ganz alleine

So, nun wieder Fritz 7 anschmeißen, wollte noch etwas prüfen.

Ingo, Gerhard ...
wir sollten einen Club gründen.
Die mit den ELOs fechten.

Gruß
Frank

By Ingo Bauer Date 2010-02-02 20:39

[quote="Frank Quisinsky"]
...
Hoffe das liest hier alles kein Vereinsspieler mit, der hält uns allesamt für restlos bescheuert und denkt sich ... lassen wir die mal lieber ganz alleine

...
[/quote]

Ja, ich hatte mich neulich hier auch ausgelassen und gefragt was diese ganze X-Core Testerei wirklich soll. Wenn 1 auf 2 Cores 60 Elo brint (optimistisch) und 2 auf 4 40, frage ich welcher Mensch den Unterschied zw einer 2900 und 3000 Elo Engine sehen kann? (Noch schlimmer wenn zwei Enignes bei 1 Core 0 Elo auseinanderliegen und bei 4 Cores meinetwegen 30 Elo, wer kann den Unterschied zw. 2985 und 3015 Elo irgendwie sehen). Ein bischen muß ich dann sogar am Sinn meiner eigenen Testerei zweifeln.

Gruß
Ingo