Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Vorschlag für neue Liste....
- - By Andreas Wutzke Date 2010-08-08 18:16
Servus,

da sich doch einige auch für längere Bedenkzeiten interesieren, würde ich vorschlagen dass sich ein paar Leute zusammentun die das interesiert und eine Liste erstellen für folgende Bedenkzeit:

40 Züge in 120min + 40 Züge in 120min + Rest in 60 min.

alles auf 1 core mit ponder on dann macht das zuschauen auch mehr spass.

1.) Warum ponder on?
Nun ich hab den Eindruck dass das natürlicher ist denn ein menschlicher Spieler schaltet auch nicht sein gehirn aus wenn er nicht am Zug ist, auserdem könnten Programme die immer richtig pondern deutlich Bedenkzeit gewinnen, was natürlich auch ein plus ist und dann ist es auch beim zuschauen interesanter...man sieht gerade die eine Engine will folgendes spielen und die andere pondert das auch und zeigt aber dann ne ganz andere variante an...ect

2.) Warum 40z/120 + 40z/120 und nicht 40z/120 + 20/60 ....
Nun ja zunächst dachte ich früher dass 40 züge ausreichen und dass das dann folgenden Endspiel da ja weniger Steine auf dem Brett sind und mit den Tablebases auch bei verkürzter bedenkzeit korrekt gespielt wird. Dann hatte ich oft recht komplexe Positionen zwischen 50 und 60 Zug auf dem brett und gemerkt dass das noch keine richtigen endspiele sind und ganz andere Ergebnise rauskommen wenn die Engines hier mehr zeit haben....
Nach 80 Zügen ist aber in meisten Fällen ein Endspiel erreicht das auch bei verkürzter Bedenkzeit korrekt abgewickelt wird.

3.) Mit eigenen Büchern und lernen an...
Weil wenn man sich ein Engine besorgt, dann ist oft auch ein eigenes Buch dabei (bei den kommerziellen) und da kann man auch ganz schön arbeit reinstecken....und lernen an weil nun ja auch da gibts sicher engines die das besser können als andere warum sollte man diese dann nicht dieses Features auspielen lassen?
Für Engines die kein eigenes Buch mitbringen, sollte ein gutes Standardbuch verwendet werden...habt ihr dafür Vorschläge?

4.) Mit Tablebases, wenn die Engine das unterstützt....

Gruß
Andi
Parent - - By Benno Hartwig Date 2010-08-08 18:27
[quote="Andreas Wutzke"]2.) Warum 40z/120 + 40z/120 und nicht 40z/120 + 20/60 ....[/quote]In früheren Partiephasen bedeutet doppelte Zeit ungefähr ein Ply mehr.
Es mag sein, dass im Endspiel mehr (2 Plys?) möglich sind, da einfach im Mittel die Anzahl möglicher Züge geringer ist.
Ich verspreche mir aber von diesen 2 Plys wenig. Ich denke nicht, dass dadurch etwas wesentlich andersartiges entsteht.
22 Ply anstatt 20 oder so, bei ansonsten gleichen Bewertungskriterien und Suchstrategien.

[quote="Andreas Wutzke"]3.) Mit eigenen Büchern und lernen an...
Weil wenn man sich ein Engine besorgt, dann ist oft auch ein eigenes Buch dabei (bei den kommerziellen) und da kann man auch ganz schön arbeit reinstecken....und lernen an weil nun ja auch da gibts sicher engines die das besser können als andere warum sollte man diese dann nicht dieses Features auspielen lassen?[/quote]
Dann hast du keine Rangliste der Engines sondern eine der Engine-Buch-Gespanne.
Kann mann machen, wenn einen tatsächlich diese Gespanne interessieren. Interressieren sie?

[quote="Andreas Wutzke"]4.) Mit Tablebases, wenn die Engine das unterstützt....[/quote]...um die Engines aufzupeppeln, die Ohne Tablebases immer wieder dumme Fehler machen? Warum?

Benno
Parent - - By Frank Quisinsky Date 2010-08-08 18:40
Hallo zusammen,

habe die verschiedenen Spielstufen mal in Levels aufgeteilt (siehe Download Rubrik auf meinen Webseiten). Ich denke bei einem Core und Ponder macht maximal 40 in 60 Sinn. Die Unterschiede zu 40 in 120 (zeigen Spielanalysen) sind zu gering. Markant wird es ca. ab 6 Minuten pro Zug. Hier werden dann verhältnismäßig mehr "andere Züge" als bei 40 in 120 (3 Minuten pro Zug) gefunden.

Ansonsten stimme ich Benno absolut zu.

Learning macht meines Erachtens keinen Sinn, führt dummerweise auch nur zu mehr doppelten Partien bzw. immer die gleichen Varianten. Tablesbases machen auch nicht wirklich Sinn. Eine Ratingliste soll vergleichen, getestet werden nicht die Datenbankeinflüsse. Ferner würde der Schuss bei 5-Steinern gar nach hinten los gehen (Programme spielen mit weniger Leistung, alles schon x-Mal getestet, siehe Kommentare hierzu unter Beeinflussungsfaktoren bei Ratinglisten).

Mal schauen, habe im Hinterkopf eine "Level 4" Ratingliste erspielen zu lassen. Aber derzeit stehen die "Level 3" Listen im Vordergrund. Vielleicht starte ich das im nächsten Jahr. Brauche auch noch mehr Erkenntnisse zu den laufenden SWCR Ratinglisten. Das Problem ist einfach, das z. B. eine Level 4 Ratingliste sehr langweilig wird. Weniger Fehler bei den Engines = mehr Remispartien ... die Partien werden länger, Zügedurchschnitt geht weiter nach oben. Und dann 3 Stunden für eine Partie ... da hätte ich keine Lust mehr zuzuschauen. Vieles spricht einfach dagegen.

Bei einer Level 4 Ratingliste wird die Remisquote weiter ansteigen. Bedeutet das weniger Partien notwendig sind. Ich schätze mal, dass ca. 550 Partien für ein aussagekräftiges Rating ausreichen. Ca. 1.200 sind es beim Bullet, ca. 900 beim Blitz und ca. 620 bis vielleicht 650 beim Level 3.

Gruß
Frank
Parent - - By Ingo Bauer Date 2010-08-08 19:07
Hi Frank

[quote="Frank Quisinsky"]
... Das Problem ist einfach, das z. B. eine Level 4 Ratingliste sehr langweilig wird. Weniger Fehler bei den Engines = mehr Remispartien ...
[/quote]

Habe ich auch mal gedacht, aber irgendwie plappert man da sein Erwartungshaltung nach. Genauso wie es bei genauem hinsehen keinen Unterschied zw. langen und kurzen Bedenkzeitranglisten gibt, scheint mir das mit den mehr Remispartien auch nicht zu stimmen.

Wie du mir neulich vorgerechnet hast ist deine Rangliste rund doppelt so lang pro Partie wie meine. Hier nun mal dine paar Engines und deren Remisquoten die wir gemeinsam haben (und ich habe nicht asugesucht, sondern einfach von oben runter:

Remisquote IPON SWCR (x64):

                               IPON  SWCR     
   1 Deep Rybka 4              31%   28
   2 Stockfish 1.7.1 JA        35%   32
   3 Naum 4.2                  40%   38
   4 Critter 0.70              36%   37
   5 Komodo 1.2 JA             40%   40
   6 Deep Shredder 12          37%   35
   7 Zappa Mexico II           37%   40
   8 Protector 1.3.2 JA        38%   37
   9 Onno-1-2-7                39%   38
  10 Deep Sjeng WC2008         36%   37
  11 Deep Junior 11.2          30%   31
  12 Loop 13.6/2007            37%   35
  13 Twisted Logic 20100131x   30%   31

Durchschnitt:                  36%      35%


Siehe da, trotz doppelter Bedenkzeit hat dein Liste sogar ein Prozent weniger Remisquote (gerundet) ... wenn du willst darfst du gerne mal mit CCRL/CEGT/oder SSDF vergleichen.

Gruß
Ingo 
Parent - - By Frank Quisinsky Date 2010-08-08 19:23 Edited 2010-08-08 19:25
Hallo Ingo,

Remisquoten solltest Du immer in der Gesamtheit aller Ergebnisse sehen.
Die Remisquote liegt bei der SWCR bei 38%. 6% weniger war es beim Blitz. Insofern gehe ich davon aus, dass die Remisquote bei Ipon ca. bei 35% liegt. Einzelergebnisse herauszupicken macht nicht wirklich Sinn.

Ferner sind auch für eine Remisquote immer alle Faktoren einer Liste zu bewerten. z. B. spielst Du mit immer den gleichen Vorgabeeröffnungen. Auch aufgrund dieser Tatsache ist es schwieriger IPON Werte für einen solchen Vergleich hinzuzuholen.

Erwartungshaltung?
Ich habe keine Ingo.
Hetze die Engines aufeinander und werte so gut es geht die Ergebnisse aus. Was dabei raus kommt ist mir wichtig, nicht was ich erwarte was rauszukommen hat.

Unterschied lange und kurze Bedenkzeiten:
Das ist doch nun wirklich sehr einfach für Dich. Du kannst ablesen welche Engines sich zwischen IPON und SWCR ein wenig unterscheiden.

Lasse Komodo doch einfach mal mit doppelter Zeit ein paar 100 Game Matches spielen und vergleiche die Ergebnisse mit Deinen. Du wirst schnell herausfinden, dass es Engines gibt die hier deutlich von mehr Zeit profitieren. Dieses Thema hatten wir erst. Komodo und Junior bieten sich an und ich denke Du wirst nach diesen Ergebnissen eine andere Meinung bekommen. Ich habe mich auch stark gewundert. Bei Doch wurde es schon offensichtlich bei der SWCR-Blitz und SWCR 40 in 10 Liste.

Wenn Du aber immer nur mit gleichen Bedinungen testest wird Dir das eher verschlossen bleiben. Dann solltest Du aber auch nicht alles mögliche in Frage setzen.

Gruß
Frank

Nach Deiner Auflistung hätte die SWCR 35% Remisquote. Tatsächlich sind es aber 38% (siehe ChessBase Grafik). Wahrscheinlich könnte ich Dir nun auch alles mögliche an Konstellationen herausziehen um ein 36 zu 41 zu konsturieren. Geht nicht, weil Deine Partien nicht offen liegen. Du hast aber meine, also ... schaue Dir die Remisquoten der Ratinglisten an ... nicht nur irgend etwas herauspicken! Und ganz wichtig, bei den Remisquoten immer die durchschnittle ELO der Gegner in ein Verhältnis setzen.
Parent - - By Ingo Bauer Date 2010-08-08 19:46
Moin

[quote="Frank Quisinsky"]

Remisquoten solltest Du immer in der Gesamtheit aller Ergebnisse sehen.
Die Remisquote liegt bei der SWCR bei 38%. 6% weniger war es beim Blitz. Insofern gehe ich davon aus, dass die Remisquote bei Ipon ca. bei 35% liegt.
[/quote]

Die Gesammtremisquote steht bei mir gleich auf der ersten Seite und deckt sich nicht mit deiner Annahme:
Draws        :  39016 (37.2 %)

[quote="Frank Quisinsky"]
Einzelergebnisse herauszupicken macht nicht wirklich Sinn.
[/quote]

Frank, ich habe kein Einzelergebniss rausgepickt, sondern 13 Enignes die wir identisch haben als Durchschnitt, und da hat die dopplet so lange 64bit SWCR 1% weniger Remisquote. Kann sein das dir das nicht passt, aber einen Unterschied sehe ich nicht zw. Remisquoten IPON und SWCR!

[quote="Frank Quisinsky"]
Ferner sind auch für eine Remisquote immer alle Faktoren einer Liste zu bewerten. z. B. spielst Du mit immer den gleichen Vorgabeeröffnungen. Auch aufgrund dieser Tatsache ist es schwieriger IPON Werte für einen solchen Vergleich hinzuzuholen.
[/quote]

Richtig, aber auf diese Art und Weise haben wir einen Vergleich. Das du das ablehnst ist Bauchgefühl denn Zahlen für eine höhere Remisquote gibt es nicht.

[quote="Frank Quisinsky"]
Erwartungshaltung?
Ich habe keine Ingo.
[/quote]

OK, dann zeige mir Zahlen die die erhöhte Remisquote begründen!

[quote="Frank Quisinsky"]
Lasse Komodo doch einfach mal mit doppelter Zeit ein paar 100 Game Matches spielen und vergleiche die Ergebnisse mit Deinen. Du wirst schnell herausfinden, dass es Engines gibt die hier deutlich von mehr Zeit profitieren. Dieses Thema hatten wir erst.
[/quote]

Ja hatten wir und ich fragte welche Engine tatsächlich bei längeren Bedenktzeiten andere NAchbarn hat. Gemeldet wurde mir keine. Die meisten glauben wohl an Zappa, aber auch da habe ich mal IPON/SWCR/CEGT40/20 /CCRL 40/40 vergleichen - immer die selben Nachbarn. (Im Moment läuft Hanibal, dann wahrscheinlich Arasan (der sollte besser sein als mien Crafty) dann vielleicht mein Zappatest, sofern nicht etwas neues umwerfendes erscheint)

[quote="Frank Quisinsky"]
Wenn Du aber immer nur mit gleichen Bedinungen testest wird Dir das eher verschlossen bleiben. Dann solltest Du aber auch nicht alles mögliche in Frage setzen.
[/quote]

Nicht ganz so herrablassend Frank. Ich bin durchaus in der Lage mal über alle Listen zu vergleichen (du kennst meine Tabellen) da ist kein Unterschied zu sehen nirgends (CCRL weicht am meisten von den anderen ab, insofern ist diese Liste mien Sorgenkind) - sofern man wirklich ordentlich auf Abweichung minimiert, und nicht nur, wie auch ich es zunächst getan habe, die ganze Liste auf ein Enignerating schiebt.

Gruß
Frank

[quote="Frank Quisinsky"]
Nach Deiner Auflistung hätte die SWCR 35% Remisquote.
[/quote]

Nein Frank, nach miener Auflistung haben die 13 x64 Engines 35% Abweichung. Diese Engines habe ich gewählt weil wir die gleich haben. Bitte ließ oben noch mal nach.

[quote="Frank Quisinsky"]
Tatsächlich sind es aber 38% (siehe ChessBase Grafik). Wahrscheinlich könnte ich Dir nun auch alles mögliche an Konstellationen herausziehen um ein 36 zu 41 zu konsturieren. Geht nicht, weil Deine Partien nicht offen liegen. Du hast aber meine, also ... schaue Dir die Remisquoten der Ratinglisten an ... nicht nur irgend etwas herauspicken!
[/quote]

Frank, ich glaube du willst es nur nicht glauben. Meine Gesamtremisquote liegt offen auf der ersten Seite. Deine Gesamtremisquote der x64 Engines beträgt nicht 38, sondern laut DEINER Seite "Number of draws       =  2921 (34.8%)", deine 32 bit Quote liegt bei "Number of draws       =  3149 (37.5%)" und bei mir sind es: "Draws        :  39016 (37.2 %)" (Alles mit ELostat - das wird wogl stimmen)

AUF Deutsch: KEIN UNTERSCHIED nach allen Daten die wir haben.

Ich wiederhole: Nach allem was wir verlgeichen können gibt es keine Hinweise auf eine erhöte Remisquote zw unseren zwei Listen trotz doppelter Bedenkzeit.

Bitte lies das alles nochmal durch und vergleiche die Zahlen selber ehe du emotional aufgewühlt antwortest.

Gruß
Ingo
Parent - - By Frank Quisinsky Date 2010-08-08 19:56 Edited 2010-08-08 19:59
Hallo Ingo,

habe mir gedacht, dass ein solcher Beitrag von Dir folgt.
Daher setzte ich noch einen zweiten Beitrag, hattest Du sicherlich noch nicht gelesen.

Es sind bei Dir also 37,2. Damit ca. 2% mehr als ich dachte. Habe nicht gesehen, dass diese Statistik auf Deinen Seiten liegt, sorry!
Dennoch, deutlich geringere Remisquote als bei SWCR.

Die SWCR-64 kannst Du nicht direkt mit IPON vergleichen.
Bei der SWCR-64 spielen Engines, die über 400 ELO hinter Rybka liegen. Mithin sind unsere Remisquoten unterschiedlich, weil die ELO-Distance eine andere ist. Ich vermute mal das die ELO-Distance bei IPON ca. bei 100 liegt. Habe mal ein bissel gerechnet, genauer gesagt müsste die ELO-Distance ca. bei 99,4 liegen.

Du kannst aber schön ablesen (SWCR-32 und SWCR-64, dass je höhere die ELO-Distance, desto geringer ist die Remisquote.

Absolut korrekt vergleichbar wäre es nur dann, wenn wir Beide mit den gleichen Gegnern und der gleichen Match-Partie Aufteilung zu Gange wären. Sonst wirds kompliziert aber grundsätzlich dennoch berechenbar.

Sofern ich abwertend geschrieben habe, sorry das wollte ich nicht.

Gruß
Frank

Zahlen für eine höhere Remisquote gibt es. Die SWCR-Blitz wurde bis auf die Zeit mit gleichen Engines bzw. sonstigen Voraussetzungen gespielt. Allerdings nicht gleiche Matchaufteilung. Insofern hilft dann die ELO-Distanz um das zu berechnen.
Parent - - By Ingo Bauer Date 2010-08-08 20:02
Hi

[quote="Frank Quisinsky"]

Es sind bei Dir also 37,2. Damit ca. 2% mehr als ich dachte.
Dennoch sind es deutlich weniger als bei doppelter Bedenkzeit.
[/quote]

DEUTLICH und kurz:

IPON: 37.2 über alles
SWCR: 34.8 bei x64 lt, Website,
SWCR: 37.5 bei 32b lt. Website
SWCR: 38.3 über alles lt. FQ.

Die 37.2 sind für dich "deutlich weniger" als deine drei anderen offiziellen Zahlen.

Ich gebe auf!

Gruß
Ingo
Parent - - By Frank Quisinsky Date 2010-08-08 20:14 Edited 2010-08-08 20:18
Hi Ingo,

schwierig mit Dir heute.
Erinnere mich noch an unsere Naum 4.2 Diskussion. Ich sagte, es gibt keinen Zuwachs, Du kamst mit Berechnungen wie viel schneller Naum 4.2 ist. Aber ein Schachprogramm besteht nicht nur auf NPS.

Klicke auf Result Stat-2 unter meinen Banner und Du kannst die Remisquote aller 42.600 SWCR Partien einsetzen (liegt bei 38%). Ausgabe von ChessBase.

Nochmals:
Die Remisquote ist abhängig von ELO-Distanz. Spielen Engines gegeneinander die ELO-mäßig weiter voneinander entfernt liegen, sinkt logischer Weise auch die Remisquote. Daher solltest Du das immer in ein Verhältnis stellen. Sonst vergleichst Du Äpfel mit Birnen.

Einfacher:
Ein Rybka 4 wird gegen einen Stockfish 1.8.0 eine höhere Remisquote haben als gegen einen Daydreamer.

Viele Grüße
Frank

Finde diese Ausgabe des Programmes von Norm richtig gut. Denn alle ELO-Berechnungsprogramme haben hier ein Problem. Die ELO-Distanz wird vermutlich bei den Berechnungen nicht gebührend berücksichtigt. ELOstat hält sich mehr an Gewinn und Verlustpartien auf, Bayesian mehr an der Remisquote. Aber die ELO-Distanz scheint als Faktor für die ELO-Berechnung nicht entsprechend eingeflossen zu sein. Wäre mal ein interessante Frage an Frank Schubert bzw. einen Hinweis wert dieses Programm vielleicht nochmal zu verbessern.
Parent - - By Ingo Bauer Date 2010-08-08 20:26
Hi

[quote="Frank Quisinsky"]
schwierig mit Dir heute.
Erinnere mich noch an unsere Naum 4.2 Diskussion. Ich sagte, es gibt keinen Zuwachs, Du kamst mit Berechnungen wie viel schneller Naum 4.2 ist. Aber ein Schachprogramm besteht nicht nur auf NPS.
[/quote]

Was willst du mir damit sagen? Scheint mir aus dem Zusammenhang gerissen - Unzeifelhaft ist Naum 4.2 schneller, es gibt einen Zuwachs und besser als seine Vorgänger ist es auch (scheint mir ich hatte recht) und ein Schachprogramm besteht nicht nur aus NPS. Welcher Nebenkriegsschauplatz soll das jetzt sein?

Gruß
Ingo
Parent - - By Frank Quisinsky Date 2010-08-08 20:34
Hallo Ingo,

wir hatten im Forum seinerzeit eine Diskussion zu Naum. Ich schrieb, dass ich bei Naum keinen ELO-Zuwachs bei 64-Bit zu der 32-Bit feststellen konnte. Auf einem Q6600 machte ich Stichproben um die ELO-Zuwachs zu berechnen. Du hattest geschrieben, dass Naum doch deutlich schneller bei 64-Bit ist und das mindestens 20 ELO ausmacht. Ich gab es auf mir Dir darüber zu diskutieren, weil es keinen Sinn machte. Ich konnte meine Ergebnisse nicht veröffentlichen, weil nur Stichproben und hatte nur 32-Bit. Du hattest nur 64-Bit.

Nun hat die SWCR auch eine 64-Bit Ratingliste.

Einfach mal auf eine der beiden Ratinglisten klicken und dann mittels "Switch Funktion" zwischen den Listen switchen. Du kannst so sehr schön die ELO-Zuwachs ablesen. Bei Naum sind es derzeit +3 für die x64. Dieser Wert wird sich weiter korrigieren und wird weiter nach unten gehen. Seinerzeit hatte ich ausgerechnet -8. Ich gehe davon aus, dass Naum 4.2 x64 oder auch andere Naum Versionen noch ein bissel nach unten gehen.

Und warum ich das aufführte.
Es ist schwierig mit Dir zu diskutieren wenn Du von etwas überzeugt bist. Offenbar haben wir wieder ein Thema bei dem es vergleichbar schwierig ist. Es ist logisch das mit höherer Bedenkzeit das Partiematerial besser wird und die Remisqoten ansteigen. Das ist keine unlogische These, sondern war schon vor 20 Jahren schön anhand von Datenbanken und GM Partien abzulesen. Wobei GM Partien jetzt nicht unbedingt der Maßstab für einen solchen Vergleich sind. Die geben ja sehr gerne schon nach wenigen Zügen Remis um keine ELOs zu verlieren

Gruß
Frank
Parent - - By Ingo Bauer Date 2010-08-08 20:40
Frank,

mit mir ist es schwierig - interessant.

ALLE anderen Listen, ich wiederhole ALLE anderen haben von Naum 4.0/4.1 rund 20 Elo+ zu 4.2 und zwar sowohl bei 32 als auch bei 64 bit. Du hast nur 3 Elo und erwartest soger das es weiter runter geht bei dir. Nicht etwas das du an dir zweifelst, sondern du ignorierst alle anderen. Ich sehe es jetzt auch 'es ist schwierig mit mir'!

Gruß
Ingo
Parent - - By Frank Quisinsky Date 2010-08-08 20:50
Hallo Ingo,

es mag sein, dass alle anderen Listen ein Plus bei Naum Versionen von 20 ELO haben.
Aber auch ein Plus von w32 auf x64 bei länger werdenden Bedenkzeiten und Ponder?

Auch Naum profitiert von längeren Bedenkzeiten (denke aber nicht mehr als vielleicht 15 im Verhältnis zu den anderen Engines).

Verwechsel jetzt nicht + von Version 4.1 auf 4.2 oder von Version 4.0 auf 4.2.
Diese Werte sollten in allen Listen in etwa gleich sein.
Auch meines Erachtens das Einzige was überhaupt richtig verglichen werden könnte.

Der Unterschied von Naum 4.0 auf 4.2 ist bei der SWCR-32 = 42 ELO
Diese 42 ELO sind vergleichbar ...

Mal schauen wie es bei IPON ist ... 44 ELO

Siehst Du ...
Solche Dinge können wir vergleichen.
Und das wird bei anderen Listen nicht anders sein.

Aber die anderen Faktoren sind interessant ... z. B. die Bedenkzeit!

Ich zweifel die anderen Listen nicht an.
Dafür gibt es keinen Gründe.

Sind wir doch froh, dass wir unterschiedliche Listen haben die uns über "Merkwürdigkeiten" diskutieren lassen.
Nicht alles ist gleich Ingo.

Stelle Dir vor morgen kommt ein anderer Ingo Bauer und spielt alles was Du spielst mit Bullet.
Er hat völlig andere Ergebnisse als Du ... dann ist das heit so, weil er Bullet spielt.

Gruß
Frank
Parent - - By Ingo Bauer Date 2010-08-08 22:08 Edited 2010-08-08 22:10
Hi
Du meinst also von 32 auf 64 bit. OK.

Hier ein paar Fakten:

CEGT: 2 Kerne, 40/4: Naum 4.2 von 32 auf 64 bit = +38 ELo
CEGT: 1 Kern, 40/4: Naum 4.2 von 32 auf 64 bit = +28 Elo
CEGT: 1 Kern, 40/20: Naum 4.2 von 32 auf 64 bit = +10 Elo
CCRL: 1 Kern, 40/40: Naum 4.2 von 32 auf 64 bit = +37 ELo

Durchschnitt = 28 Elo von 32 auf 64 bit oder 33 Elo bei Blitz und 23.5 bei länger ...

Alles anderen vorhanden Kombinationen haben zu wenig Spiele (teilweise unter 100)

Ich weiß das wird dich auch nicht überzeugen und du wirst etwas finden warum das nicht geht.
Fakt ist, die 64 bit liegt überall VOR der 32 bit und nirgends 8 ELo hinter ...

Gruß
Ingo
Parent - - By Frank Quisinsky Date 2010-08-09 08:30
Hallo Ingo,

ich glaube es war die Naum 4.1 Version mit der ich das untersuchte. Weiß nicht mehr, kann derzeit nicht nachsehen. Aleksander schrieb bei Naum 4.0 / 4.1 glaube ich auch, dass er an Verbesserungen zu x64 arbeitet (bei seinen Ankündigungen der neueren Versionen). Mal schauen was morgen dabei herauskommt wenn ich die beiden SWCR Listen aller Partien zusammenfüge.

Gruß
Frank
Parent - - By Ingo Bauer Date 2010-08-09 09:27
Moin

Frage zum "Zusammenfügen". Die einzige Enigne die du in beiden Listen gleichzeitig führst ist dann die S12 32bit? Ist das korrekt? Wenn ja, hoffe ich, dass du das ganze auf mindestens 5 "Ankerpunkte" legst. Einer alleine ist zu ungenau.

Gruß
Ingo
Parent - - By Frank Quisinsky Date 2010-08-09 09:53
Hallo Ingo,

die Frage stelle ich mir auch die ganze Zeit.
Da innerhalb der beiden Listen, die zusammengeführt werden, die Cluster aber mehr als ausreichend sind und unter den gleichen Bedingungen gespielt wurde ist das glaube ich gar nicht notwendig. Werde später auch noch Sjeng 32bit gegen alle 64-bit spielen lassen (siehe unter Punkt 5 der Aktuell Seite). Zwecks Überprüfung aber das steht derzeit noch nicht an. Möchte erst die ToDo Liste abarbeiten.

Bin mir aber selbst nicht sicher. Sollte einfach abzulesen sein wenn es zu anderen Differenzen kommt als jetzt innerhalb der 32bit / 64bit Liste.

Gruß
Frank
Parent - - By Ingo Bauer Date 2010-08-09 10:23
Moin,

Wenn du nur eine Engine nimmst die in beiden Listen vorkommt, geht das auch ohne echte Spiele. S12 in 32 und 64 bit ist praktisch identisch (+/- 5 Elo). Eigentlich mußt die die Engine nur gleichbennen und zusammenwerfen. Leider ist das nicht korrekt weil du nicht über alle Engines auf ein Minimum an Abweichung abgleichst. Je mehr Enignes in beiden Listen spielen desto besser. Selbst 2,3 Engines sind wenig. Als Minimum würde ich sagen das es 5 Engines sein sollten die Spielstärkemäßig möglichst weit auseinander liegen.

Mach dir mal den Spaß und nimm deine beiden Listen, bennene Shredder gleich und wirf die PGNs zusammen. Dann mach die Liste nochmal nachdem du mit S12-32 in der x64 Liste fertig bist. Viel Unterschied wirst du nicht sehen.

Bye
Ingo
Parent - By Frank Quisinsky Date 2010-08-09 10:46
Hallo Ingo,

könnte ja dann jeder machen wer möchte. Werde das mal ausprobieren.

Wie gesagt, ich glaube nicht das es notwendig wird jetzt für fünf Vergleichswerte zu sorgen.
Aber Du könntest natürlich Recht haben.

Die Gesamtratingliste steht auch nicht im Vordergrund.
Wenn Zeit vorhanden ist werde ich diese nutzen und z. B. einen Sjeng gegen alle spielen lassen.
Oder einen Zappa, Thinker aber das steht alles nicht im Vordergrund.

Eine nette Spielerei, mehr nicht.
Finde die w32 und die x64 getrennt sind wichtiger.
Wobei hier auch eher die Listen jeder gegen jeden und nicht die Listen aller Partien.

Wichtiger ist es für mich eher von 21 auf 23 Engines auszubauen.
So wie es ausschaut wäre Crafty ein Kandidat für die w32 Liste. Auch GullChess (wenn Ponder Mode und der Autor sich zu seinem Namen bekennt). In der 64-Bit Liste werden eh mehr als 21 spielen durch die Amateure die ich laufend hinzuholen werden. Die Liste dann auf 23 auszubauen ist kein Problem.

Also meine Prio ist:

1. Ratingliste w32 (die derzeit auf 8400 Partien beruhende Liste)
2. Ratingliste x64 (die derzeit auf 8400 Partien beruhende Liste)
3. Die beiden Listen aller Partien w32 und x64
4. Die zusammen gemixte w32 / x64 Liste

Bei den Arbeiten an den Listen

1. ToDo Liste
2. Von 21 auf 23 ausbauen.
3. Weitere Engines für die zusammen gemixte zwecks besserer Eichung (wie gesagt, glaube das ist gar nicht notwendig)

Problem was ich habe:
Wenn ich besser vergleichen möchte, sollte ich Shredder 12 x64 in der 64-Bit Liste auch durch Shredder 12 w32 ersetzen. So werden beide Listen auf Shredder 12 w32 geeicht. Du magst sicherlich Recht haben, dass es hier nicht zu Unterschieden kommt aber das wäre sauberer. Denke ich werde das auch so machen. Würde bedeuten, dass Shredder 12 x64 nur noch in der Liste aller Partien auftaucht und in der x64 Liste eine w32 Engine spielt. Was mir allerdings auch nicht sonderlich gut gefällt.

Gruß
Frank
Parent - - By Frank Quisinsky Date 2010-08-08 19:37
Hi Ingo,

mit ins Verhältnis setzen ist gemeint:

Code:
SWCR-32 - 8400 Partien
Maximum ELO distance  = 332
Average ELO distance  = 113.371
Number of White wins  =  3018 (35.9%)
Number of draws       =  3149 (37.5%)
Number of Black wins  =  2233 (26.6%)


Code:
SWCR-32 - 29.200 Partien
Maximum ELO distance  = 321
Average ELO distance  = 98.708
Number of White wins  = 10530 (36.1%)
Number of draws       = 11187 (38.3%)
Number of Black wins  =  7483 (25.6%)


Bedeutet:
Je niedriger die durchschnittliche ELO-Distanz ist, desto höher wird die Remisquote.

Insofern kannst Du nicht einfach IPON mit SWCR-64 vergleichen.
In der SWCR-64 spielen Engines wie Daydreamer ... gegen solche Engines machen alle anderen deutlich weniger Remispartien.
Setzt Du jetzt aber ...

Average ELO distance ins Verhältnis zur durschnittlichen ELO-Zahl der Datenbank und der Remispartien ist die Kurve deutlich zu sehen.
Mit mehr Zeit steigen die Remisquoten an!

Hoffe, jetzt etwas einfacher ...

Gruß
Frank
Parent - - By Ingo Bauer Date 2010-08-08 19:52
Hi

[quote="Frank Quisinsky"]

Code:
SWCR-32 - 8400 Partien
Maximum ELO distance  = 332
Average ELO distance  = 113.371
Number of White wins  =  3018 (35.9%)
Number of draws       =  3149 (37.5%)
Number of Black wins  =  2233 (26.6%)


Code:
SWCR-32 - 29.200 Partien
Maximum ELO distance  = 321
Average ELO distance  = 98.708
Number of White wins  = 10530 (36.1%)
Number of draws       = 11187 (38.3%)
Number of Black wins  =  7483 (25.6%)


[/quote]

Am Rande: Wo hast du denn diese Zahlen her? Dein Seite ist, wie immer und schön häufiger geäussert, verwirrend.

Wenn ich auf die Seite komme, schaue ich mich nach einer Rangliste um. Am Linken Rand sehe ich eine "Ratings: SWCR x64". Daklicke ich drauf und finde die oben genannte Zahlen, die von den vn dir genannten abweichen.

Ja das soll Kritik am dienm Webseitenchaos sein, wenngleich ich keinerlei Kritik an meiner Seite brauche, weil ich weiß das das im Computerschachbereich ohne jeden Verlgeich ist (gibt es jemanden der gegen Namensnennung eine neue/bessere Webseite für mich entwerfen will )

Gruß
Ingo

PS: Selbst deine neuen Zahlen sind nicht wirklich groß anders als meine, ich glaube du willst einen Unterschied sehen.
Parent - - By Frank Quisinsky Date 2010-08-08 20:05
Hallo Ingo,

ich finde, dass meine Seite absolut übersichtlich ist.
Aber solche Dinge liegen auch immer im Auge des Betrachters.

Es gibt eine SWCR-32 und eine SWCR-64.
Die Ergebnisse kannst Du einfach ansehen indem Du auf die entsprechenden Links klickst.

Informationen über die Statistik-Ausgaben findest Du im Bereich "Aktuell". Dort versuche ich seit kurzer Zeit Fragen zu beantworten. Einfach mal nachschlagen, vielleicht mit der Suchfunktion vom Browser (nach summary) suchen lassen. Die Programme sind von Norm Pollock. Seit kurzer Zeit versuche ich Norm auch Ideen für neue PGN / EPD Tools zu mailen. Er macht da eine ganze hervorragende Arbeit.

Und nochmals.
Ich glaube Du willst nur das sehen was Du sehen möchtest und spiegelst das auf mich.
Meine Statistiken sind belegt anhand von Downloads und können jederzeit selbst überprüft werden.
Würde ich zu anderen Ergebnissen kommen, würde ich das auch in Beiträgen von mir berücksichtigen.

Haben wir aber jetzt wirklich mal eine andere Meinung ...
Prima, dann lohnt es sich ja der Sache im Detail nachzugehen ...
Einer von uns Beiden wird zu einer neuen Erkenntnis kommen. Bin ich das ... SUPER ... dann hat es sich für mich gelohnt.

Viele Grüße
Frank
Parent - - By Ingo Bauer Date 2010-08-08 20:14 Edited 2010-08-08 20:17
Frank, Hier ein Bild von deiner Seite:



Wenn ich in oberen roten Kreis klicke, sehe ich unteren roten Kreis. SWCR-64 auf der Hauptseite, sollte wohl zu deiner HAUPT x64 Rangliste führen. Alles andere ist verwirrend.
Soll ich dir jetzt alle Zahlen als Bildschirmfoto liefern oder willst du selbst mal nachsehen!?

Woher soll ich wissen welche von den vielen Statistik du gerade gerne für deine Argumentation herranziehen willst? Ich habe mien Zahlen mit 2 Klicks beschafft! Komme ich zu den von dir erwähnten Zahlen irgendwie schneller?

Bye
Ingo
Parent - - By Frank Quisinsky Date 2010-08-08 20:22
Hallo Ingo,

es gibt ja auch nur eine Liste auf Deinen Seiten.

Bei mir sind es vier Listen.

Liste jeder gegen jeden 40 Partien bei 21 Engines = 8.400 Partien
und die Liste aller gespielten Partien

Je für 32 und 64Bit.

Am Dienstag wird eine Liste zur Verfügung stehen die alle Partien vereint.
Also, dann ca. eine Liste aller gespielten ca. 44.000 Partien.

Die von Dir aufgeführte ist die SWCR-64 Hauptratingliste die sich im Aufbau befindet.
Schaue mal auf die letzten drei Plätze. Diese Engines verursachen eine niedrigere Remisquote ... siehe meine anderen Beiträge zur ELO-Distanz!

Viele Grüße
Frank

Wahrscheinlich reden wir aneinander vorbei weil Du dich mit der ELO-Distanz noch nicht beschäftigt hast?
Richtig?
Parent - - By Ingo Bauer Date 2010-08-08 20:29
[quote="Frank Quisinsky"]
...
Wahrscheinlich reden wir aneinander vorbei weil Du dich mit der ELO-Distanz noch nicht beschäftigt hast? Richtig?
[/quote]

Je mehr Spiel, je mehr Enignes, desto mehr gleicht sich das alles an, sprich extreme Abweichungen fallen nicht mehr ins Gewicht. Nimm deine Liste, schmeiss die zwei extremsten Abweichungen nach oben und unten raus und schau dir mal den Durchschnitt an. Du solltest extrem wenig änderung haben!

Achtung Returkutsche: Ich glaube eher wir reden aneinander vorbei weil du von Statistik keine Ahnung hast? Richtig?

Bye
Ingo
Parent - By Frank Quisinsky Date 2010-08-08 20:38
Hallo Ingo,

sehr richtig, habe davon keine Ahnung.
Wenn es Dich dann beruhigt!

Aber wenn Du dich mit dem Thema mal näher beschäftigen möchtest, rechne die ELO-Distanz mit ein.
Du kannst keine beliebigen Datenbanken einfach so vergleichen.
Das funktioniert nicht!

Gruß
Frank
Parent - - By Benno Hartwig Date 2010-08-08 21:12
[quote="Frank Quisinsky"]Markant wird es ca. ab 6 Minuten pro Zug. Hier werden dann verhältnismäßig mehr "andere Züge" als bei 40 in 120 (3 Minuten pro Zug) gefunden.[/quote]Weil mich das sehr überrschte, und weil ich Material dazu auf deiner Seite nicht fand:
Wo finde ich Material zu diesen 3m/zug vs. 6m/zug -Unterschieden?
Benno
(Hatte halt nicht erwartet, dass es da mehr Unterschiede als zwischen 1m/zug und 2m/zug gibt, eher weniger.)
Parent - By Frank Quisinsky Date 2010-08-09 08:27
Hallo Benno,

das ist natürlich Hardwareabhängig.
Bevor ich die SWCR startete machte ich eher ab und an mal Partieanalysen mit dem Q9550. Dabei viel mir auf, dass wenn wirklich "vermutlich" bessere Züge kamen die TOP-5 diese durchschnittlich nach ca. 6 Minuten spielten. Seinerzeit analysierte ich mit einem Core, 4 Engines gleichzeitig und w32.

Beschäftige mich mit dem Thema. Schön wären automatische Analysen mit EPD files. Fragte Norm ob er ein entsprechendes Tool programmieren könnte (er arbeitet jetzt daran). Dann wird es sicherlich einfacher werden, die Vermutung besser auszuwerten.

Gruß
Frank

PS: In Anlehnung die optimale Zeitkontrolle für eine Ratingliste mit höheren Zeitkontrollen zu finden (bevor tausende von Partien gespielt werden).
Parent - - By Ingo Bauer Date 2010-08-08 18:37
Hi

Ausser das dort mit 4 Kernen statt mit einem gespielt wird ist das praktisch identisch zur SSDF ...

Mein Problem an der Sache ist das solche langen Bedenkzeiten mit TOP Enignes von keinem Menschen mehr in Echtzeit, und nur von ganz wenigen mit Engineunterstützung nach stundenlanger Analyse begriffen werden können. Irgendwie geht mir der Sinn verloren, wenn bei einer solchen Rangliste auch nichts anderes rauskommt als bei den etablierten Listen mit deutlich kürzerer Bedenkzeit ...

Auch die neue 1 Core Liste der CEGT läßt mich grübeln. Wenn man davon ausgeht das sie das dreifache an Bedenkzeit zu ihrer 4 Core 40/20 Liste haben (was mir optimistisch vorkommt) dann wären das im Schnitt 1.5 Plys tiefer. Wie viel anders soll eine solche Liste denn aussehen das es sich lohnt, oder anders gefragt, könnte man die Rechenzeit nicht einsetzen um die eigenen Liste mehr zu fundamentieren?

Gut hingegen finde ich das in letzter Zeit nicht mehr auf dem "Mehrcorewahn" bestanden wird. Warum weiß ich nicht, aber wenn sich der Trend fortsetzt, muß bald auch nicht mehr mit maximaler Menschzeitkontrolle gespielt werden.

Aber OK, jeder soll nach seiner Fasson selig werden. Viel Glück bei der Suche, ich wünsche viel Erfolg - und sei es nur um einen Unterschied zu bestehenden Listen zu sehen oder auch nicht.

Gruß
Ingo
Parent - - By Andreas Wutzke Date 2010-08-08 18:58
Hi,

nun eine neue Blitzliste brauchen wir sicher nicht. Davon gibts genug und ihr macht da auch gute Arbeit.
Ich will eben eine Liste machen die es so nicht direkt gibt.

Es gibt durchaus unterschiede zur SSDF, da gehts in letzter Zeit etwas zäh voran, ausserdem sehe ich da viele interesante Engines wie z.B, Houdini nicht auch kein R4, Stockfish etc...
also ich denke die neue Liste sollte offen sein für alles was interesantes schach spielt....

Dann warum nochmals 40z in 120...nun mag sein dass es bei den aktuellen top 20 engines nicht mehr so viel unterschied macht...aber ich beschäftige mich auch mit vielen älteren Engines und bei diesen macht es tatsächlich einen unterschied ob sie in komplexen positionen nochmals 40z in 120 haben oder etwa rest in 60min da kommen oft ganz andere ergebnisse raus...

Ich hätte gerne eine Liste in der einige Klassiker (wie z.B, Chess Genius, Rebel, M-chess sowie aktuelle Programme wie Rybka, Stockfish vertreten sind....)

und alles auf aktuelles HW z.. I7 920 oder 860

Gruß
Andi
Parent - - By Ingo Bauer Date 2010-08-08 19:10 Edited 2010-08-08 19:19
Moin

Du willst also alles Neue und die alten Klassiker, das ganze in langer Bedenkzeit, aktuell und auf neuer Hardware!?
Du brauchst kein Glück, du brauchst einen Sponsor!

Gruß
Ingo
Parent - - By Andreas Wutzke Date 2010-08-08 19:19
Servus Ingo,

dann wäre das auch für dich interesant, es gibt doch das Gerücht dass manche Engines bei höheren Bedenkzeiten überproportional zulegen.
Dass könnte dann aus der neuen Liste im Vergleich zu deiner bzw SWCR leicht erkennen können....

naja alleine schaff ich das nicht brauch keinen Sponsor aber durch aus 4-5 Leute mit entsprechender HW die da mitmachen wollen

und natürlich ist es kaum möglich und auch interesant alle alten Programme zu integrieren aber ich denke 1-2 Versionen von jedem Klassiker wie z.B. Chess Genius 1 und 3 oder Shredder 5 und 7 oder Hiarcs 7.32 und Hiarcs 9,  Mchess 8.0 wären interesant....

Als weiterer Punkt würde solch eine Liste als Abfallprodukt eine menge hochklassiger Partie liefern....die könnten z.B. für Taktik Teststellungen, Bücher etc benutzt werden....

Gruß
Andi
Parent - - By Frank Quisinsky Date 2010-08-09 08:32
Hallo Andi,

sehr richtig, zumal die SWCR mit doppelter Bedenkzeit als IPON spielt und beide Listen "Ponder = On" Listen sind. Ansonsten ist die SWCR gut vergleichbar zur CEGT. CEGT spielt ca. 40 in 12 im Vergleich zu mir (allerdings ohne Ponder). Rechnet Du den Ponder Zuwachs mit ein wäre CEGT ca. 40 in 8 im Vergleich zur SWCR. CCRL wäre ca. 40/16 im Vergleich zur SWCR. Die CCRL spielt derzeit auf dem höchsten Level (grob aus dem Kopf gerechnet).

Gruß
Frank
Parent - - By Wolfgang Battig Date 2010-08-09 12:36
[quote="Frank Quisinsky"]
...Die CCRL spielt derzeit auf dem höchsten Level (grob aus dem Kopf gerechnet).

...[/quote]

das stimmt denn CCRL hat als Grundbedenkzeit 40/40 adaptiert auf AMD-X2-4200+ (oder so ähnlich).

Länger ist dann nur unsere 40/120 (wenn sie denn mal wieder aktuell ist...) und die SSDF, die aber auch nicht
aktuell ist (kein Rybka 4, kein Stockfish usw.)
Parent - By Frank Quisinsky Date 2010-08-09 18:34
Hallo Wolfgang,

wobei die SSDF auch nicht gerade aktuell ist und beim Test auf viele Engines verzichten muss.

Für mich alleine wäre bei meiner Hardware maximal 40 in 30 bei Ponder = on denkbar.
Dann mit Aufgabefaktor um den Partiedurchschnitt zu minimieren und wahrscheinlich maximal die TOP-18.

Immerhin wäre das dann ca. die doppelte Bedenkzeit zur CCRL.

Gruß
Frank
Up Topic Hauptforen / CSS-Forum / Vorschlag für neue Liste....

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill