Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Stockfish5-Listenplätze
1 2 Previous Next  
- - By Benno Hartwig Date 2014-06-05 15:00
Andreas machte darauf aufmerksam, und ich finde dieser Hinweis gehört auch hin das Stockfish-Forum:
CCRL hat in der 40/4-Liste jetzt eine erste Einsortierung von Stockfish 5 im Netz:
http://www.computerchess.org.uk/ccrl/404/

1  Stockfish 5 64-bit 4CPU  3370  +17  −17  73.6%  −159.3  41.3%  1242
2  Houdini 4 64-bit 4CPU    3336  +15  −15  68.0%  −137.2  37.9%  1641
3  Komodo 7a 64-bit 4CPU    3322  +15  −15  61.5%   −75.8  45.6%  1334
4  Gull 3 64-bit 4CPU       3277  +19  −19  63.5%  −103.2  39.6%   985
... 
   Stockfish DD 64-bit 4CPU 3311  +15  −15  66.7%  −123.5  42.4%  1558

Mal schauen, wo dieser SF5 dann in den anderen Ratings landet.

Benno
Parent - - By Benno Hartwig Date 2014-06-05 16:01
Ingos Listen, in denen H4 und SF5 ja ungefähr gleichauf liegen, gehören ja auf jeden Fall mit zu diesem Bild:
http://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=80488#pid80488
Benno
Parent - By Bernhard Traven Date 2014-06-05 16:46
hier ist SF 5 auch vorne:
http://sedatchess.webs.com/ratings
Parent - - By GS Date 2014-06-05 21:33
Bei uns, CEGT, sieht es bisher so aus:

40/4, hier haben Wolfgang und Leto bereits 1750 Spiele zusammen,
wohl ca. + 20 vor Houdini 4.0 x64 1CPU
(das update f.d. Liste werde ich am Samstag online stellen)

40/4, 4CPU, hier hat Leto auch schon einige Spiele fertig,
ca. + 30 vor Houdini 4.0 x64 4CPU, allerdings noch sehr wenige Spiele !

In unserer 5'+3" pb=on sieht es z.Zt. (1000 Spiele fertig) so aus wie bei IPON,
"Kopf an Kopf - Rennen" um Platz # 1, siehe:
http://cegt.forumieren.com/t153-testing-stockfish-50-x64
Parent - - By Andreas Aicher Date 2014-06-05 22:10
Hallo Gerhard,
vielen Dank für die Info, sehr interessant, dass es ähnlich knapp wird, wie bei Ingo, sollte 5+3 auf einer CPU H4 besonders oder S5 weniger liegen?
Hier nur ein knapper Sieg gegen H4 und gar nur 25:25 gegen K7a (allerdings konnte H4 gegen K7a ja auch nicht gewinnen), bisher, auch bei Ingo, konnte S5 diese Duelle relativ klar gewinnen.

mfG
Andreas
Parent - - By Benno Hartwig Date 2014-06-05 22:19
Wenn es Listen gibt, in denen SF5 einigermaßen klar führt, und wenn es andere gibt, in denen es knapp ist, dann fällt das 'Warum?' ins Auge.
- Kurze Zeiten? Bei CCRL 40/4 konnte SF5 überzeugen.
- Ist es die Gegnerwahl? Im Durchschnitt stärkere? Oder auch viele Schwache? Könnte sein?
Da wäre wieder die Gretchenfrage: Welche Gegnerschaft interessiert besonders und sollte relevant sein?

Benno
Parent - - By Andreas Aicher Date 2014-06-05 23:02
das ist es nicht, kurze Zeiten, ich glaube, was ich bisher gelesen habe, ist bei 40/40 der Abstand vielleicht noch grösser, als bei 40/4, aber diese Tests laufen noch.
Aber in den Listen, wo S5 noch nicht führt, ist der Abstand wohl derart gering, weit innerhalb des ErrorM.
Ich denke mal, der Eindruck, dass S5 inzwischen die stärkste Engine ist, wird sich weiter erhärten.

Andreas
Parent - - By Benno Hartwig Date 2014-06-06 06:29

> Aber in den Listen, wo S5 noch nicht führt, ist der Abstand wohl derart gering, weit innerhalb des ErrorM.


Stimmt sicher.
Es geht mir aber nicht um die spitze Fragen, ob SF dort Nr. 1 oder 2 ist, sondern um den Unterschied der ELO-Differenz zu z.B. Houdini.
Wenn 2 Listen hier sehr unterschiedliche Differenzen ausweisen, dann ist schon interessant zu gucken, ob allein die Errorbar schon einen ausreichenden Hinweis gibt, oder ob nicht doch auch andere Gründe gefunden werden sollten.
CCRL nannte immerhin 34 ELO zwischen SF5 und H4.

Benno
Parent - - By Ingo B. Date 2014-06-06 06:48
Hallo

Neben der normalen Errorbar, und die würde ich im Moment noch favorisieren, gibt es noch echtes Schach und Artificalschach, aka Ponder ON und OFF.

Keine Ahnung ob es daran liegt, glaube ich eher nicht, auch DIE Gegner sind es nicht, solange es genug sind. Wie gesagt Errorbar hat die größte Wahrscheinlichkeit.

Gruß
Ingo
Parent - - By Timo Haupt Date 2014-06-06 09:47
Wenn ich mich auch mal kurz in die Diskussion einschalten darf: Ich halte ausnahmsweise mal Ponder=On für einen möglichen Faktor, denn ich weiß von R. Houdart, dass er sich sehr viel Mühe bei der cleveren Ponder-Nutzung gegeben hat. Hier hat Houdini vielleicht Stockfish etwas voraus. Ist natürlich durch nichts bewiesen, dafür müsste Ingo nochmal zwei Testruns (je einen Spießroutenlauf für Houdini und einen für Stockfish) unter sonst gleichen Bedingungen mit Ponder=Off durchführen (was er sicher nicht machen wird, da vermutlich Zeit- und Stromverschwendung), aber wenn dabei ein signifikant anderes Ergebnis rauskäme (z.B. SF5 nun +30 vor Houdini), dann wüssten wir, ob Ponder On/Off die Ursache ist.

Gruß
Timo
Parent - - By GS Date 2014-06-06 11:37
Ist für mich persönlich in diesem Fall auch vorstellbar, da sowohl die
CEGT 5'+3" pb=on und die IPON, ebenfalls pb=on, Houdini und Stockfish
quasi punktgleich an der Spitze liegen haben.
Die CEGT und CCRL Listen jedoch, welche mit pb=off gespielt werden,
zeigen Stockfish im Bereich von 20-30 Punkten vorne.
Parent - - By Benno Hartwig Date 2014-06-06 11:45
Wenn sich diese deutliche Wirkung von Pondern bestätigen sollte (Ich fänd es heftig. Solche Unterschiede hätte ich nicht für möglich gehalten!), dann sollte unbedingt mehr mit Pondern getestet werden. (Wenn!!)
Denn wenn jemand Interesse nicht an irgendeiner sondern an einer möglichst großen(!) Engine-Spielstärke hat, dann wird er seiner Engine sicher die ganze Maschine gönnen wollen, und dies auch in den Zeiten, in denen die Gegnerzeit läuft.

Benno
Parent - - By Andreas Aicher Date 2014-06-06 11:59 Upvotes 1
aber gegen Stockfish im direkten Duell und überhaupt gegen die Topengines erzielt H4 auch keine besseren Ergebnisse, das ist v.a. in der IPON Liste ersichtlich, sondern wiederum auch nur gegen die sogenannten Schwächeren.
Alles nicht so einfach, spielt jetzt H4 nur gegen die zweite Garnitur mit ponder on, wenn überhaupt, besser als S5 oder K7a ?
Nebenbei ponder on brächte bei der Analyse gar nichts

Andreas
Parent - By Benno Hartwig Date 2014-06-06 13:42

> Nebenbei ponder on brächte bei der Analyse gar nichts


Klar.
Die Anforderung an eine gute Analyse-Engine sind wohl auch eh so, dass leicht mal eine gewählt werden kann, die nicht unbedingt ganz vorn auf den Gewinnerlisten steht. Das hat ja auch was damit zu tun, wieviel der Mensch mit den Ausgaben (HV und Wert) anfangen kann. Und es ist noch nicht lange her, dass sie 'springenden' SF-Ausgaben, so sau-erfolgreich das SF-Spiel da auch schon gewesen sein mag, einigermaßen verwirrend wirkten.

Benno
Parent - - By GS Date 2014-06-06 12:31
Ist ja alles nur Vermutung.
Bisher gab es nur wenig spürbare Auffälligkeiten bezügl. pb=on oder pb=off.
Möglicherweise "pondert" Stockfish 5.0, oder Stockfish allgemein, nur schlechter als Houdini
und dies fällt bei geringeren Bedenkzeiten mehr ins Gewicht ?!

Hier mal eine Aufstellung der Abstände von Houdini 4.0 zu Stockfish DD:
Code:

IPON     CEGT 5'+3"   CEGT 40/4  CEGT 40/20
(pb=on)  (pb=on)      (pb=off)   (pb=ff)
  45         43          30         19

Bei pb=on ist der Abstannd von Houdini auf Stockfish (DD) grösser als bei pb=off.
Parent - - By Benno Hartwig Date 2014-06-06 13:35
Hatten die Gegner von SF und H in diesen drei Wettbewerben durchschnittlich eigentlich ungefähr eine gleiche Stärke?
Benno
Parent - By GS Date 2014-06-06 15:17
Benno Hartwig schrieb:

Hatten die Gegner von SF und H in diesen drei Wettbewerben durchschnittlich eigentlich ungefähr eine gleiche Stärke?
Benno


Das hätte man aber schon selbst finden können, aber was solls, selbst ist der Mann,
deshalb:
Gegnerdurchschnitte im Vergleich
Code:

               IPON     CEGT 5'+3"   CEGT 40/4  CEGT 40/20
               (pb=on)  (pb=on)      (pb=off)   (pb=ff)
Houdini 4.0    2898     2885         2979       3013
Stockfish DD   2860     2887         2989       2981


Nur, was soll das aussagen ?
Parent - - By Andreas Aicher Date 2014-06-06 13:11
Hallo Benno,
ich sehe jetzt nicht, dass ponder on jetzt mit möglichst grosser Engine Spielstärke zusammenhängen soll, nimm einen Quad, dann müsstest Du auf 2 Kerne pro Engine gehen, wäre das besser als ponder off mit 4 Kernen, vielleicht bei kürzeren Bedenkzeiten, beil längeren würde dieser Effekt wohl eher verpuffen, glaubst Du, dass jetzt eine grössere Engine Spielstärke zu erwarten wäre?
Wenn Du jetzt die Spiele auf einen Core, wie bei IPON und CEGT 5+3 p.o. gespielt werden, ok (bei 2 Kernen wäre dieser Effekt ja vielleicht schon wieder verpufft, wenn überhaupt vorhanden)
Aufgefallen ist dieser, falls es denn wirklich nicht mit errorbar zu erklären ist oder nicht zur gänze, erst mit den S5 Tests und was wäre, wenn dem so wäre, so würde doch wohl von allen Engines nur H4 davon profitieren, wäre das nicht so, man stellt seine Testbedingungen auf  die Stärken von H4 ein, wäre das keine Bevorzugung, fast als würde man die Eröffnungsvorgaben aussuchen (etwas überspitzt).
Ich finde es ist gut so, dass verschiedene Tests stattfinden und die anderen Listen müssen wohl nicht auf p.o. umstellen.

Andreas
Parent - - By Benno Hartwig Date 2014-06-06 13:30
Ich (du magst das ja anders sehen) möchte die Engine als die stärkste ansehen, die die gößte Stärke bei Nutzung der gesamten Maschine  erreicht.
So wie das System genutzt würde für ein Spiel gegen Carlsen oder gegen einen anderen Computer.
Genau wie ich vom GM nicht erwarte, dass er während des Spiels noch was anderes intensiv tut (z.B. ein Gedicht lernt), erwarte ich das dann auch nicht vom Engine-Rechner-Gespann. Dass soll gefälligst alles(!) für das optimale Spiel tun.
Das ist die Spielstärke, die mich vor allem interessiert. Und da gehört Pondern und Nutzung aller Kerne und des gesamten Speichers dazu.
Dahingehend sollten die Entwickler ihre Systeme aus meiner Sicht gern trimmen!

Bei der Ratinglistenerstellung auf einem Rechner muss ich natürlich Kompromisse eingehen:
"Speicher teilen" und ("Kerne teilen" oder "Rechenzeit teilen")
Falls sich zeigen sollte, dass Pondern die Reihenfolgen spürbar ändert (das ist aber noch Spekulation), dann wären für mich auch Pondern=on sehr interessant, genau so wie die effektive Nutzung mehrerer Kerne.

Zumindest ab Nutzung eines Quads würde ich dann gern Partien sehen, in der jede Seite 2 exklusive Kerne hat und pondert.
8 Kerne wären natürlich noch feiner, da hätte jeder dann 4.

Wohlgemerkt, wenn  sich denn bestätigen sollte, dass Pondern solch einen Einfluss hätte.

Benno
Parent - - By Andreas Aicher Date 2014-06-06 14:04
ich sehe das schon etwas anders, aber das wurde ja schon vor Jahren erörtert, mit dem Zeitpunkt, als es Mehrkernprozessoren gab 
Ein Computer ist eben kein Mensch, Du vermenschlichst ihn etwas, für mich ist es nur ein Analysewerkzeug.
Ich sehe bei einem 8 Core Prozessor lieber p. o. und Nutzung aller 8 Kerne pro Engine.
Ich verstehe Deinen Einwand noch immer nicht, falls sich der Einfluss bestätigt, ist das ein H4 Vorteil, bei allem was ich weiss, nur bei Blitzbedenkzeiten, willst Du wirklich, falls dieser Eindruck sich bestätigen sollte,
H4 verliert dann nach wie vor gegen S5 und S5 gewinnt sämtliche Partien, H4 punktet gegen schwächere besser, siehst Du doch, dann ist dann eventuell nicht die beste Engine vorne, sondern die, die gegen schwächere Engines ein paar Remis weniger hat.
Ich finde IPON und CEGT mit 5+3 p. o. gut, aber mehr brauche ich wirklich nicht, schon gar nicht, weil H4 etwas besser pondern könnte ? eventuell, als der Rest der Enginewelt.
Also da verstehe ich Dich wirklich nicht, ist für mich alles nicht plausibel.
Wir haben doch alles, genauso und mit noch viel mehr recht, könntest Du, denn der Verdacht, dass S5 und K7a mit mehr Bedenkzeit die beiden führenden Engines sind, nur noch Ranglisten ab mind 40/20 oder besser 40/40 fordern, wie gesagt, mit viel mehr recht in bezug auf wirkliche Spielstärke als das relativ nebensächliche ponder on !!

Andreas
Parent - - By Benno Hartwig Date 2014-06-06 14:37 Edited 2014-06-06 14:39

> Also da verstehe ich Dich wirklich nicht, ist für mich alles nicht plausibel.


Vielleicht drücke ich mich ja schlcht aus, obwohl mein Standpunkt recht simpel ist:

         Falls es so ist, dass sich ponter=on- und ponder=off-Ratinglisten einigermaßen deutlich unterscheiden,
         dann ist für mich die Ponder=on-Liste die interessantere Liste.


Solche Ratinglisten erfassen Erfolg im praktischen Ausspielen von Partien, und die Frage
"Wie stark ist die Engine?" bedeutet für mich, dass ich ihre Spielstärke im praktischen Spiel zu beurteilen versuche, bei der die Engine den ganzen Rechner für sich nutzen darf. Viel Speicher, alle Kerne, Gegnerzeit. Das Engine-Rechzner-Gespann als möglichst starker Schachspieler.
Die Spielstärke bei absichtlich und deutlich gedrosselten Ressourcen wäre für mich erst in zweiter Linie interessant.

Aber natürlich verstehe ich deinen Einwand. Wenn dich nicht die Spielstärke wie oben sondern die Nützlichkeit bei der Analyse interessiert, dann brauchst du kein Pondern, und wenn du sie mehrere Dinge gleichzeitig fragen möchtest, dann interessiert dich ggf. auf die Mehrkernfähigkeit weniger.

Benno
Parent - - By Timo Haupt Date 2014-06-06 14:56
Benno Hartwig schrieb:

         Falls es so ist, dass sich ponter=on- und ponder=off-Ratinglisten einigermaßen deutlich unterscheiden,
         dann ist für mich die Ponder=on-Liste die interessantere Liste.


*unterschreib*

Aber ich vermute, dass sich P-On / P-Off wenn überhaupt nur bei bestimmten Engines auswirkt - bei denen, deren Entwickler sich Mühe mit der Ponder-Implementierung gegeben und vielleicht auch selbst Testspiele mit P-On gemacht haben. Das werden in der heutigen Zeit sicher die wenigsten sein. Aber von einigen weiß ich definitiv, dass clevere Sachen implementiert wurden. Um ein (älteres) Beispiel zu nennen: Zappa hat bei Nutzung von mehreren Kernen manchmal sofort gezogen, obwohl der gegnerische Zug nicht dem angezeigten Ponder-Zug entsprach und es KEIN EasyMove o.ä. war. Der Grund dafür ist, dass A. Cozzie so etwas wie "Multimove-Ponder" implementiert hatte. Wie er es genau gemacht hat, hat er mir nicht verraten, nur soviel: Wenn vermutet wird, dass es mehrere (fast) gleichwertige Antworten auf einen eigenen Zug gibt und du x Kerne zur Verfügung hast, dann pondere auf mehrere Antworten a mit jeweils x:a Kernen. Das finde ich schon sehr schlau, denn es bringt vermutlich mehr, überhaupt einen Pondertreffer zu erhalten (und diesen dann zum Zeitpunkt des Gegnerzuges etwas weniger tief untersucht zu haben), als wenn x Kerne mit der Wahrscheinlichkeit y auf den falschen Zug pondern.

Gruß
Timo
Parent - - By Andreas Aicher Date 2014-06-06 15:51
wenn ich jetzt die Liste von Ingo heranziehe und die partien gegen die Topengines anschaue, bei ponder on
Stockfish 5 - Houdini 4 (3111) 127.5-92.5 57.95% Perf=3166
Stockfish 5 - Komodo 7a (3083) 121.5-98.5 55.23% Perf=3119
Stockfish 5 - Gull 3 (3057) 134.0-86.0 60.91% Perf=3134
kann ich jetzt nicht wirklich erkennen, was daran jetzt schlecht wäre

vergleicht man mit der CEGT 5+3 ponder on, also die selben Bedingungen, im Prinzip

Houdini 4.0 x64           [3108] 26.5-23.5 perf=3129
Komodo 7.0a x64         [3070] 25.0-25.0 perf=3070
Gull3 fehlt hier

und man die Listen weiter vergleicht, sind auch die Ergebnisse andere, obwohl beide mit ponder on gespielt und beide 5+3,
also auch da schon erhebliche Differenzen.

Das nennt man dann wohl ErrorBar.
Parent - - By GS Date 2014-06-06 16:06
Andreas Aicher schrieb:

wenn ich jetzt die Liste von Ingo heranziehe und die partien gegen die Topengines anschaue, bei ponder on
Stockfish 5 - Houdini 4 (3111) 127.5-92.5 57.95% Perf=3166
Stockfish 5 - Komodo 7a (3083) 121.5-98.5 55.23% Perf=3119
Stockfish 5 - Gull 3 (3057) 134.0-86.0 60.91% Perf=3134
kann ich jetzt nicht wirklich erkennen, was daran jetzt schlecht wäre

vergleicht man mit der CEGT 5+3 ponder on, also die selben Bedingungen, im Prinzip

Houdini 4.0 x64           [3108] 26.5-23.5 perf=3129
Komodo 7.0a x64         [3070] 25.0-25.0 perf=3070
Gull3 fehlt hier

und man die Listen weiter vergleicht, sind auch die Ergebnisse andere, obwohl beide mit ponder on gespielt und beide 5+3,
also auch da schon erhebliche Differenzen.

Das nennt man dann wohl ErrorBar.


Einzelmatches sollte man nicht vergleichen, dafür ist bei beiden
Listen (für die IPON gilt das abgeschwächt) die Anzahl der Partien
pro Match zu gering. Die Gesamtperformance aus allen Matches ist
"das Mass der Dinge".
Parent - - By Andreas Aicher Date 2014-06-06 16:46
darauf wollte ich ja gar nicht hinaus, sondern eigentlich nur dass man anhand der ganzen Ergebnisse, wenn man sie einzeln betrachtet, deshalb habe ich ja auch die anderen Engines erwähnt, nicht unbedingt erkennen kann, dass SF5 im Vergleich zu allen anderen Engenes eine schlechte Ponderimplemtierung vermuten würde, man kann eben anhand der Einzelergebnisse, wenn man sie mit der Performance von H4 vergleicht sehen, dass S5 gegen manche Engines besser, gegen andere schlechter abgeschnitten hat.
Wie gesagt eine schlechte Implementierung sehe ich nicht, was ist am Ende ponder on, wohl am ehesten eine Mehrzeit, wenn eine Engine viele Pondertreffer hat, könnte das natürlich ein Vorteil sein, je gehäufter das vorkommt, oder sehe ich das falsch?
Ich bewerte eine Rangliste nicht höher, nur weil sie mit ponder on gespielt wurde
Parent - - By Ingo B. Date 2014-06-06 16:59
Andreas Aicher schrieb:

..., was ist am Ende ponder on, wohl am ehesten eine Mehrzeit, wenn eine Engine viele Pondertreffer hat, könnte das natürlich ein Vorteil sein, je gehäufter das vorkommt, oder sehe ich das falsch?...


Ja, eine Engine ist nur dann beste Engine wenn sie weniger Pondertreffer hat als die Gegnerengines - nur dann hat sie bessere Züge erwartet als gespielt wurden.
Die schlechteste Engine hat allerdings auch weniger Pondertreffer, allerdings wurden bessere Züge gespielt als erwartet wurden. Die Engines aus dem Mittelfeld hatten im Durchschnitt die meisten Pondertreffer und damit am meisten Zeit ... Es verhält sich nicht unbedingt erwartungsgemäß.

Kurz: Pondern ist nicht trivial!!!

Gruß
Ingo
Parent - By Andreas Aicher Date 2014-06-06 23:28
Danke für die Info, habe mich sehr lange nicht mehr mit Pondern beschäftigt, zuletzt wohl bei den CSS Onlineturnieren 
Meine Kenntnisse von Ponder waren aber immer ziemlich rudimentär.
Aber es ist doch auch so, zumindest fällt mir das bei der Schachanalyse auf, dass sich der Analysezug sehr sehr oft deckt, ob man nun Stockfish, Komodo oder eine andere Engine analysieren lässt, eigentlich öfters, als sie voneinander abweichen.

Aber eigentlich sehe ich das unter dem Motto, viel Lärm um nichts, denn auch bei Deinen Ergebnissen und auch denen bei der CEGT , kann ich wirklich keine Ponderschwäche von S5 sehen, dafür sind die Ergebnisse zu gut.

mfG
Andreas
Parent - - By Benno Hartwig Date 2014-06-07 12:09

> eine Engine ist nur dann beste Engine wenn sie weniger Pondertreffer hat als die Gegnerengines - nur dann hat sie bessere Züge erwartet als gespielt wurden.


Oh, auch wenn ich nicht besser entscheide, dafür aber schneller und dadurch einen ply tiefer bin und den Gegnerzug also bereits errechne, bin ich schon deutlich besser.
Wie groß mag die Überlegenheit von SF5-20HZ gegen SF5-19HZ sein?

Benno
Parent - - By GS Date 2014-06-07 12:42
Benno Hartwig schrieb:

[...snip...]
Wie groß mag die Überlegenheit von SF5-20HZ gegen SF5-19HZ sein?

Nicht immer solche Fragen stellen, sondern selbst austesten !
20Hz vs 19Hz geht bei Stockfish sehr flott und man bekommt
rasch hohe Partienmengen zusammen.
Nicht immer "nur" fordern, sondern auch mal selbst was zum
Ganzen beitragen sollte das Motto sein ...
Parent - - By Benno Hartwig Date 2014-06-07 21:10

> Nicht immer "nur" fordern...


Ich vermute mal, dass du heute einen schlechten Tag hast.
Solche nassforschen 'immer'-Sätze kommen halt ganz schlecht an.

Und im Übrigen ist es ganz eindeutig meine Erfahrung, dass man erst mal fragen sollte, ob jemand Material hat, bevor man selbst ein umfangreicheres Doing aufsetzt.
Aber du kannst das ja gern anders halten.
Wann wirst du denn mit der Erfindung des Rades beginnen?

Benno
Parent - - By GS Date 2014-06-08 13:08
Benno Hartwig schrieb:

Ich vermute mal, dass du heute einen schlechten Tag hast.
Solche nassforschen 'immer'-Sätze kommen halt ganz schlecht an.

Und im Übrigen ist es ganz eindeutig meine Erfahrung, dass man erst mal fragen sollte, ob jemand Material hat, bevor man selbst ein umfangreicheres Doing aufsetzt.
Aber du kannst das ja gern anders halten.
Wann wirst du denn mit der Erfindung des Rades beginnen?

Benno


So so, "nassforsch" !
Um kurz danach folgendes zu schreiben/fragen:
"Wann wirst du denn mit der Erfindung des Rades beginnen?"

EOD:
Parent - - By Benno Hartwig Date 2014-06-08 15:07

> So so, "nassforsch" !
> Um kurz danach folgendes zu schreiben/fragen:
> "Wann wirst du denn mit der Erfindung des Rades beginnen?"


Gerhard, so ist es halt mir dem Schall im Walde.
Aber dein EOD: ist trotzdem ein guter Vorschlag.
Benno
Parent - By GS Date 2014-06-08 15:54
Benno Hartwig schrieb:

Gerhard, so ist es halt mir dem Schall im Walde.
Aber dein EOD: ist trotzdem ein guter Vorschlag.
Benno


Das EOD: war zu voreilig, ich will ja nichts "schuldig" bleiben !

Gespielt auf einem Netbook mit Dual-Atom 1.2GHz, pb=off, 128 MB HTs.
CB 13 GUI, etwas anderes habe ich nicht auf dem Netbook, da dieses
nicht für Schach zum Einsatz kommt. Stockfish 5 x64 SSE4.2 zweimal
eingebunden und einen Enginezweikampf 16 vs 17 ply (***) aufgesetzt.
Zum Einsatz kam mein 70er-Vorgaben-Set, also 140 Spiele für diesen Wettkampf.
Das Aufsetzen samt Einbinden der Engines hat ca. 5-6 Minuten gedauert. Danach
bin ich wieder auf unsere Terrasse. Nach ca. 210 Minuten war das Match durch.

(***) Auf einem richtigen PC hätte man selbstredend 17 vs 18 ply oder auch
18 vs 19 ply in deutlich kürzerer Zeit spielen lassen können, meine Quads sind
jedoch z.Zt. alle belegt. Auch hätte ich beide Cores nehmen können um die Matchzeit
zu halbieren, dies jedoch wollte ich dem Netbook nicht antun !
Netbooks ebenso wie auch Notebooks sind nicht für den Dauerbetrieb ausgelegt, das
Kühlmanagement macht das auf Dauer nicht mit resp. nimmt Schaden. Der User merkt
dies zwar i.d.R. nicht oder erst wenn es zu spät ist, auch deshalb würde mir niemals
in den Sinn kommen diese Geräte für "Dauerschach" zu missbrauchen !

Ach so, das Ergebnis:
Code:

Stockfish 5.0 x64 1CPU SSE 4.2 PLY 16  59.0  (+ 10  = 98  - 32)
Stockfish 5.0 x64 1CPU SSE 4.2 PLY 17  81.0  (+ 32  = 98  - 10)  = 57.8% = + 55 ELO (+32 -32)
Parent - - By Ludwig Buergin Date 2014-06-07 10:22
Ja was war man früher an Comp.-Schachtreffen bei Klaus oder auch Rainer froh, wenn ein Ponderzug sofort gezogen wurde.Es war damals  trotz langen Partiezeiten ein  Zeitgewinn für die Berechnung der nachfolgenden Züge. Heuzutage ist anzunehmen, dass Programme, die weniger Tiefe erreichen,die angezeigten Ponderzüge nicht mehr sofort ausspielen,aber dennoch darauf aufsetzend gewinnbringend weiter verarbeiten können.Stockfish zeigt auch Ponderzüge an.Allerdings traut er im nächsten Zug seinem ehemals errechneten Ponderzug nicht.ignoriert ihn , und fängt jedes mal immer wieder weitgehend von vorn an zu rechnen.
Das sollte bei normallangen Partien kein großer Nachteil sein,da Stockfish ja rasend schnell auf Tiefe kommt.In wieweit sich dieser kleine Nachteil von Stockfish bei den extremen kurzen Spielzeiten der Engine-Tester auswirkt,darüber kann ich nur spekulieren ?

Gruß Ludwig

Muss nicht so sein. Kann so sein.
Parent - By Benno Hartwig Date 2014-06-09 06:10

> Heuzutage ist anzunehmen, dass Programme, die weniger Tiefe erreichen,die angezeigten Ponderzüge nicht mehr sofort ausspielen,aber dennoch darauf aufsetzend gewinnbringend weiter verarbeiten können.


Ich glaube nicht, dass es eine Änderung gab.
Sie registriert das etwas gewachsenen Zeitkonto, auch für den aktuell zu berechnenden Zug ("Jeder Zug darf also im Durchschnitt z.B. 5 sec länger analysiert werden)
und sie entscheidet nach ihren davon unabhängigen Regeln, wann eine Stellung bzw. die bisherige Analyse gebietet, sich jetzt mehr Zeit zu nehmen und die nächsten Züge dann zwangsläufig knapper zu analysieren.
Naja: vermute ich mal.

Benno
Parent - - By Andreas Aicher Date 2014-06-06 15:33
also was ich bisher gesehen habe, von deutlicher Unterscheidung sind wir das meilenweit weg. Das ist der Punkt.
Alles andere siehst Du anders als ich, ich bin da zuwenig Computerschächer, das ich das verstehen will.
Mir fehlt da, sorry, ist keine Abwertung, schlicht und einfach die Logik.
Du forderst schon etwas, nämlich die Listen zukünftig wenn möglich auf ponder on umzustellen, auf den blossen, sehr leisen Verdacht, etwas könnte so sein, was ja wahrscheinlich gar nicht zutrifft und wenn dann doch nur bei kurzen Bedenkzeiten.
Für mich sind auch die Listen interessanter mit mehr Bedenkzeit, ob jetzt mit oder ohne ponder ist mir bowidl, aber komplett.
Ich fordere aber jetzt auch nicht mehr Listen mit mehr Bedenkzeit.
Wen dem denn nun wirklich so ist, der Verdacht sich erhärten sollte, ich denke mal, Du wirst das testen?
Ansonsten haben wir ponder on Listen und ponder off Listen, also wirklich 

Andreas
Parent - - By Benno Hartwig Date 2014-06-06 22:53

> Du forderst schon etwas, nämlich die Listen zukünftig wenn möglich auf ponder on umzustellen, auf den blossen, sehr leisen Verdacht, etwas könnte so sein,


Äh? Antwortest du auf mein Posting?
Ich schrieb doch

         Falls es so ist, dass sich ponter=on- und ponder=off-Ratinglisten einigermaßen deutlich unterscheiden,
         dann ist für mich die Ponder=on-Liste die interessantere Liste.

und weiter oben schrieb ich sogar ausdrücklich

         Falls sich zeigen sollte, dass Pondern die Reihenfolgen spürbar ändert (das ist aber noch Spekulation), dann wären für mich auch Pondern=on sehr interessant,
         (Hervorhebung durch Fettschrift jetzt von mir)

Ich fordere also sicher gar nichts. Ich erkläre sogar selbst, dass das heute reine Spekulation ist.
Ich sage nur, was es für mich bedeuten würde, falls sich ein deutlicher Einfluss des Ponderns bestätigen sollte.
Aber vielleicht hattest du ja tatsächlich irgendjemand anderem antworten wollen, der tatsächlich irgendwas 'fordert'.
Benno
Parent - - By Andreas Aicher Date 2014-06-06 23:07
weiter oben hast Du doch geschrieben
dann sollte unbedingt mehr mit Pondern getestet werden.

Nochmals, ich habe nicht gegen ponder on, sehe das genauso wie 40/20, 40/40 Listen, aber ich denke auch, dass wir schon zwei Listen haben, die ponder on testen.
Ich denke das ist ausreichend.
Denke mal an eine Liste, deren Engineauswahl rein nach Elozahlen geschieht, da hat man unter Umständen 6-8 sehr ähnlich Engines im Feld, jetzt gerechnet ohne Critter und Houdini, wo ja auch eine gewisse Verwandtschaft besteht, da sind Pondertreffer dann eher möglich, als sonst üblich, das gilt natürlich weder für CEGT noch für IPON.

Also von meiner Seite aus, mal mit Shakespeare
viel Lärm um nichts

Andreas
Parent - - By Benno Hartwig Date 2014-06-07 00:31

> dann sollte unbedingt mehr mit Pondern getestet werden.


"dann"(!), eben wenn und falls sich denn tatsächlich statistisch belastbar sagen lässt, das Pondern deutliche Unterschiede in der Liste hervorruft!
Im Moment ist das doch wirklich nicht mehr als eine These.
Allerdings: wenn die Listen Unterschiede zeigen, die sich durch Zufall und Errorbar nicht ausreichend erklären lassen, dann sollte man wirklich gern weiterdenken. Pondern war halt die erste Idee gewesen.

Benno
Parent - - By Andreas Aicher Date 2014-06-07 01:11
Ich sehe überhaupt keinen Handlungsbedarf, auch wenn sich "dann" bestätigen sollte. Wir haben Listen mit ponder on, das sollte doch wohl reichen.
Die ponder off Listen sind deshalb nicht weniger wert, als sie es bisher waren, sie sagen nur etwas anderes aus, vielleicht auch nur, dass eine Engine besser pondert als die andere, mehr nicht.
Die Qualität und Aussagekraft bleibt die gleiche.
Vielleicht im Gegenteil, denn wie Du ja selbst festgestellt hast, sollte eine Engine, die alle Zweikämpfe gewinnt, auch Nummer 1 sein, nicht die, die vielleicht gegen schwächere Engine ein paar wenige Pünktchen mehr holt, ob das nun dem contempt Wert geschuldet ist, oder der besseren Ponder Implementierung macht doch keinen Unterschied.
S5 gewinnt in Ponder on und Ponder off und wahrscheinlich in allen Bedenkzeiten gegen die anderen Top Engines.
Aber, nur damit ich jetzt nicht missverstanden werde, mir ist das in Prinzip egal, habe damit kein Problem, dass alle auf ponder on umstellen, bei 40/20 oder 40/40 verpufft es ohnehin.
Für mich einfach viel Lärm um nichts, wie seinerzeit das mit dem contempt Wert, man bedauert im Nachhinein immer, dass man das nicht einfach ignoriert hat.

Andreas
Parent - - By Benno Hartwig Date 2014-06-07 07:07 Edited 2014-06-07 07:17

> Für mich einfach viel Lärm um nichts


Wir plaudern gerade ein wenig.
Ist irgendwo denn noch mehr 'Lärm'? SCNR
Benno
Parent - By Andreas Aicher Date 2014-06-07 09:29
das war doch nur eine Anspielung auf ein Stück von Shakespeare, also alles andere als nichts 

Andreas
Parent - - By ? Date 2014-06-06 12:01
Hallo Timo,

Timo Haupt schrieb:

... Ich halte ausnahmsweise mal Ponder=On für einen möglichen Faktor, denn ich weiß von R. Houdart, dass er sich sehr viel Mühe bei der cleveren Ponder-Nutzung gegeben hat. ...


Gerade mit deiner Begründung glaube ich das nicht, weil praktisch immer zu den P-OFF Listen, mit geringen Abweichungen das selbe herauskommt. In diesem Fall würde das heißen, dass SF5 im Vergleich zu ALLEN anderen Engine eine "grottenschlechte" Ponderimplementierung hätte.

Ich kann das nicht ausschließen, halte es aber für eher unwahrscheinlich.

Alles statistisches Rauschen!

Gruß
Ingo
Parent - By Timo Haupt Date 2014-06-06 14:42
Hi Ingo,

aber die Wahrscheinlichkeit, dass genau bei dir UND bei der CEGT jeweils in der P-On Liste in die gleiche Richtung Rauschen erzeugt wird, so dass H4 und SF5 am Ende gleichauf liegen, ist doch eher gering, oder? Aber es ist natürlich nicht auszuschließen, dass das mal vorkommt. Trotzdem glaube ich an meine These, die vielleicht eine Kombination aus "Houdini pondert besonders gut" und "Stockfish pondert ungewöhnlich schlecht" darstellt und sich deshalb nur im Vergleich der Endergebnisse dieser beiden Engines auswirkt. Schade, wir werden es wohl nie erfahren, denn der Aufwand, um es herauszufinden (2 neue Testruns für H und SF jeweils mit P-Off), ist wohl nicht vertretbar...

Gruß
Timo
Parent - - By Benno Hartwig Date 2014-06-06 14:42

>...würde das heißen, dass SF5 im Vergleich zu ALLEN anderen Engine eine "grottenschlechte" Ponderimplementierung hätte.


Wenn man möchte, dass die Entwickler auf eine gute Ponderimplementierung achten, wäre ggf. notwendig, dass zumindest einige etablierte Listenbetreiber pondern lassen.
Solange das Fehlen eines Features nicht irgendwo negativ auffällt, wird ggf. nicht nachgebessert.

Aber erst mal soll sich ja dieser Effekt tatsächlich bestätigen. Ist ja ggf. doch nicht wahr.

Benno
Parent - - By GS Date 2014-06-06 15:21
Benno Hartwig schrieb:

Wenn man möchte, dass die Entwickler auf eine gute Ponderimplementierung achten, wäre ggf. notwendig, dass zumindest einige etablierte Listenbetreiber pondern lassen.
[...snip...]


Hhhmm, wird haben diesbezüglich die IPON und wir haben die CEGT 5'+3" !
Was braucht man(n) mehr ?
Parent - By Andreas Aicher Date 2014-06-06 15:37
genau, die Vielfalt ist doch das wichtige, wenn jetzt jeder auch noch ponder on und ponder off testen soll, das wird ja langsam uferlos, vielleicht auch noch H4 extra in jeder Liste mit contempt 0
Parent - By Benno Hartwig Date 2014-06-07 08:18

> Hhhmm, wird haben diesbezüglich die IPON und wir haben die CEGT 5'+3" !


Bitte gleich konsequent weiterfragen: Braucht man denn tatsächlich mehr als eine Liste mit Ponder=off?
BTW: Brauchen wir mehr als ein Fernsehprogramm? Mehr als eine Engine? Mehr als ein Betriebssystem auf dem Markt?
Benno
Parent - - By GS Date 2014-06-06 15:02
[quote="?"]
Gerade mit deiner Begründung glaube ich das nicht, weil praktisch immer zu den P-OFF Listen, mit geringen Abweichungen das selbe herauskommt. In diesem Fall würde das heißen, dass SF5 im Vergleich zu ALLEN anderen Engine eine "grottenschlechte" Ponderimplementierung hätte.
Ich kann das nicht ausschließen, halte es aber für eher unwahrscheinlich.
Alles statistisches Rauschen!


Ich finde Timos Idee sehr gut !
Komm Ingo, spring über Deinen Schatten und investiere die paar Euro !
Das geht ohnehin fast doppelt so schnell wie sonst, da pb=off.

Viele Grüsse,
G.S.
Parent - - By Ingo B. Date 2014-06-06 15:35
GS schrieb:


Komm Ingo, spring über Deinen Schatten und investiere die paar Euro !
Das geht ohnehin fast doppelt so schnell wie sonst, da pb=off.



Gerhard, wie bei dir ist mein Intresse an POFF Ranglisten sehr "randlagig" und auch wenn der Test nur halb so lange dauert sind es doch über 5 Euro die da durchrauschen. Dazu die Temperaturen ... bei mir ist jetzt eher Sommerpause angesagt als Dinge die sich in zwei, drei Monaten, mit mehr Spielen der POFF Betreiber, von selbst erledigen (Sei es durch fallende Ratings (meine These) oder Desinteresse der User )

Gruß
Ingo
Up Topic Hauptforen / CSS-Forum / Stockfish5-Listenplätze
1 2 Previous Next  

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill