Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Umko 1.1 test running for the IPON
- - By Ingo Bauer Date 2010-11-29 18:24
Hello

At http://www.inwoba.de Umko 1.1 x64 SSE42 is running live.

Remark: This is the first full test on new hardware. Please have a look at the news from 2010.11.28.

Have fun
Ingo
Parent - - By Frank Quisinsky Date 2010-11-29 18:32 Edited 2010-11-29 18:37
Hallo Ingo,

dann wünsche ich Dir viel Spaß mit der neuen Hardware und vor allem auch Glück, dass alles auf Dauer problemlos und zu Deiner Zufriedenheit läuft.

Etwas fragwürdig ist:
Deine Liste basiert auf Q6600 Systemen übertacktet von 2.4 auf 3.0GHz.
Nun setzt Du eine AMD Hardware ein und mixt langfristig vorhandene Ergebnisse mit AMD Hardware.
Bekanntlich profitieren einige Engines mehr oder weniger von AMD.
In der Regel sind die Engines auf Intel schneller, in der Regel weil z. B. ein ZappChess auf AMD optimiert wurde oder auch andere.

Du hattest mir ja geschrieben das Du das durchgetestet hattest und aufgrund Deiner vielen Partien wird es auch kaum relevante Änderungen geben.
Dennoch, keine gleichen Testvoraussetzungen mehr auch wenn sich das nur minimal bemerkbar machen wird ... wenn überhaupt !!

Finde Du solltest vielleicht auf Deiner News Seite mehr ins Detail gehen, führt sonst ein wenig in die Irre!
Auch weil die AMD Hardware sehr günstig ist und sich vielleicht auch andere Schachfreude überlegen mal wieder oder jetzt von Intel auf AMD zu wechseln sofern ein Neukauf ansteht.
Durch Deine Erfahrungen beim Bauen der Systeme wäre das vielleicht ganz interessant! Hoffe ich kann Dich so direkt zu diesem Thema ansprechen.

Also ...
Bin jetzt mal gespannt auf Deinen Umko 1.1 x64 Test.
Erstmalig testen wir jetzt im LIVE Mode über Spießroutenlauf die gleiche Engine
War ja nicht von mir beabsichtigt, da ich einfach nur aktuelle Engines abtesten möchte aber keinesfalls den Anspruch auf Turbo-Aktualität lege ... geht aufgrund meiner gewählten Bedenkzeit nicht ... dauert bei mir alles etwas länger. War nur sehr neugierig auf Umko 1.1 x64 und zog den Test vor ... auch weil das laufende SWCR-64 Turnier einfach langweilig wird wenn es zu lange dauert.

Viele Grüße
Frank
Parent - - By Ingo Bauer Date 2010-11-29 19:03
[quote="Frank Quisinsky"]
...
Etwas fragwürdig ist:
Deine Liste basiert auf Q6600 Systemen übertacktet von 2.4 auf 3.0GHz.
Nun setzt Du eine AMD Hardware ein und mixt langfristig vorhandene Ergebnisse mit AMD Hardware.
Bekanntlich profitieren einige Engines mehr oder weniger von AMD.
[/quote]

Ohne Zweifel ein gewisser Bruch in der Konsistenz - aber man muß auch mit der Zeit gehen und ich habe versucht den Fehler so gering wie möglich zu halten.

[quote="Frank Quisinsky"]
In der Regel sind die Engines auf Intel schneller, in der Regel weil z. B. ein ZappChess auf AMD optimiert wurde oder auch andere.
[/quote]

Nun ja, Zap-Chess habe ich nie besessen geschweige den getestet. Zappa Mexico II hingegen wurde bestimmt nicht auf AMD optimiert, sondernläuft durch Zufall da am besten.

[quote="Frank Quisinsky"]
Du hattest mir ja geschrieben das Du das durchgetestet hattest und aufgrund Deiner vielen Partien wird es auch kaum relevante Änderungen geben.
Dennoch, keine gleichen Testvoraussetzungen mehr auch wenn sich das nur minimal bemerkbar machen wird ... wenn überhaupt !!
[/quote]

Ich habe dir alle meine Daten geschickt, warum du das hier ausbreitest weiß ich nicht, aber wie du sehen kannst weicht Zappa 9% nach oben ab. 9% schneller sind über den Daumen 6 Elo. Wenn ich also für Zappa noch mal 6700 Partien spiele könnte das Ergebniss tatsächlich um 3 Elo Aufgrund der Hardware wandern ... da das auch dann noch mitten in in der Errorbar leigt, scheint es mir nicht so relevant. Am schlechtesten hat es Deep Fritz, der ist heftigst Inteloptimiert und liegt ca 18% oder ca. 10 Elo hinten. Wiederum muß ich nur noch 4300 Partien damit spielen um ihn theoretische 5 Hardwareelo verlieren zu lassen. Auch das ist innerhalb einer Error bar und es gilt weiteres wie für Zappa Mexico II. Alle weiteren Top 22 engines liegen zw. diesen beiden Extremen.
Sollte es dich stören, müßtest du konsequenterweise die Anzahl deiner Spiele pro Engine ca. verdreifachen ehe du die nötige 3 Elo Schwelle erreichst ...

Weit schlimmer wäre es übrigens für Mehrkerntests. Die AMD Phenom2 sind echte Mehrkerner, im Gegensatz zu den C2Q die nur aus 2 Duals bestehen. Die MP Enignes werden auf AMD deutlich besser als auf C2. Bei MP überholt der Phenom2 sogar den C2Q pro GHz und kommt fast an den i5/i7 ran (pro GHz).

Ansonsten verweise ich gerne auf den ersten Absatz meiner "General remarks"

[quote="Frank Quisinsky"]
Finde Du solltest vielleicht auf Deiner News Seite mehr ins Detail gehen, führt sonst ein wenig in die Irre!
[/quote]

Da bin ich ganz anderer Meinung. Ich glaube eher wenn ich mehr ins Detail gehe verwirrt das die Leute - oder glaubst du jemand versteht meine ausführliche Exceltabelle?

[quote="Frank Quisinsky"]
Auch weil die AMD Hardware sehr günstig ist und sich vielleicht auch andere Schachfreude überlegen mal wieder oder jetzt von Intel auf AMD zu wechseln sofern ein Neukauf ansteht.
Durch Deine Erfahrungen beim Bauen der Systeme wäre das vielleicht ganz interessant!
[/quote]

Ohne Zweifel bieten die AMD 6 Kerner im Moment die meisten Knoten pro EUR - Im Schnitt über viele Engines. Wenn jemand Fragen haben sollte beantworte ich die die gerne hier!

Gruß
Ingo
Parent - - By Frank Quisinsky Date 2010-11-29 19:14 Edited 2010-11-29 19:19
Hallo Ingo,

ich habe ja aufgrund beruflicher Praxis auch schon x Systeme zusammengestellt. Aber seit ca. 5-6 Monaten bin ich "AMD-mäßig" nicht gerade auf dem neuesten Stand. Die AMD Systeme werden besser und das ist unzweifelhaft so. Der Entwicklungsvorteil von Intel ist geschrumpft. Intel misst selbst die Leistung der Konkurrenz anhand Entwicklungsvorteil in "Monaten" (nach meinen Infos). Auch wenn die Preise bei Intel deutlich besser sind wie noch vor Jahren sind die AMDs immer noch günstiger. Gute Boards halten sich in etwa die Waage.

Hast mir ja die Excel Tabelle gesendet!
Was ich nicht verstehe ist die Leistung selbst. Also ein Vergleich z. B. bei einem Core zwischen Q6600 3.0 GHz und der jetzt eingesetzten AMD Hardware. Wer ist da im Vorteil? Am Besten ein Vergleich ohne Übertaktung. Vielleicht könntest Du mir diese Info geben ... ca. eine durchschnittliche Prozentzahl (bei den von uns eingesetzten Engines) der Mehrleistung des AMD Systems bei einem Core im Vergleich zu einem Q6600 2.4 GHz bei einem Core. Der andere Vorteil wäre, dass das AMD System mit 6 Cores daherkommt, ein Q6600 hat ja bekanntlich 4 Cores. Auch wäre der Stromverbrauch der AMD Maschine interessant.

Einen Q6600 bekommst Du bei ebay schon für ca. 50 EUR. Insofern ist dieser ältere Intel Prozessor immer noch sehr interessant für ein Computerschach "Standard System".

Ja, vielleicht hast Du Recht, die Excel Tabelle würde auch nur verwirren.
Finde die beiden oben aufgeführten Fragen interessant, also ein Vergleich zu Deinem ehemaligen Q6600 2.4 GHz Systemen.
Könnte ich zwar auch recherchieren aber direkt von der Quelle aufgrund einer durchschnittlichen Messung bei Schach-Engines wäre das interessanter zu erfahren!

Viele Grüße
Frank
Parent - - By Kurt Utzinger Date 2010-11-29 19:30
Hallo Frank
Hallo Ingo
Wird hier nicht viel zu viel Lärm um ganz wenige Elo-Punkte
wegen einem kaum ins Gewicht fallenden Hardware-Wechsel
gemacht. Was ist/war denn überhaupt der Grund von Ingo für
diesen [für mich nicht nachvollziehbaren] Wechsel wegen
lumpigen 10%-Mehrleistung. Und "by the way": auf was
beziehen sich solche Aussagen wie "... wer versteht denn
schon meine Excel-Tabellen ...". Ich versteh jedenfalls
nur Bahnhof, aber als einer "der sowieso nicht mehr dazu
gehört und von der Schachcomputerei keine Ahnung mehr
hat " [sinngemässe Äusserung eines Forum-Teilnehmers hier],
muss das alles ja auch nicht verstehen können.
Mfg
Kurt
Parent - By Frank Quisinsky Date 2010-11-29 19:37 Edited 2010-11-29 19:44
Hallo Kurt,

ups!
Du musst Dir nicht unbedingt das "Negative" aus Messages rausziehen.
Es gab in dem Thread, auf den Du anspielst, auch reichlich positives und bekanntlich ... niemand ist perfekt und wir alle machen Fehler, niemand ist fehlerfrei.

Ferner war die von Dir herausgepickte Äußerung nicht auf Dich bezogen, sondern eher allgemein gehalten.

Und Lärm wird hier in dem Thread sicherlich nicht gemacht.

Auch die CEGT oder die CCRL testet auf unterschiedlicher Hardware und kommt mit einer Vergleichsformel daher.
Auch ich habe in der SWCR anfangs auf Dual Core Intel Systemen getestet und die Prozessoren von Takt +- 5% gleich eingestellt bevor ich alles auf Q9550 upgedatet habe.

Geht auf Dauer auch gar nicht anders.
Ferner schrieb ich doch selbst, dass die Änderungen von Ingo kaum relevante Änderungen bei den späteren Ergebnisse mit sich bringen.
Das konnte ich anhand einer Tabelle ablesen die mir Ingo zur Verfügung gestellt hatte.

Dennoch ist das Thema interessant aber auch nur deswegen, weil ein 6-Core System eingesetzt wird welches preislich interessant ist.

Also Kurt, falscher Alarm:
Will Ingo's Liste nicht in Misskredit bringen ... sofern Du das vermutest (selbst negativ gedacht)?
Warum sollte ich das tun, vergleiche doch gerne mit Ingos Ergebnisse und insofern liegt mir etwas an seiner Arbeit die ich nach wie vor aufmerksam beobachte.

Viele Grüße
Frank
Parent - - By Ingo Bauer Date 2010-11-29 19:59 Edited 2010-11-29 20:04
Hallo Kurt,

[quote="Kurt Utzinger"]
Wird hier nicht viel zu viel Lärm um ganz wenige Elo-Punkte
wegen einem kaum ins Gewicht fallenden Hardware-Wechsel
gemacht.
[/quote]

Viel Lärm? So viel ist es auch nicht ... und nein, im Schnitt über alle Engines sind es keine Elo, nur Einzellengines können wenige Elo noch oben oder unten abweichen. Es ist also noch weniger als gedacht.

[quote="Kurt Utzinger"]
Was ist/war denn überhaupt der Grund von Ingo für
diesen [für mich nicht nachvollziehbaren] Wechsel wegen
lumpigen 10%-Mehrleistung.
[/quote]

Die 10% sinduninteressant,die nehme ich nur dankbar mit.

2 Gründe:
1.) 6 statt 4 Kerne. Ich kann mit der gleichen Anzahl an Rechnern in der selben Zeit 50% mehr Spiele machen
2.) aber weniger wichtig: SSE42. Immer mehr Engines unterstützen das.

[quote="Kurt Utzinger"]
Und "by the way": auf was
beziehen sich solche Aussagen wie "... wer versteht denn
schon meine Excel-Tabellen ...". Ich versteh jedenfalls
nur Bahnhof ...
[/quote]

Eben und deswegen hätte ich das auch gar nicht gebracht. Frank, dem ich vorher alles geschickt und erklärt hatte, fragte HIER nach mehr Infos. Die gebe ich gerne, wenngleich es auch eine EMail an mich getan hätte.

Gruß
Ingo
Parent - By Kurt Utzinger Date 2010-11-29 20:18
Hallo Ingo
Danke für die rasche Antwort. Nun sind wir alle im Bild.
Mfg
Kurt
Parent - - By Ingo Bauer Date 2010-11-29 19:53
Hallo Frank,

erstmal danke das du das hier lostrittst. Wie gesagt, es verwirrt eher!

[quote="Frank Quisinsky"]
....
Hast mir ja die Excel Tabelle gesendet!
[/quote]

und auch eine Erklärung aber es scheint die verwirrt eher.

Damit alle wissen wovon wir sprechen:

[quote="Frank Quisinsky"]
Was ich nicht verstehe ist die Leistung selbst. Also ein Vergleich z. B. bei einem Core zwischen Q6600 3.0 GHz und der jetzt eingesetzten AMD Hardware. Wer ist da im Vorteil?
[/quote]

Deine Frage hatte ich schonmal beantwortet, und du kannst es direkt im den grauen Feldern in Zeile 32 bis 36 ablesen. Wenn man den Core 2 Quad als 100% sieht ist bei gleichem Takt der Phenom2 bei den Single Top 22 Engines 2.4% langsamer. Was eigentlich vernachlässigbar ist. Über den Daumen kann man sagen C2Q und Phenom2 sind für Singlebetrieb bei gleichem Takt gleich schnell. Einzelne Engines können abweichen, dafür die oberen genauen Zahlen.

[quote="Frank Quisinsky"]
Am Besten ein Vergleich ohne Übertaktung.
[/quote]

Ich weiß, du magst das nicht, aber OC ist eigentlich egal und läuft schlicht linear - für Single Engines. Alleine aus den Zeilen 32 bis 36 kann man alles andere mit einem Dreisatz ableiten.

[quote="Frank Quisinsky"]
Vielleicht könntest Du mir diese Info geben ... ca. eine durchschnittliche Prozentzahl (bei den von uns eingesetzten Engines) der Mehrleistung des AMD Systems bei einem Core im Vergleich zu einem Q6600 2.4 GHz bei einem Core. Der andere Vorteil wäre, dass das AMD System mit 6 Cores daherkommt, ein Q6600 hat ja bekanntlich 4 Cores. Auch wäre der Stromverbrauch der AMD Maschine interessant.
[/quote]

In Zeile 39 bis 43 mal ein 2.4GHz Athlon64, ein Core2Quad mit 2.925 GHz ein Phenom2 mit 3.3GHz und ein i7/i5 bei 4 GHz. Wie ließt man die Tabelle: Wenn z.B. ein Phenom2@3.3 bei 100% liegt, sieht man das der i7@4.0 bei 143%, also 43% schneller ist. oder der C2Q@2.925 rund 91% des Phenom2 hat.
Das kannst du dir aber alles aus den Zeilen 32 bis 36 selber für jede gewünschte Taktfrequenz mit ein bischen Prozentrechnung ableiten. (Ein Q6600 bei 2.4 ist übrigens rund 25% langsamer asl ein Phenom2 bei 3.3 oder umgekehrt ist der AMD 34% schneller asl der C2Q)
Was den Strom betrifft sind die AMDs richtig gut geworden. Ich habe jede von 2.8 auf 3.3 GHz angehoben und gleichzeitig die Kernspannung runtergesetzt. Die dürften mit 6 Kernen auf keinen Fall mehr verbrauchen als die Q6600 nur bekomme ich Pro Rechner 50% mehr Ergebnisse.

[quote="Frank Quisinsky"]
Einen Q6600 bekommst Du bei ebay schon für ca. 50 EUR. Insofern ist dieser ältere Intel Prozessor immer noch sehr interessant für ein Computerschach "Standard System".
[/quote]

... aber kein SSE42 ...!

[quote="Frank Quisinsky"]
Ja, vielleicht hast Du Recht, die Excel Tabelle würde auch nur verwirren.
[/quote]

Zu spät!

Noch soviel: Das alles für Single Enignes, bei MP schneidet der Phenom besser ab, die Lücke zum i7 wird deutlich kleiner als die in der Tabelle ersichtlichen 16%/18%! Nur zum Vergleich, die 6 Kerner Phenom2 bei 3.3 GHz sind ungefähr genauso schnell wie die 4 Kerner i7 bei 4GHz. Die AMDs kosten allerdings wesentlich weniger!

Gruß
Ingo
Parent - By Frank Quisinsky Date 2010-11-29 20:03
Hallo Ingo,

super, vielen Dank für diese Ausführungen.
Stromverbrauch ist eigentlich für die Ratinglisten-Betreiber immer ein Argument.
Nicht zuletzt weil die Strompreise weiter steigern werden.

Muss mal in Ruhe ausrechnen ob ich Kosten minimieren könnte bzw. den Kosten für den Aufwand die Folgekosten auffangen.
Überhaupt auch ein interessantes Thema für Fernschachspieler die auch meist mehrere Systeme rund um die Uhr einsetzen.

Ansonsten wären meine Fragen damit beantwortet.
Und wer bei dem Thread nicht durchblickt bzw. nicht durchblicken möchte muss sich die Infos ja nicht zu Gemüte führen!

Viele Grüße
Frank
Parent - - By Frank Quisinsky Date 2010-11-29 19:25
Hallo Ingo,

noch ein Hinweis zu den von Dir erzeugten Live Tabellen.
Automatische Aktualisierung funktioniert nicht.
Lande dann wieder auf Deiner Startseite, so muss ich jedes mal wieder auf den Link klicken.
Das nervt etwas.

Opera oder andere Browser können automatisch aktualisieren.
Auch der Internet Explorer 8 kann das z. B. mit dem Tool iepro (aktuelle Version 2.51).
Ist ein sehr nützliches PlugIn für den IE7 und IE8.
Sollte ja heute Standard sein aber was solls (meine automatische Aktualisierung).

Vielleicht könntest Du das mal ändern!
Könnte auch sein das Du ein script verwendest um genau das zu verhindern?
Macht aber keinen Sinn, sehe zumindest selbst keinen Sinn dahinter verborgen!

Gruß
Frank
Parent - - By Ingo Bauer Date 2010-11-29 20:02
Ich kann nichts ändern, ich bin HTML Analphabet!

Schau dir den Code an, das ist sowas von HTML Standard, das das vielleicht der ein oder andere Browser nicht mehr kann.

Ich habe keine Ahnung, klick halt auf reload

Gruß
Ingo
Parent - By Frank Quisinsky Date 2010-11-29 20:15
Hi Ingo,

also wenn Du kein Script verwendest liegt es am Frame.
Könntest Du einfach lösen wenn Du beim Link auf Deiner Startseite die Option nutzt "Öffne im neuen Fenster".

target="_self":
wird im Frame geöffnet, wo sich der Link befindet.

target="_blank"
öffnet die Seite in einem neuen Fenster

target="_top"
öffnet die seite im gleichen fenster, aber übergeht frames

Versuche mal mit "blank".

Best
Frank
Parent - - By Frank Quisinsky Date 2010-12-01 09:16 Edited 2010-12-01 09:24
Hallo Ingo,

jetzt schaue mal genau auf unsere Auswertungen bei dem laufenden Umko 1.1 x64 Test.

Bei Dir:
Nach 762 Partien = 2.636

Bei mir:
Nach 467 Partien = 2.637

Das alleine ist nicht interessant!
Interessant sind andere Dinge ...

Schaue mal auf die Einzelergebnisse, z. B. gegen Hannibal 1.03a.
Teilweise unterscheiden sich die Ergebnisse deutlich, letztendlich haben wir aber das gleiche Ergebnis oder

Du setzt 20 Gegner ein
Ich setze 25 Gegner ein

Davon setzen wir gemeinsam 13 gleiche Gegner ein.
Also 7 Deiner 20 Gegner setze ich nicht ein oder habe neuere / ältere Versionen drin ...

Houdini 1.03a (IPON) ... bei mir spielt IvanHoe T0.5.4.1
Rybka 4 (IPON) ... bei mir spielt Rybka 4 Exp. 42
Protector 1.3.2 JA (IPON) ... bei mir spielt Protector 1.3.6 Rev. 370
Spark 0.4 (IPON) ... bei mir spielt Spark 0.5
TogaII 1.5 Beta 5c BB (IPON) ... spielt bei mir nicht da nicht x64 kompatibel und ich daher einen x64 Fruit einsetze
Crafty 23.3 JA (IPON) ... bei mir spielt Crafty 23.4 JA
GullChess 1.1 (IPON) ... bei mir spielt noch GullChess 1.0a

Private testet Du ja nicht (Spark, Fruit, Equinox) ...
Bei Protector ist es sicherlich auch OK mit der älteren Version zu spielen (regt sich kaum etwas, wenn gleich Version 1.3.4 besser ist und auch interessanter spielt).
Crafty 23.4 JA solltest Du mal updaten, bei mir ca. 30 ELO besser.
Beim Rybka Setting hast Du keine besseren Ergebnisse, gar schlechtere ... verstehe ich nicht aber OK

Bei mir spielt ferner (bei Dir nicht):

01. BugChessII 1.7 (derzeit die Nummer 25)
02. Tornado 4.25 (derzeit die Nummer 24)
03. Smarthink 1.20 (derzeit die Nummer 23)
04. Equinox 0.87t (derzeit die Nummer 22)
05. Thinker 5.4d Inert (derzeit die Nummer 11)

Ich habe also auf 24 Engines ausgebaut weil es nach meinen Analysen klar ist, dass ich durch mehr Engines ein genaueres Ergebnis erhalte.
Die Schwelle liegt hier nach Pseudoanalysen offenbar bei 26 Engines. Danach geht die Kurve nur noch langsam nach oben.

Da ich die Partiezahl minimiere um dies zu erreichen bzw. die SWCR in der Forum überhaupt durchführen zu können, komme ich auf vergleichbar gute Ergebnisse bei weniger Partien durch mehr Engines.
Seit ich von 20 auf 24 ausgebaut habe sind meine Listen um durchschnittlich 3 ELO genauer geworden ... schaue ich auf die ELO-Entwicklungen der neu getesteten Engines mit und ohne Ausbau von 20 auf 24 Engines.

Gegen wir jetzt mal zum eigentlichen Aufhänger meines Beitrages ... schrieb ich ja schon mal im Sommer!

Wir nehmen jetzt IPON bei 21 Engines und 2.000 Partien pro Engine (vereinfacht) und vergleichen die Genauigkeit von ELO-Abweichungen mit SWCR bei 26 Engines mit 1.000 Partien pro Engine und SWCR bei 20 Engines mit 760 Partien.

IPON als Maßstab da mehr Partien ...
Komme ich zu folgender statistischer Analyse:

SWCR bei 20 Engines mit 760 Partien pro Engine = 7 ELO durchschnittliche Abweichung zu IPON.
SWCR bei 26 Engines mit 1.000 Partien pro Engine = 4 ELO durchschnittliche Abweichung zu IPON.

Das heißt, würden wir absolut unter den gleichen Voraussetzungen spielen (Bücher, Bedenkzeit etc..) würden 2.000 Partien bei 21 Engines im Vergleich zu 1.000 Partien bei 26 Engines eine bessere Genauigkeit zu Deiner Testmethode von 4 ELO durchschnittlich bringen.

Ich müsste bei meinen Testbedingungen weitere 4 Quad Core Maschinen einsetzen um die doppelte Partiemenge zu produzieren, damit meine Ratingliste um 4 ELO pro Engine im Durchschnitt genauer wird.

Zurück zum Umko 1.1 x64 Test!

Aufgrund der teilweise unterschiedlichen Ergebnisse ist es verblüffend wie schnell ca. gleiche Testergebnisse bei weniger Partien produziert werden. Der Beobachter kommt beim Umko 1.1 x64 Test ferner zu keinem wirklichen Ergebnis wenn Ergebnisse so unterschiedlich sind aber dann doch die gleiche ELO erzielt wird. Würde bei mir nicht Umko 1.1 x64 in der Tabelle stehen sondern ein anderer Name wird es niemand merken (vereinfacht).

Ferner hat es bei mir bis Partienummer 430 benötigt bis mein Ergebnis bei Deinem Ergebnis lag. Sprich Umko spielte bis Partiennummer 380 noch mit 2.612 ELO und ging dann erst langsam zum wahrscheinlichen Endergebnis hoch.

Damit belegt Umko 1.1 x64 in meiner Tabelle aller getesteten Engines Platz 6 hinsichtlich ... notwendige Anzahl der Partien bis zum tatsächlichen Endergebnis.
Sprich 430 Partien sind bei den SWCR Bedinungen eine Menge Holz, es gab nur 5 Engines die noch mehr Partien benötigt haben.

Vielleicht kannst Du das in etwa nachvollziehen und meine Ansicht zur wirklich benötigten Partiemenge besser verstehen.
Mache mir mal die Mühe und schreibe Dir das hier direkt ins Forum.

Es ist immer besser mehr Partien zu haben, denke darüber sind wir uns einig aber irgendwann macht es keinen Sinn mehr so viele Partien spielen zu lassen.
Ich denke, ich nehme dann lieber eine höhere Bedenkzeit, mehr Engines und habe auch mehr Spaß beim Zusehen, denn 5 + 3 würde mir einfach viel zu schnell gehen.
Mit dem Ergebnis, dass ein sehr gutes Resultat erzielt wird.

Die Partiemenge von 1.000 zu verdoppeln macht bei der SWCR keinen Sinn.
Auch wenn die meisten Engines schon deutlich über 1.000 gespielt haben, dass liegt daran weil durch die laufenden Turniere die aktuellen Engine Versionen auch immer weitere Partien hinzubekommen.

Viele Grüße
Frank

So, beobachte weiter Deinen Critter 0.90 Test. Sehr interessant.
Freue mich auch schon auf meinen Critter 0.90 Test den ich am Freitag früh übers WE spielen lasse.
Parent - By Frank Quisinsky Date 2010-12-01 10:20 Edited 2010-12-01 10:25
Hallo Ingo,

und nun zu Ponder = on / off.
Crafty hat meines Erachtens die optimale Umsetzung von Ponder implementiert.
Das macht dann bei Crafty 23.3 im Test den ich durchführte 47 ELO, also ca. 40-50 ELO aus.
Also wenn eine Engine ohne Ponder in einem Turnier spielt, bei dem alle anderen mit Ponder spielen, ist die Engine um 40-50 ELO benachteiligt, wenn diese eine optimale Ponder Umsetzung hätte.

Bei Umko sind es aber nur 30 ELO bislang ... da Version 1.0 und 1.1 faktisch ELOmäßig / von der Spielstärke gleich sind (siehe CEGT Ergebnisse).
Und genau das hat auch einen Grund!

Beobachtest Du die Umko Partien, ist der Ponder Mode zwar korrekt implementiert aber vergleichbar wie zu IvanHoe oder auch diverse andere Engines kommen viele Ponder Züge zu schnell bzw. gar direkt. Es wird Zeit verschenkt was sich später bei 40 in 10 schön sichtbar an der Restbedenkzeit bemerkbar macht bzw. der unregelmäßigen Zeiteinteilung im Verlauf einer Partie ... z. B. überdurchschnittlich mehr Zeit wird verbraucht vor der Zeitkontrolle wenn noch zu viel Restzeit vorhanden ist. Wichtig ist daher immer zu schauen (bei z. B. 40 in 10, Restbedenkzeit nach 20, 30, 40, 50, 60 etc., also nicht nur zu schauen wie es kurz vor der Zeitkontrolle aussieht). Das spricht für eine nicht saubere Ponder-Umsetzung und kostet einer Engine wahrscheinlich letztendlich ca. 10-15 ELO. Auch Spark ist hier betroffen und wie gesagt viele andere Engines.

Shredder hat z. B. eine sehr gute Ponder Umsetzung.
Wenn Shredder ohne Ponder, in einem Ponder = on Turnier spielen würde, wäre das Endergebnis, wie bei Crafty höchst wahrscheinlich auch ca. 40-50 ELO schwächer.

Gruß
Frank
Parent - - By Ingo Bauer Date 2010-12-01 10:51
Hallo Frank

Laaanger Text. Ich fasse mal zusammen:

Zwischen dem was nach Gauss nötig ist und dem was du für nötig hälst besteht ein Unterschied.

Ist das so grob richtig.

Gruß
Ingo
Parent - - By Frank Quisinsky Date 2010-12-01 11:02 Edited 2010-12-01 11:06
Hi Ingo,

willst Du eine ehrliche Antwort?

Was nach Gauss nötig ist oder was mir eine ErrorBar sagt ist nicht uninteressant aber ich teste diese Dinge lieber selbst.
Springe auch nicht von einer Brücke weil nach Gauss vorgegeben!



Natürlich nur wenn möglich.
Es macht keinen Sinn alles in Frage zu stellen aber es macht auch keinen Sinn alles zu glauben erst Recht dann wenn eigene Ergebnisse vorliegen die absolut offensichtlich sind.

Wo wäre die Wissenschaft ohne Galileo Galilei!
Der bin ich zwar nicht aber auch hier gilt ... nach Links und Rechts umschauen und viele neue Erkenntnisse in Kombinationen führen dazu das Thesen letztendlich anerkannt werden.

Auch Kopernikus setzte Maßstäbe aber letztendlich auch nur sehr wackelig. Das musste meist erst noch weiter erforscht werden und durch die Kombination bzw. Mischung mit neuen Erkenntnissen ist die Wissenschaft mal wieder ein Stückchen voran gekommen.

Gruß
Frank
Parent - By Frank Quisinsky Date 2010-12-01 11:33
Auch Kopernikus setzte Maßstäbe aber letztendlich auch nur sehr wackelig. Das musste meist erst noch weiter erforscht werden und durch die Kombination bzw. Mischung mit neuen Erkenntnissen ist die Wissenschaft mal wieder ein Stückchen voran gekommen.

Vergessen ...
Zum Leidwesen der vielen Glaubensbrüder ... unseren Brüdern und Schwestern!
Also zum Leidwesen kirchlicher Ansichten ... den Glaubensfragen!

Wissenschaft kontra Glauben ... einer der ältesten Kämpfe überhaupt!
Müssen wir nicht aufs Computerschach übertragen

Gruß
Frank
Parent - By Ingo Bauer Date 2010-12-02 20:45
Hello Umko 1.1 SSE42 test finished.

http://www.inwoba.de

Nice new entry for beta testers.

Bye
Ingo
Up Topic Hauptforen / CSS-Forum / Umko 1.1 test running for the IPON

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill