Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / SWCR: Endergebnis Fire 1.5 xTreme x64
- - By Frank Quisinsky Date 2011-06-08 22:06
Hallo zusammen,

mittlerweile lief der Spießroutenlauf von Fire 1.5 xTreme zu Ende.
Ergebnis = +31 zur Version 1.31

Zur Engine selbst:
Im Grunde typische IPP Familie Ergebnisse. Die Statistiken gleichen sich an IvanHoe an. Sehr gut ist das Laufverhalten (kein einziger GUI Hänger), das Ponderverhalten (ja gar vorbildlich) und die Zeiteinteilung (sehr vorbildlich). Auch die Nutzung der Endspieltabellen scheinen sehr aggressiv zu sein. OK, auch der getestete IvanHoe B47cB x64 läuft sehr stabil und produzierte nur 1 Hänger. Die Remisquote ist während des Round Robin angestiegen und liegt dort wo auch die IvanHoe's liegen. Was auffällt zur Version is 1.31 ist, dass das Endspiel besser ist als bei Fire 1.31, vielleicht gar als bei IvanHoe B47cB. IvanHoe B47cB x64 spielt wie ich finde (rein intuitiv) einen Tick aggressiver.

Keine Überraschung bei diesem Test aber eine Verbesserung zur Predecessor Version 1.31!
Auch die vielen Parameter Einstellungen sind interessant.

Wer sich mit IvanHoe oder Fire beschäftigen möchte wird wahrscheinlich zu Fire greifen, gibt hier bei den Einstellungen mehr Möglichkeiten und die Spielstärke ist ca. gleich. Komme zu keinem anderen Ergebnis aber ich habe mir auch nur Statistiken angesehen, vielleicht 30-40 Partien beobachtet, wie gesagt kaum Zeit für mehr Schach.

Viele Grüße
Frank

In den nächsten Stunden werde ich mal die aktuelle SWCR Datenbank hochladen.
Wer möchte kann sich die Partien dann ansehen!
Parent - - By Frank Quisinsky Date 2011-06-08 22:50
Hallo,

so, die Datenbank mit 108.526 SWCR Partien (inklusive ELOstat und Bayesian Kalkulation, die beiden selbstgestrickten Bayesian Files für die Auswertung und einer Ausgabe Statistik Datei von Norm Pollock) steht in ca. 3 Minuten zum Download zur Verfügung. Wird derzeit hochgeladen!

Das nächste Datenbankupdate mit Partien von Andrea, den beiden beabsichtigten Spießroutenläufen von Stockfish und den letzten noch zu spielenden Partien von BugChess kommt dann in ca. 10 Tagen.

Viel Spaß mit der Datenbank und vor allem ... mit den ganzen möglichen Statistiken die hieraus möglich werden

Gruß
Frank
Parent - - By Guido.M Date 2011-06-09 05:53
Vielen Dank für diesen tollen Test.
Machst wirklich einen guten Job,muß man wirklich mal sagen !

Auch bei mir läuft Fire einwandfrei,wie bei Dir beschrieben.
Allerdings sieht die sache etwas anders aus wenn Du mit der Engine aufn Server (Chessbase) gehst.
Immer wieder Abstürze oder einfrieren.Absolut ärgerlich 

Grüße
Parent - By Michael Scheidl Date 2011-06-09 14:41
Bei mir mit 32 Bit und Singlecore ist Fire 1.5 auf Playchess.com nicht für 3+0 geeignet: Zeitüberschreitungen! Die Engine kann diese Bedenkzeit, zumindest in dieser Konfiguration, nicht einhalten. Ich habe zwar nur zwei Partien probiert, aber der Eindruck war sehr eindeutig. Die Engine schien überhaupt nicht auf den Stand der Schachuhr zu reagieren. Es gibt zwar mehrere zeitbezogene "kryptische" Parameter, aber keine Dokumentation dafür. Sorry, so groß ist meine Begeisterung dann auch nicht um hier ohne jede Unterstützung herumzuprobieren, während ich serienweise Verluste einfahre.

Wenn das bei Frank gegenteilig aussieht, kann das entweder von SMP und/oder von anderen, längeren Zeitkontrollen abhängen. Vielleicht braucht Fire 1.5 in Default-Einstellung ein gewisses Minimum > 3+0.

Für mich liegt sowieso der Wert jeder Engine vor allem in der Leistung im Analysemodus, wo obiges egal ist.
Parent - By Frank Quisinsky Date 2011-06-09 22:05
Hallo Guido,

im Grunde läuft jetzt wirklich nur noch alles vor sich hin.
So langsam ist es möglich mit den Daten zu spielen, gibt so viele Möglichkeiten etwas interessantes zu starten.

Schön wenn es Dir gefällt!

Und zu ChessBase, da kann ich wenig sagen!
Spiele ja kaum auf dem Server.
Hast du mal ältere GUI Versionen ausprobiert?

Viele Grüße
Frank
Parent - - By Ingo Bauer Date 2011-06-09 10:15
Moin Frnak,

[quote="Frank Quisinsky"]

Das nächste Datenbankupdate mit Partien von Andrea,...

[/quote]

Ich lese da das Andrea einen i7 benutzt aber ansonsten die selben Einstellungen wie die SWCR. Wie schnell ist den der i7 genau?
Heißt das, dass er auf seinem wahrscheinlich schnellerem i7 auch 40/10 spielt, sogar ohne jede Zeitanpassung durch einen Benchmark (die in sich schon schlecht sind weil sie immer nur eine Engine und nie alle abbilden können)? Hast du ein solches Mischen von Hardware nicht immer strikt abgelehnt, insbsondere auch als ich auf die Phenoms umgestellt habe? Warum dieser Umschwung?

Gruß
Ingo
Parent - - By Clemens Keck Date 2011-06-09 10:36
Hallo Ihr da

also zum Thema hardware mischen:
Ich hatte kürzlich mal so einen Gedanken über ein Projekt- leider habe ich Ihn schnell verworfen, da ich mir meiner Ausdauerproble bewusst bin.
Und zwar ging es um die erstellung einer User-Ratinglist oder average-hardware-rating-list. Also Computer aller Art und Leistungsklassen ohne Zeitanpassung an einer Liste arbeiten lassen. Das rating dürfte bestimmt der Wahrheit am nächsten kommen-und wohl auch nur wenig von den bekannten Listen abweichen.
Könnte doch sein dass die Laborergebnisse teils zu abstrakt sind.

Gruß, Clemens
Parent - - By Ingo Bauer Date 2011-06-09 12:53 Edited 2011-06-09 12:55
Hallo Clemens,

Ja, wenn man viele verschiedene Hardware hat ginge das bestimmt, ich glaube auch das die Abweichungen dann gering wären. Das Problem ist nur, das meistens wenige, im obigen Fall nur zwei Hardwaren (?) gemischt werden. Man hat also nur zwei Extreme. Ideal wären 10 (oder mehr) verschiedene Architekturen, ein kompletter Durchlauf für alle und dann die beiden Extreme aus der Datenbank löschen. Das gäbe einen ordentlichen Mix.

Ansonsten sollte man beim messen Variablen so gering wie möglich halten. (Das Schlüsselwort ist "... so gering wie möglich". Perfekt geht es kaum)

Ich sehe natürlich auch das mehr Spiele zu einer größeren Genauigkeit führen. Den möglichen Fehler durch eine weiteren Hardware gleicht man wömöglich mit mehr Spielen aus ... alles Spekulation. Ich wundere mich nur, weil Frank vehemnt dagegen war als ich umgebaut habe und jetzt holt er ohne Not weitere HW in Boot.

Gruß
Ingho
Parent - By Frank Quisinsky Date 2011-06-09 22:07
Hallo Ingo,

eigentlich bin ich auch dagegen aber der Unterschied ist sehr gering und beides sind Intel Systeme.
Auch ist es mir nicht mehr so wichtig, wichtiger ist es Personen zu integrieren die Lust haben mitzutesten.
Warum auch nicht?
Könnte ja 6 Q9550 auf die Liste ansetzen aber mein Vorsatz ist klar ... nicht mehr als 4 Systeme!

Gruß
Frank
Parent - By Frank Quisinsky Date 2011-06-09 21:42
Hallo Ingo,

Andrea berichtete, dass sein i7 fast die gleichen Bench Resultate erreicht als mein Q9550. Er wollte daher alles bei 40 in 10 belassen. Ein Update von Intel zu AMD ist schon gefährlicher hinsichtlich Beeinflussung. Innerhalb von Intel gibt es da kaum nennenswerte Unterschiede. Die neueren schnelleren i7 ... da hätte er sicherlich 40 in 7 spielen lassen müssen. Und wer möchte kann später auch die Partien aus der Datenbank entfernen ... werden gesondert gekennzeichnet. Allerdings besteht hierfür kein Grund.

Die SWCR Datenbank steht frei zur Verfügung, jeder kann z. B. auch Engines entfernen die nicht gefallen und sich seine eigene Ratingliste mit den Lieblingsengines errechnen lassen.

Gruß
Frank
Parent - - By Dieter Eberle Date 2011-06-09 13:47
Hallo zusammen,
ich möchte auf das enorme Potential hinweisen, dass in Fire 1.5 steckt. Mit etwas besseren Parametern als den defaults kann Fire noch einmal deutlich zulegen. Ich habe nicht den Eindruck, dass bei den engines der Ippolit-Familie nichts mehr vorwärtsgeht.  
Ergebnisse des settings e1 sind hier zu finden
http://www.chess2u.com/t2403p45-fire-15-xtreme-tests#14996
Gruß, Dieter 
Parent - - By Benno Hartwig Date 2011-06-09 14:16
[quote="Dieter Eberle"]ich möchte auf das enorme Potential hinweisen, dass in Fire 1.5 steckt. Mit etwas besseren Parametern als den defaults kann Fire noch einmal deutlich zulegen. [/quote]Bisweilen liest man zu verschiedenen Engines 'hat viel Potential'.
Woran machst du fest, dass gerade Fire besonders viel Potential hat?
Gelingt es hier tatsächlich durch drehen an den Parametern ein statistisch belegbares gutes Spielstärkeplus herauszuschrauben? Mehr als bei anderen?
Führen kleinere Programmkorrekturen wirklich zu deutlich mehr ELO?
Macht Fire besonders häufig 'dumme Fehler', die man doch 'einfach' abstellen können müsste?

Woran ganz konkret erkennst du dieses besondere Fire-Potential?
(habe dies halt selbst bislang nicht erkennen können)

Beeinbdruckend sind schon die letzten Spielstärkesteigerungen.
Aber lässt das wirklich auf die Zukunft schließen?
Und lässt das nicht mehr auf die Entwickler (und deren Potential) als auf die Engine schließen?
R3 war auch mit einem Riesensatz nach vorn gestürmt, und R4 hat eher enttäuscht. (Hatte R3 dann viel Potential?)

Benno

PS:
Bisweilen täuschen die Erfolge beim Parameterdrehen.
Wenn man diverse 100er- oder auch 300er-Testläufe macht mit verschiedenen (und ggf. doch gleichwertigen) Parameterisierungen, dann werden annähernd die Hälfte besser als der Durchschnitt sein, annähernd die Hälfte wird schlechter sein.
Und wenn es ein paar Tests mehr sind, dann werden welche dazwischen sein, die recht deutlich über dem Durchschnitt liegen.
Vielleicht sogar eine, die richtig hervorsticht!
Und da helfen dann nur neue, längere Testreihen gezielt mit diesen Hoffnungs-Kandidaten.
Habe halt selbst schon bisweilen glücklich frohlockt, um dann (eigentlich jedesmal!!) etwas später die Realität wiederzufinden.
Parent - - By Dieter Eberle Date 2011-06-09 14:55
Hallo Benno,
in Franks Testerzielt Fire schlappe 33,75% gegen Houdini, verliert gegen Rybka und Ivanhoe und gewinnt hauchdünn gegen Stockfish.
Die Ergebnisse des e1-Settings in immerhin 800 Blitzpartien sehen völlig anders aus.
Fire hat eine Unmenge Parameter, an denen man schrauben kann, und wenn es mir auf Anhieb gelingt, mit einem einfachen Setting eine deutliche Verbesserung zu erzielen, schließe ich daraus, dass in diesen Parametern eine Menge Potential steckt.
Gruß, Dieter
Parent - - By Benno Hartwig Date 2011-06-09 15:19 Edited 2011-06-09 15:22
Hallo Dieter,

[quote="Dieter Eberle"]in Franks Testerzielt Fire schlappe 33,75% gegen Houdini, verliert gegen Rybka und Ivanhoe und gewinnt hauchdünn gegen Stockfish.[/quote]Es ist schon richtig, dass in Franks Turnier der Fire 1.5 interessanterweise gerade gegen die Top-5-Engines schlechter gespielt hat als es letztlich zu erwarten gewesen wäre. Fire punktete halt besser gegen die schwächeren Engines (Inwieweit dieses Scoring interessiert, wird jeder selbst entscheiden. An anderer Stelle fragte ich ja auch, gegen welche Gegnerschaft ELO erspielt werden sollte, damit ELO tatsächlich möglichst das beschreibt, was einen interessiert.)
Auch wissen wir beide sicher sehr gut, dass bei jeweils nur 40(!!!) Partien gegen einen einzelnen Gegner dieses spezielle Teilergebnis kaum zu mehr als einer äußerst groben Einsortierung taugt.

[quote="Dieter Eberle"]Die Ergebnisse des e1-Settings in immerhin 800 Blitzpartien sehen völlig anders aus.[/quote]Magst du mein Augenmerk lenken:
Wo muss ich hingucken um zu erkennen, dass Fire-e1 bei 800 Spielen 'völlig andere' Ergebnisse erreichen konnte?
Wie sehr 'anders' sind sie?

Benno
Parent - - By Dieter Eberle Date 2011-06-09 15:38
Hallo Benno,
die Ergebnisse des e1-Settings findest Du unter dem Link in meinem ersten Posting. Jedes der 8 matches zeigt bessere Ergebnisse für Fire als die vergleichbaren matches in Franks Test, besonders krass ist das bei den Gegnern Houdini und Ivanhoe.
Frank hat ein andere Ivanhoe-Version in seinem Test, aber die 47cB und der 47cC sind annähernd gleich stark.
Gruß, Dieter
Parent - - By Benno Hartwig Date 2011-06-09 15:48 Edited 2011-06-09 15:52
[quote="Dieter Eberle"]die Ergebnisse des e1-Settings findest Du unter dem Link in meinem ersten Posting. [/quote]Thanx, Dieter,
was haben eigentlich die Zusätze in den Namensgebungen der Gegner-Engines zu bedeuten?
Ivanhoe B47cCx64 bb lp
Houdini 1.5a x64 gtb t4
(und ich hoffe, dass ich überhaupt auf die Begenungen sah, die du meintest)

Benno
Parent - - By Dieter Eberle Date 2011-06-09 17:47
Hallo Benno,
bb steht für both bases (RobboTripleBases + RobboTotalBases), keine glückliche Wahl, muß ich gestehen.
lp steht für TryLargePages=true. Das hat in dem match gegen Ivanhoe B47cC keine Rolle gespielt, da large pages im System ausgeschaltet waren.
gtb bedeutet Gaviota tablebases, t4 steht für Threads=4. Letzteres sollte auf einem quadcore Rechner keine Auswirkung haben, da Houdini Houdini mit maximal 8 threads läuft und die Zahl der threads automatisch bestimmt.
Gruß, Dieter
Parent - By Benno Hartwig Date 2011-06-09 18:05
Thanx,
ich wollte halt gern bestätigt werden, dass dies keine anderen Parameterveränderungen bedeutet, die diese Engines hätten schwächen können.
Benno
Parent - By Michael Scheidl Date 2011-06-12 01:24
Wie ist das Zugriffsverhalten von Houdini auf die Gaviotas? Bei mir greift die Engine in Grundeinstellung selten bzw. spät zu, erst bei ganz wenig Steinen am Brett. Es gibt zwei Engineparameter die das steuern. Siehe hierzu auch

http://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=38793

mit einer Gegenüberstellung. Ich benutze aber nur die Drei- und Viersteiner. Habe bei mir jetzt hard 10 und soft 2 eingestellt. Der Soft-Zugriff betrifft nur Tables die schon im Speicher sind. Vermutlich sind für MP-Betrieb und Fünfsteiner etwas größere Werte in Betracht zu ziehen, aber die Grundeinstellung kommt mir nicht optimal vor.

Selbstverständlich liegen meine Nalimovs und Gaviotas nicht auf der Festplatte (sondern auf USB-Memorystick; eine SSD wäre noch besser). Vielleicht sind die Houdini-Defaults "extra vorsichtig" dimensioniert, um nicht zu große Bremseffekte bei Leuten zu bewirken wo die Fünfsteiner auf der Festplatte liegen.

Man kann sich das ja in Teststellungen ansehen.

Mir kommt übrigens die Logik dieser beiden Settings komisch vor: Mindesttiefe, ab(!) der zugegriffen wird. Ich dachte, im allgemeinen wird zugegriffen bis eine bestimmte Resttiefe unterschritten wird (deswegen ergaben bei manchen Engines kleinere Parameterwerte mehr Zugriffe), und danach nicht. Also wenn z.b. Tiefe 20 angepeilt wird, Einstellung sei beispielsweise 8, Tbs.-Zugriffe bis Tiefe 20-8 = 12. Houdini will das offenbar umgekehrt machen, oder ich mißverstehe etwas nicht... Naja, ich bin ja kein Programmierer.
Parent - - By Frank Quisinsky Date 2011-06-09 21:36
Hallo Dieter,

aber das ist die ewige Suche! Mit dem Hintergedanken ... könnte ja besser sein!
Früher dachten viele von uns, dass die Bücher doch so viele ELOs ausmachen.
Heute sind es die Parameter von den Engines.

Eine Engine wird hier und dort bessere oder schwächer Lösungszeiten mit diesen vielen Möglichkeiten erzielen, aber durch eine Parameterveränderung wird eine Engine kein neues Wissen hinzugefügt. Erinnern wir uns an TheKing oder an andere Engines. Sicherlich können Parameter etwas ausmachen aber dies abzutesten ist schier unmöglich weil es einfach zu viele Konstellationen gibt. Möglich das Du eine gefunden hast bei dem Fire zum Beispiel gegen bessere Engines besser als default punktet aber gegen schwächere könnte das wieder nach hinten los gehen.

Bei den hohen Spielstärken, die wir heute haben ... wem fällt wirklich eine Verbesserung oder Verschlechterung von vielleicht 30 ELO durch einen Parameter auf?

Ganz kritische Geschichte und da für uns nicht wirklich feststellbar verbleiben die Spekutationen. Wie einst, als ein neuer Schachcomputer herauskam und wir nach einem glücklichen 20-Partien Resultat eine Verbesserung von 100 ELO vermuteten.

Wenn wir nicht wissen wie stark eine Engine ist, reizt diese Engine umso mehr. Wenn die Ratinglistenbetreiber heute sehr schnell eine ELO liefern und alles sich +- einig sind, verliert die Engine sehr schnell an Interesse. Ja wir wünschen uns eine neue Version weil wir nicht wissen ob besser oder schlechter und der Reiz ist wieder da.

Verrückte Welt hinsichtlich Ratings von Computerschachprogrammen ... überhaupt das ganze Computerschach.

Viele Grüße
Frank
Parent - - By Dieter Eberle Date 2011-06-10 00:17
Hallo Frank,
natürlich kann ich nicht alles testen. Deshalb habe ich mich erst einmal auf die starken Gegner konzentriert.
Mir ist schon klar, dass nur eine grosse Zahl von Partien gegen viele Testgegner unterschiedlicher Stärke eine einigermassen verlässliche Einschätzung der Spielstärke einer engine erlaubt.
Bis ich mit einem Rechner die Qualität eines Fire settings wirklich ausgetestet habe, hat Norman schon zwei neue Versionen herausgebracht. Trotzdem macht es mir Spass an den Parametern herumzuschrauben und das ist die Hauptsache.
Ich bin sehr gespannt auf die Stockfish-Tests, die jetzt anlaufen. Stefan Pohls Aggressivität 150 brachte bei mir sehr gute Ergebnisse.
Gruß, Dieter
Parent - - By Frank Quisinsky Date 2011-06-10 05:16
Hallo Dieter,

könntest Du mir denn ein gutes Setting für Fire benennen, das "e" Setting?
Könnte dieses dann zeitgleich mit Komodo 2.0.1 x64 JA testen wenn die beiden Spießroutenläufe von Stockfish durch sind.

Hat also noch eine Woche Zeit, wäre schön wenn Du es mir mailen könntest.

Viele Grüße
Frank
Parent - - By Dieter Eberle Date 2011-06-10 08:47
Hallo Frank,
e1 (steht für experiment 1) ist nicht geheim. Ich hatte es in Ahmeds Forum gepostet, weil Norman da liest und schreibt.
Es besteht aus King Safety Weight 107 and Mobility Weight 105. Im Moment beisst sich Deep Rybka 4 exp 42 die Zähne daran aus.
Es steht 43,5:39,5 für Fire 1.5 e1. Natürlich ist das wieder ein guter Gegner. Ein richtiger Ranglistentest wäre schon eine tolle Sache.
Mit einem Rechner kann ich eigentlich nur mit ganz kurzen Blitzzeiten testen, wenn ich auf ein paar Partien kommen will.
Gruß, Dieter
Parent - - By Frank Quisinsky Date 2011-06-11 11:00
Hallo Dieter,

also nur die Veränderung dieser beiden Parameter?

Im Anschluss an den beiden SF Läufen kann ich dann Komodo 2.0.1 JA x64 mit Fire 1.5 xTreme "Set. E" kombinieren. Sollte bis Sonntag nächster Woche sich noch etwas ändern oder ein besseres Setting auftauchen wirst Du mir sicherlich einen TIPP geben.

Erinnerung:
Auch Weal dachte an eine Verbesserung bei Fire. Sein Setting war aber 10 ELO schwächer und ich nahm es aus der Liste. Die taktischen Schrauben bei Fire müssen sehr tief stehen um bessere Ergebnisse gegen andere IPPs zu erzielen. Das wird sich dann bei längeren Bedenkzeiten und mehr Gegnern negativ auswirken. Siehst Du ja auch an dem SF Test.

Aber wer weiß ...
Werde ein Fire Setting noch testen und dann nochmals mein Oldie-Mix verschieben. Stehen einfach zu viele interessante aktuelle Dinge an. Das Oldie-Mix läuft auch nicht weg.

Gruß
Frank
Parent - - By Dieter Eberle Date 2011-06-11 19:05
Hallo Frank,
meine .uci sieht aus wie folgt:
[ENGINE]
Name=Fire 1.5 xTreme x64p e1
Author=Kranium
Filename=C:\Program Files (x86)\ChessBase\Engines.UCI\Fire_15_xTreme_x64_PP\Fire 1.5 xTreme x64p.exe
[OPTIONS]
King Safety Weight=107
Mobility Weight=105
Current Move Info=true
Hash Full Info=true
TBHit Info=true
Use Robbobases=true
TripleBase Directory=C:\trb
TotalBase Directory=C:\RobboTotalBase
TotalBase Cache=64
Dynamic TripleBase Cache=256
TripleBase Hash=256
Bulk Load Directory=C:\trb\5
Ausser den beiden geänderten Parametern gibt es nur angeknipste Infos sowie Einstellungen für die RobboTripleBases und RobboTotalBases. Da Du nur 4-Steiner benutzt, dürften allein die beiden die Einstellungen
King Safety Weight=107
Mobility Weight=105
für Dich relevant sein.
Engines der Ippolitfamilie haben nicht sehr viel Endspielwissen, da man voll auf die Robbobases gesetzt hat. Wenn nur 4-Steiner benutzt werden ist das ein gewisses Handicap für diese engines, da Konkurrenten wie Houdini, Rybka und Stockfish über mehr Endspielwissen verfügen und mit weniger Endspieldatenbanken besser zurecht kommen.
Gruß, Dieter  
Parent - By Michael Scheidl Date 2011-06-12 00:59
Stockfish und Houdini sind jedenfalls keineswegs allwissend im Endspiel. Zwar kann ich jetzt keine konkreten Beispiele anführen, aber das war mein Eindruck beim Kibitzen auf TCEC. Rybka sowie Ivanhoe (Fire spielte dort nicht) sind mir dahingehend nicht negativ aufgefallen.

Einige neue(re) starke Freeware-Engines wissen weniger über Endspiele als Schachcomputer anno 1990, was sie sich nur leisten können weil sie nichts kosten. Geschenkter Gaul und so. Aber es sieht mitunter furchtbar aus. Ich habe mir dann immer gedacht, hoffentlich schaut kein GM von Weltrang zu.
Parent - - By Frank Quisinsky Date 2011-06-12 10:21 Edited 2011-06-12 10:23
Hi Dieter,

die Frage ist testen oder aussitzen.
Siehe neuen Beitrag "Nova" im Forum.

Fire scheint jetzt wieder eine Kettenreaktion auszulösen. Konzentriere ich mich darauf bleibt alles andere liegen? Entscheide Du, mir ist es im Grunde egal ob ich das von Dir vorgeschlagene Setting teste oder nicht. Tendiere dazu zu testen ... produziert ein paar Anhaltspunkte mehr ob sich die Arbeit an den Settings lohnt oder ob Ergebnisse gegen bekannte Gegnerschafft nur verschoben werden ... hier besser dort schlechter!

Sonst wären innerhalb kürzester Zeit 4x Fire in meiner Liste und mit Nova hört die Sache ja nicht auf

Viele Grüße
Frank
Parent - - By Dieter Eberle Date 2011-06-12 14:35
Hallo Frank,
mein Fire 1.5  setting e1 (kurios, e1=experiment1 war tatsächlich das allererste, das ich ausprobierte, weil mir in Partien aufgefallen war, dass Fire 1.5 manchmal zu wenig auf den König achtet und auch gelegentlich Figuren ins Abseits manövriert) würde um Rang 2 streiten. Wenn nun ein Fire Nova angekündigt ist, der es mit Houdini aufnehmen kann, dann kannst Du erst einmal abwarten, was es damit auf sich hat. Das ist OK für mich und ich sehe das völlig unverkrampft. Vielleicht kommt schon in den nächsten Tagen eine Ankündigung, wann mit Fire Nova zu rechnen ist. Auf jeden Fall slltest Du entscheiden, was Du wann in Deiner Rangliste testest.

Stockfish ist ein Gegner gegen den sich Ippolit-basierte engines oft schwertun. Ich habe Fire 1.5 auch gegen die Stockfish-Riege antreten lassen mit folgenden Resulten:
                                      
1   Fire 1.5 xTreme x64p e1        +10  +23/=57/-20 51.50%   51.5/100
2   Stockfish 2.1.1 JA 64bit PQH   -10  +20/=57/-23 48.50%   48.5/100

                                       
1   Fire 1.5 xTreme x64p e1         +17  +21/=63/-16 52.50%   52.5/100
2   Stockfish 2.1.1 JA 64bit A150   -17  +16/=63/-21 47.50%   47.5/100 (Stefan Pohls Vorschlag Aggressivität 150 ohne weitere Änderungen)

                                   
1   Fire 1.5 xTreme x64p e1    +24  +27/=53/-20 53.50%   53.5/100
2   Stockfish 2.1.1 JA 64bit   -24  +20/=53/-27 46.50%   46.5/100

Gespielt wurde jeweils mit 4 cores, ponder off, Bedenkzeit 2m+2s und KLO-Eröffnungen.

Fire 1.5 e1 hat bei mir mehrere matches gegen Houdini mit 43-45% verloren, alle anderen matches gewonnen. Es hat mir Spass gemacht, mich damit zu beschäftigen. Wenn nun ein ein Fire Nova daherkommt, der besser ist, dann nehme ich den mit Handkuss und Fire 1.5 e1 ist Schnee von gestern. Im Hinterkopf habe ich aber vielleicht schon Fire Nova e1.
Gruß, Dieter

  
Parent - - By Frank Quisinsky Date 2011-06-12 19:35
Hi,

weiß jetzt auch nicht wie ich vorgehen soll.
Deine Ergebnisse sind interessant.

Vielleicht erst Komodo 2.01 JA testen und dann Nova und Dein Setting wieder gleichzeitig wie jetzt bei SF.
Weiß noch nicht!

Fest steht das Komodo 2.0.1 natürlich noch getestet wird.
Kommt sehr viel, schiebe dann die 32bit Turniere weiter auf.

Viele Grüße
Frank
Parent - By Dieter Eberle Date 2011-06-12 20:09
Hi Frank,
Du kannst das ganz locker auf Dich zukommen lassen und einfach nach Sachlage entscheiden. Falls Fire Nova erscheint, wird sich innerhalb eines halben Tages herauskristallieren, ob es tatsächlich ein Houdini-Konkurrent ist. Wenn das der Fall ist, kannst Du den Test von Fire 1.5 e1 auch einfach canceln, weil er dann nicht mehr interessant ist. Wie ich schon sagte, kann Fire 1.5 e1 um Rang 2 streiten, ist aber keine Konkurrenz für Houdini.
Gruß, Dieter
p.s.: Ich bin von Montag bis Donnerstag unterwegs, kann also nicht mitüberlegen.
Parent - - By Thorsten Czub Date 2011-06-09 14:41
interessant. ich glaube auch das fire1.5 ein fortschritt ist.

da sind wir einer meinung.
Parent - By Dieter Eberle Date 2011-06-11 13:47
Hallo Thorsten,
Fire 1.5 ist bereits sehr stark, aber besonders faszinierend sind für mich die vielen Einstellungsmöglichkeiten, die die engine mitbringt. Ein Teil der Parameter ist neu. Da ist sicher noch nicht alles optimiert und es lohnt sich vermutlich, damit zu experimentieren.
Gruß, Dieter
 
Parent - - By Benno Hartwig Date 2011-06-16 20:31 Edited 2011-06-16 20:35
[quote="Dieter Eberle"]ich möchte auf das enorme Potential hinweisen, dass in Fire 1.5 steckt.[/quote]
Haben auch andere mit diesem Fire-e1-Setting herumprobiert?
Ich war neugierig und habe Fire_1.5_e1 mal auf meinen kleinen Schnelltest geschickt, mit dem ich ansonsten meine Stockfish-Änderungen mit einem ersten Blick betrachte.
(74 Stellungen, mit Wiederholung gegen Rybka 3 und 4, 1m+1s, 1core, 32bit -> also 296 Partien)

ein kurzer Vergleich:
Code:
Stockfish 2.1     161,5 Punkte
Fire 1.5          163,5 Punkte
Fire 1.5 e1       160,5 Punkte

298-Partien liefern natürlich nur sehr unscharfe Ergebnisse.
Dass Fire 1.5 etwas stärker als Stockfish 2.1 ist, wird hier aber auch nahegelegt.
Aber Einen Hinweis darauf, dass e1 stärker, oder sogar deutlich stärker ist als das original-Fire-Setting, fand ich aber nicht. Eher das Gegenteil!
Haben andere die vermutete besondere et-Stärke irgendwie bestätigen können, oder eben das Gegenteil gefunden?

Benno

PS:
Bei Stockfish habe wohl selbst größere Änderungen von Aggressiveness und Cowardice kaum (keine?) Änderung der Spielstärke zur Folge. Auch nicht negativ!!
Ich wäre nicht überrascht, wenn dies bei anderen Parametern auch von Fire ähnlich wäre, besonders wenn die Änderung vergleichsweise klein ist.
Parent - By Dieter Eberle Date 2011-06-16 21:39
Danke für Deine Tests, Benno.
Ich war ein paar Tage unterwegs, kann Dir im Moment nicht sagen, ob noch jemand mit dem e1-setting getestet hat.
Um es kurz zusammenzufassen, gegen Houdini hat Fire 1.5 e1 bei mir 44-45% erzielt. Das schafft keine andere engine.
Alle anderen matches hat Fire 1.5 e1 gewonnen, auch gegen Deep Rybka 4.1 und gegen das starke setting Deep Rybka 4 exp. 42 und sehr deutlich gegen Ivanhoe 47cC, die Ivanhoe-Version, die bei mir am besten lief..
Relativ knapp fielen die Siege gegen Stockfish 2.1.1 PQH und Stockfish mit Agressivität 150 aus. Fast alle Ippolit-basierten engines tun sich gegen Stockfish schwer.
Hat Fire in Deinem Test Robbobases benutzt? Wenn ja, welche?
Gruß, Dieter 
Parent - By Ingo Bauer Date 2011-06-12 19:00 Edited 2011-06-12 19:05
.

Falscher Thread, sorry.

Ingo
Up Topic Hauptforen / CSS-Forum / SWCR: Endergebnis Fire 1.5 xTreme x64

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill