Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / R4 against Fire131
- - By Ernst Happe Date 2010-06-11 12:00

Arena Turnier02

PlatzMotorAutorWertungszahlPunkte%DeFiS-B
1Deep Rybka 4 w32 220011,0/2055,0· ·· ·· ·· ·· ·· ·· ·· ··11=0===100===1=0=11=
2Fire_131_w32_KLO 22009,0/2045,000=1===011===0=1=00=· ·· ·· ·· ·· ·· ·· ·· ··


20 Partien gespielt / Turnier beendet

Beginn des Turniers: 2010.06.10, 13:31:14
Letzte Aktualisierung: 2010.06.11, 11:49:34
Ort/ Land: XEON, Deutschland
Spielstufe: Blitz 3/3
Hardware: Intel(R) Xeon(TM) CPU 3.06GHz mit 2.048 MB Speicher
Betriebssystem: Microsoft Windows XP Professional Service Pack 2 (Build 2600)
Bedingungen: Hash: 256MB, Tablebases: Ein, Robbobases:Ein, Totalbases:Ein, Rechnen auf Gegnerzeit Aus, Anfangsstellung Noomen-Select.pgn
Benchmark: ArenaMark: 20,57 AM, 1,10 EF
Tabelle erstellt mit: Arena 2.0.1


Danach wäre R4 ca.:33-39 Elo =Punkte besser als fire 131
Deckt sich das mit anderen seriösen durchgeführten Turnieren?

Ernst
Parent - - By Benno Hartwig Date 2010-06-11 12:47
[quote="Ernst Happe"]Deckt sich das mit anderen seriösen durchgeführten Turnieren?[/quote]Gibt es denn seriöse Turniere, an denen Fire 131 teilnahm?
Benno
Parent - By Ernst Happe Date 2010-06-11 12:51
bestimmt

Ernst
Parent - - By Michael Waesch Date 2010-06-11 12:58
Ich nehme an, daß das darauf ankommt, was du unter seriös verstehst. Meinen Beobachtungen nach hängt R4 vs Fire 1.3 auch stark davon ab, auf welchem Rechner sie gespielt werden und welche R4 Version genommen wird.

Mike
Parent - - By Benno Hartwig Date 2010-06-11 17:12
[quote="Michael Waesch"]Ich nehme an, daß das darauf ankommt, was du unter seriös verstehst. [/quote] Welche mit Fire-1.3.1-Beteiligung könnten denn eventuell als seriös angesehen werden?
Nur damit man mal eine Vorstellung davon gewinnt, bis zu welchem Seriositätsgrad Fire-1.3.1 denn überhaupt betrachtet wurde und wird.
Benno
Parent - - By Michael Waesch Date 2010-06-11 17:21
Wenn du meinst, daß jede Liste, gleich welcher Art, schon allein durch die Aufnahme von Fire 1.31 unseriös wird, dann sag es doch auch so.

Mike
Parent - - By Benno Hartwig Date 2010-06-11 17:26
Nein, sicher nicht.
Außer den Berichten aus privaten Ultrakurzturnieren und den Norman'schen Lobeshymnen habe ich halt noch nichts hier gesehen.
Und da Ernst nun ausdrücklich nach seriösen Turnieren gefragt hat, ist es schon interessant, ob da irgendwo im Netz mehr ist.
Und wenn ich nach solchen Turnieren frage und als Antwort lediglich eine Unterstellung erhalte, dann, Danke Mike, dann ist das ja auch wirklich eine informative Antwort.

Benno
Parent - By Michael Waesch Date 2010-06-11 17:49
Über Fire kann ich nicht mehr sagen, als ich schon gesagt habe. Auf meinem i7 ist es jedenfalls im Bullet ziemlich stark, aber eigentlich geht es doch hinter vorgehaltener Hand nur um die Grabenkriege der Rybka-Befürworter und der Rybka-Ablehner und daß jeder der Ansicht ist, daß jeweils stärkste Programm zu besitzen. Und dann tauchen immer neuere Programme auf und die "Herausgeber", um es einmal vorsichtig zu formulieren, tönen dann "Alles Quatsch! Weder Rybka noch Fire sind die Nr. 1, denn die Nummer Eins hab allein Üüüüüüüüüüüüch!!!!".

Nun, mir ist das alles ziemlich egal, da ich, was Klone betrifft ohnehin keine rechtliche Relevanz sehe und m. E. nach sich jeder damit frei vergnügen kann wie er will. Und wer ganz auf Nummer sicher gehen will, nimmt Stockfish. Ich habe einige, der in letzter Zeit veröffentlichten Engines getestet, einerseits in meinen kleinen Spaßturnieren und auch als Analyse-Engine unter DF12-GUI [wird dank des Kopierschutzes, der nun offenbar nicht mehr auf einer Disc beruht, nun auch keine weiteren CB-Versionen mehr kaufen, vielleicht mal wieder ´n Shredder beim Kahlen selbst] - und ich kann sagen, daß man damit arbeiten kann ohne all zu viel Kalamitäten [Abstürze etc] damit zu haben.

Durch meine Umfragen ist mir auch klar geworden, daß das Durchschnittspublikum hier sehr gut informiert ist - und die Diskussionen über die Klone, bei den meisten stillen Lesern nur Gähnen verursachen dürfte, da ihnen die Fakten, falls man überhaupt von solchen sprechen kann, schon längst bekannt sind. Ehrlich gesagt, wundert es mich nur, daß noch kein "Kloner" einfach herging und "sein Programm" eiskalt zu vermarkten suchte, frei nach dem Motto: "Das müßt ihr mir erst einmal nachweisen, also verklag mich doch!"...

Na, man wird sehen.

Mike
Parent - - By Ernst Happe Date 2010-06-11 17:24
[quote="Benno Hartwig"]
[quote="Michael Waesch"]Ich nehme an, daß das darauf ankommt, was du unter seriös verstehst. [/quote]
Welche mit Fire-1.3.1-Beteiligung könnten denn eventuell als seriös angesehen werden?
...
Benno
[/quote]
alle die, die unmanipuliert ablaufen, d.h.:

1. gleiche Bedenkzeit
2. unveränderte Engine Settings
3. keine Spezialbücher
4. beide mit oder ohne EGTB`s
5. beide mit gleicher Rechenpower des Rechners z.B. CPU`s
6. beide mit Ponder on oder off
7. gewertet wie gespielt! Zü; Absturz der Engine...
8. keine zusätzlichen Programme ablaufen lassen Stichwort minimal OS
...
Parent - - By Benno Hartwig Date 2010-06-11 19:25
Für notwendig halte ich darüber hinaus:
- eine genügend große Anzahl von Partien
- Vertrauenswürdigkeit der Durchführenden aufgrund längerer Szene-Präsenz dieser Leute.

"Ich bin Jogi Glupsch und habe mal eine Hand voll Spiele gemacht!" reicht halt nicht für ein seriöses Turnier, auch wenn er erklärt, er habe deine Kriterien glänzend eingehalten.

Benno
Parent - By ernst Happe Date 2010-06-11 19:51
[quote="Benno Hartwig"]
Für notwendig halte ich darüber hinaus:
- eine genügend große Anzahl von Partien <-- o.k. aber so groß wie viele glauben muss sie aber nicht sein Ernst
- Vertrauenswürdigkeit der Durchführenden aufgrund längerer Szene-Präsenz dieser Leute. <-- siehe Überschrift unmanipuliert Ernst

"Ich bin Jogi Glupsch und habe mal eine Hand voll Spiele gemacht!" reicht halt nicht für ein seriöses Turnier, auch wenn er erklärt, er habe deine Kriterien glänzend eingehalten.

Benno
[/quote]

Ernst
Parent - - By Orlando de la Vega Date 2010-06-11 13:03
Hi Ernst,

it's a very interessant tournament. But how many threads did you use for each engine ?

Best,
Orlando
Parent - By Ernst Happe Date 2010-06-11 13:22
each 4
Parent - By Ulrich Harm Date 2010-06-11 13:10
"Danach wäre R4 ca.:33-39 Elo =Punkte besser als fire 131"

Entschuldige, aber da musste ich dann doch schon mal ein bischen lächeln.
Als ob man mit einem Turnier gegen eine einzige Engine mit 20 Partien
ein Elo - Rating mit einer solchen Präzesion abgeben könnte !!
Da kann man genauso gut Kaffeesatz - Lesen.
Mal ganz davon abgesehen, dass das genaue Rating eines Programmes
natürlich immer auch etwas von den Spielbedingungen, der Hardware,
den Eröffnungsbüchern usw. abhängt. 
Selbst nach 500 Partien (z.B. 50 Partien gegen 10 verschiedene
Gegner bleibt immer noch eine statistische Ungenauigkeit von
sicher mindestens plusminus 10 Elopunkten beim Rating (wenn man mal
von einer 99 % igen Wahrscheinlichkeit ausgeht, dass das betreffende
Rating in diesem Fehlerrahmen liegt).

  


    Gruss Ulrich
_________________-
Parent - - By Axel Caro Date 2010-06-11 13:17
Hallo Ernst,

wenn Du schon Blitz spielen lässt, könntest Du die Partienanzahl dann nicht um eine Zehnerpotenz, sagen wir auf 100-500 Partien erhöhen? 20 Partien 3+3 sagen leider so gut wie gar nichts aus.

Gruß
Axel
Parent - By Ernst Happe Date 2010-06-11 19:47

Arena Turnier1

PlatzMotorPunkte%De
1Deep Rybka 4 w3241,0/8051,2==1====11=0=0=01=01=1=1=00==0=01=1=1001=010=00=1111=1==1=011000=11==00=1==010===
2Fire_131_w32_KLO39,0/8048,7==0====00=1=1=10=10=0=0=11==1=10=0=0110=101=11=0000=0==0=100111=00==11=0==101===


80 Partien gespielt / Turnier beendet

Beginn des Turniers: 2010.06.11, 12:31:54
Letzte Aktualisierung: 2010.06.11, 19:33:55
Ort/ Land: XEON, Deutschland
Spielstufe: Blitz 1/1
Hardware: Intel(R) Xeon(TM) CPU 3.06GHz mit 2.048 MB Speicher
Betriebssystem: Microsoft Windows XP Professional Service Pack 2 (Build 2600)
Bedingungen: Hash: 256MB, Tablebases/Robbobases/Totalbases: Ein, Rechnen auf Gegnerzeit Aus, Anfangsstellung Noomen-Select.pgn
Benchmark: ArenaMark: 20,57 AM, 1,10 EF
Tabelle erstellt mit: Arena 2.0.1


Aus Zeitgründen wurde die Bedenkzeit reduziert, was aber nach Studien von G.S. fast egal ist!

Ernst
Parent - By Benno Hartwig Date 2010-06-11 17:28
20 Partien bei langen Zeiten machen Aufwand. Dass diese Ergebnisse gepostet werden, kann ich schon verstehen.
Aber, Ernst, 20 Blitzergebnisse, mal so schnell an einem Abend erspielt. Hmmm...
Benno
Up Topic Hauptforen / CSS-Forum / R4 against Fire131

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill