Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Critter 1.6a running for the IPON
- - By Ingo Bauer Date 2012-06-26 20:20
at http://www.inwoba.de

Will it perform better than the 1.6 version?

Have fun
Ingo
Parent - - By Clemens Keck Date 2012-06-26 20:36
Klasse Ingo

ich hoffe es tut sich was, wie schon gelegentlich bei den a Versionen passiert.

Vielen Dank für die Gauntlets

MfG Clemens
Parent - - By Stefan Pohl Date 2012-06-27 07:14
[quote="Clemens Keck"]
Klasse Ingo

ich hoffe es tut sich was, wie schon gelegentlich bei den a Versionen passiert.

Vielen Dank für die Gauntlets

MfG Clemens
[/quote]

Guten Morgen, zusammen

Es tut sich was bei der 1.6a, aber leider nach unten! So wie es bei Ingo z.Zt. aussieht (700 Partien gespielt, ca. -20 Elo), so sieht es leider auch bei mir aus, wenn auch nicht ganz so schlimm. Im LightSpeed-Gauntlet, der fast durch ist, liegt Critter 1.6a nach 2744 von 3000 Partien bei einer Erfolgsquote von 56.0%, während die 1.6 nach allen 3000 Partien bei 56.91% lag. Es ist sehr unwahrscheinlich, daß die 1.6a dieses Ergebnis noch erreicht...bisher also bei mir ca. -6 Elo (das ist allerdings innerhalb der Errorbar, ebenso wie Ingos Zwischenstand, aber eine Steigerung können wir uns wohl abschminken, wenn es in beiden Tests abwärts geht)

Grüße - Stefan
Parent - - By Thomas Müller Date 2012-06-27 08:17
Hallo,

danke an ingo und dich für die schnellen tests!
Also ist es ein bugfix...auch gut!

gruß thomas
Parent - - By Stefan Pohl Date 2012-06-27 08:52
[quote="Thomas Müller"]
Hallo,

danke an ingo und dich für die schnellen tests!
Also ist es ein bugfix...auch gut!

gruß thomas
[/quote]

Das Endergebnis (3000 Partien) von Critter 1.6a im LightSpeed-Gauntlet ist 56.4%, also 0.5% schwächer (3.5 Elo = Errorbar) als Critter 1.6.

Gruß - Stefan
Parent - - By Benno Hartwig Date 2012-06-27 12:47
[quote="Stefan Pohl"]Das Endergebnis (3000 Partien) von Critter 1.6a im LightSpeed-Gauntlet ist 56.4%, also 0.5% schwächer (3.5 Elo = Errorbar) als Critter 1.6.[/quote]Und sollte das nun als Widerlegung der These "gleiche Spielstärke" gesehen werden?
Ich vermute 'nein'! Bei 3000 Partien gleichstarker Gegner ist die Wahrscheinlichkeit für eine mindestens 50,5%-Überlegenheit irgendeines der Partner doch noch recht groß.
(Bei Gelegenheit mal genauer rechnen lassen...)
Benno
Parent - By Stefan Pohl Date 2012-06-27 13:16
[quote="Benno Hartwig"]
[quote="Stefan Pohl"]Das Endergebnis (3000 Partien) von Critter 1.6a im LightSpeed-Gauntlet ist 56.4%, also 0.5% schwächer (3.5 Elo = Errorbar) als Critter 1.6.[/quote]Und sollte das nun als Widerlegung der These "gleiche Spielstärke" gesehen werden?
[/quote]

Nein, natürlich nicht. Alles weit innerhalb der Errorbar. Reiner Zufall. Könnte auch 0.5% besser sein.

Gruß - Stefan
Parent - - By Ingo Bauer Date 2012-06-27 09:44
Moin,

[quote="Thomas Müller"]
Hallo,

danke an ingo und dich für die schnellen tests!
Also ist es ein bugfix...auch gut!

gruß thomas
[/quote]

Nach der "Bugfixbeschreibung" und meinen Beobachtungen würde ich auch genau das erwarten. Das Rating noch so tief liegt würde ich noch mal ausser acht lassen. Ich erinnere mich das auch die 1.6 lange hinter der 1.4 lag aber Richtung Ende kontinuierlich geklettert ist. Ich spiele zwar alle Eröffnungen durcheinander je Engine, aber die 75 werden doch der Reihe nach abgearbeitet. Also Gegner 1 mit Eröffnung 1, Gegner 2 mit Eröffnung 2 usw, wenn die erste Runde fertig ist, geht alles EINE Nummer weiter. AM Ende kommt für Engine Nr. 19 dann die ersten Eröffnungen dran. Im Moment sind also die Eröffnungen größer als 36 alle noch nicht angespielt ...

Theoretisch könnte ich mal eine Engine durchspielen lassen, alle gewonnen oder verlorenen Eröffnungen nach vorne oder hinten sortieren. Dann neustarten und ich würde eine sensationell gute oder schlechte Startperformance erhalten. Wenn Critter 1.6 mal mit 3200 Elo bei mir gestartet wäre, wäre das Echo in den Foren sensationel ... , leider würde er dann zum Schluss massiv abbauen - was auch ein tolle Resonanz hervorrufen würde. Was ich sagen will ist - das Match ist erst am Schluß zu Ende

Gruß
Ingo
Parent - By Stefan Pohl Date 2012-06-28 07:22
[quote="Ingo Bauer"]
Moin,

[quote="Thomas Müller"]
Hallo,

danke an ingo und dich für die schnellen tests!
Also ist es ein bugfix...auch gut!

gruß thomas
[/quote]

Nach der "Bugfixbeschreibung" und meinen Beobachtungen würde ich auch genau das erwarten. Das Rating noch so tief liegt würde ich noch mal ausser acht lassen. Ich erinnere mich das auch die 1.6 lange hinter der 1.4 lag aber Richtung Ende kontinuierlich geklettert ist. Ich spiele zwar alle Eröffnungen durcheinander je Engine, aber die 75 werden doch der Reihe nach abgearbeitet. Also Gegner 1 mit Eröffnung 1, Gegner 2 mit Eröffnung 2 usw, wenn die erste Runde fertig ist, geht alles EINE Nummer weiter. AM Ende kommt für Engine Nr. 19 dann die ersten Eröffnungen dran. Im Moment sind also die Eröffnungen größer als 36 alle noch nicht angespielt ...

Theoretisch könnte ich mal eine Engine durchspielen lassen, alle gewonnen oder verlorenen Eröffnungen nach vorne oder hinten sortieren. Dann neustarten und ich würde eine sensationell gute oder schlechte Startperformance erhalten. Wenn Critter 1.6 mal mit 3200 Elo bei mir gestartet wäre, wäre das Echo in den Foren sensationel ... , leider würde er dann zum Schluss massiv abbauen - was auch ein tolle Resonanz hervorrufen würde. Was ich sagen will ist - das Match ist erst am Schluß zu Ende

Gruß
Ingo
[/quote]

Tja, nun sind 80% der Partien gespielt und Critter 1.6a liegt immer noch 20 Elo hinter der 1.6. Das ist zwar noch ganz knapp in der Errorbar, aber wenn es dabei bleibt, wird es sicher wilde Debatten geben, warum die bugfix-Version so viel schwächer scort, weil viele das Prinzip der Errorbar bis heute nicht verstanden haben. Und der arme Richard Vida wird sich fragen lassen müssen, was er bei der 1.6a verbockt hat...
Wenn meine neue LightSpeed-Rangliste fertig erstellt ist (mit Critter 1.6a), laß ich dann evt. noch mal die 1.6er durchlaufen. Da in meiner Rangliste Critter dann jeweils 10000 Partien spielt, ist dort die Errorbar bedeutend schmaler...

Gruß - Stefan
Parent - - By Michael Scheidl Date 2012-06-29 12:44
Soeben gefunden:

1812.5  -  737.5    71.08%    Perf=2972

2550 out of 2550 games played


Version 1.6 ist mit 2986 gelistet, aber das ist mit BayesElo berechnet. D.h. jetzt ist interessant was die Bayes-Berechnung für 1.6a ergibt, und ob sich die Errormargins überlappen.

Es ist zwar verfrüht von einer Art "Plafond" zu reden auf dem Engines wie Stockfish, Critter und Houdini angekommen sind, doch der Gedanke drängt sich auf. Vielleicht ist die erneute Inspiration durch eine neue Rybkaversion vonnöten.
Parent - - By Benno Hartwig Date 2012-06-29 13:33
[quote="Michael Scheidl"]Vielleicht ist die erneute Inspiration durch eine neue Rybkaversion vonnöten.[/quote] Dazu müsste Vas aber erst mal aus seinem (beleidigten?) Tiefschlaf geweckt werden können.

Benno
Parent - By Ingo Bauer Date 2012-06-29 13:53
[quote="Benno Hartwig"]
[quote="Michael Scheidl"]Vielleicht ist die erneute Inspiration durch eine neue Rybkaversion vonnöten.[/quote] Dazu müsste Vas aber erst mal aus seinem (beleidigten?) Tiefschlaf geweckt werden können.

Benno
[/quote]


Nene, warum? Woher soll er denn die Inspiration nehmen?

Bye
Ingo
Parent - - By Ingo Bauer Date 2012-06-29 14:46
Test run for Critter 1.6a is finished: http://www.inwoba.de

I try to keep the IPON free of very similar engines as this would distort the ratings. Therefore one of the two 1.6 Critter versions will be deleted with the next engine which will be played in. The question is which one. The latest release of the author or the "better" one? Anyone willing to share his opinion?

Bye
Ingo
Parent - By Michael Scheidl Date 2012-06-29 15:14
I would not object against keeping the latest version 1.6a, because the 95% margins overlap anyway. Also, maybe the bugs in 1.6 could harm that version more, in the future.

Danke für den Test. - Wenn sich sonst nichts tut, könntest Du eventuell - bevor die PCs zusehr abkühlen - testen wie Critter scort, wenn man den neuen Parameter für Königssicherheit erhöht... Vielleicht vom Default 32 auf 64? (Max.= 100). R.Vida schrieb ja sinngemäß irgendwo, daß er derzeit im Streß ist. D.h. vielleicht ist dieser Parameter noch lange nicht optimiert.
Parent - - By Clemens Keck Date 2012-06-29 15:58
Hallo Ingo

das ist echt eine schwierige Entscheidung welche Version weiterhin drinne bleibt. Im Grunde muss man die 1.6a nehmen weil die 1.6 ja bugs hat die in der 1.6a behoben wurden. Streng genommen müsste man zur 1.4 zurückkehren...das ist aber auch irgendwie doof. Also bleibt die 1.6a. Sie ist die aktuellste und nur minimal schwächer(wenn überhaupt).

Gruß, Clemens
Parent - - By Ingo Bauer Date 2012-06-29 16:12
[quote="Clemens Keck"]
Hallo Ingo

das ist echt eine schwierige Entscheidung welche Version weiterhin drinne bleibt. Im Grunde muss man die 1.6a nehmen weil die 1.6 ja bugs hat die in der 1.6a behoben wurden. Streng genommen müsste man zur 1.4 zurückkehren...das ist aber auch irgendwie doof. Also bleibt die 1.6a. Sie ist die aktuellste und nur minimal schwächer(wenn überhaupt).

Gruß, Clemens
[/quote]

Du hast es erfasst Clemens!

Zusätzlich ist die 1.6a der einzige offizielle Download ...

Die 1.6a ist offensichtlich Autorenwunsch, auch wenn er damit sicher hinter Komodo rutscht ...

Vor ein paar Tagen schrieb ich, das ich hoffe das ein neues Release immer wenigstens 10 ELo besser ist als der Vorgänger weil sonst alle möglichen Probleme drohen. Jetzt habe ich den Salat ...

Gruß
Ingo
Parent - - By Simon Gros Date 2012-06-30 09:37
Ich würde auch die aktuellste Engineversion wählen. Allerdings müßte dann die Überschrift zur Liste geändert werden, da:
"List of 20 best single engines, one engine per Author:"
nicht mehr zutreffend ist. "List of the latest 20 ..." wäre nun besser. So oder so, eine tolle Liste.
Simon_G
Parent - By Thorsten Czub Date 2012-06-30 10:39
manchmal ist NEU eben nicht besser.
Parent - - By Ingo Bauer Date 2012-06-30 13:30


Hehe, nene, ändern muß ich nichts. Zum einen ist da noch die Errorbar und es besteht eine gewisse Wahrscheinlichkeit das die 1.6a die beste Version ist, zum anderen ist es die "best"e Version im Sinne des Autors.

...

Vielleicht lasse ich einfach die 1.6 drin. Das erzeugt etwas Druck auf den Autor

Gruß
Ingo
Parent - By Simon Gros Date 2012-06-30 14:02
Hhhmmmm. Immerhin steht selbst die 1.4a noch 10 Punkte vor der 1.6a in der Full-List.
Simon_G
Parent - By Stefan Pohl Date 2012-06-29 17:14
[quote="Clemens Keck"]
Hallo Ingo

das ist echt eine schwierige Entscheidung welche Version weiterhin drinne bleibt. Im Grunde muss man die 1.6a nehmen weil die 1.6 ja bugs hat die in der 1.6a behoben wurden. Streng genommen müsste man zur 1.4 zurückkehren...das ist aber auch irgendwie doof. Also bleibt die 1.6a. Sie ist die aktuellste und nur minimal schwächer(wenn überhaupt).

Gruß, Clemens
[/quote]

Da stimme ich zu. Bei mir war 1.6a nach 3000 Partien nur 0.5% (=3.5 Elo) schwächer als die 1.6. Und auch bei Ingo ist sie innerhalb der Errorbar. War halt Pech für 1.6a, so ist Statistik nun mal.

Gruß - Stefan
Up Topic Hauptforen / CSS-Forum / Critter 1.6a running for the IPON

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill