Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Ratinglistenberechnung: Schon viel erlebt aber das ...
- - By Frank Quisinsky Date 2010-04-02 12:10 Edited 2010-04-02 12:18
noch nicht!

Wieder zurück zu Naum 4.2 in der SWCR:

Fassen wir mal die Ratinglisten Entwicklung zusammen:

Bis Partie 135 = 21 ELO vor Rykba 3 ...
Ich schrieb ... das eine Engine noch um 50 ELO fällt, bei ca. 125 Partien habe ich noch nicht erlebt.

Bis Partie 300 = 6-14 ELO vor Rybka 3 ...
Dieses Rating war konstant von Partie Nummer 150-300 !!

Und dann ging es los ...

Bis Partie 410 = 18 ELO hinter Rybka 3 ...
Von Partie Nummer 300 - 410 verlor Naum 4.2 ca. 32 ELO !!

STOP
Das habe ich bei der Erstellung von Ratinglisten bisher noch nie gesehen!

OK ...
Aber offenbar noch nicht genug ...

Bis Partie 500 = 12 ELO hinter Rybka 3 ...
Wieder 6 ELO hinzugewonnen. Das ist OK und nichts außergewöhnliches. Ich meine ELO Gewinn oder Verlust Zwischen Partie Nummer 400 und 500!
Schwankte eher sehr leicht, Naum spielte also konstant.

Nach meinen Excel Hochrechnungen gibt es nun noch die letzte kritische Phase. Ca. die Partiennummer 560! Bei sämtlichen Ratinglisten die ich berechnet habe, und ich mache das auch schon seit mehr als 10 Jahren, keine Verluste mehr gab die größer als 10 ELO waren. Falsch, gab es 1x ... Glaurung im negativen Sinne vor ca. 4 Jahren bei der ATL-4.

Nun aber der nächste Hammer:
Zum zweiten Mal geht Naum über meine errechneten Maximal-Werte.

Bis Partie 592 = 26 ELO hinter Rybka 3 ...
Und verliert 12 ELO.

Maximalwert ist 10 ELO, bei sämtlichen Berechnungen die ich durchführte und das waren nicht wenig.

Zurück zum Einstiegsrating bzw. obigen Kommentar nach 135 Partien.
21 ELO vor Rybka zu jetzt 26 ELO hinter Rybka = 47 ELO verloren.
Ich schrieb (siehe Thread Naum 4.2 nach 135 Partien) ... mehr als 50 ELO Verlust oder Gewinn gab es bei schon vorliegenden 135 Partien noch nie.

Naum 4.2 ist knapp daraunter, muss jetzt noch ca. 170 Partien spielen.
Jetzt bin ich mal gespannt wie das weiter geht.
Offenbar ist bei Naum alles möglich.

Es sind jetzt 592 Partien gespielt. Das Rating dürfte, wenn ich das mit allen anderen SWCR Engines vergleiche, nicht mehr um mehr als 7 ELO verändern. Den Rekord hält hier Cyclone xTreme II. Cyclone verlor von Partien Nummer 575 bis 680 noch 7 ELO.

Festzuhalten ist:
In CEGT gab es von Naum 4.0 auf 4.2 eine Verbesserung von 60 ELO, bei Ingo von 45 ELO und bei mir sind es derzeit 51 ELO. Das ist alles im Rahmen, aber nach den ganzen zeitweisen Statistiken (Remis Statistik, gesehene Partien, Verlustpartien-Vergleiche mit Rybka 3 bzw. nach allen anderen Erfahrungswerten) konnte ich nicht davon ausgehen. Hier hat mir offenbar zum ersten mal eine Statistik einen Streich gespielt.

Die aktuelle SWCR:
http://www.schach-welt.de/spezial/computerschach-/swcr-engines-top-20-.html

Dennoch Naum 4.2 ist auf Platz 2 hinter Rybka 3, verbessert sich von Platz 4 auf Platz 2 und legt wie vom Programmierer angekündgit um ca. 50 ELO zu.

Gruß
Frank
Parent - - By Udo Kaiser Date 2010-04-02 14:48
so wie ich das sehe bist du über deine eigene Ersenzählerei überrascht, richtig ?
Parent - By Frank Quisinsky Date 2010-04-02 15:54
Hi,

früher haben wir die Erbsen nicht gezählt, wir haben damit geschossen.
Meist auf Leute die wir nicht mochten.

Pusterohr, Erbse rein und auf den Hintern gezielt.
Wärst Du mir früher so gekommen, wärst Du ein begehrtes Zielobjekt gewesen.



Habe Deinen Namen schon öfters hier gelesen, zwar noch kein Beitrag aus dem ich etwas entnehmen konnte aber das ist auch nicht wichtig.
Hauptsache Dein Fun Faktor ist abgedeckt.

Dir also weiterhin viel Spaß mit Erbsen etc..

Gruß
Frank
Parent - - By Klaus S. Date 2010-04-02 15:03
Hi Frank,

kann das daran liegen, dass du die ersten ca. 150 Partien auf nur einem Rechner gespielt hast,
und ab dann auf 2 bzw.4 Rechnern fortgesetzt hast? Ich meine auffällig ist das schon.

Vielleicht ist irgendwie, irgendwo,  irgendwas   mit der Hardwarekonfiguration bei den
unterschiedlichen Rechnern (Quad, Core2Duo)

Intel Q9550, 2,86GHz, F-Bench 1Core 4.43
Intel E8400, 3,00GHz, F-Bench 1Core 4.66
Intel E6700, 3,00GHz, F-Bench 1Core 4.56 Upd.


anders, was da reinspielen könnte? Kann ich mir zwar nicht so direkt vorstellen, war nur so ein Gedanke.

Gruß
Wilfried
Parent - By Frank Quisinsky Date 2010-04-02 15:49
Hi Wilfried,

OK, das wäre ein Ansatzpunkt.

Die drei Maschinen überprüfe ich regelmäßig. Bei dem E6700 (voher ein E4600) ist mir Corair RAM ausgefallen. Beim Wechsel habe ich den Prozessor mitgetauscht, weil ich erst dachte es liegt am Prozessor. Aus IT-Erfahrung (beruflich damit zu tun) ist bekannt, dass gerade die von mir bevorzugten Asus Boards einen kleinen Konstruktionsfehler haben. Gerade die Boards der P5B Serie, welches bei dem E6700 / 4600 im Einsatz ist. Die Platinen sind zu dünn bzw. die Leiterbahnen unter dem Prozessorbefestigung nicht gut genug geschützt. Drückst Du z. B. einen Standardkühler von Intel an (die ich nicht einsetze) kann durch das leichte andrücken das Board schon beschädigt werden. Nun ist es bei dieser Maschine so, dass zwar ein sehr guter Kühler eingebaut ist der aber das gleiche Befestigungssystem wie die Standard-Intel-Kühler hat. Daher dachte ich erst ist es das Board und nicht der RAM. Den Corsair dann durch OCZ ersetzt, den anderen Prozessor drauf gelassen. Das ist kurz vor dem Naum 4.2 Start passiert, also vor ca. 2 Wochen. Allerdings läuft die Maschine wieder und alles scheint OK zu sein. Bei dem Q9550 ist eine Platte ausgefallen, ca. vor 1 Monat auch ersetzt. Auch das war dumm, denn bei 300 gespielte Partien mussten wiederholt werden, weil leicht festgestellt werden kann, seit wann eine Platte ein Problem hat

TB Zugriffe auf die 4-Steiner erfolgen durch Corsair Voyager GT Sticks. Die sind OK. Das war es an Hardwareproblemen in den letzten 5 Monaten.

Es stimmt.
Während Junior 11.1 auf den drei Rechnern seinen Spießroutenlauf spielte, spielte Naum die ersten Partien auf den beiden freien Cores des Q9550. Die ersten Partien wurden also auf den Q9550 gespielt. Zur Zeit sind alle drei im Einsatz, auf den Q9550 laufen mithin je 2 Partien. Schaue ich mir die Statistiken der Rechner jetzt an, ist es aber so, dass diese auf allen drei Rechnern ausgeglichen sind, bzw. leicht bessere auf den E6700, sehr leicht bessere.

Die Partien gegen Deep Fritz 12, Ktulu 9.03 wurden vor dem Junior 11.1a Spießroutenlauf bzw. Naum 4.2 Spießroutenlauf gestartet, auch hier wieder auf allen Rechnern.

Wäre eine Möglichkeit gewesen aber auszuschließen!

Maximal das vielleicht etwas mit den Platten bzw. Sticks nicht in Ordnung ist, aber das überprüfe ich regelmäßig mit Crystal Disk Info / Everest Ultimate.

Gruß
Frank
Parent - - By Ingo Bauer Date 2010-04-02 18:19
Hallo Frank

[quote="Frank Quisinsky"]
...

Nach meinen Excel Hochrechnungen gibt es nun noch die letzte kritische Phase. Ca. die Partiennummer 560!
Es sind jetzt 592 Partien gespielt. Das Rating dürfte, wenn ich das mit allen anderen SWCR Engines vergleiche, nicht mehr um mehr als 7 ELO verändern.
....
[/quote]

Ich weiß du glaubst ganz fest an deine Theorie das so wenige Spiele langen, aber wenn du dich hier freust das eine Engine um 6 Elo wieder zu legt schau doch mal in meine Liste.

DF12 habe ich nach 1500 Partien das erste mal gelistet. Damals hatte die Engine 2779 Elo. Jetzt nach 2500 Partien sind es 6 Elo mehr und es kann sein das sie in weitern 1000 Partien wieder 6 weniger hat. Was meinst du was bei dir zw 700 und 1000 oder zw. 1000 und 1500 noch passieren könnte ...

Ansonsten mußt du, nach allem was ich so in anderen Listen lese, deine 64bit Einschätzung für Naum 4.2 von "unwesentlich" in ca 20 Elo ändern.

Gruß
Ingo
Parent - - By Frank Quisinsky Date 2010-04-02 18:40 Edited 2010-04-02 18:42
Hallo Ingo,

1. Nun ja 6 ELO Abweichung bei dem von Dir geschilderten Fall Deep Fritz 12 Fall ist ja OK. Denke so etwas ist auch ein Extrem aber OK. Das passiert immer mal wieder.

2. 20 ELO 64-Bit Zuwachs.
Bei CEGT Naum 4.0 war die die 32-Bit Version besser. Bei 4.1 und bei 4.2 die 64-Bit Version. Wenn du sagst 20, schaue ich mir die Werte von CEGT noch an. Ermittle dann aus Deinen 20 und CEGT den Durchschnitt und ändere das mit dem 64-Bit Zuwachs natürlich ab. Muss ich das nicht wieder testen (kam ja bei Naum 4.1 auch auf -8 nach 400 Partien, zugegeben das waren dann wirklich zu wenig Partien). Ehrlich gesagt, habe auch keine Lust mehr bei Naum 4.2 wieder x hundert Partien auf x64 selbst spielen zu lassen nur für den x64 Zuwachs. Die Engine ist mir nicht mehr so ganz geheuer hinsichtlich w32, x64 und Statistiken. Vom Spielstiel KLASSE, läuft perfekt ... das meine ich nicht.

Jetzt geht bei mir das Rating nach 594 Partien schon wieder deutlich nach oben.
Gebe es auf ... wenn Naum 4.2 durch ist kommt die nächste Engine und fertig. Von mir aus kann Naum dann dieses Statistik Spielchen bis 5.000 Partien so weiter treiben

Gruß
Frank
Parent - - By Frank Quisinsky Date 2010-04-02 18:50
Hi,

ja, wenn Du 20 mit Deinen Ergebnisse ermittelt hast, CEGT auch (gerade Gerhards Beitrag gelesen) ist das klar.
Ändere das gleich ... 20 im Blitz und 20 bei Deiner mittleren Bedenkzeit.

Gruß
Frank
Parent - By Ingo Bauer Date 2010-04-02 19:00
Hi

[quote="Frank Quisinsky"]
Hi,

ja, wenn Du 20 mit Deinen Ergebnisse ermittelt hast, CEGT auch (gerade Gerhards Beitrag gelesen) ist das klar.
Ändere das gleich ... 20 im Blitz und 20 bei Deiner mittleren Bedenkzeit.

Gruß
Frank
[/quote]

Ich weiß leider nicht was bei meinen 700 Spielen raus ekommen ist, da meine Remote verbindung zum Hauptserver nicht mehr geht. Die "ca 20" sind aufgrund meiner Schätzung des Geschwindigkeitsunterschiedes und der CEGT zustande gekommen. Genaues erst am Sonntag Abend.

Bye
Ingo
Up Topic Hauptforen / CSS-Forum / Ratinglistenberechnung: Schon viel erlebt aber das ...

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill