Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / fishtest-Farbgebung
- - By Benno Hartwig Date 2016-07-18 14:09
Ach, und ich habe es immer noch nicht.

Wenn ich auf den Fishtest gucke,
http://tests.stockfishchess.org/tests?page=4
sehe ich insbesondere rote, gelbe und grüne Einträge.

Grün interpretierte ich als "erfolgreiche Tests"
LLR: 2.96 (-2.94,2.94) [0.00,5.00]
Total: 54550 W: 7671 L: 7365 D: 39514


Rot als "durchgefallen"
LLR: -2.96 (-2.94,2.94) [0.00,5.00]
Total: 13148 W: 2403 L: 2472 D: 8273


Gelb als "weiß noch nicht so recht"??
LLR: -2.97 (-2.94,2.94) [0.00,5.00]
Total: 56342 W: 10947 L: 10822 D: 34573


Aber wenn ich dann so einen grünen(!) Eintrag finde
LLR: 2.96 (-2.94,2.94) [-3.00,1.00]
Total: 143212 W: 19630 L: 19676 D: 103906

bin ich irritiert.
Hier wurde mehr verloren als gewonnen, und trotzdem ein grüner Eintrag?

Aber, ich weiß auch nicht, was die unterschiedlichen Angaben in den eckigen Klammern bedeuten sollen.


Benno
Parent - By Patrick Jansen Date 2016-07-18 14:17
Benno, mach dir nix draus, du bist nicht der Einzige Auch ich kapier es manchmal nicht.
Parent - - By Stefan Pohl Date 2016-07-18 15:24 Edited 2016-07-18 15:37 Upvotes 1
Moin Benno,

hab wenig Zeit, daher ganz kurz:
grün=Erfolg, gelb=knapp fehlgeschlagen, rot=fehlgeschlagen
Manchmal werden aber Patches, die bei kurzer Bedenkzeit nur gelb waren, bei der längeren Bedenkzeit doch noch getestet und dann bei der langen Bedenkzeit doch grün. Da kann ich dir leider auch nicht genau sagen, welche gelben Patches dann doch noch bei langer Bedenkzeit getestet werden, und welche nicht.

Für die Farbgebung des Ergebnisses sind die Zahlen in den eckigen Klammern maßgeblich. [0.00, 5.00] und [0.00, 4.00] sind "echte" Patches, die Stockfish verbessern sollen und die darauf getestet werden. Dann reicht ein 50% Ergebnis gegen den Original-Stockfish nicht aus. Auch nicht ein sehr geringes Plus. Es muß eben eine meßbare Verbesserung erzielt werden.
[-3.00, 1.00] sind Änderungen im Programmcode, die nur darauf geprüft werden, daß sie keinen nennenswerten/meßbaren Schaden anrichten. Als Beispiel: Simplifications, also Codeverschlankungen. Da reicht ein 50% Ergebnis, oder auch ganz knapp darunter.

Genauer weiß ich es leider auch nicht. Hoffe, geholfen zu haben.

Stefan

PS: Interessant sind also Elomäßig nur die [0.00, 5.00] und die [0.00, 4.00] Patches.,Und diese wiederum umso mehr, je weniger Partien bei der LTC (längere der beiden Bedenkzeiten) nötig waren,,bis sie als grün durchgingen. Alles unter 10000 Partien ist potentiell sehr stark. Mehr als 40000 Partien heißt, ging geradeso noch durch. Der letzte Patch vom 16.7. brauchte nur 5900 Partien,,um zu ergrünen. Das ist Hammer-wenig! Also sehr interessant.
Parent - By Benno Hartwig Date 2016-07-18 15:47 Edited 2016-07-18 16:20
Danke, Stefan,
ja, deine Erklärung schaffte ein gutes Stück weit Klarheit.
Benno
Up Topic Hauptforen / CSS-Forum / fishtest-Farbgebung

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill