Vor mehreren Jahren hatte ich genau dieselbe Idee, mit...
Zitat:
dem Blitz-Vorschau-Index, dem BLIVORIX. Der Grundgedanke: Ein schneller Testdurchlauf, der eine erste Vorschau auf die Blitz-Spielstärke einer Engine ergibt.
http://computerschach.twoday.net/stories/3276822/ Der Blivorix entsteht
http://computerschach.twoday.net/stories/3279924/ Sinnvolle Atomstromnutzung
Anwendung mit diversen Engines:
http://computerschach.twoday.net/stories/3287568/http://computerschach.twoday.net/stories/3352108/http://computerschach.twoday.net/stories/3359924/http://computerschach.twoday.net/stories/3330427/http://computerschach.twoday.net/stories/2104107/Das Konzept beinhaltete zwei verschiedene Interfaces und zwei unterschiedliche Zeitkontrolltypen, sowie zwei konstante Gruppen von Enginegegnern mit bekannter Spielstärke. Es war somit sehr "zeitgebunden" und erwies sich deshalb als nicht langfristig tragfähig, weil diese Gegner bald zu schwach für viele Neuerscheinungen wurden.
Im Prinzip kann man sich auch weniger systematisch, mit einfachen Engineturnieren die man halt auf aktueller Basis zusammenstellt, einen guten ersten Eindruck von jeder Engine verschaffen. Natürlich mit einer viel geringeren statistischen Verläßlichkeit als die Ranglistentests, aber krasse Fehlschüsse um 200 Elo daneben oder so erwarte ich bei einer vernünftigen Konfiguration nicht. Unlängst konnte ich so Fruit reloaded 2.1 ziemlich gut prognostizieren, bei leichter Unterschätzung: 2640 aus 64 Partien, und bei CEGT 40/4 wurden es dann 2664 aus 1.300 Partien.
http://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=85355Das größte Problem ist die Gegnerauswahl, deren Stärken idealerweise "um den Testkandidaten herum" angesiedelt wären, dessen Spielstärke man aber noch nicht kennt.
Da hab ich schon manchmal daneben gegriffen, indem ich durchschnittlich viel zu starke oder zu schwache Gegner ausgewählt habe. Aber sonst kein Problem.