Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / ERET, dies und das ...
- - By GS Date 2017-03-11 11:54 Upvotes 1
Nachdem ich auch diesmal sehr schnell aufgezeigt habe, dass die
vom Autor des ERET u.a. gemachte Aussage:

"Er ist konzipiert worden, um schnell einen ersten Eindruck
von der Spielstärke einer neuen Engine zu erhalten."


nicht zutrifft, siehe z.B.:

http://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=106947#pid106947

nachfolgend eine fiktive Geschichte **:

Ein Autor einer Schachengine, nennen wir ihn Joe Doe, glaubt aus
einigen wenigen Tests seinerseits, dass sein neuestes Werk deutlich
stärker als die Engine Tao 5.7 (beliebiges Beispiel) sein müsste, da
bereits seine letzte Version gut 58% gegen Tao 5.7 scoren konnte in
diversen Matches.

Er greift also zum ERET (** würde nie so geschehen, siehe weiter unten)
und muss feststellen, dass sein neuestes Werk "nur" ganze 9 Stellungen
löst bei 5" pro Stellung. Tao 5.7 hingegen schafft satte 19 Lösungen auf
seiner Maschine.
Oh Schreck denkt Joe Doe, meine Engine ist doch einiges schwächer geworden
als gedacht. Trotzdem, die Neugierde siegt, lässt er über Nacht ein Match
seiner neuen Engineversion gegen Tao 5.7 laufen.
Am nächsten Morgen sieht er voller Überraschung ein 70:30 für seine Engine
auf dem Bildschirm ?! Da stimmt was nicht, ich habe mit Sicherheit einen
Fehler gemacht bei der Konfiguration des Matches gestern spät am Abend,
denkt er. Also beisst er in den saueren Apfel und lässt das Match, nach
Neustart seines PCs und sorgfältigstem konfigurieren des Machtes, wiederholen.
Bereits nach 5 Stunden schaut er auf den Zwischenstand und sieht (natürlich)
sein neues Werk mit 21.5:8.5 in Führung. Er bricht ab, genug gesehen !

** das alles wird so, "Gott sei Dank", nie auftreten, da kein mir bekannter
Engineautor einen Stellungstest für die Spielstärkeneinschätzung seiner
Engine verwenden würde !
Parent - - By Horst Sikorsky Date 2017-03-11 15:14 Upvotes 2
Klar das man bei 2 Blinden Schach-Engine würfeln kann.
und nur 5s ist Käse, 15s Minimum und viele schwere Aufgaben
Parent - By Silvio Zschako Date 2017-03-11 20:28
Oje, Horst, was wird wohl der Meister dazu sagen, der im Thread " Neuer Stellungstest: Der Eigenmann Rapid Engine Test (ERET) " ausdrücklich 5s empfiehlt. 
Parent - - By Silvio Zschako Date 2017-03-11 20:59
GS schrieb:

** das alles wird so, "Gott sei Dank", nie auftreten, da kein mir bekannter
Engineautor einen Stellungstest für die Spielstärkeneinschätzung seiner
Engine verwenden würde !


Ein Engineautor vielleicht nicht, aber im Thread "Extrem-Schach" weissagt der Meister: "Das ist eben der Vorteil bei einem wie mir, der schon seit 20 Jahren 'Engines ordentlich' bedient: 'kurz antesten' genügt ihm, um Programme einzuschätzen." 
Parent - - By GS Date 2017-03-12 12:27
Silvio Zschako schrieb:

[...snip...]
Ein Engineautor vielleicht nicht, aber im Thread "Extrem-Schach" weissagt der Meister: "Das ist eben der Vorteil bei einem wie mir, der schon seit 20 Jahren 'Engines ordentlich' bedient: 'kurz antesten' genügt ihm, um Programme einzuschätzen." 


Ich habe das gerade überflogen.
Sie haben Recht, auch ich musste lachen.
20 oder mehr Jahre etwas zu tun bedeutet
halt noch lange nicht, dass man es kann !

Mich wollte der Herr auch belehren, bezügl.
Konfigurationen von Tests.
Parent - - By Silvio Zschako Date 2017-03-12 21:14
Da geht ein jeder seinen eigenen steinigen Weg zum Gipfel des Computerschachs, die Irrwege eingeschlossen. Und da viele Wege nach Rom führen, drücke ich schon mal allen Freaks des Computerschachs die Daumen, daß speziell der eigene Weg der richtige ist.

Ansonsten erinnert mich die ganze Thematik an folgenden Gedanken von Claude Lévi-Strauss:

„Denn wir leben in mehreren Welten, von denen jede wahrer ist als diejenige, die sie in sich schließt, aber falsch in bezug auf diejenige, von der sie umschlossen ist.“  

GS schrieb:

20 oder mehr Jahre etwas zu tun bedeutet
halt noch lange nicht, dass man es kann !


Ja. Geht mir auch so. Zum Beispiel: 20 oder mehr Jahre Schach  zu spielen, bedeutet noch lange nicht, daß ich es auch kann. Wir hangeln ja alle an der Spirale zur Vollkommenheit.
Parent - By Benno Hartwig Date 2017-03-13 06:50

> Wir hangeln ja alle an der Spirale zur Vollkommenheit.


Wenn man denn meint, dass man in den 20 Jahren wirklich voran gekommen ist, dass es immer ein Weg nach oben, in Richtung "Vollkommenheit" war, ist das ja schon mal was.
Nicht in jeder Hinsicht kann ich das von mir behaupten.
Und wie ist es beim "Schach spielen"? Den Leistungshöhepunkt sollte man wohl nicht im Rentenalter erwarten.

Benno
Parent - - By Walter Eigenmann Date 2017-03-12 01:01
GS schrieb:

Nachdem ich auch diesmal sehr schnell aufgezeigt habe, dass die vom Autor des ERET u.a. gemachte Aussage: "Er ist konzipiert worden, um schnell einen ersten Eindruck von der Spielstärke einer neuen Engine zu erhalten."  nicht zutrifft


Nö, du hast gar nichts "sehr schnell aufgezeigt", sondern nur dubiose "Messungen" präsentiert. Guggst du hier:
http://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=106985#pid106985

GS schrieb:
nachfolgend eine fiktive Geschichte **:
Ein Autor einer Schachengine, nennen wir ihn Joe Doe, glaubt aus einigen wenigen Tests seinerseits, dass sein neuestes Werk deutlich stärker als die Engine Tao 5.7 (beliebiges Beispiel) sein müsste, da bereits seine letzte Version gut 58% gegen Tao 5.7 scoren konnte in diversen Matches. Er greift also zum ERET (** würde nie so geschehen, siehe weiter unten) und muss feststellen, dass sein neuestes Werk "nur" ganze 9 Stellungen löst bei 5" pro Stellung. Tao 5.7 hingegen schafft satte 19 Lösungen auf seiner Maschine. Oh Schreck denkt Joe Doe, meine Engine ist doch einiges schwächer geworden als gedacht. Trotzdem, die Neugierde siegt, lässt er über Nacht ein Match seiner neuen Engineversion gegen Tao 5.7 laufen. Am nächsten Morgen sieht er voller Überraschung ein 70:30 für seine Engine auf dem Bildschirm ?! Da stimmt was nicht, ich habe mit Sicherheit einen Fehler gemacht bei der Konfiguration des Matches gestern spät am Abend, denkt er. Also beisst er in den saueren Apfel und lässt das Match, nach Neustart seines PCs und sorgfältigstem konfigurieren des Machtes, wiederholen. Bereits nach 5 Stunden schaut er auf den Zwischenstand und sieht (natürlich) sein neues Werk mit 21.5:8.5 in Führung. Er bricht ab, genug gesehen ! ** das alles wird so, "Gott sei Dank", nie auftreten, da kein mir bekannter Engineautor einen Stellungstest für die Spielstärkeneinschätzung seiner Engine verwenden würde !


Also, es mag ja sein, dass das Geschichtenerzählen nicht zu deinen Kernkompetenzen gehört - aber so langweilen müsstest du denn doch nicht
Denn natürlich ist die Erkenntnis trivial, dass Programmierer nicht Stellungstests fürs Optimieren ihrer Engine verwenden.
Aber noch viel weniger lassen sie dafür tausende von 15-Minuten-Partien ausspielen...

Seinerzeit, vor 15 Jahren, als wir beide noch häufig im Chessbits-Forum von Elvis (+) rumschrieben, warst du bedeutend unterhaltsamer:
http://22010.foren.mysnip.de/read.php?1578,306257,306281#msg-306281


.
Parent - - By Clemens Keck Date 2017-03-12 09:36
Walter Eigenmann schrieb:

Denn natürlich ist die Erkenntnis trivial, dass Programmierer nicht Stellungstests fürs Optimieren ihrer Engine verwenden.
Aber noch viel weniger lassen sie dafür tausende von 15-Minuten-Partien ausspielen...

tausende 15 Minuten Partien glaube ich auch nicht.
Meistens sind es zehntausende von sehr kurzen Partien, 1-2 Minuten maximal.
Manche spielen auch weit unter 1 Minute Partien.
Wenn sich dann ein messbarer Unterschied zeigt, wird auch mal mit 3 min oder 5 min getestet.
Und zu Stellungstests
Ganz früher, da gab es einen BT-2450 Test. Der lief 8 Stunden, und brachte ein einigermaßen verlässliches rating.
Heute sind die engines zu stark für Stellungstests, und eine recht genaue SpielstärkeMessung wird durch die vielen Spiele engine-engine möglich.
Der Aufwand ist allerdings sehr groß, somit an dieser Stelle ein herzliches Dankeschön an die Betreiber von Ratinglisten

Gruß, C.K.
Parent - By Walter Eigenmann Date 2017-03-12 11:02
Clemens Keck schrieb:
Und zu Stellungstests
Ganz früher, da gab es einen BT-2450 Test. Der lief 8 Stunden, und brachte ein einigermaßen verlässliches rating.
Heute sind die engines zu stark für Stellungstests, und eine recht genaue SpielstärkeMessung wird durch die vielen Spiele engine-engine möglich.

Stimmt, der war seinerzeit in häufiger Anwendung und wurde immer wieder als Referenz-Stärkemessung hinzugezogen:
https://de.wikipedia.org/wiki/BT2450
Aber wie viele andere Stellungstests aus der Ära Schachcomputer "krankt" er heute an viel zu simplen Aufgaben.
Houdini&Co. lösen die 30 BT2450-Aufgaben in je weniger als 0,1 Sekunden - und jene, die nicht gelöst werden,
sind entweder inkorrekt oder doppellösig.
Aber das ist die historische Retrospektive; die damalige Forscherleistung von Bednorz und Tönissen ist davon unberührt.

Und quasi in memoriam sei doch noch eine tolle Stellung aus dem BT2450 angeführt, nämlich die Test-Aufgabe Nr. 4 (Harding 1978):

Weiss gewinnt


.
Parent - By Benno Hartwig Date 2017-03-12 19:32

> Ganz früher, da gab es einen BT-2450 Test. Der lief 8 Stunden, und brachte ein einigermaßen verlässliches rating.


Ich hatte die Sinnhaftigkeit dieses Tests aber auch immer dadurch als gegeben gesehen, dass die Testkandidaten ja oft Brettcomputer waren.
Eine umfangreiche Serie von Partien hat da so richtig viel(!) Arbeit gemacht.
Da stand der Stellungstest in Konkurrenz zu sehr mühsamen Serien von letztlich doch viel(!) zu kleinen Partien-Serien.

Das ist heute mit Blick auf Engines eben sehr deutlich anders.

Benno
Parent - By GS Date 2017-03-12 12:20
Walter Eigenmann schrieb:

[...snip...]
Seinerzeit, vor 15 Jahren, als wir beide noch häufig im Chessbits-Forum von Elvis (+) rumschrieben, warst du bedeutend unterhaltsamer:
<a class='urs' href='http://22010.foren.mysnip.de/read.php?1578,306257,306281#msg-306281'>http://22010.foren.mysnip.de/read.php?1578,306257,306281#msg-306281</a>



Was war (ist) daran "bedeutend unterhaltsamer" ?
Ich hatte dem User Harald ein wenig unterstützt
bei der Erstellung einer (seiner) I-Net-Seite.
Dies hatte rein gar nichts mit Unterhaltung zu tun.
Unterstützung war und ist der korrekte Begriff.
Parent - - By Peter Schneider Date 2017-03-13 23:47 Upvotes 3
Ich finde das völlig daneben, dass man sich über Herrn Eigenmann und dessen neuen Stellungstest lustig macht.
Ich halte das für eine hervorragende Leistung auch heutzutage noch 111 Stellungen zu finden, bei denen sich die guten Engines von den weniger Guten unterscheiden.
Obwohl ich mir die Stellungen noch nicht angesehen habe, - natürlich bleiben Stellungstests am Ende oftmals taktische Tests, bei denen Material für eine Gewinnstellung geopfert wird.
Aber am Ende ist das doch der Reiz des Schachs, das Initiative mitunter mehr zählt als Material.
Das sind doch die Partien, die Preise gewinnen, bei denen Material für Intitiative geopfert wird.
Jeder Fernschachspieler fragt sich, - ob nicht neben den vorgeschlagenene Enginezügen nicht ein Bauerzug langfristig vorteilhaft ist.
Nur so Gedanken...
Peter
Parent - - By Frank Rahde (Mod.) Date 2017-03-14 07:40
Ich stimme dir voll zu. Die Eigen-Leistung von Walter ist beachtenswert. Zum Glück ist er ein wehrhafter Mensch, so dass ich hier als Moderator noch nicht einschreiten musste. Kritik an den Beiträgen wird es immer geben, die gilt es auszuhalten, solange es sachlich bleibt und es nicht unter die Gürtellinie geht.

Gruß von einem FS-Freund.
Parent - By GS Date 2017-03-18 09:45 Upvotes 1
Frank Rahde (Mod.) schrieb:

[...snip...]
Zum Glück ist er ein wehrhafter Mensch, so dass ich hier als Moderator noch nicht einschreiten musste.
[...snip...]


Hoppla, das liest sich meines Erachtens so, dass sie, wäre
der Autor des ERET nicht wehrhaft, "eingegriffen" hätten ?!
Darf ich fragen welche Stelle(n) solch ein Vorgehen ihrerseits
aus ihrer Sicht gerechtfertigt hätte ?
Up Topic Hauptforen / CSS-Forum / ERET, dies und das ...

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill