Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / 100 lange Spiele zw. Deep Rybka 4 und Houdini 1.03a
1 2 Previous Next  
- - By Ingo Bauer Date 2010-10-19 08:53
Hallo

In der Disskusion über den Beitrag von Jeroen Noomen und seine 60 langen Partien habe ich die vollständigen Informationen vermisst. Deswegen habe ich mich entschlossen 100 eigene Partien spielen zu lassen. Ich stelle sie und das Ergebniss hier zur Disskusion und werde mich für mindestens 36h jedes Kommentars enthalten um dem Interessierten zu ermöglichen sich ein eigenes Bild zu machen. Gerne werde ich später aber meine eigenen Eindrücke schildern:

Bedingungen:

GUI: Shredder Classic
CPU: AMD Phenom II 6 core @ 3.120 GHz (this is approx. a 3GHz Q6600)
Threads: 3(!) (~equal to a 4 core Q6600@2.4GHz)
Opening Positions: FQ 50 Position set
Colours: changing, every engine has to play White and Black, 100 games overall
Time control: 60 minutes per game/each side, played on 3 equal computers.
Ponder: ON (of course, I play real matches!)
Tablebases: 4 piece Nalimov (only Rybka can make use of it)
Ettiquette: ON (three consecutive 0.00 evals of both engines is a draw, 3 times in a row +/- 5.xx of the loosing engines is a loss!)

Result: + 23,= 60,- 17 in favor for Rybka 4

Leider kann ich die 100 Spiele nicht direkt hier posten, da sie zu groß sind, deswegen:

Download all games as PGN: http://www.mediafire.com/?9xmbb835fi7k61k

Die Spiele im PGN-file sind in der Reihenfolge wie sie beendet wurden! Kein Crash während der 100 Spiele!

Viel Spaß
Ingo
Parent - By Rudolf Rohs Date 2010-10-19 10:22
Hi,

also ist Rybka 4 bei langen Bedenkzeiten noch etwas stärker als Houdini 1.03.
Das Erbebnis ist etwas enger als das auf Openchess veröffentlichte Ergebnis
von Martin Thoresen der Rybka 4 gegen Houdini 1.02 auf Turnierstufe laufen lies,
passt also sehr gut dazu, da die 1.03 etwas stärker als die 1.02 ist.

In beiden Fällen ist der Elounterschied allerdings deutlich geringer als der von
Jeroen Noomen angegebene.

Jedenfalls danke für den Test Ingo.

Gruß

Rudolf Rohs
Parent - By Werner Preuss Date 2010-10-19 10:24
Hallo,

ich habe es mal ausgerechnet:
Bei Dir erreicht Rybka einen Score von 53%, in dem anderen Posting sind es 59%.

Ich denke die Schwankungen liegen im Rahmen dessen, was bei dieser Anzahl von Partien üblich ist.
Die Ergebnisse von J. Noomen wurden zumindest im Grundsatz bestätigt. Bei längeren Bedenkzeiten
ist Rybka etwas stärker als Houdini.

Gruß
W
Parent - By Benno Hartwig Date 2010-10-19 14:37
[quote="Ingo Bauer"]Time control: 60 minutes per game/each side, played on 3 equal computers.[/quote]Thanx. Ergebnisse auch mit sehr vielen Partien bei sehr kurzen Zeiten gab es schon öfter.
Und dort wurde R4 einigermaßen abgehängt.
Bei längeren Zeiten schien der Vorsprung von Houdini zu schwinden.
Ob er bis auf Null geht, oder ob, wie es dein Ergebnis andeutet, hier sogar R4 vorn liegt, wäre interessant herauszufinden.
Von daher, thanx für dein Mosaiksteinchen.

Benno
Parent - - By Bert Rinzel Date 2010-10-19 17:28
Code:
Result: + 23,= 60,- 17 in favor for Rybka 4


Ist das nicht beweis genug für die annahme, dass die ganzen blitz-tests nichts aussagen?
Parent - By Andreas Luettke Date 2010-10-19 18:15
Hallo Bert,

inwiefern sollte das denn Beweis genug sein, ich glaube ein Schachprogrammierer
kann mit den Blitztestgames bestimmt etwas anfangen.

Gruss Andreas
Parent - - By Gerhard Sonnabend Date 2010-10-19 21:33
[quote="Bert Rinzel"]
[...snip...]
Ist das nicht beweis genug für die annahme, dass die ganzen blitz-tests nichts aussagen?
[/quote]

Aus einem einzigen Match, dazu noch gerade mal über 100 Spiele durchgeführt,
sollte man (völlig gleichgültig auf welchem Level und/oder unter welchen Bedingungen
auch immer durchgeführt) ÜBERHAUPT NICHTS in Bezug auf irgendwelche (ELO)
Zahlen und/oder Platzierungen, Reihungen etc. etc. schliessen !
Erst recht sollte man sich tunlichst zurückhalten aus solch einer Serie Wertungen in Bezug
auf "Blitz ist besser als X", "Blitz ist gleichgut wie X" oder gar "Blitz ist schlechter als X"
abzusondern. Ingo ist bekannt dafür, dass er eben nicht an Unterschiede zwischen
den einzelnen Bedenkzeiten glaubt, so lange es nicht allzu "tief" geht, z.B. 1'+0.5'' oder
ähnlichen Quatsch betreffend.
Parent - - By Frank Quisinsky Date 2010-10-19 21:53
Hallo Gerhard,

das wirst Du aber niemals aus den Köpfen vieler Anwender bekommen.

Die spielen Rybka 4 vs. IvanHoe ... IvanHoe gewinnt mit 30:20 und ist dann x ELO besser.
Das mag ja im direkten Vergleich bei 50 Partien so sein aber leider nicht wenn viele weitere Engines hinzugeholt werden.

Und daran werde ich auch mit den vielen SWCR Ergebnisse nicht rütteln.
Wer an bestimmte Zahlen glauben möchte, soll es tun.

Wichtig ist, dass alle ein wenig Spass bei der Testerei haben und überhaupt irgend etwas feststellen.
Ganz egal ob das in ein Computerschachbuch als eine Regel eingetragen werden kann oder nicht, spielt wirklich keine Rolle.

Ist auch müssig immer wieder darüber zu diskutieren, auch wenn das was Du geschrieben meine volle Bestätigung findet.
Aber wie gesagt, was solls ...

Gruß
Frank
Parent - - By Joe Nettelbeck Date 2010-10-20 00:03
[quote="Frank Quisinsky"]

Das mag ja im direkten Vergleich bei 50 Partien so sein aber leider nicht wenn viele weitere Engines hinzugeholt werden.

[/quote]

Das wiederum mag auch so sein, aber es kommt eben drauf an, wofür man die Engines verwendet. Verwendet man sie für Fernschachanalysen, sagt das Ergebnis schon etwas aus, denn da wird man kaum auf jemanden treffen, der mit Delfi oder Ruffian als Sekundanten spielt - sondern eben vor allem auf Rybkaspieler und vermutlich auch auf die Clones...
Parent - - By Frank Quisinsky Date 2010-10-20 09:08 Edited 2010-10-20 09:15
Hi Joe,

nun hatte ich sehr viel Kontakt zu starken Fernschachspielern in der Zeit als ich für die SCHACHWELT die Spielstilbeschreibungen anfertigte (deutscher Fernschachbund wies darauf hin) bzw. auch der Redakteur für Fernschach-Events der SCHACHWELT, siehe auch meine Aktuell Seite ... Eintrag 062.

Auszug:
- nirgends fand ich Spielstilbeschreibungen der Engines.
Es ist sehr vermessen über Spielstile zu berichten. Die besten Engines spielen auf einem höheren Level als die besten Schachspieler der Welt. Aber die Aufgabe reizte mich. Sehr viele Fernschachspieler waren interessiert und so bekam ich auch laufend TIPPs von Fernschachspielern zu den Spielstilbeschreibungen. Meine eigenen Eindrücke mischte ich mit den Fehlerbeschreibungen und Eindrücken von starken Fernschachspielern. Es erreichten mich sehr viele positive Zuschriften, gerade zu diesen kurzen Spielstilbeschreibungen. Auch versuchte ich bei jedem Interview Informationen zu diesem Themenkomplex direkt von der Quelle zu erhalten und befragte daher regelmäßig die Programmierer der Engines. Sehr interessant war hierbei dann der Umstand, dass fast jeder der Herren eine andere Meinung zu der generellen Frage zu Spielstilen bei Engines hatte. So dachte ich mir, nicht aufgeben, sondern jetzt erst Recht kurze Beschreibungen aus den bekannten Informationen basteln. Ergänzend fertigte ich zahlreiche Statistiken zu bereits gespielten SWCR Partien an. Dennoch, ein sehr zweischneidiges Thema. Aber zumindest wurde mal ein Ergebnis erzielt, ob gut oder schlecht sei dahingestellt.


In der Tat ist es so, dass viele Fernschachspieler Rybka und immer noch Deep Fritz für Ihre Fernschachanalysen einsetzen. Selbst hatte ich den Eindruck, dass allerdings sehr viele Fernschachspieler schon längst raus haben, dass die starke Phase von Rybka im späten Mittelspiel beginnt und mehr Engines einsetzen, gerade in den frühen Partiephasen und im späten Endspiel. Viele Eindrücke dieser Spieler deckten sich mit meinen, einige Kommentare die ich erhalten habe sind in den Spielstilbeschreibungen eingeflossen.

Und zu Ruffian und Delfi:
Zumindest war es mal so, dass zum Zeitpunkt als Ruffian erschienen ist, viele mit Ruffian analysierten. Nicht zuletzt wegen dem MV-Mode der seinerzeit perfekt umgesetzt wurde und natürlich auch aufgrund der Spielstärke. Heute ist das ganz sicher nicht mehr so.

Letztendlich wird es so sein, dass die Fernschachspieler, die sich mit Computerschach ein wenig mehr auseinandersetzen, altivernative Programme einsetzen. Sehr beliebt ist Naum und auch Shredder. Naum findet bei längeren Bedenkzeiten enorm viel, geht auch aus Test-Sets mit längeren Zeitkontrollen hervor. Shredder hat viele Stärken im Endspiel. Bei der Taktik ist das alles ein wenig zweischneidig. Riskante Varianten werden meist nicht gespielt, so sind die großen Taktiker wie z. B. Spark nicht sehr gefragt zumal Spark auch nicht so bekannt ist wie ein Rybka oder Deep Fritz. Naum 4.2 scheint so etwas wie ein Geheimtipp zu sein wie mir von 3 verschiedenen Seiten berichtet wurde ... im Grunde genauso bekannt im Fernschach wie ein Spark ... auch klar!

Zwei Fernschachspieler schrieben gar ...
Würden wir nur Rybka einsetzen, würden wir schlicht und einfach überspielt werden weil das fast alle machen bzw. die Tendenz eher ist mehr Programme einzusetzen.

Also ich denke das Ergebnisse zwischen 2 Engines rein gar nichts aussagen, erst Recht nicht wenn die IPP Familie beteiligt ist. Nach meinen Analysen fehlen den Engines offenbar Wissen im Endspiel und viele gute Stellungen können nicht umgesetzt werden. Dafür sind die Engines sehr schnell.

Selbst gehe ich bei meinen Analysen sehr experimentell vor (bin ständig auf der Suche nach dem taktischen Einschlag).

So setze ich unter ChessBase 10 (11 immer noch nicht installiert) auf Quad Core meist ein:

Engine 1: Spark 0.5 x64
Engine 2: Stockfish 1.9.1 x64
Engine 3. Junior 11.2 x64
Engine 4 variiert: Je nach Stellung ... Hiarcs 13.1, Shredder 12 oder Rybka 4

Lasse ich länger analysieren ... "Über-Nacht-Analyse" kommt als Engine 4 Naum 4.2 zum Einsatz.

So hat sicherlich jeder, der dann doch mehr Engines einsetzt, und sich mit dem Thema beschäftigt, seine Engine-Kombinationen.
Würde ich Fernschach spielen, würde ich wahrscheinlich Junior herausnehmen und Rybka (da ich Rybka nicht mag, eher IvanHoe) fest mitlaufen lassen (Engine 3).

Viele Grüße
Frank
Parent - - By Frank Quisinsky Date 2010-10-20 09:31
Hi,

übrigens, zur Jahreswende führten GM Hickl und meine Wenigkeit ein Interview mit GM Meier (Nummer 2 in Deutschland zu diesem Zeitpunkt) durch. GM Meier läßt Rybka als Kiebitz mitlaufen. Was Rybka nicht findet wird eh erarbeitet (nicht wichtig), so ungefähr GM Meier. Glaube das steht auch im Interview auf den SCHACHWELT Webseiten. Als ich Shredder 12 auf meinem Notebook auf dem DGT Brett mal gegen GM Meyer antreten ließ unterhielten wir uns während der Partie. GM Meier kannte z. B. Stockfish gar nicht und meinte ... hört sich interessant an, werde ich mir anschauen. Im Grunde haben zumindest die GMs auch weniger Zeit für Computerschach und sind immer für solche Tipps dankbar. Aber letztendlich dienen die Engines nur als Überprüfung von Varianten, zumindest auch bei den super starken Fernschach GMs. Die haben gar keine Lust x Computer rechnen zu lassen um deren Züge auszuspielen, glaube da bestehen zu den GMs im Normalschach kaum Unterschiede.

Auch wurde mir mehrfach bestätigt, dass z. B. ein Rybka für sich allein vielleicht maximal eine Fernschach ELO von 2.550 hätte, eher 2.500 oder knapp drunter. Das wahnsinnig hohe Nivau im Fernschachbereich wird wahscheinlich oftmals unterschätzt bzw. die Programme im Fernschach überschätzt. Vielleicht werden auch die starken Programme im Fernschach unterschätzt, kann das selbst kaum beurteilen und muss mich dahingehend eher auf die Aussagen der Fernschachspieler verlassen.

Aus meinen Erfahrungen mit längeren Analysen heraus kann ich nur sagen das Rybka grotten langweiliges Schach nach der Eröffnung spielt. Viele scharfe aber sehr gute Varianten noch nicht mal im Suchbaum hat bzw. viele Schacheröffnungen äußert merkwürdig und total abweichend von der Theorie spielt. Hierzu GM Meyer ... tja Frank, das ist unser Vorteil ... die Eröffnung und die langfristigen Pläne. Nur leider machen wir kleine Fehler und die Programme nutzen diese erbarmungslos aus.

Gruß
Frank
Parent - - By Rudolf Rohs Date 2010-10-20 11:38
Hallo Frank,

Computerprogramme spielen im Fernschach heutzutage schon eine große Rolle. Ohne Computerhilfe ist man ab einem
gewissen Niveau chancenlos. Das bedeutet aber nicht, daß nur noch Computer gegeneinanderspielen. Es gibt auch noch
eine ganze Reihe anderer Faktoren die wichtig sind.

1) ein guter Fernschachspieler muß seiner Engine helfen können. Es spart sehr viel Zeit, wenn man sinnlose Varianten
    aus der Computerberechnung ausschließen kann und somit einige Halbzüge weiter kommt, oder Zeit für entscheidendere
    Züge in anderen Partien findet. Schließlich spielen viele Fernschachspieler 10-30 Partien gleichzeitig und haben trotzdem
    kein Rechnenzentrum zuhause.
2) auch fehlt den Computerprogrammen wie Du auch schon sagtest der langfristige Plan. Der muß vom Menschen kommen.
3) Im Eröffnungsbereich sind Computer zwar schon stark, aber guten Eröffnungsbüchern oder gutem Eröffnungswissen immer
    noch unterlegen.
4) Das gleiche gilt für das Endspiel. Hier entscheidet Endspielwissen und Tablebasedatenbanken und erst danach der Computer
5) Nicht zuletzt muß ein Fernschachspieler auch immer selbst die Stellung und auch die vom Computer empfohlenen Varianten
    selbst beurteilen können, schon alleine um Bugs zu vermeiden oder auszuschalten. Auch kommt es immer wieder vor, daß
    eigene Züge vom Programm nachgerechnet auf einmal bessere Bewertungen als der ursprüngliche Computerzug bringen.

All dies bewirkt, daß es trotz der wenigen verschiedenen eingesetzten Programme im Fernschach sehr große Spielstärkeunter-
schiede gibt. Ich stell heute abend mal den Rybka an und schau mir morgen früh den Gewinnzug oder wenigstens die
Remisvariante an, funktioniert also höchstens im unteren Elobereich.

Gruß

Rudolf

PS. Computerprogramme können nur Stellungen bewerten, sie können keine Ideen oder Pläne entwerfen. Wenn die Stellung aus-
     geglichen ist fällt einem Computer nichts weiteres ein als die Stellung ausgegelichen zu halten. Stellungen verkomplizieren oder
     unklare Positionen anstreben um dem Gegner Fehler zu ermöglichen ist nicht ihr Streben. Sie nützen nur gemachten Fehler aus,
     dies allerdings meist absolut tödlich.

Parent - - By Benno Hartwig Date 2010-10-20 17:43
[quote="Rudolf Rohs"]Stellungen verkomplizieren oder unklare Positionen anstreben um dem Gegner Fehler zu ermöglichen ist nicht ihr Streben.[/quote]Sicher?
Eine Engine könnte ohne weiteres so programmiert werden, dass sie komplizierte Stellungen bevorzugt, besonders ruhige Stellungen eher vermeidet. Nur würde solch eine Strategie nur gegen Menschen Erfolge bringen. Und in der Praxis werden die Engines aber mehr nach ihren Erfolgen gegen andere Engines gemessen.
Ich meine aber, zumindest vor 20 Jahren noch wurde in einschlägigen Artikeln behauptet, Schachcomputer würden Stellungen verkomplizieren, weil ihre Routinen dies bevorzugen. Die Entwickler wussten halt, dass ihre Programme sonst blind dastehen.
Falsch?

Und auch das Fallenstellen wäre meiner Meinung nach programmierbar. Etwas was die Remisquote gegen schwächere Engines und Menschen vielleicht mindern könnte, was gegen andere Topengines aber stören würde.

Benno
Parent - By Frank Quisinsky Date 2010-10-20 18:56
Hi Benno,

im Schachcomputerzeitalter wurde sehr viel übertrieben. Denke es ist uns allen klar, dass dies eher fürs Marketing gemacht wurde. Uns selber ist es kaum aufgefallen weil schon die starken Geräte mit ca. 2.000 ELO spielten und die meisten Vereinsspieler bei ca. 1.600 ELO liegen.

Aber ich bin bei Dir was komplizierte Stellungen angeht. Es gab mal eine Zeit da hatte ich diesen Eindruck bei der Fritz Entwicklung. Bevorzugtes spielen auf offene Linien ließen die anderen Programme verzweifeln und Fritz galt als taktische Bombe. Heute ist das kaum noch zu sehen, klar die Programem haben alle zugelegt. Der Spark Programmierer versucht in diesem Bereich einiges und auch sehr erfolgreich. Gibt keine andere Engines die so viele Kurzpartien erspielt wie Spark und immer durch sehr gewagte Züge die sich aber langfristig als gut herausstellen. Und schön daran ist, dass Spark selbst sehr selten schnell in Nachteil kommt. Also weit weg von experimentellen spielen. Eine absolute TOP-Leistung hinsichtlich der Programmierung denn das macht Spark anders als die anderen und wie gesagt sehr erfolgreich.

Oder Junior!
Wird von Fernschachspielern gerne während der Eröffnung und ein paar Züge hinein ins Mittelspiel eingesetzt. Weil ... die Engine anders spielt, entweder untergeht oder den genialen Zug findet. Das beurteilen dann die Fernschachspieler selbst aber ein Junior darf aufgrund dieser Stärke (die aber auch zu einer Schwäche werden könnte) nicht bei Analysen fehlen.

Sicherheitsgeschiebe ohne wirklichen Plan, zwar keine Fehler aber auch keine außergewöhnlichen Züge, so spielt Rybka lt. einen Kommentar von einem Fernschach GM während meiner SCHACHWELT Zeiten. Mit den Analysen kann ich im Grunde wenig anfangen aber für die Eröffnung benötige ich auch keine Fehlerkontrolle ... so seine Aussage. Spielst Du engine-engine kannst Du warten bis zu schwarz wirst bis Rybka mal aggressive um die Ecke kommt und einen riskanten taktischen Zug spielt, mal einen Bauer für offene Linien gibt etc.. Eigentlich eher etwas für Sicherheitsfanatiker, nur nichts anbrennen lassen und Remis ist ja auch gut

Wir können schon mächtig froh sein, so viele geniale Werkzeuge zur Hand zu haben um dieses Hobby ausgiebig nachzugehen. Daher sind unterchiedliche Engine Entwicklungen auch wichtig, es darf und sollte nicht alles gleich sein, nur wegen ein paar ELO Pünktchen mehr.

Gruß
Frank
Parent - By Joe Nettelbeck Date 2010-10-20 17:07
[quote="Frank Quisinsky"]
Zwei Fernschachspieler schrieben gar ...
Würden wir nur Rybka einsetzen, würden wir schlicht und einfach überspielt werden weil das fast alle machen bzw. die Tendenz eher ist mehr Programme einzusetzen.

[/quote]

Hallo Frank,
ehrlich gesagt, das sehe ich anders. Ich verfolge da die Strategie, mit nur einer Engine zu analysieren (eben Rybka). Dadurch lerne ich sie wesentlich besser kennen und bekomme mit der Zeit ein Gefühl für die Situationen, in denen ich speziell "nachhaken" und bohren muss, weil Rybka dort ohne größere Hilfe vielleicht nicht vertrauenswürdig ist. Und das kann keine so schlechte Vorgehensweise sein - immerhin spiele ich derzeit in der Vorrunde der Deutschen Meisterschaft...  

Grüße
Joe
Parent - - By Werner Mueller Date 2010-10-20 00:13
[quote="Gerhard Sonnabend"]
[quote="Bert Rinzel"]
[...snip...]
Ist das nicht beweis genug für die annahme, dass die ganzen blitz-tests nichts aussagen?
[/quote]

Aus einem einzigen Match, dazu noch gerade mal über 100 Spiele durchgeführt,
sollte man (völlig gleichgültig auf welchem Level und/oder unter welchen Bedingungen
auch immer durchgeführt) ÜBERHAUPT NICHTS in Bezug auf irgendwelche (ELO)
Zahlen und/oder Platzierungen, Reihungen etc. etc. schliessen !
Erst recht sollte man sich tunlichst zurückhalten aus solch einer Serie Wertungen in Bezug
auf "Blitz ist besser als X", "Blitz ist gleichgut wie X" oder gar "Blitz ist schlechter als X"
abzusondern. Ingo ist bekannt dafür, dass er eben nicht an Unterschiede zwischen
den einzelnen Bedenkzeiten glaubt, so lange es nicht allzu "tief" geht, z.B. 1'+0.5'' oder
ähnlichen Quatsch betreffend.
[/quote]

Schön, dass Du ELO in Klammern gesetzt hast , eine mögliche Erklärung dafür, dass Unterschiede bei verschiedenen Bedenkzeiten möglich sein könnten, hätte ich auch noch.

Es gilt (ganz grob), dass - unabhängig davon wie 'schnell' die Suche einer Engine ist - eine Verdoppelung der Bedenkzeit ein knappes Ply an zusätzlicher Suchtiefe ergibt.

Daraus folgt, dass der 'Vorsprung' an Plies, den eine Engine mit 'schneller' Suche gegenüber einer Engine mit 'langsamer' Suche hat, immer derselbe ist, unabhängig von der Suchtiefe bzw. der Bedenkzeit.

Und es liegt mehr als nahe anzunehmen, dass der Vorteil aus diesem Vorsprung an Plies mit zunehmender Suchtiefe geringer wird (das hast Du doch sogar mal gemessen: was ist ein zusätzliches Ply 'wert' in Abhängigkeit von der Suchtiefe?). 
Parent - By Bert Rinzel Date 2010-10-20 09:07
Der große vorteil, den Rybka seinerzeit - bereits seit der ersten version - hatte, war wohl die schnelle suche. Rybka kam schon immer viel früher als andere engines auf den "besseren" zug.

In langen games kann man  auch heute mit R4 noch beobachten, dass Rybka bei Tiefe 18-20 bereits den endgültigen zug errechnet hat, der später auch gezogen wird.

Andere Programme tun sich da viel schwerer. Sie kommen meist wesentlich später noch auf einen anderen - wohl besseren - zug. Das ist der grund dafür, dass im direkten vergleich gegen Rybka erst bei richtig langen bedenkzeiten bessere ergebnisse erzielt werden.

Den vorteil der schnellen suche haben heute die vermeintlichen clones zu ihren gunsten ausgebaut. Teilweise sind sie bei den ganz kurzen spielen sogar besser deswegen.

Aber auch hier hebt sich der Vorteil in längeren games natürlich wieder auf.
Parent - - By Gerhard Sonnabend Date 2010-10-20 09:31
[quote="Werner Mueller"]
[...snip...]
Es gilt (ganz grob), dass - unabhängig davon wie 'schnell' die Suche einer Engine ist
- eine Verdoppelung der Bedenkzeit ein knappes Ply an zusätzlicher Suchtiefe ergibt.
Daraus folgt, dass der 'Vorsprung' an Plies, den eine Engine mit 'schneller' Suche
gegenüber einer Engine mit 'langsamer' Suche hat, immer derselbe ist, unabhängig von
der Suchtiefe bzw. der Bedenkzeit.
Und es liegt mehr als nahe anzunehmen, dass der Vorteil aus diesem Vorsprung an Plies
mit zunehmender Suchtiefe geringer wird
[...snip]
[/quote]

Die "diminishing returns", welche Du beschreibst, wird es wohl geben. Nur bin ich
mir nicht sicher ab welchen Suchtiefen das beschriebene eintrifft. Ich bin mir jedoch
ziemlich sicher, dass in Ingos Test die Grenze noch nicht erreicht wurde.

Übrigens sollte man sich davor hüten Engineausgaben bezügl. Suchtiefe, Kn/S etc.
miteinander zu vergleichen.

[quote="Werner Mueller"]
(das hast Du doch sogar mal gemessen: was ist ein zusätzliches Ply 'wert' in
Abhängigkeit von der Suchtiefe?).
[/quote]

Ich hatte seinerzeit den so-called "branching factor" anhand einiger Stellungen für
verschiedene Engines ermittelt. Dies war zu Zeiten eines Rybka 1.1 (und 1.2f). Damals
zeigten die Stichproben, dass vor allem Toga II 1.2 spürbar langsamer als die
anderen Engines war. Dies sowohl in der Eröffnung als auch im Mittelspiel mit noch
vielen Steinen auf dem Brett.

Viele Grüsse,
G.S.
Parent - - By Werner Mueller Date 2010-10-20 11:02
[quote="Gerhard Sonnabend"]
...
Die "diminishing returns", welche Du beschreibst, wird es wohl geben. Nur bin ich
mir nicht sicher ab welchen Suchtiefen das beschriebene eintrifft. Ich bin mir jedoch
ziemlich sicher, dass in Ingos Test die Grenze noch nicht erreicht wurde.
...
[/quote]
Na, dieser Effekt wäre gerade bei niedrigen Suchtiefen bzw. kurzen Bedenkzeiten (und dann z.B. Verdoppelung oder Vervierfachung der Bedenkzeit) am deutlichsten nachzuweisen.
Parent - - By Gerhard Sonnabend Date 2010-10-20 11:46
Ich meinte das in Bezug auf die "diminishing returns".
Ich bin mir nicht sicher wann der beschriebene Effekt beginnt sich auszuwirken,
also ab welcher Tiefe ein "2-Ply-Vorsprung" (nur ein Beispiel) kaum mehr ins
Gewicht fällt.
Parent - By Werner Mueller Date 2010-10-20 12:35
[quote="Gerhard Sonnabend"]
Ich meinte das in Bezug auf die "diminishing returns".
Ich bin mir nicht sicher wann der beschriebene Effekt beginnt sich auszuwirken,
also ab welcher Tiefe ein "2-Ply-Vorsprung" (nur ein Beispiel) kaum mehr ins
Gewicht fällt.
[/quote]
Ah ja, ok.
Parent - By Rudolf Rohs Date 2010-10-19 21:58
Hi,

ja, wenn du 1'+1'' Partien meinst sicherlich.

Aber Ingo's Liste zeigt ja schon an, daß auf seinem Level Rykba 4 und Houdini 1.03 in etwa gleich stark sind.
Bei Stundenpartien scheint Rykba leicht besser zu sein, aber der Unterschied zu Ingo's Ipon-Liste ist schon gering.
Von ca. 50 % steigert sich Rybka auf 53 %.

Gehn wir mal davon aus, daß sich dies bei mehr Partien bestätigen würde. Dann würde Ingo's Liste immer noch ein
sehr guter Anhaltspunkt sein, wie stark eine Engine bei längeren Bedenkzeiten ist.

Das Verhältnis von 2 Engines die in der Ipon 100 Elos auseinanderliegen dürfte also auch bei Langzeitanalysen nicht kippen.
Kleinere Verschiebungen von 10-20 Elopunkte scheinen aber möglich zu sein.

Sogesehen ein schönes Ergebnis des Tests.

Gruß

Rudolf

Parent - By Benno Hartwig Date 2010-10-19 23:27
[quote="Bert Rinzel"]Ist das nicht beweis genug für die annahme, dass die ganzen blitz-tests nichts aussagen?[/quote]Wenn(!) sich dieses Stärkeverhältnis in anderen Tests bestätigt, wäre das ein Beweis, dass im Falle Houdini oder Rybka (oder beiden) die Blitz-Stärke deutlich anders ist als bei langen Zeiten. Mehr natürlich nicht.
Blitztest sagen ganz prima etwas aus über die Spielstärke im Blitzen.

Benno

PS:
Ich habe den Eindruck, dass es Houdini ist, der bei langen Zeiten ungefähr R4-Stärke hat, aber bei kurzen und besonders bei kürzesten Zeiten relativ stärker ist.
Überraschend, besonders für einen Clone, aber es ist wohl so.
und es wäre schon interessant zu verstehen, wie dies gemacht wird (war bei Ivanhoe ja auch schon so, das Feld für Forschungen in den Sourcen lädt also ein.).
Parent - - By rebelposter Date 2010-10-20 08:23
hier stand ein posting was ohne rücksprache willkürlich gelöscht wurde!

eine riesengrosse sauerei! 
Parent - - By Frank Rahde (Mod.) Date 2010-10-20 08:39 Edited 2010-10-20 09:27
Hallo Anon,

was meinst Du? Ich kann im Admin-Bereichs des Forums keine Löschaktion erkennen. Zuvor freigeschaltete Beiträge werden von uns nicht kommentarlos gelöscht. Du solltest vielleicht auch wissen, dass Beiträge von Gästen (keine Stammposter) hier erst von einem der Moderatoren freigeschaltet explizit werden müssen, um sichtbar zu werden. Daher hatte es keinen Effekt, als Du 5-6 Postings mit gleichem Inhalt (siehe oben) abgesetzt hast... Wie Du siehst, habe ich Deinen Beitrag freigeschaltet (gibt nix zu verbergen) und ich wüsste gern von Dir in einem netteren Ton, welcher Beitrag (von wem, von wann, welcher Inhalt) angeblich verschwunden ist.

Danke+Gruß, Frank

PS: Postings von gesperrten Schreibern oder anonyme Postings, die den Nutzungsbedingungen zuwiderhandeln, werden natürlich entsprechend behandelt.
Parent - By Bert Rinzel Date 2010-10-20 08:44
Moin

mir wurde zwischendurch angezeigt, dass Peter Struwel, oder wie er auch jeweils heissen mag, auf meinen beitrag geantwortet hat. Dieser beitrag wurde offenbar nicht freigeschaltet.

Bert
Parent - - By Thomas Müller (Mod.) Date 2010-10-20 11:38
Hallo,

ich weiß was die "sauerei" dabei ist
Gelöscht habe ich und werde das auch weiterhin tun.
Und ich verweise auf Nutzungsbedingungen §6.

Grüße Thomas
Parent - - By Benno Hartwig Date 2010-10-21 11:39
[quote="Thomas Müller (Mod.)"]Gelöscht habe ich und werde das auch weiterhin tun. Und ich verweise auf Nutzungsbedingungen §6.[/quote]Da der Schreiberling sich irgendwie keiner Schuld bewusst zu sein scheint: Hast du ihm die Gründe für das Löschen skizziert?
Oder war sein Posting so, dass er eh wissen müsste, warum es anstoßen würde?
Benno
Parent - - By Thomas Müller Date 2010-10-21 12:08
Mir sind die Gründe bekannt.
Warum fragst du?

Grüße thomas
Parent - - By Benno Hartwig Date 2010-10-21 12:53 Edited 2010-10-21 12:55
[quote="Thomas Müller"]Mir sind die Gründe bekannt.Warum fragst du?[/quote]Weil es mich interessierte.
Wenn ein Posting von mir gestrichen würde, würde ich gern erfahren wollen, warum.
Es würde mich vergleichsweise wenig trösten, dass du die Gründe schon kennst. 
Würdest du dies anders sehen, wenn ein Posting von dir in einem anderen Forum gestrichen würde?
Darum fragte ich, ob jener ominöse Rebelposter über die Gründe informiert wurde.
Benno
(Dass ich gem. Nutzungsbedingungen kein Anrecht habe auf Aufklärung, ist halt eine andere Sache.)
Parent - By Thomas Müller Date 2010-10-21 14:23
Du bist Stammposter und würdest eine info bekommen.
Dafür gibt es eine Funktion im Forum bei der Absender benachrichtigt werden können. Bei "Gästen" geht das nicht.

Derjenige weiß (hoffentlich!) warum das gelöscht wurde.
Wenn nicht werde ich das nicht extra mitteilen.

Und von mir wurden noch nie postings gestrichen/gelöscht egal wo, weil ich mich an bestimmte regeln halte im Gegensatz zu ein paar komischen Leuten hier!

Grüße thomas
Parent - By Andreas Luettke Date 2010-10-20 13:17
Hallo Mr. Unbekannt,

lt. $7 der Nutzungsbedingungen dieses Forums muss der Forenbetreiber mit niemanden Rücksprache halten wenn Beiträge gelöscht und oder nicht freigegeben werden. Darüber hinaus besteht auch keinerlei Anspruch auf die Erteilung von Auskünften über gelöschte und oder nicht freigegebe Beiträge.
Manchmal ist es doch ganz gut wenn man erst die Nutzungsbedingungen liest bevor man unnötig rumpoltert.

Andreas
Parent - - By Ingo Bauer Date 2010-10-20 19:39
Hallo alle

Wie angedroht, hier meine Eindrücke.

1. Ein Ergebniss aus 100 Spielen so zu werten, dass eine Enigne besser als die andere ist nicht möglich. Ich habe mehrere Enignes in der IPON die gegen schwächere Enignes im direkten Vergleich verloren haben. Was klar zeigt, dass sowohl 100 Spiele, egal welche Zeitkontrolle, viel zu wenig sind als auch EINE Enignepaarung nicht taugt um eine Spielstärke zu ermitteln.

2. Beide Enignes liegen nur 3 Gewinne/Verluste zum Gleichstand auseinander. Das sind 3 magere Spiele aus 100. Wie jemand aufgrund dessen davon sprechen kann das irgendwelceh anderen Testmethoden nichts taugen ist mir ein Rätsel Ich vermute eher den Wunsch als Vater des Gedanken.

3. Leider ist wohl niemand auf die Idee gekommen sich mal ein bischen Enignestatistik anzusehen. Die erreichten +6 hatte Rybka nach 37 Spielen, oder rund einem Drittel, danach schwankte es nur noch um diesen Punkt. Nach 37 Spielen dachte ich es wird ein Schlachtfest (Siehe auch Punkt 7), aber danach passierte nichts mehr und die Prozentzahl für Houdini wurde besser und besser. Wenn ich die ersten 60 Spiele genommen hätte wäre mien Ergebniss ähnlich wie das von Jeroen Noomen, wenn ich die letzten 60 genommen hätte wäre es praktisch ein Gleichstand. Das Problem ist, das niemand weiß wie es nach 200 Spielen aussehen würde, Houdini könnte aufgeholt haben, oder Rybka weiter davongezogen sein ... ein weiterer Punkt der zeigt, dass das Ergebniss aus einer einzigen Enginepaarung völlig irrelevant sind.

4. Immer wieder behaupten einzelne das sie aus einem Spielen herrauslesen könnten welche Einge die bessere ist. Offensichtlich scheinen diese Leute hier nicht mitzulesen, zumindest hat sich keiner die Mühe gemacht ein einzelnes Spiel zu bewerten
(Ich kann wegen dem netten gewonnen Endspiel nur mal Spiel 89 anz Herz legen; als 6Steiner gewonnen, als 5 Steiner gewonnen, und doch nur Remis ... auch mit 6 oder 5 Steiner Tbs ... !? )

5. Ich hoffe das diejenigen die sich für die Verwandschaft dieser Engines interessieren, sich die Spiele einmal näher ansehen. Ich habe keinerlei Vergleichsmöglichkeiten über die Remisquote bei gleichstarken Enignes und dieser Zeitkontrolle, aber 60 finde ich hoch (siehe auch Punkt 7); auf der anderen Seite kann man ein beliebiges Spiel nehmen, auch die Remisen, und sich die gegenseitigen Pondertreffer oder besser Nichttreffer ansehen. Es gibt mehrere Spiel in denen sichtbar ist, das eine Engine auf dem Dameflügel agieren will, und da auch Gegenspiel erwartet, während die andere konsequent auf der anderen Seite Initiative sucht. Wenn es nach diesen Treffern gehen würde, ist der "Cloneverdacht" (besser Derivat) für mich ein ziemlich wirres Konstrukt! Kurz: Wenn man mir diese beiden Engines ohne mein Wissen über etwaige Vorwürfe vorgesetzt hätte, würde ich nie vermuten, dass sie irgendetwas geinsam haben sollen. (Allerdings traue ich mir auch nur zu vielleicht ein paar Shreddereigenheiten zu erkennen. Bei allen anderen Engines bin ich nicht so gut)

7. Kurz zum verwendeten Testset. die + 6 für Rybka passierten in den ersten 37 Spielen, ob das am Eröffnungsset lag oder an der Enigne weiß ich mangels Vergleich mit anderen Enginepaarungen nicht. Sehr viele Spiele verharrten lange in blockierten Stellungen. Das Bemühen möglichst neutrale Startpositionen zu finden schient mir hier zuviel des Guten zu sein worauf auch die Remisquote deuten mag. Letztendlich muß ich aber sagen das ich zumindest nichts gesehen habe, das schon aus der Eröffnung für Weiß oder Schwarz gewonnen war. Für eine endgültige Beurteilung der Eröffnungen bräuchte ich VIEL mehr Spiele, für meinen persöhnlichen Geschmack waren die Spiele ein bischen zu "geschlossen".

Fazit: Eine drei Spiele Differenz zum Ausgleich ist mir einfach viel zu wenig um von einer besseren oder schlechteren Enigne zu sprechen. für mich sind beide Enignes, wie auch in der IPON, nach wie vor gleich stark.

Bye
Ingo

PS: Übrigens sprechen einige dieser Punkte auch dafür, das Bücher, die im Enigneraum mit Rybka vs Rybka erstellt und getestet werden, ziemlich wertlos sind, soblad sie auf wirklich andere aber gleichstarke Engines treffen würden. D.h. nicht, das man nicht eine Variante finden kann die Rybka gut spielt, d.h. nur, das ein gleichstarker Gegner diese Variante nicht spielen würde.
Parent - - By Frank Quisinsky Date 2010-10-20 20:31
Hi Ingo,

vielen Dank für den Bericht.

Eine Anmerkung:
Die hohen Remisquoten bei Rybka 4 gegen vermutete Cloens oder vermutete Clones gegeneinander sind normal und liegen oftmals gar bei 70%. Das hat nichts mit dem Testset zu tun. Richtig ist aber, dass ich bewusst Stellungen ausgewählt habe bei denen es nicht direkt zu Abtauschorgien kommt, einfach um die Partien spannender zu halten und frühe Endspiele zu vermeiden. Habe aber selbst nur 2-3x durchlaufen lassen, also mein Test-Set ist nicht komplett durchgetestet wurden und absolut zugeschnitten auf das was ich gerne sehen möchte bei ausgeglichener Eröffnungswahl ... gute Mischung nach dem ECO-Code.

Was ich aber getestet hatte ...
8 Engines untersuchten die Stellungen mit 3 Minuten pro Zug auch nach Schwarz Zug 8 - 10 ... um zu vermeiden das schlechte Stellungen drin sind. Also dahingend habe ich alles mögliche unternommen um sicherzugehen das die ausgesuchten Stellungen nicht verfrührt zu Vorteilen führen.

Dennoch, werde mich mit dem Thema nochmals beschäftigen und sicherlich an dem Test auch noch etwas optimieren. War selbst ein wenig im Stress wegen den vielen Updates auf meinen Seiten und habe die 100 Partien noch nicht heruntergeladen bzw. reingesehen. Mache ich aber noch.

Viele Grüße
Frank
Parent - - By Ingo Bauer Date 2010-10-20 21:02
Hallo Frank,

[quote="Frank Quisinsky"]

Die hohen Remisquoten bei Rybka 4 gegen vermutete Cloens oder vermutete Clones gegeneinander sind normal und liegen oftmals gar bei 70%. Das hat nichts mit dem Testset zu tun.
[/quote]

Ganz so einfach ist es nicht, bei der IPON liegen die Remisquoten gegen Houdini (und andere wie ich dir schon zugesand habe) deutlich niedriger!
Houdini-Rybka liegt bei mir bei 49%, Rybka-Stockfish 1.8 bei 51%, Rybka-Kommodo bei 45, Rybka Stockfish 1.9.1 bei 45. Houdini ist in völlig normaler, Gesellschaft und keinesfalls Auffällig was die Remisquote betrifft. Die höchsten Remisquoten erreicht Houdini mit Stockfish ... soll jeder selber interpretieren Die absolut höchste Remisquote die ich auf die schnelle finden konnte war Deep Fritz 12 gegen Rybka 2.3.2a- 62%. Wer hat denn da wo abgeschrieben wenn Remisquote (aus 100 Spielen) ein Zeichen von "geklaut" ist?
Ich sehe eine so hohe Remisquote eher als Ergebniss einer Kombination aus langen Bedenkzeit und remislichen Eröffnungsstellungen oder, bei nur 100 Spielen, schlicht als Zufall.

[quote="Frank Quisinsky"]
Richtig ist aber, dass ich bewusst Stellungen ausgewählt habe bei denen es nicht direkt zu Abtauschorgien kommt, einfach um die Partien spannender zu halten und frühe Endspiele zu vermeiden. Habe aber selbst nur 2-3x durchlaufen lassen, also mein Test-Set ist nicht komplett durchgetestet wurden und absolut zugeschnitten auf das was ich gerne sehen möchte bei ausgeglichener Eröffnungswahl ... gute Mischung nach dem ECO-Code.
[/quote]

Spannende Partien waren durchaus auch dabei. Wie gesagt, vieles war aber auch einfach nur ewig lang blockiert. Vielleicht auch weil die Engines beide ihre Bauern gern halten um den Gegner zu einem Fehler zu verleiten ... vielleicht mal ein Ansatz um aus Deep Shredder noch ein paar Elo rauszuquetschen ... mal sehen.

[quote="Frank Quisinsky"]
Was ich aber getestet hatte ...
8 Engines untersuchten die Stellungen mit 3 Minuten pro Zug auch nach Schwarz Zug 8 - 10 ... um zu vermeiden das schlechte Stellungen drin sind. Also dahingend habe ich alles mögliche unternommen um sicherzugehen das die ausgesuchten Stellungen nicht verfrührt zu Vorteilen führen.
[/quote]

Kann ich nur bestätigen (auch wenn 100 Spiel zu wenig sind dafür). Ich habe keine Partie gesehen die direkt nach der Startstellung verloren war.

Gruß
Ingo
Parent - By Frank Quisinsky Date 2010-10-20 21:27
Hi Ingo,

Thema Landwirte:
Die Macht der Bauern von GM Hickl

Eines meiner besten Bücher und ganz sicher sind viele Ansätze drin die auch Programmieren helfen könnten.

Lese immer wieder gerne in diesem Buch und untersuche die Beispiele, sehr hilfreich.
Kannst Du ja mal Stefan vorschlagen, er wird sehr viele Infos entnehmen können!

Gruß
Frank
Parent - - By Frank Quisinsky Date 2010-10-20 22:17 Edited 2010-10-20 22:27
Hi,

schaue mal hier ...
Gestern gepostet ...

Code:
Rybka 4 x64                   :  40 (+ 10,= 23,-  7), 53.8 % ... gegen Houdini 1.03a
Rybka 4 x64                   :  40 (+  6,= 29,-  5), 51.2 % ... gegen IvanHoe T0.4
Rybka 4 x64                   :  40 (+ 11,= 23,-  6), 56.2 % ... gegen IvanHoe B52aC
Rybka 4 x64                   :  40 (+  5,= 28,-  7), 47.5 % ... gegen IvanHoe 52iUSTMO
Rybka 4 x64                   :  40 (+  4,= 27,-  9), 43.8 % ... gegen FireBird 1.1 WD
Rybka 4 x64                   :  40 (+ 11,= 22,-  7), 55.0 % ... gegen Fire 1.31


Übrigens, ganz interessant.
Die Fans dieser Engines umjubeln Firebird 1.1 WD ... klar lassen gegen Rybka 4 spielen.
Und ... die Engine ist 40 ELO schwächer als IvanHoe T0.4 im Spiel gegen viele unterschiedliche Gegner.
Und genau das wird heit immer wieder nicht erkannt.

Immer das gleiche Bild bei den extrem hohen Remisquoten auch nach "nur" 40 Partien pro Match.
Es gibt keine andere Engine-Engine Konstellation, welche mit solchen Remisquoten daherkommt. Und wenn dann eher zufällig bzw. wenn dann eher wenn die Engines im späten Mittelspiel / Übergang Endspiel vergleichbar stark sind.

Und diese Remisquoten werden bei längeren Bedenkzeiten zunehmen, auch das ist klar.
70% war jetzt etwas übertrieben aber 60% sollte normal sein, wenn es zu solchen Paarungen kommt.

Und ich bin mir absolut sicher ...
Das späte Mittelspiel, diese enorme Stärke steckt in den IPPs wie in Rybka 4.
Wenn Reverse Engeneering betrieben wurde, dann wurde damit hier ein Umsetzungsweise kopiert, auch wenn die ganzen Ideen sicherlich schon vorher bekannt waren aber auf eine gute Umsetzung kommt es an.

Jetzt herausfinden, wo unterscheiden sich denn die Engines noch ist wahnsinnig aufwendig. Denke das IvanHoe B52aC deutlich aggressiver in den frühen Partiephasen zu Werke geht. Sich etwas mehr absetzt vom Rybka Stil.

Andere Frage:
Was ist denn überhaupt der Rybka Stil. Nur weil eine andere Engine in dieser sehr wichtigen Partiephase vergleichbares Wissen zu Rybka 4 hat muss das noch keine 1:1 Kopie sein. Kommt ein Stockfish oder ein Komodo daher, die auch sehr stark im späten Mittelspiel, Übergang Endspiel sind ... werden die Remisquoten höher. Das alles entscheidet sich genau bei dieser Partiephase und das macht die Sache so kompliziert bzw. festzustellen ob es sich um geklonte Ideen handelt (meine jetzt nicht Komodo / Stockfish). Ich denke nicht, weil die Ideen schon länger bekannt sind. Aber es macht keinen Sinn x Engines mit gleichen Spielstilen in einer Liste zu haben.

Gruß
Frank
Parent - - By Ingo Bauer Date 2010-10-20 23:10
Hallo

[quote="Frank Quisinsky"]
Hi,

schaue mal hier ...
Gestern gepostet ...

Code:
Rybka 4 x64                   :  40 (+ 10,= 23,-  7), 53.8 % ... gegen Houdini 1.03a
Rybka 4 x64                   :  40 (+  6,= 29,-  5), 51.2 % ... gegen IvanHoe T0.4
Rybka 4 x64                   :  40 (+ 11,= 23,-  6), 56.2 % ... gegen IvanHoe B52aC
Rybka 4 x64                   :  40 (+  5,= 28,-  7), 47.5 % ... gegen IvanHoe 52iUSTMO
Rybka 4 x64                   :  40 (+  4,= 27,-  9), 43.8 % ... gegen FireBird 1.1 WD
Rybka 4 x64                   :  40 (+ 11,= 22,-  7), 55.0 % ... gegen Fire 1.31


..., ganz interessant.
[/quote]

Beeindruckende Remisquoten. Ich will aus deiner Liste der Vollständigteithalber noch eine paar weitere mit mehr als 50% zitieren:

Rybka 4 x64 - Stockfish 1.8.0 JA x64        :  40 (+  9,= 23,-  8), 56.2 % Remisquote

Rybka 4 (32b) - Stockfish 1.8 26 Remis 65% Remisquote
Rybka 4 (32b) - Critter 0.8 21 Remis 53% Remisquote
Stockfish 1.8 x64 - Spark 0.5 22 Remis
Stockfish 1.8 x64 - Critter 0.8 21 Remis
Stockfish 1.8 x64 - Ivanhoe 25 Remis
Naum 4.2 x64 - Zappa M2 23 Remis
Naum 4.2 x64 - Kommodo 1.0 24 Remis
Naum 4.2 x64 - Thinker 25 Remis
Critter 0.8 - Shredder 12 20 Remis
Shredder 12 - Kommodo 1.2 x64 20 Remis
Shredder 12 - Stockfish 1.7 24 Remis
Shredder 12 - H13.1 20.5 Remis
Kommodo 1.2 - Stockfish 1.7 24 Remis
Kommodo 1.2 - Gull 22 Remis
...
Spike 1.2 - Critter 0.7 22 Remis
Chipolino - Equinox 24 Remis
...

Sind das jetzt alles Derivate voneinander...?

Tatsächlich glaube ich das ähnlich gute Engines hohe Remisquoten produzieren (wäre ja auch komisch wenn nicht). Weil immer über den Cloneverdacht geprochen wird fallen einem diese Quoten bei Rbyka - Litto auf, tatsächlich existieren sie überall und sind nichts besonderes, auch nicht bei Rybka-Litto!

Gruß
Ingo
Parent - By Frank Quisinsky Date 2010-10-20 23:29
Ingo,

das ist richtig aber in dieser Regelmäßigkeit mit sämtlichen IPP Versionen ist das nicht die Regel.
Ich schrieb ja ...

Vermutung:
Beim Computerschach entscheiden sich die meisten Partien im späten Mittelspiel ca. gleich starker Engines, Übergang Endspiel.
Wenn in dieser Partiephase andere Programme auch Stärken haben kommt es zu hohen Remisquoten, was auch logisch ist ... denn je näher die Programme beieinander liegen desto höher die Remisquote. Schreib ferner, das genau dieser Punkt es schwierig macht weiter zu differenzieren bzw. das es fast unmöglich ist und subjektive Eindrücke bei "Nicht-Programmierern" verbleiben.

Uns ist allen bekannt welche Engines besonders stark sind.

Wird einem Programmierer der Source Code von Rybka vorgelegt und der Soruce Code von Houdini vorgelegt würde er beurteilen können welche Gemeinsamkeiten die Engines haben und was gleich ist. Das wird nie passieren, warum wohl?

Warum haben denn die Herren kein Interesse daran.

Kannst ja mal Herrn Houdert und Herrn Raylich anschreiben die Sorucen der aktuellen Versionen zu einem Herrn Hyatt zu senden.
Und warum ist das so?

Hat das wirklich etwas damit zu tun das zu viele eigenen Ideen drin sind oder eher etwas damit zu tun das bekannt wäre welche bekannten Ideen genutzt werden.

Gruß
Frank

Habe für heute auch genug
Parent - - By Ingo Bauer Date 2010-10-20 23:29
[quote="Frank Quisinsky"]
...
Rybka 4 x64                   :  40 (+  6,= 29,-  5), 51.2 % ... gegen IvanHoe T0.4
...
[/quote]

Sehe ich erst jetzt: Ausgerechnet die Litto-Engine die dich überzeugt hat die höchste Remisquote von allen gegen Rybka 4 (72.5%). Das nenne ich Realsatire!

Nicht ernst nehmen, bei 40 Spielen ist sowieso alles Zufall. Niemals aus nur 100 Spielen irgendetwas lesen wollen! Aus 40 schon gar nicht!

Gruß
Ingo
Parent - By Frank Quisinsky Date 2010-10-20 23:32
Ingo,

überzeugt hat mich die Version B52aC.
Aber die T0.4 ist die stärkste spielt ausgeglichener und dennoch viele unterschiedlichen Züge zu Rybka 4.

Im Grunde hatten alle drei IvanHoes Stärken und Schwächen.
Bestes Zeitmanagement bei der 52iUSTMO, auch gutes Mattverhalten (keine unnötigen Rechenphasen bei Matt im Suchbaum). Muss ja jemand mal etwas dran verändert haben . Die B52aC hatte sehr viele kurze Gewinnpartien, spielt aggressiv. Die Fire Versionen spielten am langweiligsten, verloren schnell deutlich mehr Partien als diese gewinnen konnten. Trotz deutlicher Quote mehr zu Gunsten der Gewinnpartien. Etc. denke meine Wahl ist OK denn für eine musste ich mich entscheiden. Kann die falsche sein aber so wichtig ist das nun wieder auch nicht.

Gruß
Frank
Parent - - By Benno Hartwig Date 2010-10-20 20:48
[quote="Ingo Bauer"]3. Leider ist wohl niemand auf die Idee gekommen sich mal ein bischen Enignestatistik anzusehen. Die erreichten +6 hatte Rybka nach 37 Spielen, oder rund einem Drittel, danach schwankte es nur noch um diesen Punkt. Nach 37 Spielen dachte ich es wird ein Schlachtfest (Siehe auch Punkt 7), aber danach passierte nichts mehr und die Prozentzahl für Houdini wurde besser und besser. Wenn ich die ersten 60 Spiele genommen hätte wäre mien Ergebniss ähnlich wie das von Jeroen Noomen, wenn ich die letzten 60 genommen hätte wäre es praktisch ein Gleichstand. Das Problem ist, das niemand weiß wie es nach 200 Spielen aussehen würde[/quote]Sofern die Engines nicht tatsächlich ihre Spielstärke ändern, musst du davon ausgehen, dass es scheißegal ist, wann welche Engine ihre Punkte gemacht hat, bei den ersten Spielen oder bei den letzten. Wenn es g:v steht, dann hat die erste Engine die Erfolgsquote g/(g+v), und von genau diesem Wert solltest du ausgehen. Alles andere wäre Spökenkiekerei.

Benno
Parent - By Ingo Bauer Date 2010-10-20 21:12
Hallo Benno,

Es ist mir auch egal.
Es ging mir mehr um die Tatsache das die ersten 60 Partien, also die ersten 30 Eröffnungen ein Ergebniss wie das von Jeroen produziert hätten, während die letzten 60Spiele/30Eröffnungen einen Gleichstand (~)ergeben. Sprich, 60 Spiele sind mit riesigen Unsicherheiten behaftet, 100 nur minimal besser.

Oder, wie ich mehrmals schrieb: Niemals aufgrund von 100 Spielen ein Engine X ist besser prognosizieren.

Gruß
Parent - - By Günther Höhne Date 2010-10-20 20:48 Edited 2010-10-20 20:50
[quote="Ingo Bauer"]

5. Ich hoffe das diejenigen die sich für die Verwandschaft dieser Engines interessieren, sich die Spiele einmal näher ansehen. Ich habe keinerlei Vergleichsmöglichkeiten über die Remisquote bei gleichstarken Enignes und dieser Zeitkontrolle, aber 60 finde ich hoch (siehe auch Punkt 7); auf der anderen Seite kann man ein beliebiges Spiel nehmen, auch die Remisen, und sich die gegenseitigen Pondertreffer oder besser Nichttreffer ansehen. Es gibt mehrere Spiel in denen sichtbar ist, das eine Engine auf dem Dameflügel agieren will, und da auch Gegenspiel erwartet, während die andere konsequent auf der anderen Seite Initiative sucht. Wenn es nach diesen Treffern gehen würde, ist der "Cloneverdacht" (besser Derivat) für mich ein ziemlich wirres Konstrukt! Kurz: Wenn man mir diese beiden Engines ohne mein Wissen über etwaige Vorwürfe vorgesetzt hätte, würde ich nie vermuten, dass sie irgendetwas geinsam haben sollen. [/quote]

Hallo Ingo,

starte mal ein Match zwischen Toga II 1.4 beta 5c und Deep Saros 0.9. Anschließend erklärst Du mir anhand der Partien, warum Deep Saros ein Derivat von Toga sein muss??
Ein paar Änderungen in der Suche (Effizienz), dazu Änderungen in der Bewertungsfunktion und schon hat Deep Saros 0.9 einen ganz eigenen Spielstil, da wirst Du mit der Auswertung von Pondertreffern wenig Glück haben.
Um beurteilen zu können, ist wesentlich mehr Wissen notwendig, insbesondere über individuelle Besonderheiten der Spielanlage.

Gruß
Günther
Parent - - By Frank Quisinsky Date 2010-10-20 20:55
Hi Günther,

aber letztendlich bleibt eine Engine eine Engine. Daran ändern auch die Parametereinstellungen wenig. Grundsätzliches Spielverhalten ist gleich. So werden trotz diverser Änderungen die IPPs oder die Rybkas immer im Übergang zum Endspiel die Punkte einfahren. Hier und da kommen andere Züge aber das Gesicht einer Engine verändert sich kaum.

So z. B. nach dem Test der 6 IPP Familie engines.
Gehe ich rein nach meinen subjektiven Eindrücken zum Spielstil würde ich die B52aC bevorzugen und gar einen anderen Spielstil (bis auf die Stärke im Übergang zum Endspiel im Vergleich zu Rybka) bescheinigen. Die von mir nun genutze T0.4 spielt zwar auch rein subjektiv anders hat aber mehr Gemeinsamkeiten mit den Rybka Engines.

Alles sehr zeitaufwendig und schwierig festzustellen und im Grunde sind die subjektiven Eindrücke viel wertvoller als die Eindrücke die über generierten Statistiken kommen. Also Spielstileigenschafften sind zwar auch über Statistiken möglich aber dafür benötigt es sehr viele von diesen Statistiken und dann liegt auch "nur" ein grobes Ergebnis vor. Verlasse mich also selbst hierbei mehr auf meine subjektiven Eindrücke und lasse mir von den Statistiken maximal helfen um Meinungen vielleicht besser dingfest zu machen.

Gruß
Frank
Parent - By Günther Höhne Date 2010-10-20 21:22
[quote="Frank Quisinsky"]
aber letztendlich bleibt eine Engine eine Engine. Daran ändern auch die Parametereinstellungen wenig. Grundsätzliches Spielverhalten ist gleich. So werden trotz diverser Änderungen die IPPs oder die Rybkas immer im Übergang zum Endspiel die Punkte einfahren. Hier und da kommen andere Züge aber das Gesicht einer Engine verändert sich kaum.
[/quote]

Hallo Frank,

den gleichen Eindruck habe ich auch, also kein Wiederspruch!

Gruß
Günther
Parent - - By Ingo Bauer Date 2010-10-20 21:24
Moin,

[quote="Günther Höhne"]
...
Ein paar Änderungen in der Suche (Effizienz), dazu Änderungen in der Bewertungsfunktion und schon hat Deep Saros 0.9 einen ganz eigenen Spielstil, da wirst Du mit der Auswertung von Pondertreffern wenig Glück haben.
Um beurteilen zu können, ist wesentlich mehr Wissen notwendig, insbesondere über individuelle Besonderheiten der Spielanlage.
...
[/quote]

Mehr Wissen ist immer gut, aber leider habe weder ich noch du das. Alles woran wir uns halten können sind Dinge die wir (ich zumindest) selber sehen können, und das sind eigentlich nur Dinge wie Pondertreffer oder das Verhalten in bestimmten Stellungen. Bei Pondertreffer und Stellungsbewertungen der fraglichen Engines sehe ich verschiedenes, du Gemeinsamkeiten - ich fürchte das wird sich auch nicht ändern. Alles andere müssen du und ich (zumindest ich) anderen Leuten glauben. Sicher ist, dass du und ich anderen Leuten glauben

Kleine Frage: Ich kenne die Engine "Samos" nicht, aber würdest du sie als "Clone" bezeichenen wenn der "Autor" sie soweit geändert hat das sie anders spielt als Toga oder ist die Bezeichnung "Derivat", also Abkömmling, nicht treffender. (Was nichts über den Status der Littos aussagt!)

Gruß
Ingo
Parent - - By Günther Höhne Date 2010-10-20 21:36
[quote="Ingo Bauer"]
Kleine Frage: Ich kenne die Engine "Samos" nicht, aber würdest du sie als "Clone" bezeichenen wenn der "Autor" sie soweit geändert hat das sie anders spielt als Toga oder ist die Bezeichnung "Derivat", also Abkömmling, nicht treffender. (Was nichts über den Status der Littos aussagt!)
[/quote]

Hallo Ingo,

das Thema hatten wir schon, Derivat ist natürlich treffender! Aber ob nun Clone oder Derivat von Rybka, beides wäre nicht legal.

Gruß
Günther
Parent - - By Ingo Bauer Date 2010-10-20 22:31
Hi

[quote="Günther Höhne"]
...Aber ob nun Clone oder Derivat von Rybka, beides wäre nicht legal.
[/quote]

Na ja, eine Kopie, ist fast überall illegal kein Zweifel. Ein Derivat, und wir sind uns einig das es wenn dann darum geht, ist schon schwieriger.

1. Es gibt, so weit ich weiß, Weltweit kein Patent auf irgeneinen speziellen Schachalgorithmus. Insofern kann es sich, sollte VR Recht haben nur um eine Copyrightverletzung handeln, was Rechtlich gleich zwei Etagen tiefer anzusiedeln ist.
2. In den meisten Ländern, auch Rußland, ist, nachdem was ich gelesen habe, das decompilieren, verstehen, nachprogrammieren von Software (ohne Patente) nicht verboten (bei uns (EU) übrigens auch noch nicht so lange). In der Praxis, ist ein Bruch dieses Verbots nur unter extrem günstigen Umständen nachzuweisen (de Fakto wohl fast nie - kennt jemand einen gerichtlich entschiedenen Fall von Nachprogrammieren ohne Patentverletzung? Ich höre und lese immer nur von 1:1 Kopien oder Patentverletzungen)

Mein derzeitiger Stand ist eher der: Wenn jemand sich an Rybka gemacht hat, hat er entweder Insiderwissen oder Rybka wurde in Teilen decompiliert und entschlüsselt/verstanden. Das Nutzen von ersterem ist ohne Verbot in einem Vertrag sogar in der EU legal, zweites zumindest in weiten Teilen (dem größeren) der Welt. Moralisch mag sich der ein oder andere, vielleicht sogar zu Recht, entrüsten, ein Großteil der Menscheit, interessanterwiese die aufstrebenden Nationen und nicht die etablierten, haben da weniger Probleme. (Und ein letztes mal, wir sprechen nicht von einem Patent, also etwas das ein Erfindungshöhe besitzt, sondern von Copyright.

Das ist so im Groben meine momentane Arbeithypothese. Da der anklagende Autor nichts zur Aufklärung beitragen will und lt. eigener Aussage nichts beweisen kann, scheint mir das obige im Moment am plausibelsten. Deswegen will ich dir wiedersprechen was die pauschale Illegalität eines Derivates betrifft.

Als letztes: Diesen Fall mit Moral zu bewerten ist eine zweischneidige Sache. Man kann in diesem Fall argumentieren, das da jemand Schweiß und vielleicht Tränen investiert hat und nun um den Lohn seiner Arbeit gebracht wird, man kann auch argumentieren, das mit diesem Copyright-/Patentrecht die entwickelte Welt versucht ihre Monopole zu sichern. Andererseits gäbe es ohne Patente womöglich keinen oder weniger Fortschritt, vielleicht aber auch mehr Fortschritt (Stichwort freie Software) und besser verteilten Reichtum ... schwere Kost die ich nicht abschließend beurteilen kann. Auf jeden Fall weiß ich nicht wessen moralischer Standpunkt ethisch besser ist.

Was ich sicher weiß ist, dass, Entrüstung hin, Recht haben her, die Ippo/Robbos nicht mehr verschwinden werden!

Gruß
Ingo
Parent - - By Günther Höhne Date 2010-10-20 22:55 Edited 2010-10-20 22:59
[quote="Ingo Bauer"]
2. In den meisten Ländern, auch Rußland, ist, nachdem was ich gelesen habe, das decompilieren, verstehen, nachprogrammieren von Software (ohne Patente) nicht verboten (bei uns (EU) übrigens auch noch nicht so lange). In der Praxis, ist ein Bruch dieses Verbots nur unter extrem günstigen Umständen nachzuweisen (de Fakto wohl fast nie - kennt jemand einen gerichtlich entschiedenen Fall von Nachprogrammieren ohne Patentverletzung? Ich höre und lese immer nur von 1:1 Kopien oder Patentverletzungen)
[/quote]

Hallo Ingo,

ob das decompilieren illegal ist, hängt von den jeweiligen Lizenzbedingungen des Programms ab, meistens wird es aber verboten. Umsonst sind die Programme ja nicht closed-source.

[quote="Ingo Bauer"]
Was ich sicher weiß ist, dass, Entrüstung hin, Recht haben her, die Ippo/Robbos nicht mehr verschwinden werden!
[/quote]

Sicher werden die Ippo's nicht verschwinden, man muss aber nicht noch andere motivieren das gleiche zu tun wie diejenigen, die Klone "produizieren".

Gruß
Günther
Up Topic Hauptforen / CSS-Forum / 100 lange Spiele zw. Deep Rybka 4 und Houdini 1.03a
1 2 Previous Next  

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill