Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Stockfish 4 running for the IPON
- - By Ingo Bauer Date 2013-08-21 09:18
http://www.inwoba.de

According to the fora and the internal self test it might be a big improvement.

Have fun
Ingo
Parent - - By Stefan Schiffermüller Date 2013-08-21 09:36
[quote="Ingo Bauer"]
http://www.inwoba.de

According to the fora and the internal self test it might be a big improvement.

Have fun
Ingo
[/quote]
Hallo Ingo,

du bist hier nicht auf talkchess.com Du kannst wieder auf Deutsch umschalten.

Gruß Stefan
Parent - By Ingo Bauer Date 2013-08-21 09:50
[quote="Stefan Schiffermüller"]
[quote="Ingo Bauer"]
http://www.inwoba.de

According to the fora and the internal self test it might be a big improvement.

Have fun
Ingo
[/quote]
Hallo Ingo,

du bist hier nicht auf talkchess.com Du kannst wieder auf Deutsch umschalten.

Gruß Stefan
[/quote]

Ich mache ein Posting und verteile das X mal mit Cut and Paste. So viel Englisch muß sein, zumal dies auch ein mehrspachiges Forum ist.

Gruß
Ingo
Parent - By Benno Hartwig Date 2013-08-21 11:04
[quote="Ingo Bauer"]http://www.inwoba.de[/quote]Fein, thanx! Und immer mal wieder einen Blick wert.
Und mit 3040 ELO hat SF jetzt nach den ersten 131 Partien auch ganz nett loslgelegt.
Benno
Parent - - By Benno Hartwig Date 2013-08-21 11:55
Angenommen, jemand fertigt eine SF-Version, die gegen die besten 5 Engines zwar geringfügig schlechter abschneidet, die aber gegen die schwächeren Engines noch etwas sicherer punktet. Im Ergebnis ergäbe sich eine etwas bessere ELO-Bewertung.
Würde solch ein SF wirklich gefühlsmäßig als der 'stärkere Stockfish' angesehen werden?
Ich befürchte: Nein.
Benno
Parent - By Ingo Bauer Date 2013-08-21 12:15
[quote="Benno Hartwig"]
Angenommen, jemand fertigt eine SF-Version, die gegen die besten 5 Engines zwar geringfügig schlechter abschneidet, die aber gegen die schwächeren Engines noch etwas sicherer punktet. Im Ergebnis ergäbe sich eine etwas bessere ELO-Bewertung.
Würde solch ein SF wirklich gefühlsmäßig als der 'stärkere Stockfish' angesehen werden?
Ich befürchte: Nein.
Benno
[/quote]

Tja, eine Situation die wir so noch nicht hatten ...

Solange es nur wenige Elo sind, enscheidet für das "menschliche Gefühl" wer in der direkten Begegnung die Oberhand behält. Der CB Server kann als Bsp dafür dienen und das hat auch etwas sympatisches - eine Weltangliste entscheidet nicht unbedingt wer Weltmeister wird ...

Gruß
Ingo
Parent - - By Michael Scheidl Date 2013-08-21 13:37
Mein Bauchgefühl spricht dafür daß eine Engine welche gegen die Nummern 6...100 sehr gut punktet, elomäßig ebenso gut gegen die Nummern 1...5 punktet. Das ist eine völlig logische Erwartung, und somit gehe ich bis zum Beweis des Gegenteils davon aus.
Parent - - By Tom Paul Date 2013-08-21 13:57
Und ich gehe davon aus das eine taktisch spielende Engine gegen schwächere Gegner mehr Punkte holt als eine positionell spielende.
Schwächere Gegner, damit meine ich die Engines bei denen vor allem auf Taktik geachtet wurde und das ist bei den meisten vor allem den älteren der Fall, gegen diese hat ein Taktik Profi wie Houdini 3 deutlich bessere Chancen, weil er eben deren Bereich auf den sie spezialisiert sind besser beherrscht und somit keine Chancen lässt.
Eine positionell spielende Engine wie Komodo, Stockfish, etc. würde gegen diese Gegner zwar auch gewinnen aber weniger Punkte holen, weil ab und zu etwas taktisches übersehen werden würde.

Wenn ich als Mensch taktisch sehr stark bin und z.B. 2500 habe, dann ist es mir lieber wenn ich gegen einen taktisch schwächeren Gegner 2400 antreten muss, als gegen einen positionell spielenden Gegner mit 2400.
Parent - - By Michael Scheidl Date 2013-08-21 14:16
Alle Engines sind Taktik-Profis. - Bei Komodo gibt es eine Besonderheit: Kein kombinatorischer Stil, aber sehr große taktische Stärke wie Tests bewiesen haben. Eine Art Petrosian, quasi.
Parent - By Tom Paul Date 2013-08-21 14:21
Dann nenne ich Houdini 3 jetzt nicht Taktik Profi sondern Taktik Gott und die anderen sind eben nur Profis.
Parent - By Horst Sikorsky Date 2013-08-22 08:41
[quote="Michael Scheidl"]
Alle Engines sind Taktik-Profis. - Bei Komodo gibt es eine Besonderheit: Kein kombinatorischer Stil, aber sehr große taktische Stärke wie Tests bewiesen haben. Eine Art Petrosian, quasi.
[/quote]
Event:
Ort:
Datum:

Weiss:
Schwarz:

Ergebnis
Board

JA diese Partie auch
Parent - - By Benno Hartwig Date 2013-08-21 14:14
[quote="Michael Scheidl"]Mein Bauchgefühl spricht dafür daß eine Engine welche gegen die Nummern 6...100 sehr gut punktet, elomäßig ebenso gut gegen die Nummern 1...5 punktet. Das ist eine völlig logische Erwartung, und somit gehe ich bis zum Beweis des Gegenteils davon aus.[/quote]Das ist eine mutige These von dir.
Ist nicht genau dieses Verhalten tendentiell sogar jetzt schon zu erwarten, wenn eine sehr starke Engine durchgängig mit einem gewissen Geringschätzungsfaktor spielt? Wenn sie Remis vermeidet, auch wenn sie geringfügig im Nachteil steht. Gegen viele schwache Gegner wird sie dann noch etwas besser, und gegen vergleichsweise wenige Starke wird sie bisweilen halbe Punkte verschenken.

Und wenn ein Entwickler es darauf anlegt, wird er solche Effekte sicher auch durch die Programmlogik weiter verstärken können. Aber will er?

Jeder menschliche Schachspieler kann sich vorab über die Spielstärke seines Gegners informieren und sein Spiel, seine Risikobereitschaft, seine Remiswilligkeit entsprechend anpassen. Wäre vernünftig, Engines solch eine Information auch zukommen zu lassen, falls sie damit tatsächlich ihr Spiel tunen könnten?

Benno
Parent - By Tom Paul Date 2013-08-21 14:19
Es wäre noch besser wenn eine Engine während der Partie erkennen würde wo der Gegner Schwächen hat und versuchen würde das Spiel in diese Richtung zu lenken.
Parent - - By Michael Scheidl Date 2013-08-21 14:32
Zitat:
Ist nicht genau dieses Verhalten tendentiell sogar jetzt schon zu erwarten, wenn eine sehr starke Engine durchgängig mit einem gewissen Geringschätzungsfaktor spielt? Wenn sie Remis vermeidet, auch wenn sie geringfügig im Nachteil steht. Gegen viele schwache Gegner wird sie dann noch etwas besser, und gegen vergleichsweise wenige Starke wird sie bisweilen halbe Punkte verschenken.

Das ist die Theorie; mir ist kein Praxisbeweis bekannt. Ich neige zu der Ansicht: Den Gegner zu unterschätzen, ist durchwegs schlecht, egal ob gegen stärkere, gleich starke oder schwächere...

Zitat:
Wäre vernünftig, Engines solch eine Information auch zukommen zu lassen, falls sie damit tatsächlich ihr Spiel tunen könnten?

Sicher! Das wäre ein schönes Spaß-Feature für uns Enginefreaks. Auf einem Massenmarkt hat das allerdings keine Bedeutung, denn dort wollen Leute einfach eine möglichst perfekt abgestimmte Analyse-Engine haben.

Beispielsweise, es wird keinen 1900er-Klubspieler amüsieren, wenn eine Engine ihm eine "geniale, riskante" Fortsetzung empfiehlt, die leider nur ein 3000 Elo-Spieler in allen Verzweigungen korrekt abwickeln kann. Sowas ist zwar lustig aber unterhalb Halbgottniveau unbrauchbar.
Parent - By Benno Hartwig Date 2013-08-21 14:48
Zitat:
Das ist die Theorie; mir ist kein Praxisbeweis bekannt. Ich neige zu der Ansicht: Den Gegner zu unterschätzen, ist durchwegs schlecht, egal ob gegen stärkere, gleich starke oder schwächere...
Klar. Es wäre noch zu zeigen, dass ein gewisser 'Geringschätzungsfaktor' gegen die Engines mit z.B. mind. 100 ELO weniger tatsächlich vorteilhaft ist. Könnte schon interessant sein.
Wenn ein etwas schwächerer Gegner aber als 'etwas schwächer' eingeschätzt wird, könnte das eigentlich nicht als 'unterschätzen' bezeichnte werden, oder? 

Zitat:
Sicher! Das wäre ein schönes Spaß-Feature für uns Enginefreaks. Auf einem Massenmarkt hat das allerdings keine Bedeutung, denn dort wollen Leute einfach eine möglichst perfekt abgestimmte Analyse-Engine haben.
Das denke ich auch. Allerdings stellt sich dann die Frage, ob eine Ratingliste, die in der Hauptsache aus Spielen gegen deutlich schwächere beruht, hier der beste Auskunftgeber ist. (OK, will sie ja ggf. auch gar nicht sein, sondern eben die Vielfalt der Zusammentraffen abbilden)

Viele Grüße
Benno
Parent - - By Patrick Götz (Mod.) Date 2013-08-21 17:08
Wenn das Bundesliga wäre, wäre Stocki im Moment ganz klar mit 18 Siegen in 18 Matches auf den 1. Platz.

Stockfish4
Stockfish 4 64 - Houdini 3 STD (3071)    16.0  -  13.0    55.17%    Perf=3107
Stockfish 4 64 - Komodo CCT (3036)    15.5  -  14.5    51.67%    Perf=3047
Stockfish 4 64 - Critter 1.4a (2974)    20.5  -  10.5    66.13%    Perf=3090
Stockfish 4 64 - Deep Rybka 4.1 (2952)    20.5  -  9.5    68.33%    Perf=3085
Stockfish 4 64 - Gull 2.1 (2944)    18.5  -  11.5    61.67%    Perf=3026
Stockfish 4 64 - Chiron 1.5 (2844)    22.5  -  8.5    72.58%    Perf=3013
Stockfish 4 64 - Protector 1.5.0 (2837)    22.5  -  8.5    72.58%    Perf=3006
Stockfish 4 64 - Naum 4.2 (2832)    25.5  -  4.5    85.00%    Perf=3133
Stockfish 4 64 - Hannibal 1.3 (2820)    21.0  -  10.0    67.74%    Perf=2948
Stockfish 4 64 - HIARCS 14 WCSC 32b (2812)    22.0  -  8.0    73.33%    Perf=2987
Stockfish 4 64 - Deep Shredder 12 (2800)    23.5  -  6.5    78.33%    Perf=3023
Stockfish 4 64 - Deep Sjeng c't 2010 32b (2778)    23.5  -  5.5    81.03%    Perf=3030
Stockfish 4 64 - Spike 1.4 32b (2764)    25.0  -  4.0    86.21%    Perf=3082
Stockfish 4 64 - spark-1.0 (2756)    23.0  -  7.0    76.67%    Perf=2962
Stockfish 4 64 - Deep Junior 13.3 (2743)    24.5  -  5.5    81.67%    Perf=3002
Stockfish 4 64 - Quazar 0.4 (2726)    25.0  -  5.0    83.33%    Perf=3005
Stockfish 4 64 - Toga II 3.0 32b (2711)    26.0  -  4.0    86.67%    Perf=3036
Stockfish 4 64 - Zappa Mexico II (2704)    25.5  -  4.5    85.00%    Perf=3005
    400.5  -  140.5    74.03%    Perf=3020

541 out of 2700 games played

Parent - - By Ingo Bauer Date 2013-08-21 17:19
Interessant, Ich bin so auf Durchschnitt gegen alle fixiert das ich das nicht mal mitbekommen hätte

Aber, abgerechnet wird zum Schluß.

Gruß
Ingo
Parent - By Benno Hartwig Date 2013-08-22 05:19 Edited 2013-08-22 05:23
[quote="Ingo Bauer"]Aber, abgerechnet wird zum Schluß.[/quote]Im Moment (nach 1264 Partien) zielt SF4 mit 3019 ELO darauf, sich ganz knapp vor H1.5a (3016 ELO) zu platzieren.
Benno
Parent - - By Patrick Götz (Mod.) Date 2013-08-23 06:22

Stockfish 4 64 - Houdini 3 STD (3071)78.0-72.052.00%Perf=3084
Stockfish 4 64 - Komodo CCT (3036)72.5-77.548.33%Perf=3025
Stockfish 4 64 - Critter 1.4a (2974)81.5-68.554.33%Perf=3004
Stockfish 4 64 - Deep Rybka 4.1 (2952)89.0-61.059.33%Perf=3017
Stockfish 4 64 - Gull 2.1 (2944)91.5-58.561.00%Perf=3021
Stockfish 4 64 - Chiron 1.5 (2844)111.0-39.074.00%Perf=3025
Stockfish 4 64 - Protector 1.5.0 (2837)116.5-33.577.67%Perf=3053
Stockfish 4 64 - Naum 4.2 (2832)115.0-35.076.67%Perf=3038
Stockfish 4 64 - Hannibal 1.3 (2820)111.5-38.574.33%Perf=3004
Stockfish 4 64 - HIARCS 14 WCSC 32b (2812)113.5-36.575.67%Perf=3009
Stockfish 4 64 - Deep Shredder 12 (2800)116.0-34.077.33%Perf=3013
Stockfish 4 64 - Deep Sjeng c't 2010 32b (2778)122.5-27.581.67%Perf=3037
Stockfish 4 64 - Spike 1.4 32b (2764)125.0-25.083.33%Perf=3043
Stockfish 4 64 - spark-1.0 (2756)120.5-29.580.33%Perf=3000
Stockfish 4 64 - Deep Junior 13.3 (2743)123.0-27.082.00%Perf=3006
Stockfish 4 64 - Quazar 0.4 (2726)133.0-17.088.67%Perf=3083
Stockfish 4 64 - Toga II 3.0 32b (2711)131.5-18.587.67%Perf=3051
Stockfish 4 64 - Zappa Mexico II (2704)128.5-21.585.67%Perf=3014
1980.0-720.073.33%Perf=3014





2700 out of 2700 games played

Parent - By Benno Hartwig Date 2013-08-23 06:33
Und ich bin mal gespannt (insb. mit Blick auf H1.5a), wo SF nun landen wird in der 'IPON - BayesElo 0056 result'-Liste.
Benno
Parent - - By Rudolf Rohs Date 2013-08-23 06:34
Tja,

hat nicht gereicht für an H1.5a vorbeizukommen.
Aber im direkten Vergleich gegen alle Multicoreengines gewonnen,
auch gegen Houdini 3 STD.
Nur die Singlecoreengine Konodo CCT war stärker.

Sieht aus als ob sich statt des Königs ein Triumvirat an der Spitze etabliert.

Gruß

Rudolf
Parent - - By Benno Hartwig Date 2013-08-23 07:33
[quote="Rudolf Rohs"]hat nicht gereicht für an H1.5a vorbeizukommen.[/quote]Nun hat Ingo die Listen aktualisiert: http://www.inwoba.de/bayeselo.html
Und SF liegt in der langen Liste mit einem ELO-Pünktchen vor H1.5a.
'Purer Zufall' mag man mit Recht einwerfen wollen. Aber in diesem sportlichen Vergleich hat SF4 im Zieleinlauf diesmal eben das Näschen vorn gehabt.

Benno
Parent - - By Ingo Bauer Date 2013-08-23 07:55
Ich würde trotdem nicht von einem Triumvirat sprechen, dafür ist Houdini über alles doch noch zu weit weg.

Die 150 Spiele sind auch jeweils viel u wenig um daraus einen Schluß zu ziehen. Sollte sich das allerdings bestätigen wird es bei Playchess interessant

Die die Houdini schlagen wollen nehmen Stockfish
Die die Sockfish schlagen wollen nehmen Komodo
Die die Komodo schlagen wollen nehmen Houdini

Tatsächlich würde das mal wieder etwas Spannung dor erzeugen, insofern haffe ich das sich das bestätigt.

Gruß
Ingo
Parent - - By Benno Hartwig Date 2013-08-23 08:09 Edited 2013-08-23 08:11
[quote="Ingo Bauer"]Die die Houdini schlagen wollen nehmen Stockfish
Die die Sockfish schlagen wollen nehmen Komodo
Die die Komodo schlagen wollen nehmen Houdini[/quote]Ich bin überzeugt, bei langen Spielserien SF4<->H3 wird H3 immer noch sehr sicher einen Vorsprung wahren können.
Soweit ich es verstand, wurde SF4 doch vor allem gegen andere SFs getunt, gar nicht mal direkt gegen H3. Aber natürlich wäre ein spezielles Tuning gegen H3 auch spannnend. Der Champ wird halt gejagt. Wer im Maschinensaal erfolgreich sein will, muss vor allem gegen H3 gut können.

Falls Ingos Rechner nun schrecklich Langeweile haben sollten  , fänd ich ja auch spannend, wenn z.B. SF4 noch mal denselben Parcour durchlaufen könnte mit einem fest eingstellten Geringschätzungsfaktor, der taugt, ein Remis ein Stück weit vermeiden zu wollen.
Das Ergebnis bräuchte ja nicht in die Liste eingehen. Da würde ja ein viel zu großes Fass aufgemacht werden, wenn jetzt noch spezielle Parameter-Kombinationen eingehen sollen. Klar.
Aber ich fänd superintressant zu sehen, ob sich dies tatsächlich zählbar in einer besseren Ausbeute gegen die vielen Schwächeren und in größeren Problemen gegen Stärkere und Gleichstarke auswirkt. Und hier in der Summe zu einer etwas höheren ELO-Zahl führen würde!

Benno
Parent - By Ingo Bauer Date 2013-08-23 08:33
[quote="Benno Hartwig"]
Falls Ingos Rechner nun schrecklich Langeweile haben sollten  , fänd ich ja auch spannend, wenn z.B. SF4 noch mal denselben Parcour durchlaufen könnte mit einem fest eingstellten Geringschätzungsfaktor, der taugt, ein Remis ein Stück weit vermeiden zu wollen.
[/quote]

Langeweile ist nicht das Thema. Mein Setup verbraucht unter Vollast (hatte ich nicht mit S4) 1.5kW/h. Bei 1.5kW bekomme ich den Lauf in rund 36h durch, das sind bei 0.29EUR pro kW rund 15EUR ... Es muß mich schon sehr spannend sein bis ich das mache (oder jemand will das zahlen ... )

Gruß
Ingo

PS: Sorry, meine Tastatur hat Probleme und schluckt Buchstaben. Wenn ich nicht alles nochmal lese ist das noch schlimmer als meine normal miese Rechtschreibung.
Parent - By Rudolf Rohs Date 2013-08-23 08:58
Hallo Ingo,

Houdini ist der eindeutige Ranglistenchef und somit das Optimum, erst recht weil Houdini 4 nicht lange auf sich warten lassen sollte.

Aber für's Computer- und erst Recht für's Fernschach (wo man die eingesetzten Engine(s) des Spielpartners nicht kennt) ist die aktuelle Konstellation
prima. Drei Engines die zumindest untereinander fast auf gleichem Niveau sind.

Gruß

Rudolf

PS: Auch bei Clemens Turnier liegen die großen Drei aktuell (nach 32 Runden) insgesamt nur einen Punkt auseinander und wechseln
      sich bisher in der Führung immer wieder ab. Das bestätigt die Vermnutung bisher.
Parent - - By Michael Scheidl Date 2013-08-23 09:06
Ein sehr gutes, aber auch irgendwie komisches Ergebnis: Gewinnt 18 von 19 Matches (inkl. das gegen Fritz nehme ich an?), darunter gegen die Rang Eins-Engine, und wird trotzdem nur Dritte. Das Komodomatch war dabei sogar eine Überperformance. Es gab ein paar Unterperformances, z.B. gegen Spike, aber ich nehme an das geht jeder Engine mehr oder weniger so.

Nun könnte es gar sein daß Stockfish den Podestplatz gleich wieder knapp verliert, falls Critter ähnlich zugelegt hat - womit ich aber ehrlich gesagt nicht rechne.
Parent - - By Stefan Pohl Date 2013-08-23 09:22
[quote="Michael Scheidl"]

Nun könnte es gar sein daß Stockfish den Podestplatz gleich wieder knapp verliert, falls Critter ähnlich zugelegt hat - womit ich aber ehrlich gesagt nicht rechne.
[/quote]

Ich dachte es kommt kein neuer Critter, zumindest nicht in näherer Zukunft?!?
Zitat dazu von Martin (TCEC) auf talkchess: "Unfortunately Richard didn't manage to get a stable enough version for this second Season of nTCEC. Fingers crossed for Season 3!"

Weißt du mehr als das?
Falls ja, wäre ich für jede Info sehr verbunden, da ich meine LS-testruns ja schon ein bißchen im voraus planen muß (zumindest versuche ich es)...

Stefan
Parent - By Michael Scheidl Date 2013-08-23 09:45
Zitat:
Weißt du mehr als das?

Nein, weniger

Schade... aber danke für die Info. Hoffentlich spielt dann Version 1.6a bei TCEC mit; Critter ist voriges mal mit einigem Pech zu früh ausgeschieden.
Parent - By Ingo Bauer Date 2013-08-23 09:32
[quote="Michael Scheidl"]
Ein sehr gutes, aber auch irgendwie komisches Ergebnis
[/quote]

Finde ich nicht, so etwas sollte eigentlich der Normalfall sein. Früher zu Zeiten von Shredder/Fritz/Junior/Hiarcs (war das schön) war das gang und gäbe. Allerdings hatten wir durch Rybka und dann Houdini über Jahre eine Verzerrung. Vielleicht stellt sich jett wieder so etwas wie ein Normalzustand ein.

Davon abgesehen sollte man nicht zu viel in nur 150 Spiele hineindeuten ...

Gruß
Ingo
Parent - By Benno Hartwig Date 2013-08-23 09:48
[quote="Michael Scheidl"]Ein sehr gutes, aber auch irgendwie komisches Ergebnis: Gewinnt 18 von 19 Matches (inkl. das gegen Fritz nehme ich an?), darunter gegen die Rang Eins-Engine, und wird trotzdem nur Dritte. [/quote]Dass eine Top-Engine bei jeweils 100 Partien die schwächeren schlägt, sollte sicher erwartet werden.
Dass gegen H3 gewonnen wurde, ist eine Super-Einzelleistung. Wenn die Ergebnisse dann aber nicht zum Spitzen-ELO-Wert taugen, dann liegt das wohl daran, dass gegen die vielen Schwächeren nicht sooo überzeugend gewonnen wurde, wie dies z.B. H3 gelungen war.

Benno
Parent - - By Ingo Bauer Date 2013-08-23 07:07
Stockfish 4 run is finished and online: http://www.inwoba.de

Very remarkable!

Bye
Ingo
Parent - By Joe Boden Date 2013-08-23 07:41 Edited 2013-08-23 07:47
Ingo ich finde den Eintrag mit der aktualisierten SF4-Version in Deiner Liste nicht?
Sorry..Browsercache geleert...jetzt ist es sichtbar.
Up Topic Hauptforen / CSS-Forum / Stockfish 4 running for the IPON

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill