Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Fritz 12 against Stockfish 1.6.3 JA
- - By Orlando de la Vega Date 2010-03-06 20:18
Fritz 12 against Stockfish 1.6.3 JA

PlaceEngineAuthorCountryPointsSingle results
1Fritz 12Frans Morsch26.0/501100½½1000-0½1½10½½½0-101001½101-1½1½11½111-0½1½0½½0½0
2Stockfish 1.6.3 JAT. Romstad, M. Costalba, J. Kiiski24.0/500011½½0111-1½0½01½½½1-010110½010-0½0½00½000-1½0½1½½1½1



50 of 50 matches played.
Fritz 12 v/s Stockfish 1.6.3 JA (50: + 18,= 16,- 16)

Start of tournament: ......... 2010.03.05, 23:59:55
Town/ Country: .............. Dax, France
Level: ............................ Blitz (1'+1")/40 repeated
Hardware: ...................... Intel® Pentium® Dual CPU T2370
Engines: ......................... Fritz 12 / Stockfish 1.6.3 JA
Hash: ............................. 64 MB / 64 MB
GUI: ............................... Fritz 11
OS: ................................ Windows Seven
Ponder OFF ..................... OFF
Nalimov TB ..................... 3+4+5
Book: ............................. Fritz 11.ctg, stopped using after 5 moves.
Openings: ....................... 25 different openings randomly chosen by GUI, large mode.



Best regards,
Orlando
Parent - - By Werner Schüle Date 2010-03-06 20:53
[code][/code]Hm,
Stockfish kanns aber viel besser:
                        
1   Stockfish 1.6.3 x64 1CPU  +21/-10/=19 61.00%   30.5/50
2   Deep Fritz 12 1CPU      +10/-21/=19 39.00%   19.5/50

CEGT Resultat für 40/20

Gruß
Werner
Parent - By Ingo Bauer Date 2010-03-06 21:30
Hi Werner

[quote="Werner Schüle"]
                        
1   Stockfish 1.6.3 x64 1CPU  +21/-10/=19 61.00%   30.5/50
2   Deep Fritz 12 1CPU      +10/-21/=19 39.00%   19.5/50

CEGT Resultat für 40/20

[/quote]

Bei mir, was bezogen auf die Hardware und Durchschnittszeit mindestens so lang ist wie die 40/20 der CEGT (sozusagen CPU-Cycles/move), sieht es ähnlich aus:

Stockfish 1.6.3 JA        : 2831

Fritz 12 32b                  : 100 (+ 46,= 40,- 14), 66.0 %
Deep Fritz 12 32b             : 100 (+ 46,= 36,- 18), 64.0 %
Deep Fritz 12 32b 2T          : 100 (+ 31,= 43,- 26), 52.5 %


Allerdings haben wir die 64bit Version von Stockfish gestestet und nicht die 32 bit. Nichtsdestotrotz sind 50 oder 100 Spiele (Insbesondere gegen eine Engine) schlicht zu wenig um Schlüsse zu ziehen.

Gruß
Ing0
Parent - By Gerhard Sonnabend Date 2010-03-07 12:44
Für die CEGT-Blitz-Liste ebenso.

CEGT-Blitz-Liste, Auszug:
Code:

Rybka 3.0 x64 1CPU      3119  +9  -9  3940 71.7% 2958 33.9%
Stockfish 1.6 x64 1CPU  3046 +15 -15  1400 63.9% 2946 36.9%
...
Stockfish 1.6 w32 1CPU  2979 +14 -14  1600 65.0% 2872 33.0%
Fritz 12                2948  +7  -7  5398 53.7% 2923 39.8%
...


Direkter Vergleich:
Stockfish 1.6 x64 1CPU vs Fritz 12 --- 59.5-40.5

Viele Grüsse,
G.S.
Parent - - By Ulrich Harm Date 2010-03-08 13:09
Dieses Ergebnis mit einer klaren Niederlage von Stockfish 1.6.3 gegen Fritz 12
kann ich auch nicht glauben ! Bei einem Schnellschachturnier vor einiger Zeit
holte Stockfish 1.6.2 gegen Fritz 11 einen deutlichen Sieg mit einem Score von
weit über 60 % (für Stockfish) herausgespielt.
Da nun Fritz 12 auch nicht dramatisch stärker sein soll als Fritz 11, scheint mir
dieses Ergebnis eines klaren Sieges von Fritz 12 nicht erklärbar und widerspricht
auch den jeweiligen Ratings in den Ranglisten.

Aber das hat ja wohl auch schon bei anderen Kommentatoren Widerspruch
hervorgerufen, wie verschiedene Beiträge hier zeigen.

   Gruss Ulrich
_________________
Parent - - By Klaus Ritter Date 2010-03-08 15:50
Code:
Von Klaus Ritter (profil) Datum 2009-12-08 21:11

Orlandos Test schaue ich mir schon lange nicht mehr an, mir kamen schon damals einige Partien (Ergebnisse) Spanisch vor.
Ich fragte schon mal nach Download links, ohne das es eine Antwort gab.


Ich bleibe dabei ! Orlandos Test s nehme ich auch weiterhin nur als lustige unterhaltung wahr.

KR
Parent - - By Kurt Utzinger Date 2010-03-08 18:25
Hallo Klaus
Kann es nicht sein, dass ihr Orlando Unrecht tut. Wenn es stark
unterschiedliche Resultate geben kann, dann muss es an den
Testbedingungen liegen mit den durch die Engines wahllos
gewählten Eröffnungen. Hier steckt mir etwas zu wenig
Systematik dahinter. Und dass die Bedenkzeit mir nicht passt,
ist nicht Orlando anzulasten.
Mfg
Kurt
Parent - - By Benno Hartwig Date 2010-03-09 07:41
[quote="Kurt Utzinger"]Wenn es stark unterschiedliche Resultate geben kann...[/quote]...dann sollte man bedenken, dass er stets nur 50 Partien spielt.
Wenn man nur 50 Partien spielt ist unbedingt zu erwarten, dass es immer wieder Ergebnisse gibt, die einigermaßen deutlich neben den aus großen Listen bekannten Werten liegen!
Wenn solche Ausreißer nicht in genügender Häufigkeit aufträten, dann könnte z.B. an Manipulation gedacht werden.
50 Partien!
Stets und lediglich 50 Partien!!

Werfen wir 4 mal ne Münze.
Auch wenn der Erwartungswert für 'Häufigkeit Zahl' 2 ist, auch wenn 2 darüber hinaus das häufigste Einzelergebnis ist, werden wir hier sogar in der Mehrzahl der Fälle ein Ergebnis "0, 1, 3 oder 4 mal Zahl" erhalten.

Die Sammlung all seiner Ergebnisse könnte interessant sein.
Wieviele Partien mag er insgesamt in solchen 50-Partien-Begegnungen durchgeführt haben?

Benno
Parent - By Thomas Müller Date 2010-03-09 08:31
geh oben auf suche, gebe dort als schreiber "orlando" ein und du bekommst alle postings.
Allein in den letzten tagen waren es dann 4 von fritz12 a 50 partien, sind dann immerhin schon 200.
Wenn er mal eine übersicht oder komplettliste erstellen würde, könnte man mehr sehen.
So gesehen sind es eben "nur" 50 einzelne

Wenn man was finden will kann man jeden test oder rangliste schlecht reden

--
TM
Parent - - By Udo Kaiser Date 2010-03-09 09:49
wenn man eine Münze wirft gibt es entweder Kopf oder Zahl oder die Münze bleibt auf dem Rand stehen.
Parent - - By Benno Hartwig Date 2010-03-09 14:40
[quote="Udo Kaiser"]wenn man eine Münze wirft gibt es entweder Kopf oder Zahl oder die Münze bleibt auf dem Rand stehen.[/quote]...oder sie plumpst in den Gulli. Ja, der Möglichkeiten sind viele
Benno
Parent - - By Udo Kaiser Date 2010-03-09 16:33
nein. es gibt 3 möglichkeiten.
kopf oder zahl (2 seiten einer medaille)
oder die dritte, weder kopf noch zahl.

wenn sie in den gulli plumpst ist das auch möglichkeit drei weil es weder kopf noch zahl ist.

münze werfen : y = (a+b)*c   <=>  y=a*c + b*c
Parent - By Benno Hartwig Date 2010-03-09 17:30
[quote="Udo Kaiser"]nein. es gibt 3 möglichkeiten.
kopf oder zahl (2 seiten einer medaille)
oder die dritte, weder kopf noch zahl.[/quote]Das wäre reine Willkür von dir, dein persönlicher Durchführungswunsch.
Viele andere Definitionen der zu unterscheidenden Zustände nach dem Wurf wären auch möglich und weder du noch ich können hier etwas Verbindliches festlegen.
Kopf/Zahl (nicht Kopf oder Zahl wäre eine irregulärer Ablauf, der nicht in die Wertung eingeht) ist beim Münzwurf nur die bei weitem gebräuchlichste.
Aber wir entfernen uns sowohl von der Computerschach-Praxis als auch den Themen, bei denen die Stochastik den Münzwurf in idealisierter Form (mit zwei möglichen Ergebnissen) als Zufallsexperiment nutzt.
Benno
Parent - By Gerhard Sonnabend Date 2010-03-08 19:41
[quote="Ulrich Harm "]
Dieses Ergebnis mit einer klaren Niederlage von Stockfish 1.6.3 gegen Fritz 12
kann ich auch nicht glauben !
[...snip...]
[/quote]

Du bezeichnest 24-26 als klar ?

Viele Grüsse,
G.S.
Parent - - By Benno Hartwig Date 2010-03-09 08:00
[quote="Ulrich Harm "]Dieses Ergebnis mit einer klaren Niederlage von Stockfish 1.6.3 gegen Fritz 12 kann ich auch nicht glauben ![/quote]Dann bist du zu skeptisch.
Bei 50-Partien-Begegnungen wird Fritz ca. mit folgenden Wahrscheinlichkeiten mindestens 26:24 gewinnen, auch wenn Stockfish die stärkere Engine ist.

Code:
Überlegenheit Stockfish                Wahrsch 26:24 oder deutlicher für Fritz
     0,50  : 0,50                                     40%
     0,525 : 0,475                                    24%
     0,55  : 0,45                                     13%
     0,575 : 0,425                                     6%
     0,60  : 0,40                                      2%

Ein 50-Partien-Match kann auch immer mal wieder die schwächere Engine gewinnen.
Bei der Vielzahl derartiger Matches, die Orlando spielt, werden einige derartige Ergebnisse darunter sein. Gerade das ist zu erwarten.

Benno
Parent - By Ulrich Harm Date 2010-03-09 17:21
Hallo Benno,

das ist natürlich auch wieder wahr. Nehmen wir mal an, Stockfish spielt bei
grossen Partienzahlen einen Score von ca. 58-60 % gegen Fritz 12 (was ich
ungefähr so schätzen würde), dann besagt die angeführte statistische
Verteilung, dass die Wahrscheinlichkeit von 26-24 oder besser für Fritz
immer noch im Bereich von 2 - 5 % liegt !
Damit löst sich der Widerspruch natürlich leicht wieder auf und wir kommen
wieder zu dem Ergebnis, dass solche Turniere mit ca. 50 Partien eigentlich noch
keine allzu grosse Aussagekraft haben; insbesondere wenn die Spielstärke der
Engines nicht allzu weit auseinanderliegt.

     Gruss Ulrich
__________________
Up Topic Hauptforen / CSS-Forum / Fritz 12 against Stockfish 1.6.3 JA

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill