Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Darstellung / Entwicklung beim laufenden Engine Test ...
- - By Frank Quisinsky Date 2014-01-12 09:34 Edited 2014-01-12 09:37
Hallo zusammen,

möchte ja die Darstellung von einem laufenden Test verbessern. Später auch andere Dinge in eine Ratingliste bringen als nur die pure ELO (sehr aufwendig, kommt so nach und nach).

Zunächst zu der Darstellung von einem laufenden Test ...
Was ich eingeführt habe ich die Darstellung in 100er Partien Steps.
Neu ist nun, dass die ich die Punkte aufführe um direkt besser sehen zu können, ob es gute oder schlechte Serien gab. Letztendlich bin ich der Meinung, dass hierdurch später eine Prognose gefertigt werden könnte hinsichtlich der Wahrscheinlichkeit ob das Endergebnis nach 1.000 Partien eher die Tendenz nach oben oder unten hat. Wobei das ja klar ist, dass alles immer auch abhängig von den Gegnern bzw. der Anzahl der Gegner ist.

Also, SmarThink hatte einen auf 100 Partien gesehen bisherigen Punktdurchschnitt von 26,8.
Von Partie Nummer 101-200 gab es ganz offenbar eine sehr gute Serie mit 32,5 Punkten. Alle anderen 100er Serien waren dann +-3-4 Punkte was normal ist. Aufgrund der guten Serie zwischen Partien Nummer 101-200 ging logischer Weise die ELO leicht nach unten.

Vielleicht gibt es noch andere Darstellungsideen hierzu?

Gruß
Frank

Code:
Version        : 1.05.700 Beta
Still running  : SmarThink 1.50 SSE3 x64
Performance    : 2704
Points average : 26,8 per 100 games

06.01.14 - 14.01.14, ~ 120 games per day
SmarThink 1.50 SSE3 x64 (updates each 15 minutes)
ELO history after 100, 200 ... games!

                                     ELOs  Games  Score  Draws  White Black Points ->  w/ d/ l
21. SmarThink 1.50 SSE3 x64        : 2704    700  26.8%  32.1%  14,0  09,5  23,5   -> 11/25/64
21. SmarThink 1.50 SSE3 x64        : 2709    600  27.3%  33.3%  12,5  10,5  23,0   -> 05/36/59
21. SmarThink 1.50 SSE3 x64        : 2716    500  28.2%  32.8%  15,0  13,5  28,5   -> 11/35/54
21. SmarThink 1.50 SSE3 x64        : 2716    400  28.1%  32.2%  16,5  07,5  24,0   -> 12/24/64
21. SmarThink 1.50 SSE3 x64        : 2727    300  29.5%  35.0%  15,5  13,0  28,5   -> 12/33/55
21. SmarThink 1.50 SSE3 x64        : 2732    200  30.0%  36.0%  19,5  13,0  32,5   -> 14/37/49
21. SmarThink 1.50 SSE3 x64        : 2712    100  27.5%  35.0%  15,5  12,0  27,5   -> 10/35/55

January 12th, 2014, 08:30

01. Houdini 4 STD x64 A            : 3097  20 20   985  79.5%  2861  28.2%
02. Stockfish 05.12.13 SSE42 x64   : 3066  18 18   985  76.3%  2863  36.5%
03. Komodo TCECr x64               : 3048  19 19   985  74.3%  2864  33.3%
04. Critter 1.6a x64               : 2994  17 16   985  67.5%  2867  43.2%
05. Equinox 2.02 x64               : 2979  17 17   985  65.5%  2867  41.5%
06. GullChess 2.2 x64              : 2969  17 17   985  64.1%  2868  42.1%
07. Rybka 4.1 SSE42 x64            : 2950  17 17   985  61.5%  2869  39.8%, ELOstat 1.3
08. Hannibal 1.4b x64              : 2866  17 17   985  49.0%  2873  42.2%
09. Chiron 1.5 x64                 : 2855  17 17   985  47.3%  2874  40.0%
10. Protector 1.5.0 JA x64         : 2839  17 17   985  44.9%  2874  41.9%
11. Naum 4.2 x64                   : 2832  17 17   985  43.9%  2875  41.2%
12. Jonny 6.00 Yokohama x64        : 2831  17 17   985  43.8%  2875  37.4%
13. Hiarcs 14 WCSC w32             : 2827  17 17   985  43.1%  2875  39.5%
14. Sjeng c't 2010 w32             : 2801  17 17   985  39.3%  2876  40.6%
15. Junior 13.8.04 Yokohama x64    : 2798  18 18   985  38.8%  2877  32.8%
16. Shredder 12 x64                : 2790  17 17   985  37.8%  2877  37.0%
17. Spike 1.4 Leiden w32           : 2784  17 17   985  36.9%  2877  39.1%
18. Quazar 0.4 x64                 : 2769  18 18   985  34.8%  2878  36.5%
19. Spark 1.0 x64                  : 2764  17 17   985  34.1%  2878  39.1%
20. Booot 5.2.0 x64                : 2763  18 18   985  34.0%  2878  35.9%
21. SmarThink 1.50 SSE3 x64        : 2704  22 22   700  26.8%  2879  32.1%
Parent - By Frank Quisinsky Date 2014-01-12 09:43
Hallo,

Ziel ist es also eine Prognose zu programmieren.

Bei einem Durchgang mit 1.000 Partien habe ich 10 100er Ergebnisse.
Wenn 10 Engines getestet sind, sind es 100 100er Ergebnisse.

Daraus lässt sich ein Abweichungsdurchschnitt errechnen und auf einen laufenden Test drüberstülpen.
Und je mehr Engines getestet sind, desto besser ist die Prognose die natürlich auch weiß / schwarz Abweichungen berücksichtigen sollte.

Das macht mehr Sinn als die fehlerhafte ErrBar.
Wäre zumindest mal eine Idee, denn es ist "scheiß" egal ob bei der Prognoseberechnung sich die Ergebnisse auf eine oder x andere Engines berücksichtigt werden.

Wie gesagt mit der Zielsetzung:
Mit den geringsten Mitteln beim Testen von Engines den größtmöglichen Erfolg ...

Gruß
Frank
Parent - - By Guest Date 2014-01-12 10:30
Sehr gut!!!

Es gefällt mir außerordentlich dieses hier: w/ d/ l/ für jeweils 100 spiele.

Werte dann bitte diese jeweils 100 Spiele mit elo statt aus und plotte diese Werte aus mit errorbar und dem Mittelwert der bis dahin erspielten elo Zahl.

Das wäre das Nonplusultra und du,hast dir,ein Denkmal erstellt.
Parent - - By Frank Quisinsky Date 2014-01-12 11:40 Edited 2014-01-12 11:43
Hallo,

Denkmäler habe ich schon in Serie eingesäckelt. Bin ich nicht mehr scharf drauf, weil auch viele andere Denkmäler von einem ganz anderen Kaliber gesetzt haben. Wir haben heute mehr Denkmäler als Engines in der Szene und könnten auch die Denkmäler gegeneinander antreten lassen bzw. diese plotten und den Mittelwert hieraus errechnen. Und wenn die Entwicklung so weiter geht haben wir keine Engines mehr aber dafür ganz viele Denkmäler. Ein Dank an alle die der Szene irgend etwas beisteuern und wenn es nur ein +0,23 ist egal von welcher Engine produziert. Beitrag ist Beitrag und ob großes oder kleines Denkmal, Denkmal ist Denkmal.

Also, mache ein genaues Beispiel!

100 Spiele mit ELOstat auswerten macht meines Erachtens keinen Sinn. Weil die Engine auf die geeicht wird auch nur 100 Partien hat und ein heilloses Durcheinander in Zahlen und bedeutungslosen Fakten ausgelöst wird. Interessant ist eigentlich eher auszuwerten wie die durchschnittlichen Abweichungen aus vielen Tests sind um mittels dieser Durchschnittswerte dann eine Prognose auf einen laufenden Test zu schieben.

Ausgegeben wird nicht ein unsinniges +- (unsinnig weil die Anzahl der Gegner hierbei nicht berücksichtigt wird) sondern ein auf Computerschach mittels vorhandenen Ergebnissen prognostiziertes +++, ++, + oder ---, --, -oder ein =

Also, es geht wahrscheinlich mit mehr Partien nach unten oder oben oder bleibt in etwa gleich. Das es überhaupt nach unten oder oben geht, bei diesem Beispiel mit 1.000 Partien und 20 Gegnern, sollte eh eine verhältnismäßig geringe Wahrscheinlichkeit nach sich ziehen.

Gruß
Frank
Parent - - By Guest Date 2014-01-12 11:53
Hi frank

wahrlich ich sage dir in diesem heillosen Durcheinander liegt die ganze Wahrheit.  Willst du die Erkenntnis erreichen, dann scheue nicht die Arbeit. Du willst es doch wissen, also lasse dich nicht aufhalten...
Parent - - By Frank Quisinsky Date 2014-01-12 13:28
Nee, nee so läuft der Hase nicht.
Hase braucht Gesellschaft ...
Parent - - By Frank Quisinsky Date 2014-01-12 17:03 Edited 2014-01-12 17:09
Hier mal für Houdini 4 STD x64 A

Code:
Version: 1.04
Engine : Houdini 4 STD x64 A
29.12.13 - 06.01.14, Houdini 4 STD x64 A (replaced Houdini 3 Pro x64)
ENDED: http://www.amateurschach.de/ftptrigger/houdini_4-std-x64-a.html

+50 to Houdini 3 Pro x64
02. Houdini 3 Pro x64                 3048  1.000 (+566,=346,- 88), 73.9%
01. Houdini 4 STD x64 A               3098  1.000 (+638,=293,- 69), 78.5%

                                      ELOs  Games  Score  Draws  White Black Points->  w/ d/ l
01. Houdini 4 STD x64 A               3098  1.000  78.5%  29.3%  44,0  34,5  78,5 -> 63/31/06 expected +
01. Houdini 4 STD x64 A               3098    900  78.4%  29.1%  41,5  40,5  82,0 -> 70/24/06
01. Houdini 4 STD x64 A               3093    800  78.0%  29.8%  44,0  37,0  81,0 -> 66/30/04
01. Houdini 4 STD x64 A               3088    700  77.6%  29.7%  38,0  38,5  76,5 -> 62/29/09
01. Houdini 4 STD x64 A               3089    600  77.8%  29.8%  41,0  40,0  81,0 -> 68/26/06
01. Houdini 4 STD x64 A               3082    500  77.1%  30.6%  40,0  33.0  73,0 -> 56/34/10 -5,5 ELO should go higher
01. Houdini 4 STD x64 A               3092    400  78.1%  29.8%  39,5  37,5  77,0 -> 63/28/09
01. Houdini 4 STD x64 A               3096    300  78.5%  30.3%  41,0  35,0  76,0 -> 58/36/06
01. Houdini 4 STD x64 A               3109    200  79.8%  27.5%  43,5  37,0  80,5 -> 66/29/05
01. Houdini 4 STD x64 A               3100    100  79.0%  26.0%  40,5  38,5  79,0 -> 66/26/08

expected +
with more games ELO could be a bit higher



Bedeutet das Houdini durchschnittlich 78,5 Punkte bei 100 Partien macht.
Ein kleiner Einbruch zu sehen von Partie Numm 401-500 ...
Logischer Weise solle die ELO wieder ansteigen und stieg auch an.

Aufgrund von diesem Einbruch könnte das Rating nach mehr als 1.000 Partien noch sehr leicht nach oben gehen.
Parent - - By Frank Quisinsky Date 2014-01-12 18:23 Edited 2014-01-12 18:28
Hier nun Equinox 2.02 x64

Code:
Version: 1.03
Engine : Equinox 2.02 x64
22.12.13 - 29.12.13, Equinox 2.02 x64 (replaced Equinox 2.00 x64)
ENDED: http://www.amateurschach.de/ftptrigger/equinox_202-x64.html

+01 to Equinox 2.00 x64
05. Equinox 2.00 x64                  2972  1.000 (+431,=427,-142), 64.5%
05. Equinox 2.02 x64                  2973  1.000 (+432,=422,-146), 64.3%

                                      ELOs  Games  Score  Draws  White Black Points->  w/ d/ l
05. Equinox 2.02 x64                  2973  1.000  64.3%  42.2%  34,0  27,5  61,5 -> 39/45/16 expected +
05. Equinox 2.02 x64                  2977    900  64.6%  41.9%  33,0  31,0  64,0 -> 46/36/18
05. Equinox 2.02 x64                  2977    800  64.7%  42.6%  37,5  32,0  69,5 -> 49/41/10
05. Equinox 2.02 x64                  2971    700  64.0%  42.9%  35,0  32,5  67,5 -> 48/39/13
05. Equinox 2.02 x64                  2966    600  63.4%  43.5%  37,0  31,5  68,5 -> 47/43/10
07. Equinox 2.02 x64                  2958    500  62.4%  43.6%  36,0  26,5  62,5 -> 39/47/14
07. Equinox 2.02 x64                  2958    400  62.4%  42.8%  32,0  30,5  62,5 -> 42/41/17
07. Equinox 2.02 x64                  2957    300  62.3%  43.3%  38,5  25,5  64,0 -> 43/42/15
07. Equinox 2.02 x64                  2951    200  61.5%  44.0%  37,0  28,0  65,0 -> 42/46/12
08. Equinox 2.02 x64                  2925    100  58.0%  42.0%  31,5  26,5  58,0 -> 37/42/21 -6,3 ELO should go higher

expected +
with more games ELO could be a bit higher


Auch bei diesem Spießroutenlauf ist klar was passiert ist. Der Einbruch kam direkt von Partienummer 1-100. Vielleicht ein sehr leichter Einbruch von Partie Nummer 901-1000. Könnte strittig sein, wahrscheinlich geht das Rating mit mehr Partie eher leicht nach oben als nach unten.
Insofern logisch das die ELO nach oben geht. Würde hier auch ein Plus setzen für "könnte noch leicht nach oben gehen".
Im Grunde wie bei Houdini 4 könnte man aber auch hier von einem stabilen Resultat sprechen. Es ist nicht davon auszugehen, dass sich nach diesem Verlauf irgend etwas gravierend bewegt.

Machte solche Auswertungen auch hin- und wieder bei der SWCR1. Aus Erfahrung heraus kommt es selten zu einem Einbruch von +-3 Punkten zum durchschnittlichen Endergebnis. Bei einem Naum Test, glaube Naum 4.0 w32 hatte ich mal zwei Einbrüche mit mehr als 10 Punkten hintereinander. Dann logischer Weise stieg die ELO mit mehr Partien immer weiter an.

Was aber generell auffällt ist, das durch diese Statistik direkt ins Auge fällt ob ein Rating stabil ist oder nicht. Wenn bei 10x 100 Partien Durchläufen wenig passiert ist, ist die Wahrscheinlichkeit zu gering das sich mit mehr Partien etwas ändert. Werten wir mal den nächsten Kandidaten aus.
Parent - - By Frank Quisinsky Date 2014-01-12 19:23 Edited 2014-01-12 19:32
Hier nun Komodo TCECr x64

Code:

+31 to Komodo 6 x64
03. Komodo 6 x64                      3013  1.000 (+506,=384,-110), 69.8%
03. Komodo TCECr x64                  3044  1.000 (+554,=365,- 81), 73.7%

                                      ELOs  Games  Score  Draws  White Black Points->  w/ d/ l
03. Komodo TCECr x64                  3044  1.000  73.7%  36.5%  38,5  33,0  71,5  -> 53/37/10 expected = -
03. Komodo TCECr x64                  3046    900  73.9%  36.4%  39,5  36,5  76,0  -> 56/40/04
03. Komodo TCECr x64                  3045    800  73.6%  36.0%  35,5  35,0  70,5  -> 49/43/08
03. Komodo TCECr x64                  3048    700  74.1%  35.0%  40,0  33,0  73,0  -> 54/38/08
03. Komodo TCECr x64                  3051    600  74.2%  34.5%  39,5  36,0  75,5  -> 57/37/06
03. Komodo TCECr x64                  3048    500  74.0%  34.0%  39,0  33,0  72,0  -> 52/40/08
03. Komodo TCECr x64                  3053    400  74.5%  32.5%  36,5  35,0  71,5  -> 55/33/12
01. Komodo TCECr x64                  3062    300  75.5%  32.3%  40,5  38,5  78,5  -> 64/30/06 +4,8%, ELO should go down
03. Komodo TCECr x64                  3046    200  73.8%  33.5%  38,5  34,5  73,0  -> 57/32/11
03. Komodo TCECr x64                  3053    100  74.5%  35.0%  39,0  35,5  74,5  -> 57/35/08

expected  - = with more games ELO could be a bit lesser


In Anbetracht dessen das der Wert eher über die beiden Ausfallwerte von 78,5 oder 76,0 liegen sollte das Rating leicht fallen.
Aber auch hier, wieder sehr konstant. Nicht zu sehen, dass sich irgend etwas stark verändern könnte.
Wie gesagt, eine solche Auswertung ist bedeutet interessanter als die nichts aussagende ErrBar, die von Wahrscheinlichkeitstheorien oder besser Wahrscheinlichkeitsterrorismus ausgeht, welche kaum eintrifft und ferner auch noch falsch berechnet wird.

Einen habe ich noch ... und dann wären wir schon bei 40 100er Beispielen hinsichtlich der Berechnung zu der ich mir noch die Formel aushecken muss.
Parent - - By Frank Quisinsky Date 2014-01-12 19:52 Edited 2014-01-12 19:56
Hi,

also grundlegend:

ErrBar +- bedeutet wie hoch ist die Wahrscheinlichkeit das mich der Blitz trifft.
Durchschnittliche Abweichung nach 100, 200, 300 games je nach Anzahl der Gegner bedeutet, wie hoch ist die Wahrscheinlichkeit das mich ein Regentropfen trifft.

Was bringt mir beim Betrachten einer Ratingliste mehr.
Blitz oder Regentropfen?

Und wenn wir uns für den Regentropfen entscheiden, dann merken wir schnell wie unsinnig es ist viele Partien spielen zu lassen.
So rein gefühlsmäßig nach meiner Logik.

Gruß
Frank

Hagel, Tauwetter, Schnee ... alles das muss rein
Parent - By Guest Date 2014-01-12 20:08
Ich sag doch immer wieder: zehn Partien sind genug! Schau zu und bewerte! Aber du musst Schachspielen können, sonst bringt das nix...
Parent - - By Frank Quisinsky Date 2014-01-12 21:36 Edited 2014-01-12 21:43
Nun also Stockfish 05.12.13 SSE42 x64

Code:
Version: 1.01
Engine : Stockfish 05.12.13 SSE42 x64
06.12.13 - 14.12.13, Stockfish 05.12.13 SSE42 x64 (replaced Stockfish 03.11.13 SSE42 x64)

ENDED: http://www.amateurschach.de/ftptrigger/sf_05122013-sse42-x64.html
+24 to Stockfish 03.11.13 SSE42 x64
02. Stockfish 03.11.13 SSE42 x64:     3036  1.000 (+522,=411,- 67), 72.8%
01. Stockfish 05.12.13 SSE42 x64:     3060  1.000 (+562,=384,- 54), 75.4%

                                      ELOs  Games  Score  Draws  White Black Points->  w/ d/ l
01. Stockfish 05.12.13 SSE42 x64      3060  1.000  75.4%  38.4%  41,0  35,0  76,0  -> 56/40/04 expected +
01. Stockfish 05.12.13 SSE42 x64      3059    900  75.3%  38.2%  41,0  35,5  76,5  -> 60/33/07
01. Stockfish 05.12.13 SSE42 x64      3058    800  75.2%  38.9%  37,5  38,5  76,0  -> 59/34/07
01. Stockfish 05.12.13 SSE42 x64      3057    700  75.1%  39.6%  40,5  35,5  76,0  -> 60/32/08
01. Stockfish 05.12.13 SSE42 x64      3054    600  74.9%  40.8%  37,5  32,0  69,5  -> 44/51/05 -5,9%, ELO = should go higher
01. Stockfish 05.12.13 SSE42 x64      3065    500  76.0%  38.8%  42,0  31,5  73,5  -> 52/43/05
01. Stockfish 05.12.13 SSE42 x64      3071    400  76.6%  37.8%  39,0  38,0  77,0  -> 59/36/05
01. Stockfish 05.12.13 SSE42 x64      3070    300  76.5%  38.3%  42,5  34,5  77,0  -> 60/34/06
01. Stockfish 05.12.13 SSE42 x64      3066    200  76.2%  40.5%  41,5  35,0  76,5  -> 55/43/02
01. Stockfish 05.12.13 SSE42 x64      3064    100  76.0%  38.0%  41,5  34,5  76,0  -> 57/38/05

expected +++ = with more games ELO could be a bit higher


Stockfish ist ein schönes Beispiel für klare kontinuierliche Ergebnisse. Aber auch hier gab es einen Aussetzer. Zwischen Partie 501-600 und sehr leicht auch von 401-500 ging das Rating zurück. Insofern kann davon ausgegangen werden das es noch leicht steigen wird.

Interessant bei Stockfish ist immer ein ganz besonderer Umstand?

Das Verhältnis von Gewinn / Verlustpartien als weißer steht bei 80,8% zu 19,3% und als schwarzer bei 70% zu 30%. Das war auch schon beim Stockfish Test der Version vom 03.11.2013 zu sehen. Auch bei den schnellen Gewinn / Verlustpartien unter 50 Züge auffällig. Stockfish spielt als weißer deutlich aggressiver als mit den schwarzen Steinen.

Auch wird deutlich, dass Stockfish weniger Partien verliert aber überproportional zur Spielstärke Remis spielt. Auch Remis unter 40 Züge sind im Vergleich zu Houdini der hier nur 1 hat sehr deutlich mehr. Das heißt hier liegt das Verbeserungspotential dieser Engine. Schwarz muss aggressiver gemacht werden, vielleicht mit dem Trick der Rybka EXP Settings (unterschiedliche Werte für weiß und schwarz) und Remis unter 60 Zügen muss bei mehr als 20 Figuren auf dem Brett aus dem Weg gegangen werden bzw. irgendwie abgelehnt werden.

Das könnte bei meiner Simulation bei entsprechender Gewinnerwartung Gegner ELO-Durchschnitt ca. 20-25 ELO bringen.

Genug ...
Wir haben jetzt schon 40 x 100er Ausgaben.
4 von den 40 Ausgaben weichen um mehr als 4% vom Durchschnittswert ab.
Das heißt in jeder zehnten von 100 Serien kommt es zu deutlich veränderten Spielstärkeausgaben.

Spielt jemand also 100 Partien liegt die Wahrscheinlichkeit bei 90% das Endergebnis um +-15 zu treffen.
Immer bei der Anzahl der verwendeten Gegner ... hier also 20.

Muss mir mal Gedanken zur richtigen Formel bei den Durchschnittswerten machen.
Wichtig das noch viele weitere Erkenntnisse aus den Spießroutenläufen einfließen damit die Prognose dann genauer werden kann.

Gruß
Frank

PS: Beobachtet mal den SmarThink Spießroutenlauf ... die ELO muss in den letzten Partien zurück gehen nach den bisherigen Ergebnissen. Es sei denn es kommt zu einen zweiten Aussetzer nach oben oder unten.
Parent - - By Tom Paul Date 2014-01-12 22:29
Wenn man Stockfish aus schwarzer Sicht aggressiver spielen lassen würde, dann würden sich überwiegend Niederlagen anhäufen.
Über den 10% Unterschied darf man sich nicht wundern, schließlich hat weiß den ersten Zug und dieser macht nun mal sehr viel aus.
Somit ist hier alles bestens.

Das Remis unter 60 Zügen muss bei 30!!! Figuren auf dem Brett vermieden werden!!!
Man muss einen Code schreiben, der 3-Fold Rep verbietet, wenn andere 0.00 Züge spielbar sind. Unabhängig davon wie viele Züge aus der Grundstellung heraus gespielt wurden.
Wer einen Code schreiben kann darf anfangen
Parent - By Frank Quisinsky Date 2014-01-12 22:39 Edited 2014-01-12 22:41
Hi Tom,

5-8% sind normal, aber 10%
Wie gesagt, geht auch aus der Statistik zu schnelleren Gewinnpartien hervor.
Die liegt weit weg von 5-8% als schwarzer.

Habe den Eindruck, dass Stockfish als Schwarzer passiver spielt.

Hast Recht, meinte auch ab 30 Zügen.
Ist natürlich so, dass wenn immer weniger Figuren auf dem Brett sind die Remiswahrscheinlichkeit bei ausgeglichener Stellung höher ist. Da gibt es im Grunde nichts zu vermeiden. Meine, wenn immer weniger Figuren auf dem Brett sind macht es gar Sinn Remis wegen den Endlosschleifen zu forcieren, lange bevor die Endspieldatenbanken aktiv werden. Die Frage ist dann immer ab wie vielen Figuren auf dem Brett wird Remis forciert wenn wirklich kein echter Vorteil in Sicht ist. Liegt bei wenigen Figuren nur ein kleiner Vorteil in der Stellung natürlich auf die Endspieldatenbanken und Fehler Gegner hoffen.

Müsste man sich ja erstmal in den Code einarbeiten. Wenn ich damit beginne und fertig bin ist Stockfish schon bei 3.500 ELO

Gruß
Frank
Parent - - By Hauke Lutz Date 2014-01-12 22:44
Wäre Sinnvoll wenn man sagt du vermeidest innerhalb von 60 Zügen grundsätzlich das Remis, wenn mehr als 20 Figuren auf dem Brett sind & du dadurch nicht mehr als 0,2 Bauerneinheiten in Nachteil geraten wirst.
Parent - - By Jörg Oster Date 2014-01-12 23:06
60 Züge sind vielleicht etwas viel, aber eine interessante Idee, das vom Material abhängig zu machen.
Muss ich mal antesten. 
Parent - By Hauke Lutz Date 2014-01-12 23:22
Die Frage ist, wenn man Stockfish sagt sei mit dem Tauschen etwas zurückhaltender und man zur Bedingung macht das 12 Bauern/Figuren geschlagen worden sein müssen bevor du Remis akzeptierst, ob die Zugvorgabe, seien es 30 oder mehr Züge, überhaupt erforderlich wäre.
Parent - - By Frank Quisinsky Date 2014-01-12 23:44 Edited 2014-01-12 23:46
Hallo Jörg,

ich habe schon damit begonnen mit den Tools von Norm Materialabhängige Dinge zu filtern.
Es ist unglaublich welche Möglichkeiten diese Methode darstellt und sicherlich hier und dort auch schon angewendet.

Houdart muss etwas in der Richtung gemacht haben. Wie sonst will er so gezielt Remis unter 50 Zügen aus dem Weg gehen. Damit hievt er sich gegen die schwächeren Engines im späten Mittelspiel regelrecht nach oben. Oder er hat noch einen anderen Ansatz aber eine logischeren als den sehe ich einfach nicht.

Wäre schön wenn Du das mal ausprobieren könntest.
Je mehr Figuren auf dem Brett desto mehr muss Remis verhindert werden.
Ab einer bestimmten Anzahl an Figuren vielleicht forciert werden wenn die Stellung ausgeglichen beurteilt wird. Wobei auch hier immer noch eine Zeit weitergespielt werden sollte, weil der Gegner könnte patzen. In der Regel wird gepatzt in ausgeglichenen Stellungen wenn Bauern und Schwerfiguren auf dem Brett sind. Bei Leichtfiguren und Bauern und weniger möglicher Züge wird die Patzerei geringer. Also müssten hier auch als Bewertungsmaßstab die möglichen Züge einkalkuliert sein. So rein aus dem Beobachten der Partien heraus. Das ist nicht bestimmt nicht einfach zu programmieren.

Gruß
Frank
Parent - - By Joe Boden Date 2014-01-13 00:16
gibts eine notebook empfehlung von dir frank?

i5 ssd matt lange akkulaufzeit
Parent - - By Frank Quisinsky Date 2014-01-13 06:46
Hi,

gab im Media Markt kürzlich einen Acer i7 vierte Generation mit bis zu 3GHz.
Ohne DVD (finde ich vorteilhaft) aber auch mit normaler HD (keine SSD) für ca. 800 EUR.
8GB RAM.

Das Geräte hatte ich mal ein wenig getestet.
Wird nicht so warm, bleibt leise und hat ne lange ACCU Laufzeit.

Habe in Erfahrung gebracht, dass es sehr bald für diesen Preis auch mit SSD zu haben ist.
Lenovo hat für ca. 200 EUR mehr ein nettes UltraBook.

Würde jetzt nicht kaufen, warte bis März (bessere Preise, neue Modelle).

Gruß
Frank
Parent - By Joe Boden Date 2014-01-13 07:41
Danke für den Tipp, Frank!
Parent - By Tom Paul Date 2014-01-12 23:45
Sehen wir es doch mal aus menschlicher Sicht:

Ich bin die Nummer 1.
->und damit das so bleibt versuche ich immer Remis durch 3-Fold Rep zu vermeiden,
->wenn ich andere gleichwertige Züge(+0.00) zur Verfügung habe
->aber nicht wenn ich -50.00 schlechter stehe.
->Dabei ist es mir vollkommen egal ob ich in der Eröffnung oder im Endspiel bin
->und ob 32 oder 3 Figuren(2 mit denen man Matt setzen kann) auf dem Brett sind.

->Es kann sein das z.B. die gegnerische Engine schwach ist und das Remis nicht halten kann.
->Oder es ergibt sich 30 Züge später ein Gewinn für mich, trotz vorheriger 0.00 Bewertung, da ich die Nummer 1 bin und somit eine höhere Chance auf einen Sieg habe als mein Gegner.
->Oder irgend einen Bug enthält, der sich aber nur unter bestimmten Bedingungen zeigt, wodurch Stockfish nach Regeln gewinnen würde.

->Ein Schachspieler bietet Remis, der andere lehnt es ab mit der Begründung: Wenn die Stellung Remis ist, dann können wir auch weiter spielen.
->3-Fold Rep ist quasi ein Remisangebot und da die Stellung Remis ist, darf 3-Fold Rep vermieden und die Partie weitergespielt werden. Was besonders der Engine / dem Spieler zugute kommt der weiter oben ist.

Es kann doch für die Experten nicht so schwer sein ein Stück Code zu schreiben?
Up Topic Hauptforen / CSS-Forum / Darstellung / Entwicklung beim laufenden Engine Test ...

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill