Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / TCEC aktuell
1 2 Previous Next  
- - By Peter Martan Date 2019-09-25 07:18 Edited 2019-09-25 07:45 Upvotes 1
Ich fang mal einen neuen Thread an, weil die alten schon etwas voll sind.

Ich lese gerade im momentanen Pausenfüller unter dem bekannten Link
https://tcec-chess.com/
, spielt "Stockfish 190826_dll_fix", könnte man den nicht statt gegen ein Sammelsurium von Chancenlosen (mal vielleicht theoretisch von komodo ohne MTCS abgesehen, LCZeroCPU?) gegen LC0 antreten lassen statt dessen, wenn im Sufi jetzt ja dann eh Allie statt LC0 steht?

Ich meine nur, interessanter wär's wohl allemal, nein?
Aber vielleicht will man ja dadurch die GPUs schonen, dass man nur CPU- nutzende Engines spielen lässt. Ein Klimaschutzbeitrag sozusagen.


Edit: und ja, natürlich wäre einfach Pause machen bis zum Sufi auch eine gute Alternative, man wird doch den "dll-fix" auch weniger aufwendig testen können, denk' ich. An der Hardware und der TCEC- Installation wird's ja wohl nicht liegen, wenn's wieder crasht, oder?
Parent - - By Michael Scheidl Date 2019-09-26 14:14 Upvotes 1
Das Sufi startet heute um 21:00 Uhr MSZ, wie üblich über 100 Partien 120m+10s mit 50 Eröffnungsvarianten von J.Noomen.

Derzeit läuft für ein paar Stunden noch ein Test 30+5 mit den beiden Finalteilnehmern, ergänzt um einen zweiten "Noobbook" Stockfish der ein großes Buch nutzt. Laut Chat unterscheiden sich auch die Geringschätzungsfaktoren, was in der Bewertungsgraphik überraschend deutlich auffällt, außer wenn beiden bei 0.00 ankommen.

Bei einer Umfrage unter https://strawpoll.com/sfedzga7 erwarten derzeit von 318 Wählern 33% 53...55 Punkte für Stockfish und 18% 55,5...57,5. Nur rund 10% rechnen mit einem Sieg von AllieStein.
Parent - - By Benno Hartwig Date 2019-09-26 14:28
Ja, die Ergebnisse aus der Premium-Liga lassen einen SF-Sieg vermuten.
Allie holte dort halt 26,0 Punkte aus 42 durchgespielten Partien. (61,9%)
SF holte 26,5 Punkte aus 40 durchgespielten Partien. (66,3%)
Seehhr wenige Partien, klar, aber die einzigen Infos, die wir mit Blick auf einen Spielstärkevergleich haben.

Vertraue ich mal darauf, dass es nicht mehr zu Crashes im Finale kommt.
Benno
Parent - - By Guenter Stertenbrink Date 2019-09-27 08:42 Edited 2019-09-27 09:25
die NNs werden mit steigender Bedenkzeit oft besser. Elomaessig.

Bei CCC war Leelenstein recht gut verglichen mit  SF
http://rybkaforum.net/cgi-bin/rybkaforum/topic_show.pl?tid=33124

und just boomt Allie

10$ auf Allie
Parent - - By Peter Martan Date 2019-09-27 09:29 Edited 2019-09-27 09:49
Stocki holt sich gerade die erste blutige Nase in der dritten Partie (round 3.1) mit Schwarz in einem Königsinder.
Parent - - By Eduard Nemeth Date 2019-09-27 09:41
Die gespielte Variante ist aus Computersicht klar besser für Weiss.
Parent - - By Peter Martan Date 2019-09-27 09:50
Ja, Eduard. Mal sehen, was SF in der Rückpartie damit anfängt.
Parent - - By Eduard Nemeth Date 2019-09-27 10:13
Ja. Weiß jemand ob man die aktuelle Allie Engine (AllieStein v0.5-dev_7b41f8c) irgendwo herunterladen kann?
Parent - By Eduard Nemeth Date 2019-09-27 13:55
Allie kann das Rückspiel ausgeglichen gestalten.
Parent - By Ingo Althöfer Date 2019-09-27 11:53
Partie 4 ist eine offene Saalschlacht. Bei Zug 22. Sb1 sieht
es so aus, als ob beide gewinnen könnten.

Ingo Althöfer.
Parent - - By Ingo Althöfer Date 2019-09-27 09:43 Edited 2019-09-27 09:50
Die Partie ist ein Hammer. 17. exf5 gxf5 18. f4 gefallen mir
sehr für Weiß. Und bei Zugpaar 57 sehe ich nicht wirklich, woher
die hohen Bewertungen (aus Sicht von beiden Programmen) kommen.

Ingo Althöfer.
Parent - - By Peter Martan Date 2019-09-27 09:49
Ingo Althöfer schrieb:

PS. Es ist Partie 3, nicht Partie 5.

Natürlich, danke.
Hab's noch editieren können.
Parent - - By Ingo Althöfer Date 2019-09-27 09:50 Edited 2019-09-27 09:59
Peter Martan schrieb:

Ingo Althöfer schrieb:

PS....

Natürlich, danke.
Hab's noch editieren können.


Danke, habs auch noch editieren können 
Parent - - By Peter Martan Date 2019-09-27 09:52
Ingo Althöfer schrieb:

Peter Martan schrieb:

Ingo Althöfer schrieb:

PS. Es ist Partie 3, nicht Partie 5.

Natürlich, danke.
Hab's noch editieren können.


Danke, habs auch noch editieren können 

https://www.youtube.com/watch?v=wCk4nrQ1yaQ
Parent - By Ingo Althöfer Date 2019-09-27 10:00
Peter Martan schrieb:

Ingo Althöfer schrieb:

Peter Martan schrieb:

Ingo Althöfer schrieb:

...

Natürlich, danke.
Hab's noch editieren können.


Danke, habs auch noch editieren können 

<a class='ura' href='https://www.youtube.com/watch?v=wCk4nrQ1yaQ'>https://www.youtube.com/watch?v=wCk4nrQ1yaQ</a>


Danke, habs auch noch mal editieren können,
Ingo.
Parent - - By Stefan Pohl Date 2019-09-27 09:49 Edited 2019-09-27 09:53
Guenter Stertenbrink schrieb:

die NNs werden mit steigender Bedenkzeit oft besser. Elomaessig.



Das ist eine reine Behauptung. Es gibt keine statistische verläßliche Untersuchung, die das unterstützt, soweit mir bekannt.
Das einzig statistisch wenigstens halbwegs sichere Experiment zu dieser Frage stammt von mir und zeigt, daß das nicht stimmt:

Von meiner Website https://www.sp-cc.de/lc0-testing.htm

I always believed, that it is better to play more games with faster time-controls, than playing less games with longer time-controls. Because a higher number of games makes the errorbar smaller and the results more valid. But Lc0 is running much slower, than the classical AB-Engines (like Stockfish) - will that lead to distorted results, when lc0 has to play with a very short thinking-time? To answer that question, we can compare the two testruns of lc0 with Net T40.T8.610:
I did a testrun with 50''+500ms (my new testsetting) (short) and with 150''+1500ms (my old testsetting) (long). I did a ORDO-calculation of both in one ratinglist. Here the result: (you can see, that Lc0 does not benefit from the 3x longer thinking-time)

Code:

    Program                      Elo    +    -   Games   Score   Av.Op.  Draws

   1 BrainFish-2 190531 bmi2    : 3577    9    9  5000    79.7 %   3328   38.1 %
   2 Stockfish 190622 bmi2      : 3531    7    7  5500    73.6 %   3343   43.1 %
   3 Stockfish 190504 bmi2      : 3527    8    8  5100    74.7 %   3329   44.1 %
   4 Stockfish 10 181129        : 3508    6    6 12000    77.2 %   3284   39.5 %
   5 Lc0 0.21.2 T40.T8.610      : 3490    9    9  3000    66.1 %   3365   46.0 % (short)
   6 Lc0 0.21.1 T40.T8.610      : 3486   20   20   700    68.6 %   3337   49.9 % (long)
   7 Stockfish 9 180201         : 3461    8    8  5000    74.9 %   3258   41.7 %
   8 Houdini 6 pext             : 3431    4    4 18600    61.8 %   3337   49.5 %
   9 Komodo 13.01 bmi2          : 3402    6    6  9500    52.3 %   3386   52.3 %
  10 Komodo 12.3 bmi2           : 3395    6    6  9100    59.4 %   3323   50.3 %
  11 Komodo 13.01 MCTS          : 3298    7    7  6000    42.2 %   3358   54.4 %
  12 Fire 7.1 popc              : 3281    4    4 18600    42.3 %   3345   50.3 %
  13 Xiphos 0.5.3 bmi2          : 3272    5    5 12600    34.1 %   3399   48.3 %
  14 Ethereal 11.53 pext        : 3270    7    7  5500    34.6 %   3389   50.0 %
  15 Komodo 12.3 MCTS           : 3261    6    6  8000    43.7 %   3312   47.1 %
  16 Ethereal 11.25 pext        : 3253    5    5 12100    33.0 %   3391   46.2 %
  17 Laser 1.7 bmi2             : 3202    7    7  6100    30.5 %   3357   45.5 %
Parent - - By Guenter Stertenbrink Date 2019-09-27 10:04 Edited 2019-09-27 10:18
es gibt Tests von -ich glaube mtgostark- ist auf einer google-tables seite glaub ich

D.Krabbe ebenfalls, bin nicht sicher

bei mir mit Lc0-CPU auf Tablets ist es ganz krass

CCEG auch Pohl auch, siehe Posts von Battig hier

cscuile :  https://docs.google.com/spreadsheets/d/1ZAIuHR6n-5JTxKQc0XUSx1jy1cj8DNLKA7-urBw/edit#gid=1057148787

war da nicht sogar ein chart im A0-paper ?

btw. Leelenstein scheint das CCCC10 Finale gegen Stockfish gewonnen zu haben,
kennt jemand das Ergebnis ?  (laut Lc0-Forum)
Parent - - By Wolfgang Battig Date 2019-09-27 11:38 Edited 2019-09-27 11:42 Upvotes 2
Guenter Stertenbrink schrieb:

es gibt Tests von -ich glaube mtgostark- ist auf einer google-tables seite glaub ich

D.Krabbe ebenfalls, bin nicht sicher

bei mir mit Lc0-CPU auf Tablets ist es ganz krass

CCEG auch Pohl auch, siehe Posts von Battig hier

cscuile :  <a class='ura' href='https://docs.google.com/spreadsheets/d/1ZAIuHR6n-5JTxKQc0XUSx1jy1cj8DNLKA7-urBw/edit#gid=1057148787'>https://docs.google.com/spreadsheets/d/1ZAIuHR6n-5JTxKQc0XUSx1jy1cj8DNLKA7-urBw/edit#gid=1057148787</a>

war da nicht sogar ein chart im A0-paper ?

btw. Leelenstein scheint das CCCC10 Finale gegen Stockfish gewonnen zu haben,
kennt jemand das Ergebnis ?  (laut Lc0-Forum)


Ganz ehrlich Günter, dieses unzusammenhängede Geschreibsel geht mir manchmal echt auf den S..k (sorry). Vor allem wenn mein Name in deiner drolligen Aneinanderreihung von Buchstaben (sprich: Buchstabensalat) vorkommt.  :->

Und was kommt raus, als "Beweis" oder wenigstens "Anhaltspunkt" für die Behauptung von "besser mit mehr Bedenkzeit"?

NIX: "ich glaube", "glaub ich", "bin nicht sicher", "war da nicht sogar was...?", "scheint..."

Und: "CCEG auch Pohl auch, siehe Posts von Battig hier"
Hä?
Wer ist CCEG (evtl. CEGT??!!) und was haben wir (so wir denn gemeint waren) zum Thema beigetragen? In unserer Rangliste mit wirklich langer Bedenkzeit taucht bislang übrigens keine NN-Engine auf.

Und "Posts von Battig hier" solltest du - ganz abgesehen vom Stil - dringend mal konkretisieren. Ich kann mich nicht erinnern, in letzter Zeit dazu etwas geschrieben zu haben, was aber auch an meinem löchrigen Gedächtnis liegen mag. Lasse mich daher gern eines besseren belehren.

Also: Erleuchte mich!

Nix für ungut, aber das musste mal raus! :->
Parent - - By Guenter Stertenbrink Date 2019-09-27 12:17
ahh, muss ich's erst zusammensuchen ...
ich dachte, das war klar , es zieht sich doch schon fast wie ein roter Faden durch deine Posts :

W.Battig 2019/07/12
- es stehen noch Matches gegen etwas „schwächere“ Engines an.
Da wird das Rating vermutlich (!) noch etwas fallen.
Allerdings ist diese Schwäche von LC0 nicht mehr so stark ausgeprägt.
LC0 punktet mittlerweile gleichmäßiger. Die Differenz zwischen bester und
schwächster Performance liegt für 0.21.2/NW42668 aktuell bei knapp
70 Punkten, bei 0.20.2/NW32930 waren es ca. 140.

W.Battig 2019/04/10
Im direkten Duell ist LC0 normalerweise mittlerweile auf Augenhöhe, aber eben nur da.
In unserem 5'+3"-Test mit Ponder hat LC0 (32930, das Network vom letzten TCEC-Finale)
das Match gegen SF10 mit 53,5:46,5 gewonnen, also ca. +24 ELO. Nach 1300 Partien
gegen insgesamt 13 Gegner liegt Leela aber 25 Punkte zurück
In unserer Rangliste mit 40 Züge / 3 Minuten ähnlich. Hier ging das Match gegen
SF 10 knapp verloren (- 25 Punkte), der Abstand in der Liste beträgt aber 44 Punkte (1800 Partien).
Oder gegen eine Stockfish-Development Version (vom 20.3.): direktes Match +7 ELO,
Abstand vermutlich aber um die 60-70 ELO, da die Stockfish-Dev. ca. 25-30 Punkte stärker
sein dürfte als SF10. Schreibe bewusst "dürfte" und "vermutlich", weil die Rangliste erst am
Freitag aktuell sein wird.

-------------------
ich editiere die posts oefters, wenn mir noch was einfaellt
Parent - - By Stefan Pohl Date 2019-09-27 12:37 Edited 2019-09-27 12:39
Beide zitierten Postings haben gar nichts mit der These, daß lc0 mit mehr Bedenkzeit überproportional mehr Elo zulegt als AB-Engines, zu tun. Sondern es geht um die Frage, ob lc0 gegen schwächere Gegner schwächer performt, als gegen starke wie Stockfish. Und das ist ja auch so. Hat aber eben gar nichts mit dem Thema zu tun, daß du hier zuerst aufgeworfen hast.
Parent - - By Guenter Stertenbrink Date 2019-09-27 13:06
hoehere Spielstaerke , bessere Hardware , hoehere Bedenkzeit sind doch sehr
gut proportional
Parent - By Stefan Pohl Date 2019-09-27 13:16
Offensichtlich verstehst du nicht, worum es geht.
Parent - - By Wolfgang Battig Date 2019-09-27 13:33
Diese Postings hatte ich auch gefunden (suchte zwischenzeitlich in der Foren-Suche) und erinnere mich sogar noch, wenigstens in Teilen, daran.

Wie Stefan dankenswerterweise schon schrieb, hat das mit der Thematik bzw. eher BEHAUPTUNG, dass LCZero bzw. andere NNs angeblich (!!!) mit höherer Bedenkzeit vergleichsweise besser sind, nix, aber auch gar nix zu tun!! 

Und das mit einem lapidaren "hoehere Spielstaerke , bessere Hardware , hoehere Bedenkzeit sind doch sehr gut proportional" sozusagen "beweisen" oder als Tatsache hinstellen zu wollen ist schlicht Unfug.

Ich will nicht grundsätzlich ausschließen, dass es so sein könnte, aber eine entsprechende Testreihe mit verschiedenen Bedenkzeiten, relevanter (!!) Partien~ und (!) Gegnerzahl sowie ansonsten exakt gleichen Bedingungen ist extrem aufwändig, dass ich mir und v.a. meiner Stromrechnung das nicht antun möchte...

Du darfst natürlich gerne. Aber bitte nicht mit CPU auf Tablets, sondern wenn schon, dann auch "richtig"

Für mich hier
EoD
Parent - - By Guenter Stertenbrink Date 2019-09-27 14:27
nicht noetig. Ist laengst geschehen. Vor Jahren. Die Daten sind vorhanden.
CCRL. Du kannst es mit CEGT-Daten nachvollziehen, wenn du willst.
Man sieht es an den Elos einer engine mit 1,2,4 Kernen.
Hier ist durch die Bank ein etwa 40-Elo Zuwachs bei Kern-Verdopplung
zu sehen. Da muesste ich hier mal ein .GIF gepostet haben.
Eine kleine Ausnahme mag Komodo sein : etwa 5 Elo mehr als
bei Stockfish bei Kernverdopplung (ca.2015)
Auch Stefan Pohl, Walter Eigenmann haben hier Statistiken gepostet,
die zeigen, wie gut die Elo-Ranglisten -selbst ERET- uebereinstimmen,
unabhaengig von der Bedenkzeit.
Parent - - By Peter Weise Date 2019-09-28 09:51
Die CEGT bietet für die Blitzliste 40/4 immer eine sehr schöne Aufstellung bezüglich Kernverdoppelung:
http://www.cegt.net/40_4_Ratinglist/Top2und4CPU/top2und4cpu.htm
Für die 40/20 Liste konnte ich keine derartige Aufstellung finden bisher. Es sieht dabei gar nicht nach durchschnittlich + 40 aus, sondern alles ist eher unregelmäßig. Neuerdings werden sogar 8-CPU-Programme aufgeführt (ganz unten).
Parent - - By Peter Weise Date 2019-09-28 10:18
Exemplarisch die ersten 3 der CEGT 40/4:

Programm   Version   ELO-1-CPU (Partien) ELO-2-CPU (Partien) Diff. ELO-4-CPU (Partien) Diff. ELO-8-CPU (Partien) Diff.
----------------------------------------------------------------------------------------------------------------------
Stockfish    10        3453     (4400)     3522     (3100)   +69     3549     (2400)   +27     3561     ( 520)   +12
Houdini       6        3374     (9400)     3429     (5000)   +55     3466     (2300)   +37     3502     ( 540)   +36
Komodo       12.2.1    3348     (2100)     3422     (1750)   +74     3448     (1100)   +26     nichts gefunden


Bei aller gebotener Vorsicht scheint es so zu sein daß bei 8 vs 16 CPU fast gar keine Steigerung mehr zu erwarten wäre. In jedem Falle niemals +40!
Parent - - By Benno Hartwig Date 2019-09-28 12:33 Edited 2019-09-28 12:36 Upvotes 1

> Bei aller gebotener Vorsicht scheint es so zu sein daß bei 8 vs 16 CPU fast gar keine Steigerung mehr zu erwarten wäre.


Mich würde auch interessieren, ob die 44 TCEC-Kerne tatsächlich und messbar eine größere Spielstärke produzieren als beispielweise 22 Kerne es täten.
Für selbstverständlich halte ich das nicht.
Aber zugegeben: 44 Kerne klingt geil.
Und: Ich finde vollkommen richtig, dass man diese Power anbietet. Und ein Entwickler, dem gelingt dies besonders gut auszunutzen, der soll sehr gern Motivation und Erfolg haben.
Benno
Parent - By Peter Weise Date 2019-09-30 11:00
So gehts mir auch. Deshalb bin ich als ehemaliger "CCRL-Jünger" überrascht gewesen wie viele Daten die CEGT diesbezüglich bereit hält! Das geht weit über das übliche Maß hinaus und verdient große Anerkennung.
Parent - - By Guenter Stertenbrink Date 2019-09-28 12:18
danke, die Liste kannte ich nicht. So ab 3200,3400 wird es etwas weniger,
das mag an der hohen Remisquote liegen.

Hier mein chart aus 2016:
http://magictour.free.fr/CCRL16J.GIF

In 3 threads hier gepostet
http://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=111074
http://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=105824
http://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=105415

Vielleicht mach ich dasselbe mal mit den aktuellen CEGT-Listen ...
Parent - - By Benno Hartwig Date 2019-09-30 13:42

> http://magictour.free.fr/CCRL16J.GIF


Thanx!
Was beschreibt dieses Bild:
Wieviel Elo verschiedene Engines mit verschiedenen 1CPU-Spielstärken hinzugewinnen, wenn man ihnen stattdessen 4 CPU gibt?
Parent - By Guenter Stertenbrink Date 2019-09-30 18:40
ja.
hier das Bild fuer CEGT : http://magictour.free.fr/CEGT19-9.GIF

noch sieht man hier nicht, dass die Differenzen mit steigender Elo abnehmen
Parent - - By Stefan Pohl Date 2019-09-27 12:41
Guenter Stertenbrink schrieb:


bei mir mit Lc0-CPU auf Tablets ist es ganz krass



Na, dann mach doch mal einige hundert Partien mit kurzer und langer Bedenkzeit gegen jeweils wenigstens 3 Gegner und poste die Resultate. Bin gespannt. Auch, wenn nicht klar ist, daß Lc0 im Schneckentempo (CPU auf Tablet) sich diesbzgl so verhält, wie auf einer RTX-GPU wie heutzutage üblicherweise benutzt wird. Dennoch wäre es interessant.
Parent - By Guenter Stertenbrink Date 2019-09-27 12:57 Edited 2019-09-27 13:00
hab ich afair bereits gepostet. Damals im Lc0-Android thread oder so.
Auch im MZ-Forum, glaub' ich.
Ich hatte hier auch immer einen Zettel rumliegen mit den Resultaten

Lc0 gewinnt 50 Elo pro Bedenkzeitverdopplung, afair

vielleicht finde noch einen Link oder Zettel ...

-------------------------------

- -/- Von Guenter Stertenbrink Datum 2019-07-31 11:57 Editiert 2019-07-31 12:38
Lc0-48x5 mit 8 Kernen (4xA53+4xA72) auf dem mediapad M3 hatte Elo

2440 bei 10+0 sec.
2518 bei 30+0
2552 bei 30+1
2574 bei 60+1
2661 bei 120+2
2726 bei 300+5
2868 bei 600+10
(2948) bei 1800+30

jeweils ca. 80 Partien gegen etwa gleichstarke Gegner
bei 1800+30 etwa so stark wie Demolito(8 Kerne) oder Hakkapeliitta(1Kern)

dann dauerte mir das zu lange, ich weiss also nicht wielange das noch so weitergeht ...
Parent - By Stefan Pohl Date 2019-09-26 17:20 Edited 2019-09-26 17:36
Michael Scheidl schrieb:

Das Sufi startet heute um 21:00 Uhr MSZ, wie üblich über 100 Partien 120m+10s mit 50 Eröffnungsvarianten von J.Noomen.

Derzeit läuft für ein paar Stunden noch ein Test 30+5 mit den beiden Finalteilnehmern, ergänzt um einen zweiten "Noobbook" Stockfish der ein großes Buch nutzt. Laut Chat unterscheiden sich auch die Geringschätzungsfaktoren, was in der Bewertungsgraphik überraschend deutlich auffällt, außer wenn beiden bei 0.00 ankommen.



Allie spielt hier mit einer neuen dev-Version, die laut der github-Seite allerdings nur zwei Änderungen des Time-Managements beinhaltet:
Don't take long time deciding between two moves with equal visits and equal scores.
Don't take an inordinate amount of time on the last move of a game for no good reason.

Man darf wohl davon ausgehen, daß diese neue dev-Version auch im Superfinal spielen wird.

Und das mit n11, was wohl Leelenstein Netz 11 heißen soll. Inwieweit das besser spielt als Netz 10.x, ist natürlich nicht klar.
Auf der patreon-Seite des Machers kann man (als nicht zahlenderGast) zum Thema Leelenstein 11 nur das lesen:
" I'm starting from the average of 10.0 and 10.1 (which was supposed to be 10.2 but actually ended up weaker than either one). I think it only need a little fine tuning so it should be a good starting place for next experiment. Having the policy smoothing on one of the data sources, and adding more data that has been 7 man rescored. Same cycle length and LR range as last time."

Auch das klingt nicht nach umwälzenden Spielstärkesteigerungen...

Aufgrund des bescheidenen Abschneidens von Allie 0.5dev mit LS 10.2 in meinem 3000 Partien Testrun und der im Superfinal zumindest nicht komplett lächerlich geringen Zahl der Partien, lehne ich mich mal aus dem Fenster und sage einen Sieg von Stockfish voraus - sofern Stockfish crashfrei bleibt, versteht sich.

Denn in dem direkten 500-Partien head-to-head von Allie gegen Stockfish (Version vom 22.6.2019) ging es in meinem Allie-Testrun so aus:

Stockfish 190622 bmi2  - Allie 0.5dev LS 10.2     : 500 (+132,=300,- 68), 56.4 %

Also klarer Sieg für Stockfish. Auch, wenn wir annehmen, daß Allie nun mit LS 11 besser spielt, so ist ja auch die neueste Stockfish-Dev besser geworden, als die hier getestete Version von Ende Juni, nämlich ca. +20 Elo in meinen Tests. Insofern halte ich ein 55%-45% Ergebnis für Stockfish im kommenden Superfinal für realistisch.

Bin auf jeden Fall gespannt! Bei nur 100 Partien kann viel passieren. Mal abwarten, welche merkwürdigen Eröffnungen J.Noomen dieses Mal ausgegraben hat.

Wer TCEC-Superfinal Feeling daheim haben will, dem lege ich nochmal den Download der von mir editierten J.Noomen Eröffnungen ans Herz:

https://www.sp-cc.de/files/jn_openings.zip

Dort gibt es eine editierte Sammlung aller TCEC Superfinal Eröffnungen von J.Noomen, ohne Doubletten, ohne extrem kurze Vorgabe und alle Endstellungen mit Komodo gecheckt, auf nicht zu starken Anfangsvorteil für eine Farbe:

1) deleted all lines 4 plies or shorter
2) deleted all lines with non-unique endpositions
3) checked all endpositions with Komodo 13.02: 10'/move, Quadcore,
eval-interval [-0.50;+0.60]

237 out of 350 lines remaining. All endpositions are unique and not too bad for white or black.

Viel Spaß!

Die neuen Eröffnungen des 16. Superfinals werde ich, wenn sie erst mal öffentlich sind, zeitnah ergänzen.
Parent - - By Stefan Pohl Date 2019-09-27 13:26 Edited 2019-09-27 13:38 Upvotes 1
So, ich hab mich nun doch mal dazu durchgerungen, auf patreon 3$+Steuern pro Monat an josh abzudrücken, wodurch ich mir nun das Leelenstein 11 NeuralNetz herunterladen konnte, welches gerade im Superfinal spielt. Habe nun einen neuen Testrun mit Allie 0.5dev gestartet. Mit LS11 und den Settings aus dem Superfinal: Dort je 7168 MB für Hash und TreeSize. Das habe ich auf je 256MB eingedampft, weil ich soviel Speicher nicht habe und bei mir ja die Spielgeschwindigkeit viel höher ist (50''+500ms, durchschnittliche Spieldauer 3 Minuten, also ca. ein Hundertstel dessen, wie lange eine Partie im Superfinal dauert, zudem ist dort die Hardware natürlich auch noch erheblich schneller (Allie hat dort etwas das 8fache an Knoten, wie bei mir). Insofern hat Allie proportional gerechnet sogar fast 3x mehr Speicher für Hash und TreeSize als im Superfinal.)
Einziger Parameter, der sonst noch im Superfinal bei Allie 0.5dev gesetzt ist, ist MaxBatchSize=160. Das habe ich auch so übernommen.
In gut 6 Tagen sollte das Egebnis vorliegen. Bin gespannt, ob es signifikant besser ausfällt, als Allie 0.5dev mit LS 10.2 und default-Parameteren (außer UseFP16=true, versteht sich ja)

(Die UCI-Parametersettings der spielenden Engines sind auf der neu designten TCEC-Site einzusehen, wenn man mit dem Mauszeiger auf den kleinen Köning (weiß oder schwarz) oberhalb der Engine-Logos und Enginenamen der gerade spielenden Engines fährt (nicht draufklicken!). Muß man auch erst mal drauf kommen...)
Parent - By Stefan Pohl Date 2019-09-28 12:59
Stefan Pohl schrieb:

So, ich hab mich nun doch mal dazu durchgerungen, auf patreon 3$+Steuern pro Monat an josh abzudrücken, wodurch ich mir nun das Leelenstein 11 NeuralNetz herunterladen konnte, welches gerade im Superfinal spielt. Habe nun einen neuen Testrun mit Allie 0.5dev gestartet. Mit LS11 und den Settings aus dem Superfinal: Dort je 7168 MB für Hash und TreeSize. Das habe ich auf je 256MB eingedampft, weil ich soviel Speicher nicht habe und bei mir ja die Spielgeschwindigkeit viel höher ist (50''+500ms, durchschnittliche Spieldauer 3 Minuten, also ca. ein Hundertstel dessen, wie lange eine Partie im Superfinal dauert, zudem ist dort die Hardware natürlich auch noch erheblich schneller (Allie hat dort etwas das 8fache an Knoten, wie bei mir). Insofern hat Allie proportional gerechnet sogar fast 3x mehr Speicher für Hash und TreeSize als im Superfinal.)
Einziger Parameter, der sonst noch im Superfinal bei Allie 0.5dev gesetzt ist, ist MaxBatchSize=160. Das habe ich auch so übernommen.
In gut 6 Tagen sollte das Egebnis vorliegen. Bin gespannt, ob es signifikant besser ausfällt, als Allie 0.5dev mit LS 10.2 und default-Parameteren (außer UseFP16=true, versteht sich ja)


Nach knapp 500 Partien kann mal ja schon mal ein kleines frühes Zwischenfazit ziehen:
Erfolgsscore von Allie 0.5dev mit Leelenstein 11 Netz und TCEC-Setting momentan bei 62.7%
Allie 0.5dev (default-Settings) und (schwächeres) Leelenstein 10.2 Netz hatte als Endergebnis (3000 Partien gegen die identischen Gegner) 59.3% Erfolgsscore.

Also momentan ca. +25 Elo für die "Superfinal-Allie". Es scheint zwar eine Steigerung zu geben, aber diese ist - wie ich erwartet hatte - nur geringfügig und an Lc0 0.22.0 Mit T40B.4-160 Netz wird Allie keinesfalls heranreichen.
Parent - - By Ingo Althöfer Date 2019-10-07 08:47
In Partie 64 hat Stockfish Allie im frühen Mittelspiel mit einem
Läuferopfer überrascht und dann sehenswert überspielt.

Neuer Stand: 11-3 für Stockfish.

Beeindruckt und entsetzt gleichzeitig,
Ingo Althöfer.
Parent - By Peter Martan Date 2019-10-07 15:50 Upvotes 1
Ich habe vollends das Interesse verloren, als Stefan (Pohl) schrieb, Allie sei auch noch gehandicapt.

Nicht, dass das alles nicht sowieso reiner Zufall wäre bei diesen Spielstärkeverhältnissen auf dieser Hardware, fällt aber dann doch einfach noch das letzte bisschen Spannung weg, wenn man (sich) dann im Nachhinein sagen wird, ja, war eh nicht LC0 und jetzt dann noch, ja, war ja nicht einmal volle Kraft Allie.
So viel Hardware- Zeit und Strom wieder nur für den Schornstein.
- - By Michael Scheidl Date 2019-09-27 16:01

In bedrängter Lage am schwarzen Königsflügel entkorkte Stockfish 17...Txb2!! Kleiner Schönheitsfehler: 17...Lxa3!! hätte auch funktioniert.

[Event "TCEC Season 16 - Superfinal"]
[Site "TCEC"]
[Date "2019.09.27"]
[Round "5"]
[White "AllieStein v0.5-dev_7b41f8c-n1"]
[Black "Stockfish 19092522"]
[Result "1/2-1/2"]
[ECO "B48"]
[Annotator "User,N."]
[SetUp "1"]
[FEN "1rbr2k1/3nbppp/p1p1p1P1/q2p3P/4PP2/P1N2Q2/1PP2B2/2KR1B1R b - - 0 17"]
[PlyCount "31"]
[EventDate "2019.??.??"]

17... Rxb2 $3 (17... Bxa3 $3 18. bxa3 Qxa3+ 19. Kd2 Ne5 $1 20. Qg3 Nf3+) 18.
Kxb2 Qxa3+ 19. Kb1 Qb4+ 20. Ka2 Qa3+ 21. Kb1 Qb4+ 22. Kc1 Qa3+ 23. Kd2 Ne5 24.
gxf7+ Kf8 25. Qg3 Nf3+ 26. Ke2 Qxc3 27. e5 Qc4+ 28. Kxf3 Qe4+ 29. Kg4 Qf5+ (
29... Qxh1 $2 30. Re1) 30. Kf3 Qe4+ 31. Kg4 Qf5+ 32. Kf3 Qe4+ 1/2-1/2

https://www.tcec-chess.com/archive.html?season=16&div=sf&game=5
Parent - - By Peter Martan Date 2019-09-27 16:52 Edited 2019-09-27 17:08
In der 6. scheint SF zurückzuschlagen.

Nach

1. e4 c5 2. Nf3 e6 3. d4 cxd4 4. Nxd4 Nc6 5. Nc3 Qc7 6. Be3 a6 7. a3 Nf6 8. f4 d6 9. Qf3 Be7 10. O-O-O O-O 11. Nxc6 bxc6 12. g4 Nd7 13. h4 Rd8 14. h5 Rb8 15. Be2 d5 16. h6 g6 17. Rhf1 Qa5 18. Nb1 Qc7 19. Nc3 Qa5 20. Bd4 c5 21. Bg7 d4 22. Nb1 Qb6 23. b3 a5 24. Nd2 Ba6 25. Nc4 Qc6 26. a4 Rb4 27. Ne5 Nxe5 28. fxe5 Bg5+ 29. Kb1 f6 30. Bxf6 Rf8 31. Bxa6 Qxa6 32. Bxg5 Rxf3 33. Rxf3 Qa7



hat SF eine Eval von >12, Allie 1.57, erst nach dem folgenden
34. Rdf1 Rb8 35. Bf6
klettert sie auch so richtig.
Parent - - By Stefan Pohl Date 2019-09-28 15:54
Partie 12 ist praktisch entschieden - Stockfish wird zum ersten Mal in Führung gehen.
Parent - - By Peter Martan Date 2019-09-28 23:37
Und baut auf 2 Punkte Vorsprung aus.

In der 14. nach

1. e4 e6 2. d4 d5 3. Nc3 Bb4 4. e5 c5 5. a3 Bxc3+ 6. bxc3 Ne7 7. Qg4 Qc7 8. Qxg7 Rg8 9. Qxh7 cxd4 10. Ne2 dxc3 11. f4 Bd7 12. Qd3 Na6 13. Nd4 Qa5 14. Nb3 Qa4 15. g3 Rc8 16. Be3 b6 17. Nd4 Nc5 18. Qh7 Rg6 19. Bh3 Ne4 20. O-O Nf5 21. Bxf5 exf5 22. Rad1 Nd2 23. Rf2 Rc4 24. e6 Bxe6 25. Qh5 Ne4 26. Nxe6 Rxe6 27. Rxd5 Nd6 28. Rd3 Ke7 29. g4 Rce4 30. gxf5 Rf6 31. Re2 Nxf5 32. Qh8 Rg6+ 33. Kf1



wäre mit z.B. 33...Td6 die bei beiden bis dahin gezeigte 0.00 schon richtig gewesen, aber nach 33...Dc6? ist das Spiel mit 34.Lc5+ praktisch aus.
Parent - - By Benno Hartwig Date 2019-09-29 00:04
Und SF sieht praktisch sofort (<< 1 Sekunde!), dass er nun deutlich in Vorteil kommt.
Parent - By Guenter Stertenbrink Date 2019-09-29 06:35 Edited 2019-09-29 06:52


hier stieg StockFish's eval von 1.00 auf 2.70 , und Allies einige
Halbzuege spaeter von 0.00 auf 3.20.

Aber das merkwuerdige war, wie RotFishs Live-eval hier staendig
zwischen ca.0.80 und 2.50 hin-und hersprang in den naechsten
Halbzuegen. So 5-10 mal

Es folgte : Bd2 Qh3 37. Qb5 Bf8 38. f5 exf5 39. Ne3 Rxd2+ 40. Kxd2 Bh6 41. Qe2 Kg7 42. Qf2 f4 43. Nxd5 Qa3 44. Nxf4 *

Allie bei +3.70 , BlauLeela bei +0.80 , die Fische bei 0.00

Parent - - By Stefan Pohl Date 2019-09-29 06:15
Läuft also bisher erwartungsgemäß. Allie ist einfach merkbar schwächer, laut meiner Testruns irgendwas um die 70 Elo. Bei viel mehr Bedenkzeit und Rechenpower knautscht dieser Abstand natürlich zusammen, wegen der viel höheren Remisqoute. Aber Stockfish ist dennoch stärker. Mal sehen, ob sich das über die kompletten 100 Partien auch abbilden wird. Habe ja darauf getippt (ca. 55% für Stockfish)... abwarten.
Wirklich schade, daß Lc0 nicht das Superfinal gegen Stockfish spielt.
Parent - - By Guenter Stertenbrink Date 2019-09-29 07:46
aber du hast auch Lc0 bei deinen Bedingungen etwa 10-20 Elo schwaecher als Stockfish,
waehrens Sie unter TCEC-Bedingungen in mehreren Turnieren etwa 30 Elo besser war.

Das wuerde dann die Allie-Differenz  von 70Elo auf 20-30Elo (TCEC) reduzieren.
Nun, StockFish hat kuerzlich noch 10 Elo zugelegt, also 30-40 Elo.
Das macht dann 55/100  fuer Stockfish , OK.
Parent - - By Peter Martan Date 2019-09-29 08:53
Parent - By Guenter Stertenbrink Date 2019-09-29 10:52 Edited 2019-09-29 11:05
ich uebersah, dass die 70 Elo-Differenz zu Lc0 sich auf die alte Allie-Version bezog.
Die aktuelle TCEC-SF-Version soll ja etwa 25 Elo staerker sein. Dann waeren es nur
ca. 10 Elo bis Stockfish  bei TCEC-Konditionen
https://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=124583
https://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=124490
Parent - - By Benno Hartwig Date 2019-09-29 10:46 Upvotes 1
Ach, es gab jetzt schon so viel von Lc0 zu sehen.
Und Allie konnte in der Premium Liga ja schon positiv Überraschungen.
Ich finde sehr schön, dass Allie nun auch mal einen genaueren Blick auf sein Können bietet.
Und in wenigen Monaten wird vermutlich Lc0 erneut seine Chance haben (vielleicht dann ja Allie vs. Lc0, *duckundwech*)
Parent - By Stefan Pohl Date 2019-09-29 12:27 Edited 2019-09-29 12:31
Benno Hartwig schrieb:

Ach, es gab jetzt schon so viel von Lc0 zu sehen.
Und Allie konnte in der Premium Liga ja schon positiv Überraschungen.
Ich finde sehr schön, dass Allie nun auch mal einen genaueren Blick auf sein Können bietet.
Und in wenigen Monaten wird vermutlich Lc0 erneut seine Chance haben (vielleicht dann ja Allie vs. Lc0, *duckundwech*)


Leider scheint die neue dev-Version von Allie, die jetzt im Superfinal spielt, wohl eher eine Verschlimmbesserung zu sein. Es gab ja nur 2 Änderungen am Time-Management und die scheinen nicht gelungen zu sein. Jedenfalls zieht m.E. nach Allie im Superfinal deutlich zu schnell und hat immer sehr viel Zeit auf der Uhr. Das ist gegen eine taktische Granate wie Stockfish auf dieser Hardware, sicher ein Nachteil.
Up Topic Hauptforen / CSS-Forum / TCEC aktuell
1 2 Previous Next  

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill