Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / TCEC/S16 entschieden!
- - By Michael Scheidl Date 2019-10-12 01:29
Mit dem Gewinn der 93. Partie hat Stockfish das Superfinale der 16. TCEC-Saison gewonnen. Der Zwischenstand von 51:42 ist für die gegnerische Engine AllieStein nicht mehr aufholbar. Nach einer Zwischenphase mit einem Bonusprogramm, während im Hintergrund die nötigen Vorbereitungen getroffen werden, folgt der 4. TCEC-Cup.
Parent - - By Benno Hartwig Date 2019-10-13 11:18
Und ausgegangen ist es nun

    54.5-45.5

für Stockfish.
Also mit der Quote 54,5% (und ich habe nicht mal den Taschenrechner dafür gebraucht )
Dies entspricht einer Überlegenheit von 31 Elo.
Parent - By Reinhold Stibi Date 2019-10-13 12:58
Mit normaler Hardware RTX 2070  und  Ryzen 3900 12 CPUs
wäre wahrscheinlich die Überlegenheit von Stockfish  über 50 Elo.

Die Gewinnpartien sollten noch ausgewertet werden.
Parent - - By Michael Scheidl Date 2019-10-14 17:56
Zitat:
Nach einer Zwischenphase mit einem Bonusprogramm...

Dieses wird mit denselben Bedingungen wie im Superfinale, außer mit der Zeitkontrolle 12m+3s zwischen Stockfish und Houdini 6.03 abgehalten. Stockfish hat bereits gewonnen; nach 74 Partien steht es 50,5:24,5 bzw. 29:2 Siegen. Das sind rund +135 Elo was nicht sehr dramatisch ist...

Nach Gewinnpartien steht es aber 29:2 und das ist vernichtend.
Parent - - By Stefan Pohl Date 2019-10-14 19:43
Tja, Stockfish ist allen anderen AB-Engines mittlerweile weit enteilt.
Parent - - By Benno Hartwig Date 2019-10-14 20:50
Stimmt.
Der Blick auf die Elo-Kurve auf deiner Seite erweckt den Eindruck, als hätte sich SF von Februar bis August dieses Jahres spielstärkemäßig nicht wirklich weiterentwickelt, danach sei es aber wieder zu einer spürbaren Steigerung gekommen.
Komodo und Houdini tun sich wohl wirklich schwer, dieses Tempo mitzugehen.
Ich mutmaßte, dass Houdini mit der kommenden Version wieder einen kräftigen Elo-Sprung gelingen würde. Allerdings hätte ich erwartet, dass wir davon hier bei TCEC auch schon was zu sehen bekommen. Sieht nicht wirklich so aus.
Dauerhaft abgehängt?


Benno
Parent - - By Klaus S. Date 2019-10-14 21:01
Es gibt keine kommende Version von Houdini. (Leider)
Parent - By Benno Hartwig Date 2019-10-14 23:19
Oh

aber das erklärt auch, dass hier bei TCEC die Houdini-Version 6.03 antritt, die immerhin schon November 2017 veröffentlicht wurde.
Soweit ich mich erinnere, war damals Houdini durchaus dicht an der SF-Spielstärke dran. Hatte die Spielstärke der damaligen SF-Vollversion durchaus erreicht.
Und man sieht dann, was auch diese letzten 2 Jahre SF-Fortschritt bewegen konnten!
Parent - By Stefan Pohl Date 2019-10-15 05:27
Benno Hartwig schrieb:

Stimmt.
Der Blick auf die Elo-Kurve auf [url]deiner Seite[/url] erweckt den Eindruck, als hätte sich SF von Februar bis August dieses Jahres spielstärkemäßig nicht wirklich weiterentwickelt, danach sei es aber wieder zu einer spürbaren Steigerung gekommen.
Komodo und Houdini tun sich wohl wirklich schwer, dieses Tempo mitzugehen.
Ich mutmaßte, dass Houdini mit der kommenden Version wieder einen kräftigen Elo-Sprung gelingen würde. Allerdings hätte ich erwartet, dass wir davon hier bei TCEC auch schon was zu sehen bekommen. Sieht nicht wirklich so aus.
Dauerhaft abgehängt?


Benno


Ja, in letzter Zeit konnte Stockfish mehr zulegen, als in den Monaten zuvor. Das ist aber nichts ungewöhnliches. Es gab immer mal Phasen, wo es schneller aufwärts ging und Phasen, in denen es langsamer oder gar nicht vorwärtsging. Auf jeden Fall ist die AB-Konkurrenz schon seit längerer Zeit abgehängt: Bei Komodo geht es schon seit Jahren kaum noch vorwärts und Houdini ist eingestellt. Und Ethereal und Xiphos sind viel zu weit weg.
Parent - - By Eduard Nemeth Date 2019-10-17 09:33
Das scheinen manche nicht zu kapieren. Sonst hätte man solch ein Match nicht gestartet. Und dann kostet diese jetzt drittklassige Engine auch noch so viel Geld (zwischen 50 und 100 Euro). 
Soeben gespielt auf InfinityChess:

[Event "Blitz 3' + 2'', Rated"]
[Site "?"]
[Date "2019.10.17"]
[Round "?"]
[White "yellowjacket, Houdini 6"]
[Black "SolistaChess, Raubfisch"]
[Result "0-1"]
[WhiteElo "2257"]
[BlackElo "2550"]
[PlyCount "124"]
[EventDate "2019.??.??"]
[EventType "blitz"]

1. e3 Nf6 2. d4 d5 3. Bd3 c5 4. h3 Nc6 5. Nf3 c4 6. Be2 b5 7. O-O Bf5 8. b3 e6
9. a4 a6 10. Nh4 Be4 11. f3 Bg6 12. Nxg6 hxg6 13. Bd2 Rb8 14. axb5 axb5 15. c3
Bd6 16. Be1 O-O 17. e4 Nh5 18. e5 Nxe5 19. dxe5 Bxe5 20. Ra2 Qg5 21. g4 Nf4 22.
h4 Qf6 23. Kh1 Ra8 24. Rd2 Ra1 25. Qc2 g5 26. h5 g6 27. Bd1 gxh5 28. Bg3 Rfa8
29. Rh2 h4 30. Bxf4 Qxf4 31. Rg2 Bd6 32. b4 Kg7 33. Qb2 Qe3 34. Rgf2 Bf4 35.
Kg2 Qe5 36. Kh1 Qf6 37. Qc2 e5 38. Qb2 d4 39. cxd4 exd4 40. Bb3 h3 41. Nd2 Bxd2
42. Rxa1 Bc3 43. Rxa8 Bxb2 44. Ra2 Bc1 45. Bd1 Bf4 46. Rh2 Bxh2 47. Kxh2 d3 48.
Kxh3 c3 49. Kg2 Qf4 50. Rf2 Qc1 51. Rf1 Qd2+ 52. Kg3 c2 53. Bxc2 dxc2 54. Rh1
c1=Q 55. Rxc1 Qxc1 56. Kf2 Qd2+ 57. Kg3 Qe2 58. f4 Qe3+ 59. Kh2 Qf2+ 60. Kh1
gxf4 61. g5 f3 62. g6 Qg2# 0-1

Das ist nicht mal ein Training-Partner.
Parent - By Stefan Pohl Date 2019-10-17 10:54 Upvotes 2
Also das ist nun wirklich maßlos übertrieben. Drittklassig ist Houdini mit Sicherheit nicht. Houdini ist immer noch auf Augenhöhe mit Komodo und damit eine der stärksten AB-Engines der Welt.
Parent - - By Wolfgang Battig Date 2019-10-17 11:03 Upvotes 2
Eduard Nemeth schrieb:

...diese jetzt drittklassige Engine ...

??
Ich bin weit davon entfernt ein Houdini/Houdart-Fan zu sein, aber DAS, lieber Eduard, ist bei allem nötigen Respekt, der größte Unsinn, den ich - abgesehen vom ein oder anderen Tom-Paul-Posting - in letzter Zeit hier gelesen habe.

Houdini ist derzeit (noch) Nr. 3. Komodo hat fast aufgeschlossen und die neue Stoofvlees-Version a12 wird vorbeigehen. Also immer noch Nr. 4.
Wie kann die Nr. 3 oder 4 "drittklassig" sein?? Wer ist dann erst- und wer zweitklassig?

Edit: Stefan Pohl war schneller!, danke Stefan!
Parent - By Wolfgang Battig Date 2019-10-17 13:01
Wolfgang Battig schrieb:

... und die neue Stoofvlees-Version a12 wird vorbeigehen...


Scheint doch (noch) nicht soweit zu sein. Bleibt wohl (sehr) knapp dahinter. Bei 7 Punkten Differenz aber jetzt auf Augenhöhe und nur noch eine Frage der Zeit, da GCP seine Engine noch weiterentwickelt.

https://cegt.forumieren.com/t1190-testing-stoofvlees-ii-a12
Parent - - By Kurt Utzinger Date 2019-10-17 20:36
Eduard Nemeth schrieb:

Das scheinen manche nicht zu kapieren. Sonst hätte man solch ein Match nicht gestartet. Und dann kostet diese jetzt drittklassige Engine auch noch so viel Geld (zwischen 50 und 100 Euro). 
Soeben gespielt auf InfinityChess:


Hallo Eduard
Auf welches Posting bezieht sich diese Aussage?
Gruss
Kurt
Parent - By Eduard Nemeth Date 2019-10-17 23:13 Edited 2019-10-17 23:16
Auf das von Michael.

Ich spiele viel auf den Servern. Bin daher vielleicht zu verwöhnt von Stockfish's Spielstärke, und von Lc0 wenn die auf 2x RTX 2080 Ti antritt. Gegen Houdini gewinnt Stockfish sogar auf meinem 2 Core Laptop,
ich musste zB. auf Infinity Chess 50 Rapid Partien absolvieren (nicht Blitz) um den Rang Springer zu bekommen. Dabei durfte ich nicht unter 2000 Elo fallen. Zunächst hatte ich bedenken ob der Laptop das schafft.
Aber weit gefehlt, für Houdini gab es nur Prügel. Auf solche Matches wie Stockfish vs. Houdini habe ich daher null Interesse!
Parent - - By Tom Paul Date 2019-10-14 21:13
Michael Scheidl schrieb:

Zitat:
Nach einer Zwischenphase mit einem Bonusprogramm...

Dieses wird mit denselben Bedingungen wie im Superfinale, außer mit der Zeitkontrolle 12m+3s zwischen Stockfish und Houdini 6.03 abgehalten. Stockfish hat bereits gewonnen; nach 74 Partien steht es 50,5:24,5 bzw. 29:2 Siegen. Das sind rund +135 Elo was nicht sehr dramatisch ist...

Nach Gewinnpartien steht es aber 29:2 und das ist vernichtend.


Ich sage ja auch immer das Siege und Niederlagen zählen und nicht die natürlichen Remise.
Das macht dann +465 ELO und wie du schon sagtest es ist vernichtend.
Parent - By Wolfgang Battig Date 2019-10-14 21:26
Ich sage ja auch immer, dass du nur Unsinn von dir gibst...
- - By Guenter Stertenbrink Date 2019-10-14 09:19
es gab ein "alternatives Superfinale" : Lc0-Stockfish.
https://www.twitch.tv/navratil25
Aehnliche Konditionen.

Hier ein Thread:
https://groups.google.com/forum/#!topic/lczero/HlyPXfPJ-Lg

Wie ist es ausgegangen ?

9-2,5-2 --> 11-7 = +18 Elo nach 76 Partien fuer Lc0-Terminator-J13B.2-188 gegen StockFish_250919
Parent - - By Stefan Pohl Date 2019-10-14 19:52 Edited 2019-10-14 20:00
Guenter Stertenbrink schrieb:

es gab ein "alternatives Superfinale" : Lc0-Stockfish.
<a class='ura' href='https://www.twitch.tv/navratil25'>https://www.twitch.tv/navratil25</a>
Aehnliche Konditionen.

Hier ein Thread:
<a class='ura' href='https://groups.google.com/forum/#!topic/lczero/HlyPXfPJ-Lg'>https://groups.google.com/forum/#!topic/lczero/HlyPXfPJ-Lg</a>

Wie ist es ausgegangen ?

9-2,5-2 --> 11-7 = +18 Elo nach 76 Partien fuer Lc0-Terminator-J13B.2-188 gegen StockFish_250919


Da lief es für Lc0 mit einem Netz in Standardgröße 256x20 im Superfinal 15 besser.
Tja, mein Testrun mit dem J13B.2-200 Netz läuft auch nicht gerade überragend. Größere Netze heißt eben leider nicht automatisch höhere Spielstärke. Das leicht bessere positionelle Spiel wiegt den Geschwindigkeitsnachteil nicht oder fast nicht auf.
Google hat schon gewußt, warum sie auf 256x20 Netzgröße bei AlphaZero gesetzt haben...die haben sicher ein paar Größen ausprobiert, darf man annehmen.

Das Gute ist, daß der Kampf um die Spitze für Stockfish somit noch nicht verloren ist. Denn bis die T60 Netze stark geworden sind (und das wird noch lange dauern!), sehe ich momentan kaum noch weiteres Verbesserungspotential für lc0. Während es für Stockfish peu a peu weiter nach oben geht.
Parent - - By Tom Paul Date 2019-10-14 21:23
Stefan Pohl schrieb:

Guenter Stertenbrink schrieb:

es gab ein "alternatives Superfinale" : Lc0-Stockfish.
<a class='ura' href='<a class='ura' href='https://www.twitch.tv/navratil25'>https://www.twitch.tv/navratil25</a>'>https://www.twitch.tv/navratil25</a>
Aehnliche Konditionen.

Hier ein Thread:
<a class='ura' href='<a class='ura' href='https://groups.google.com/forum/#!topic/lczero/HlyPXfPJ-Lg'>https://groups.google.com/forum/#!topic/lczero/HlyPXfPJ-Lg</a>'>https://groups.google.com/forum/#!topic/lczero/HlyPXfPJ-Lg</a>

Wie ist es ausgegangen ?

9-2,5-2 --> 11-7 = +18 Elo nach 76 Partien fuer Lc0-Terminator-J13B.2-188 gegen StockFish_250919


Da lief es für Lc0 mit einem Netz in Standardgröße 256x20 im Superfinal 15 besser.
Tja, mein Testrun mit dem J13B.2-200 Netz läuft auch nicht gerade überragend. Größere Netze heißt eben leider nicht automatisch höhere Spielstärke. Das leicht bessere positionelle Spiel wiegt den Geschwindigkeitsnachteil nicht oder fast nicht auf.
Google hat schon gewußt, warum sie auf 256x20 Netzgröße bei AlphaZero gesetzt haben...die haben sicher ein paar Größen ausprobiert, darf man annehmen.

Das Gute ist, daß der Kampf um die Spitze für Stockfish somit noch nicht verloren ist. Denn bis die T60 Netze stark geworden sind (und das wird noch lange dauern!), sehe ich momentan kaum noch weiteres Verbesserungspotential für lc0. Während es für Stockfish peu a peu weiter nach oben geht.


Zu AlphaZeros Zeiten, gab es doch die heutigen GPUs gar nicht .
Von daher haben Sie damals die Größe entsprechend angepasst unter Berücksichtigung der verwendeten Bedenkzeit.

Keine Engine entdeckt so viele beste Züge wie das größte, trainierte LC0 Netz bei genug Bedenkzeit.

Man kann halt nichts entdecken, wenn man nichts weiß bzw. ein zu kleines Netz hat und das eigene Limit zu 99,9% bei einpaar Sekunden oder Minuten pro Zug liegt.
Parent - By Eduard Nemeth Date 2019-10-15 00:38
Das leuchtet ein. Oder man nimmt stärkere Hardware. Zwei RTX 2080 Ti wären ein Traum. Damit kann man dann schon was reissen auf den Spielservern. Im Blitz ist man auf Augenhöhe, und bei längeren Partien klar besser als Stockfish. Vor einigen Monaten habe ich den Vorläufer von Fat Fritz bei längeren Partien (60+15) beobachtet. Ich sah richtig gute Partien. Werde demnächst einige Kostproben zeigen. Aber auch Fat Fritz hat mir neulich imponiert, wie er auf 2x RTX 2080 Ti im Blitz einen Stockfish auseinander genommen hat.
Parent - - By Stefan Pohl Date 2019-10-15 05:20
Tom Paul schrieb:


Zu AlphaZeros Zeiten, gab es doch die heutigen GPUs gar nicht
Von daher haben Sie damals die Größe entsprechend angepasst unter Berücksichtigung der verwendeten Bedenkzeit.


Genau das ist der Punkt, du Auskenner: AlphaZero lief auf den GoogleTPUs und erreichte im Wettkampf gegen Stockfish 80000 n/s. Und hatte eine Minute Bedenkzeit pro Zug. Und trotz dieser hohen Verarbeitungsgeschwindigkeit und der rel. langen Bedenkzeit entschied sich Google für ein 256x20 Netz.
Parent - By Stefan Pohl Date 2019-10-18 08:15 Edited 2019-10-18 08:20
Stefan Pohl schrieb:

Tom Paul schrieb:


Zu AlphaZeros Zeiten, gab es doch die heutigen GPUs gar nicht
Von daher haben Sie damals die Größe entsprechend angepasst unter Berücksichtigung der verwendeten Bedenkzeit.


Genau das ist der Punkt, du Auskenner: AlphaZero lief auf den GoogleTPUs und erreichte im Wettkampf gegen Stockfish 80000 n/s. Und hatte eine Minute Bedenkzeit pro Zug. Und trotz dieser hohen Verarbeitungsgeschwindigkeit und der rel. langen Bedenkzeit entschied sich Google für ein 256x20 Netz.


So, der Testrun des J13B.2-200 Netzes ist durch. Ein J.Horthos "Terminator"-Netz (Größe: 320x24). Wie ich (und Google wohl auch, s.o.) erwartet hatte, ist das Ergebnis schlechter als die, der besten 256x20-Netze. Genau: -38 Elo schlechter als T40B.4-160.

https://www.sp-cc.de/lc0-testing.htm

Interessanterweise ist das Ergebnis sehr ähnlich zum kleinen 128x10 LD2 Netz (s.u.). Es kristallisiert sich in meinen Testruns nunmehr recht klar heraus, daß 256x20 der wohl beste Kompromiß zwischen Netzgröße und Verarbeitungsgeschwindigkeit ist, was die real entstehende Elo-Leistung angeht. Weswegen wohl Google sich ebenfalls für die Größe 256x20 entschieden hat.

Code:

     Program                     Elo    +    -   Games   Score   Av.Op.  Draws

   1 Stockfish 190622 bmi2     : 3532    5    5 12500    63.0 %   3433   52.5 %
   2 Lc0 0.22.0 T40B.4-160     : 3529    9    9  3000    67.9 %   3390   47.0 %
   3 Lc0 0.21.2 42741          : 3523    9    9  3000    67.5 %   3388   46.7 %
   4 Lc0 0.22.0 T40B.2-106     : 3520    9    9  3000    67.1 %   3388   45.7 %
   5 Lc0 0.21.3 42850          : 3516   10   10  3000    66.7 %   3388   46.0 %
   6 Lc0 0.21.2 42595          : 3513    9    9  3000    66.3 %   3388   47.0 %
   7 Lc0 0.21.2 T40.T8.610     : 3511   10   10  3000    66.1 %   3388   46.0 %
   8 Lc0 0.22.0 LStein 10.2    : 3491    9    9  3000    63.7 %   3388   46.0 %
   9 Lc0 0.22.0 J13B.2-200     : 3491    9    9  3000    63.3 %   3390   47.7 % <--- größeres Netz (als 256x20), basierend auf T40-Partien
  10 Lc0 0.22.0 LD2            : 3483    9    9  3000    62.6 %   3388   46.9 % <--- kleineres Netz (als 256x20), basierend auf T40-Partien
  11 Allie 0.5dev LS 11        : 3482    9    9  3000    62.1 %   3390   52.5 %
  12 Lc0 0.21.4 32930          : 3462    9    9  3000    60.0 %   3388   50.2 %
  13 Scorpio 3.02 32930        : 3460    9    9  3000    59.3 %   3390   54.4 %
  14 Allie 0.5dev LS 10.2      : 3460    9    9  3000    59.3 %   3390   51.7 %
  15 Houdini 6 pext            : 3449    4    4 13500    51.2 %   3439   55.2 %
  16 Lc0 0.22.0 11260          : 3434    9    9  3000    56.3 %   3388   53.8 %
  17 Komodo 13.1 bmi2          : 3431    6    6  7000    54.7 %   3396   53.3 %
  18 Komodo 13.01 bmi2         : 3417    5    5  9500    47.3 %   3436   51.9 %
  19 Scorpio 3 NN-Maddex       : 3369    9    9  3000    47.2 %   3390   50.6 %
  20 Fire 7.1 popc             : 3321    5    5 13500    33.1 %   3449   46.6 %
  21 Xiphos 0.5.3 bmi2         : 3308    4    4 13500    31.4 %   3450   46.0 %
  22 Ethereal 11.53 pext       : 3301    5    5 13500    30.5 %   3450   44.7 %
Parent - By Guenter Stertenbrink Date 2019-12-18 02:25
J13B.2-188  spielt zur Zeit auch im CCCC-11-Finale

das alternative Superfinale stand nach 93 Partien   +13 -9 =71 fuer Lc0  (+15 Elo)
Up Topic Hauptforen / CSS-Forum / TCEC/S16 entschieden!

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill