Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / S16 - LCZeroCPU vs League 1 Bonus
- - By Benno Hartwig Date 2019-08-28 20:41
Diese Bonus-Runde
S16 - LCZeroCPU vs League 1 Bonus
finde ich tatsächlich auch wirklich interessant.
Wenn der CPU-LC0 da mithalten kann, dann ist das schon eine sehr ordentliche Leistung, finde ich!
Benno
Parent - - By Michael Scheidl Date 2019-08-28 22:49
Zitat:
Wenn der CPU-LC0 da mithalten kann, dann ist das schon eine sehr ordentliche Leistung, finde ich!

Mag schon sein, aber mich stört diese Unterbrechung der Saison und insbesondere, daß sie unbedingt auf 45m+5s stattfinden muß... Eine etwas instinktlose Entscheidung der Organisatoren, die zu einem Besucherschwund führen könnte. Ich bin sauer.
Parent - By Benno Hartwig Date 2019-08-28 23:24
Ja, solche Zwischendurch-Läufe könnten gern mit deutlich kürzeren Zeiten erfolgen. Vielleicht 15min + 5sec.
Andererseits sind es auch nur gerade mal 32 Partien.
Parent - By Benno Hartwig Date 2019-08-31 06:22
Hmmm, dass jetzt aber noch ein Bonus kommt, immerhin 160 Partien über 30'+5' "Eine schaumgebremste Lc0 gegen Liga P, wo auch die nicht schaumbegrenzte Lc0 dabei ist"  empfinde ich nun aber auch als sehr Überflüssig.
"S16 - Testing LCZero 30pct vs DivP" heißt das Event. Oder ist das "Testing" in der Hinsicht ernst zu nehmen, dass TCEC dies braucht, um Sicherheit für die kommende TCEC-echt-Runde zu haben?

Benno
Parent - - By Klaus S. Date 2019-08-30 21:33
Zitat:
Diese Bonus-Runde
S16 - LCZeroCPU vs League 1 Bonus
finde ich tatsächlich auch wirklich interessant.
Wenn der CPU-LC0 da mithalten kann, dann ist das schon eine sehr ordentliche Leistung, finde ich!
Benno

Vorraussichtlicher Endstand:

1   LCZeroCPU v0.21.3-nLD2  32   18.5   0   10 [7/3]   6 [1/5]   11.25   3755   -15 [3740]
2   Stoofvlees II a12        2    1.5   0   1 [1/0]   0 [0/0]   26.25   3788   8 [3796]
3   Booot 6.3.1              2    1.5   0   1 [0/1]   0 [0/0]   26.25   3683   14 [3697]
4   ScorpioNN v2.9.2-n_mad   2    1.5   0   1 [1/0]   0 [0/0]   26.25   3694   13 [3707]
5   Laser 230319             2    1.5   0   1 [1/0]   0 [0/0]   26.25   3730   11 [3741]
6   rofChade 2.105           2    1.0   0   1 [1/0]   1 [0/1]   17.50   3679   4 [3683]
7   Pedone 230719            2    1.0   0   1 [1/0]   1 [0/1]   17.50   3610   8 [3618]
8   Xiphos 0.5.3             2    1.0   0   0 [0/0]   0 [0/0]   17.50   3738   1 [3739]
9   Jonny 8.1                2    1.0   0   0 [0/0]   0 [0/0]   17.50   3629   7 [3636]
10   Ginkgo S16              2    1.0  

....

Und  welche Schlüsse ziehst du nun aus dieser Leistung von Lc0 ??
Parent - By Klaus S. Date 2019-08-30 23:09
Arasan hat gegen Lc0 gewonnen!

Endstand:  1   LCZeroCPU v0.21.3-nLD2  32   17.5
Parent - - By Benno Hartwig Date 2019-08-30 23:48
17,5 Punkte aus 32 Paritien gegen die Gegner aus Liga 1
Ich habe den Eindruck, Liga 1 ist schon eine Gruppe von Programmen, die ein sehr, sehr ordentliches Schach spielen, stärker als die Top-Engines vor noch wenigen Jahren
(Fire war mal recht dicht dran an der Spitze!)
Lc0-CPU hatte ich um viele, viele Klassen schwächer empfunden als die Grafikkartenversionen. Und dass Lc0-CPU trotzdem gegen Liga 1 mithalten kann, beeindruckt mich einfach!

Benno
Parent - - By Guenter Stertenbrink Date 2019-08-31 07:26 Edited 2019-08-31 07:48
waere eine CPU-Version bereits vor -sagen wir- 10 Jahren ,
vor der Zeit der GPUs moeglich gewesen ?

Als das damals beste Schachprogramm ?

Oder, mit dem Wissen von heute, aber ohne Computer, nur mit Kopf,
koenntest du der Schachprogrammierung von 2009 entscheidende Impulse geben ?

--------------------------------

The term was popularized by Nvidia in 1999, who marketed the GeForce 256 as "the world's first GPU".[3]
Nvidia's CUDA platform, first introduced in 2007,[47] was the earliest widely adopted programming model for GPU computing
Parent - By Stefan Pohl Date 2019-08-31 07:54
Guenter Stertenbrink schrieb:

waere eine CPU-Version bereits vor -sagen wir- 10 Jahren ,
vor der Zeit der GPUs moeglich gewesen ?



Sicher, aber es wäre in vertretbarer Zeit nicht möglich gewesen, ein NeuralNetz im Selfplay aufzubauen, weil selbst mit nur 800 nodes pro Zug die Partien viel zu lange gedauert hätten, um auf 30, 50 oder gar 80 Millionen Partien zu kommen.
Parent - - By Lothar Jung Date 2019-08-31 07:56 Edited 2019-08-31 08:05
Nein, es waren noch nicht mal die theoretischen Grundlagen für das Reinforcement Learning entwickelt worden.
Dann braucht man auch GPUs für das Training der weights von CPU-NNs. Selbst mit einem großer CPU-Cluster dauert das viel zu lange.
Es benötigte schon die Finanz- und Rechenkapazität und Forschungsanstrengungen von Google um das Zero-Projekt durchzuführen.
Lothar
Parent - - By Ingo Althöfer Date 2019-08-31 08:16
Hallo Herr Jung,

Lothar Jung schrieb:
Nein, es waren noch nicht mal die theoretischen Grundlagen
für das Reinforcement Learning entwickelt worden.

da möchte ich widersprechen.

Diese Grundlagen waren schon in den 1990er Jahren da,
unter dem Namen "Multi-armed Bandit Problems", aber...

Als 2008 oder 2009 Oliver Textaud (der der Kopf des MoGo-Teams
war) in einem Workshop vortrug und ich den anderen erzählte, wie
toll ich das fände, sagte mein Doktorvater Rudolf Ahlswede
(1938 - 2010) nur: "Das ist doch alles viel älter. Im statistischen
Zweig der Informations-Theorie gibt es eine Arbeit von 1952
oder 1955 (von einem Herrn Liu), wo das alles schon untersucht
und erklärt ist, wenn auch nicht mit solchen sexy Namen wie
multi-armed bandits."

Natürlich war in den 1950ern die Hardware noch nicht so weit,
um die Sache mit dramatischen praktischen Folgen anwenden
zu können.

Ingo Althöfer.
Parent - - By Lothar Jung Date 2019-08-31 12:32
Hallo Herr Althöfer,

ja, die Entwicklung des RI-Learning geht bis in die späten 50er Jahre zurück.
In Bezug auf Spiele war das Backgammon-Programm von Gerry Tesauro (TD-Gammon) in 1992 sehr wichtig.
Man hat aber 1996 z.B. IBM mit Deep Blue weiter den A/B-Ansatz mit Bruce Force verfolgt.
RI-NN-Ansätze wären von der Hardwareseite nicht umsetzbar gewesen.

Grüße Lothar Jung
Parent - By Guenter Stertenbrink Date 2019-08-31 18:59 Edited 2019-08-31 19:07
es geht doch auch ohne selfplay mit existierenden Partien.
Nur eben zur Zeit vielleicht so 100-200 Elo schwaecher schaetz ich.

Aber es gab nichts dergleichen, ausser vielleicht giraffe, und das erst 2015.
1000 Elo hinter stockfish.

Man haette doch wenigstens mal abschaetzen koennen, wieviel
Hardware/Trainingszeit benoetigt wird fuer sagen wir 3000 Elo,
Aber anscheinend war dann jedermann ueberrascht von a0.
Parent - - By Frank Brenner Date 2019-09-01 14:54
Noch wenige Wochen bevor Deepmind  AlphaZero-Go vorstellte, waren doch weltweit noch alle Go Programmierer  und alle Menschen die etwas von der Spieleprogrammierung verstanden der Meinung, es würde noch mehrere Jahrzehnte dauern bis die Go Programme so gut würden wie die besten menschlichen Spieler.
Es gab zu dem Zeitpunkt schon Grafikkarten auf dem Consumer Markt mit denen man sowas wie LC-Zero hätte auf die Beine stellen können, aber niemand (außer deepmind) war in der Lage das Potential zu erahnen und vor allem war niemand in der Lage so ein Programm zu programmieren.

Unser aktuelles LC-Zero basiert ja auf einer weitestgehenden Nachprogammierung von Deepminds AlphaZero.

Deepminds AlphaZero ist so genial wie der Alpha-Beta Algorithmus, allerdings noch cleverer, viel komplexer und es erfordert deutlich mehr intelligenz AlphaZero zu erfinden als AB.
Wäre Deepmind nicht mit Alphazero daher gekommen wären auch heute noch Neuronale Netze so weit von der Schachprogrammierung entfernt wie Meine Uroma die Quantenphysik versteht und die "experten" würden immer noch zweifeln dass innerhalb der nächsten 50 Jahren der beste Go Spieler von einem Computerprogramm besiegt würde.
Parent - By Guenter Stertenbrink Date 2019-09-01 15:32
ich denke dass es auch ohne DeepMind gekommen waere/ kommen wuerde
Nur vielleicht so 5 Jahre spaeter.

Uebrigens hatte ich tatsaechlich darauf gewettet, dass ein Computer
Go-Weltmeister wuerde vor 2020.
Ohne viel Ahnung von Neural-Netzen zu haben.
Gekauft hauptsaechlich in 2009 zu Kursen um die 40, dann jeweils aufgestockt
zu niedrigeren kursen, allerdings bei sehr geringem Volumen.

http://www.ideosphere.com/fx-bin/Claim?claim=GoCh
Up Topic Hauptforen / CSS-Forum / S16 - LCZeroCPU vs League 1 Bonus

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill