Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / TCEC: Dritter KomodoMCTS-Crash begünstigt Finalchancen von Lc0
- - By Michael Scheidl Date 2019-01-11 21:31
Es ist passiert! Heute ist Komodo-MCTS in der Premier Division von Saison 14 zum dritten Mal abgestürzt, d.h. alle Ergebnisse werden gestrichen und die Engine steigt ab. Der bereinigte Zwischenstand:

Revised Standings: SF 19.5/28, Leela 15.5/28, K 15.0/28, H 15.0/28, Fire 12.5/29, Eth 10.5/28, Andy 10.0/27

(!standings in den Chat eintippen)

Eine Dramaturgie die man nicht hätte schreiben dürfen, da man als "zu übertrieben und unwahrscheinlich" kritisiert worden wäre
Parent - By Tobias Lagemann Date 2019-01-12 04:18
Hallo Michael,

auch der Abstiegskampf gewinnt an Dramatik, denn Ethereal und Andscacs haben nun wieder beide gute Chancen, in der Premier Division zu bleiben.

Hart wird es dann natürlich nächste Season in der First Division. Mit Komodo MCTS ist dort eine Engine am Start, die nach dem Zwangsabstieg deutlich stärker sein dürfte, als es ein "normaler" Absteiger gewesen wäre.

Viele Grüße
Tobias
Parent - - By Heiko Krauß Date 2019-01-12 09:40
Michael Scheidl schrieb:

Es ist passiert! Heute ist Komodo-MCTS in der Premier Division von Saison 14 zum dritten Mal abgestürzt, d.h. alle Ergebnisse werden gestrichen und die Engine steigt ab. Der bereinigte Zwischenstand:

Revised Standings: SF 19.5/28, Leela 15.5/28, K 15.0/28, H 15.0/28, Fire 12.5/29, Eth 10.5/28, Andy 10.0/27

(!standings in den Chat eintippen)

Eine Dramaturgie die man nicht hätte schreiben dürfen, da man als "zu übertrieben und unwahrscheinlich" kritisiert worden wäre


wie würde es denn aussehen , wenn man die 3 Crashpartien abschätzen würde , wäre dann Leela auch auf Finalkurs ?
Parent - - By Tobias Lagemann Date 2019-01-12 11:18
Hallo Heiko,

ich habe mir die gecrashten Partien nicht angeschaut, nur die Bewertungen beim disconnect gesehen und die lagen/liegen in der Remisbreite. Nähme man das Maßstab für die Wertung, dann hätte Komodo einen Punkt und Houdini einen halben Punkt weniger.

Und dann läge LC0 nach der 34. Runde auf Platz 2.

Aber wie will man Computerpartien abschätzen? Dass Bewertungen manchmal innerhalb weniger (Computer)Züge kippen können, sollte sich rumgesprochen haben. In der Runde zuvor, als LC0 einen Crash hingelegt hat, war die Bewertungen so eindeutig, dass man abgeschätzt hat. Daher wurde wohl die im Chat wurde zuvor auch genannte Möglichkeit einer Neuansetzung der Partie verworfen.

Tja, wenn jetzt die gecrashten Partien neu gespielt würden, dann wäre wieder manches offen gewesen. Aber es ist, wie es ist. Komodo MCTS ist raus.

Und es wird möglicherweise erst mit der letzten Partie über Platz 2 entschieden, denn da spielt SF mit Weiß gegen LC0.

Viele Grüße
Tobias
Parent - - By Klaus S. Date 2019-01-12 12:01
Zur Zeit spielt Fire gegen K MCTS.

Warum? Ich denke MCTS ist raus. Es werden Partien gespielt die nachher nicht gewertet werden!?

Es liegt wohl am automatischen Ablauf.
Parent - By Tobias Lagemann Date 2019-01-12 12:13
Hallo Klaus,

ja, im Chat stand, dass es zu aufwändig wäre, Komodo MCTS aus dem Turnier zu nehmen, da spielt man lieber weiter und streicht nachher lediglich Komodo MCTS samt Ergebnissen aus der Liste.

Mich stört das nicht, da die Partien ja nun auch einen gewissen Unterhaltungswert haben.

Viele Grüße
Tobias
Parent - By Heiko Krauß Date 2019-01-12 12:24
Danke Tobias.
ich wusste das zuvor beim LCO-Crash abgeschätzt wurde , daher meine Frage.
Warten wir mal ab, es bleibt spannend.
Für die nächste Saison sollten dann aber ganz klare Regeln herrschen (abschätzen oder nullen)

Wer am Ende auch immer ins Superfinale einzieht hat das nötige Quentchen Glück gehabt
Tatsache ist LCO hat zu Houdini und Komodo aufgeschlossen
Erstaunlich (für mich) dass das so schnell ging

Schönes Wochenende
Heiko
Parent - By Peter Martan Date 2019-01-12 09:43 Edited 2019-01-12 09:48
Michael Scheidl schrieb:

(!standings in den Chat eintippen)

Eine Dramaturgie die man nicht hätte schreiben dürfen, da man als "zu übertrieben und unwahrscheinlich" kritisiert worden wäre


Was mir an dieser sonst so tollen Veranstaltung mehr und mehr stinkt, ist, dass man die aktuellen Daten immer mehr nur online und möglichst überhaupt nur im Chat erfährt, die Spalte Standings führt z.B. komodo MCTS derzeit schon auch noch, der Download von Event und aktueller .pgn funktioniert momentan gerade ausnahmsweise mal wieder, das war aber, wenn ich das sonst in der letzten Zeit hin und wieder probiert habe, eigentlich auch nie der Fall.

Dass man bei TCEC interessiert ist, die Zuschauer "bei der Stange", heißt online zu halten, kann ich ja verstehen, aber, naja, man wird halt immer kritischer und grantiger im Alter.
Parent - - By Tobias Lagemann Date 2019-01-14 10:30
Hallo zusammen,

nach Komodos Niederlage gegen SF und LC0 Sieg gegen Fire heißt es nun im Kampf um Platz 2 "Advantage LC0".

SF 22.5/32, Leela 18.5/33, H 17.5/33, K 16.5/32, Fire 14.0/33 Eth 12.0/31, Andy 12.0/32

Viele Grüße
Tobias
Parent - - By Lothar Jung Date 2019-01-14 11:11
Ich glaube die Messe ist gesungen.
Da müsste schon viel schiefgehen.
Zumal über die Partien von LC0 mit Ausfall einer GPU noch zu entscheiden wäre.
Parent - - By Michael Scheidl Date 2019-01-15 01:17
Auf der Liveseite haben sie nun K-MTCS aus dem Zwischenresultat herausgenommen. - Es bleibt knapp!
https://tcec.chessdom.com/live.html
Parent - - By Tobias Lagemann Date 2019-01-16 07:53
Hallo Michael,

es bleibt bis zum Schluss spannend, denn nur wenn Komodo in Partie 167 gegen Andscacs gewinnt und LC0 in Partie 168 gegen SF verliert, kann LC0 noch den 2. Platz verlieren. Okay, wenn LC0 crasht, wäre es bei einem Komodo Sieg auch vorbei.

Aber Komodo hat gegen Adscacs in dem Match bislang nur remisiert. Wird das in der 6. Partie anders sein?

Das ist ein spannendes Finale.

Viele Grüße
Tobias
Parent - - By Tobias Lagemann Date 2019-01-16 14:02
Sooo,

Komodo hat seinen Job erledigt.

Jetzt reicht LC0 ein Unentschieden für das Erreichen des Superfinales.

Mal (zu)schauen!

Viele Grüße
Tobias
Parent - By Achim Müller Date 2019-01-16 14:21
Ausgerechnet in der entscheidenden Partie gegen Stockfish scheint es wieder Probleme mit einer GPU zu geben, 7 knps in einer Mittelspeilstellung ist für lc0 auf der Hardware ein extrem niedriger Wert.

Ciao

Achim
Parent - - By Heiko Krauß Date 2019-01-16 15:52
"Yippie Yah Yei Schweinebacke!"
      das Endspiel ist remis
Die Echse ist tot , es lebe LcO
Parent - - By Martin Steinwandter Date 2019-01-16 16:12
Wäre fast noch ein schwarzer Tag für Euch Leela Fans geworden
Parent - - By Heiko Krauß Date 2019-01-16 16:17
Tom Paul spendiert uns jetzt allen ´ne Super-Dooper-GPU 
Parent - By Tobias Lagemann Date 2019-01-17 05:26
Hallo Heiko,

es gibt keine Super-Dooper-GPUs, die richtige Hardware ist TPU. Und die spendiert Google wahrscheinlich nur verdienten Helden des NN-Engine Marketings. Kann aber sein, dass wir dann in den Genuss des ausgemusterten GPU Parks von T.P. kommen. Aber ich würde davon nichts nehmen, denn das wäre ja sauschlechte Hardware.

Viele Grüße
Tobias
Parent - - By Stefan Pohl Date 2019-01-16 16:19 Upvotes 2
Martin Steinwandter schrieb:

Wäre fast noch ein schwarzer Tag für Euch Leela Fans geworden


Fan oder nicht Fan. Auf jeden Fall wird das im Superfinale mal was anderes als immer nur Stockfish entweder gegen Komodo oder Houdini. Abwechslung tut Not!
Parent - - By Ingo Althöfer Date 2019-01-16 16:46
Stefan Pohl schrieb:
... Auf jeden Fall wird das im Superfinale mal was anderes
als immer nur Stockfish entweder gegen Komodo oder Houdini.
Abwechslung tut Not!

Nehmen wir mal an, dass Lc0 ins Superfinale kommt.
Wenn ich die Regeln richtig verstanden habe, dürfen
beide Finalisten zum Finale ihre Programm-Versionen
updaten.

Hoffentlich setzt die Leela-Gruppe dann im SuFi eine Version
ein, die NICHT vorher in aller Öffentlichkeit bekannt ist. Sonst
könnte nämlich das StockFish-Team seine SuFi-Version direkt
darauf tunen.

Ingo Althöfer.
Parent - - By Peter Martan Date 2019-01-16 17:24 Edited 2019-01-16 17:29
Hallo Herr Professor!
Ingo Althöfer schrieb:

Hoffentlich setzt die Leela-Gruppe dann im SuFi eine Version
ein, die NICHT vorher in aller Öffentlichkeit bekannt ist. Sonst
könnte nämlich das StockFish-Team seine SuFi-Version direkt
darauf tunen.


Da sähe ich aber wahrscheinlicher und größer die Gefahr an, dass eine noch nicht öffentlich bekannte Netzwerk- Version (von der Engine ganz zu schweigen), ins Superfinale geschickt würde und es stellt sich dann dort erst heraus, dass sie doch nicht soo gut ist.
(Und wie soll das eigentlich gehen, wenn man die Netzwerke über ein Framework von Usern, die ihre Hardware fürs Training spenden, erstellen lässt, dass man eine eigene Superfinale- Version "heimlich" entwickelt?)

Genau so gut könnte man befürchten, Leela würde jetzt schon ganz unheimlich heimlich gegen die jüngste SF- Version lernen, nicht mehr nur aus Selfplay, wenn das eine heimlich geht, sollte das andere erst recht kein Problem sein.

Los, jetzt wieder Sie mit einer Gegenverschwörungstheorie, so heizen wir die Spannung weiter an!
Parent - - By Ingo Althöfer Date 2019-01-16 17:36
Lieber Herr Martan,

Peter Martan schrieb:
Los, jetzt wieder Sie mit einer Gegenverschwörungstheorie,
so heizen wir die Spannung weiter an!

wie lange müssen wir denn heizen, oder anders gefragt:
Wann soll das Superfinale beginnen?

Eine Frage an die Trick-Aktivisten:
Wissen die Programme des Superfinales, wie die bis zum
jeweiligen Zeitpunkt beendeten Partien ausgegangen sind?

Falls ja, könnte man ein Programm aus zwei Engines bestehen lassen:
dem Vordermann und einem Schläfer. Es beginnt der Vordermann. Zeigt
sich z.B. nach den ersten 20 Partien, dass Programm A mit 8-12 hinten
liegt, könnte bei A der Schläfer A' zum Einsatz kommen.

Ihr Ingo Althöfer.
Parent - - By Peter Martan Date 2019-01-16 17:43 Edited 2019-01-16 17:52
Genau so hab ich's mir gedacht.

Darf ich Sie dann mal als den Mathematik und -Computerschachexperten schlechthin in diesem unserem bunten Forum mal was anderes fragen?
Die Sache mit der Elospreizung durch Drawkiller- Eröffnungen und die Errorbar in Hinblick auf das Ranking allein, abgesehen von der Höhe der Elowerte, in einem bestimmten Enginepool, sagen wir im Anlassfall einfachster Weise, was zwei bestimmte Engines oder Engineversionen allein angeht.

http://forum.computerschach.de/cgi-bin/mwf/topic_show.pl?pid=118239#pid118239

Hat die Errorbar, was die Zahl der notwendigen Partien für ein bestimmte statistische Signifikanz, die beiden möglichen Plätze von Engine 1 und Engine 2 betreffend, überhaupt etwas mit der Eloformel zu tun, oder genügt es nicht, die beiden möglichen Ergebnisse Engine 1 oder Engine 2 ist besser (um wieviel, spielt keine Rolle) allein statistisch mit einer ganz anderen Formel zu berechnen, deren Namen mir nicht einfällt.
(Mit dieser Frage sind wird dann nämlich sowieo immer zum Statistiker gegangen für ein zu bewilligendes Studiendesign, wenn es galt, auszurechnen, wieviel Fallzahlen wir brauchen werden für die notwendige statistische "Power" )
Parent - - By Guenter Stertenbrink Date 2019-01-17 05:17
kann man alles berechnen , aber ich mache meist monte-carlo Simulationen fuer sowas, das ist einfacher.

es gab so ein TLA(three letter acronym) dafuer - POS (probability of superiority) oder so

ich glaube, L.Antonov(asmfish) gab das oefter an im TCEC chat damals oder im fishpond Forum
Vielleicht ist das mit drin im ORDO programm ?
Parent - - By Peter Martan Date 2019-01-17 07:14 Edited 2019-01-17 07:55
Naja, da fehlt mir halt die wirkliche statistisch- mathematische Bildung. Aus der Grenzwissenschafts-Vorlesung weiß ich noch dunkel, dass es eine Menge einzelner Rechenarten gibt, so nebulöse Begriffe, die sich noch im Hinterkopf herumtreiben (hab' mir jetzt natürlich doch schnell mal die Skripten von damals rausgesucht) sind Anova (Analysis of variance), T-Test, Chi-Square, Correlation Spearman's, C. Pearson's, besonders nett fand ich so vom Klang her immer Mann- Whitney U und Wilcoxon Signed Ranks.

Und für bestimmte Parameter aus der Anwendungspraxis "Studie", haben wir damals als kleine Übung auch so ein bisschen rumgerechnet, was da hingegen für so ein Sample of Chess Engines und die Merkmalsdifferenz "Spielstärke" aus dem Versuch "Ranking im Engine- Engine- Match" einer bestimmten Testumgebung die statistisch korrekte Art der Berechnung wäre, hätte ich keine Ahnung, dass es absolut nicht ausgerechnet Elo sein müsste, könnte, sollte, dürfte, wenn es ausschließlich darum geht, für die Reihung von einer bestimmten Engine- Anzahl eine Partienzahl für eine bestimmte Signifikanz oder Errorbar zu bestimmen, bin ich mir aber sicher.

Den Spielstärkenunterschied zu quantifizieren, ist es natürlich der Weg, der im Schach üblich ist, wenn es sich aber um so geringe Merkmalsdifferenzen handelt (nur an Performance in ganzen und halben Punkten gemessen, was ja sowieso eine minimalistisch genaue Methode dazu ist, einem Statistiker müsste sowas direkt peinlich sein), die ja nicht von Natur aus in "Elo" bestehen, sondern in Unterschieden im Source- Code und oder einem oder mehreren neuronalen Netzen, sehen wir deutlicher und deutlicher, dass die Partienzahlen explodieren mit der Zahl an Teilnehmern im direkten Vergleich und mit einer ganzen Reihe von einzelnen Variablen, die, je kleiner der wirkliche Spielstärkeunterschied wird, umso mehr, jeder für sich, die Ergebnisse immer wesentlicher beeinflussen. Und die Remisquote ist dafür nicht primär verantwortlich, die ist hingegen auch einfach eine Auswirkung der geringen Merkmalsdifferenz.

Die Eröffnungsstellungen sind eines dieser Kriterien, sie willkürlich so zu wählen, dass die Remisquote sinkt, erhöht nur scheinbar die Merkmalsdifferenz Spielstärke selbst, es sei denn, man beschränkt sich in deren Definition völlig auf das eine Testset.
Man muss sich im Klaren sein, die Ergebnisse stimmen quantitativ und qualitativ ausschließlich für ein einzelnes Sample und ein einzelnes Testset, für ein anderes eventuell völlig, aber sicher irgendwie, anders.

Nun kann man Rückschlüsse aus dem Vergleich mit anderen Eröffnungstestsets und anderen Engine- Pools, anderen TCs usw, auf die zu erwartende Partiezahl ziehen, die man für eine bestimmte statistische Signifikanz braucht, wenn's aber allein um die Errorbar eines Rankings von 1-x für x Teilnehmer geht, darf man nicht erwarten, die Elowertung, die man von den Teilnehmern aus anderen Testumgebungen kennt, und die man mit dem einzelnen Testet spreizt, sei in Hinblick auf die Errorbar (des Ratings sowieso nicht, sonst müsste man ja gar nicht mehr testen) aber auch nicht in Hinblick auf die Errorbar des Rankings 1:1 übertragbar. Wie viel man sie spreizt, ist die Frage, nicht die Antwort.

Es wäre sonst einfach eine self fulfilling prophecy,  mit einer Elospreizung durch ein bestimmtes Eröffnungstestset eine bestimmte Elorelation zu ermitteln in einem bestimmten Sample, und aus der dann nicht nur das einzelne Ranking im einzelnen Pool abzuleiten (das kann man natürlich machen, Performance in Prozent täte aber denselben Dienst), sondern auch, obwohl man die Elo willkürlich gespreizt hat, aus den so gespreizten Relationen außer dem Ranking im einen einzelnen Versuch, irgendwie in absoluter Höhe und oder in Relation zueinander mehr oder weniger ähnliche Versuche im Ergebnis vorherzusagen. Ist der Sinn von Elo, aber nicht, wenn man die Punkte als solche durch die Selektivität des einzelnen Matches willkürlich spreizt.

Das sagt ja Stefan selbst auch immer wieder, es kommt ihm nicht auf die Elo- Zahlenwerte an, dann kann man sie aber auch nicht (quantitativ in irgendeiner Genauigkeit) als direktes Maß für die Errorbar des Rankings verwenden, sondern man müsste diese (Errorbar) gesondert und nur für den einzelnen Pool und das einzelne Testset immer wieder neu berechnen, mit welcher statistischen Methode auch immer.
Period.
Parent - - By Guenter Stertenbrink Date 2019-01-17 07:32
ich denke, du ueberschaetzt die Probleme. Ich finde, es klappt ganz gut
mit den Elos

unabhaengig von Eroeffnungsbuch, Zeitkontrolle,
Parent - - By Peter Martan Date 2019-01-17 07:45 Edited 2019-01-17 08:29
Guenter Stertenbrink schrieb:

unabhaengig von Eroeffnungsbuch, Zeitkontrolle,

Weder unabhängig vom Eröffnungsbuch (Drawkiller, hallo, ist das so rein an Arbeitsaufwand, und sei es nur, es zu testen, an dir vorbeigegangen?), noch unabhängig von der Hardware- TC (hallo, worüber diskutieren hier noch und noch Fachleute, was die "Performance" verschiedener CPUs und GPUs angeht?) und schon gar nicht unabhängig von Teinehmerfeld.
Und bei dem, um was es ja hier gerade geht, ausschließlich ein bestimmtes Ranking zu ermitteln, ist es eben auch schon gar nicht und absolut nicht mehr egal, in Zeiten des Geradeersterblühens einer völlig neuen Engine- Generation, welche und wie viele "althergebrachte" Engines du mit welchen und wie vielen NN- Engines und oder A-B, MCTS, pict und punct und Dings- Dingens  du mitspielen lässt, momentan gerade nicht einmal mehr bei den ersten 4 Plätzen, was ist mit den anderen (Plätzen weiter unten, auf einmal alles schnurzpiep?)?
Man soll die Dinge so einfach machen, wie sie sind, aber nicht einfacher.


Edit: und selbst wenn's, wie du schreibst, mit den Elo "ganz gut klappt" (was sich verflixt nach einem halb vollen Glas anhört, bei dem es ja bekanntlich mathematisch völlig egal ist, ob man es halbvoll oder halbleer sieht, die mathematische Info darin ist ausschließlich "halb"), soo einfach ist diese Formel zur Berechnung von einer so simplen Frage, ist die eine oder andere Engine besser, auch nicht gerade oder?

Arpad Elo wollte einen Weg formulieren (gut formuliert, oder? ), menschlichen Spieler, die immer nur eine ganz geringe Anzahl von Spielen und meistens eben nicht direkt gegeneinander spielen und spielten, eine Spielstärkenrelation vorherzusagen, merke, nicht als Absolutwert ihnen aufs Auf zu drücken, sondern vorherzusagen, mit welcher Wahrscheinlichkeit der Eine gegen den Anderen abschneiden würde, so sie denn gegeneinander anträten.

Aus dieser zu ganz anderen Zwecken gedachten, wie gesagt auch nicht ganz unkomplizierten Formel, macht man im Computerschach seit Jahr und Tag eine, nein die heilige Kuh, obwohl man damit doch eigentlich nichts anderes errechnen will, als welche Engine im direkten ungezügelten Big Data- Match gegen welche andere besser oder schlechter gereiht ist.

Es geht jetzt gerade bei den Drawkiller- Eröffnungen gerade um nichts anderes als ein ganz bestimmtes Ranking ganz bestimmter (weniger, momentan gerade überhaupt nur 2er) Engines oder sogar nur 2er Versionen von ihr oder sogar nur um 2 verschiedene Netze.

Schmeck's Elo, interessiert keine S...eele, schon gar nicht, was die Errorbar des einzelnen Versuches in Hinblick auf die Zahl der für eine bestimmte Signifikanz notwendigen Partiezahl angeht.
Mann-Whitney U wäre viel einfacher und genauer.

Oder von mir aus auch POS.
Parent - By Peter Martan Date 2019-01-17 08:58 Edited 2019-01-17 09:02
Peter Martan schrieb:

Aus dieser zu ganz anderen Zwecken gedachten, wie gesagt auch nicht ganz unkomplizierten Formel, macht man im Computerschach seit Jahr und Tag eine, nein die heilige Kuh, obwohl man damit doch eigentlich nichts anderes errechnen will, als welche Engine im direkten ungezügelten Big Data- Match gegen welche andere besser oder schlechter gereiht ist.

Haha, zu Big Data fällt mir überhaupt die Lösung schlechthin ein, das wär doch wirklich eine einfache und lohnende Aufgabe für AI, nein?
Ein neuronales Netz, das sowieso mit Unmengen von Schachpartien gespeist wird, auch gleich ausrechnen lassen, welche von beliebig vielen Engines gegen welche andere welches Ranking verdient!

Dann hätten wir auch wirklich endlich vollends die Kartoffel- Anbau und Selbstaufess- Maschine, man müsste sich nicht einmal mehr in die Entwicklungskontrolle einmischen, die Engines spielen gegeneinander um dabei zu lernen, die einen mehr, die anderen weniger, das neuronale Netz oder eines davon wird zusätzlich mit der Aufgabe betraut, die Entwicklung des Fortschritts in irgendwelchen beliebigen Maßzahlen anzugeben und vorherzusagen, wie sie in den nächsten Stunden, Tagen, Jahren weitergehen wird.
Dann kann man auch immer gleich die Teilnehmer unterhalb einer gewissen Marke aus dem Spiel nehmen, die Menschen sind eh schon lang aussortiert.
Selfplay and Selfmeasure Elo, sehr künstlich, sehr intelligent.
Parent - - By Guenter Stertenbrink Date 2019-01-17 12:03
also drawkiller war doch just ein Beispiel wie die Elo, das Ranking
_trotz_ solch unterschiedlicher Eroeffnungen stabil ist

http://magictour.free.fr/POHL19A.GIF

ach ja, und dann war da noch ERET
Parent - By Peter Martan Date 2019-01-17 13:10 Edited 2019-01-17 13:14
Das Beispiel, das du so schön graphisch dargestellt hattest, zeigte einerseits die Korrelation, andererseits die Spreizung, und dann ging's darum, ob das jetzt mit anderen Engine- Pools, anderen Hardware- TCS und zuletzt z.B. mit einem reinen Einzelvergleich zweier LC0- Versionen, bzw. -Netzen auch so sei, und wie viele Partien man in welchem Fall spielen lassen müsste, um das alles zu beweisen oder widerlegen.

Und dann waren da außer Eret auch noch STS, Kai Laskos Stellungstest für positionelles Spiel,  Noomens Gambit- Lines, zig verschiedenste Testsuites für Eng-Eng- Matches und das buchlose Match.
Und was wird dann sein, wenn's mehr einander untereinander noch mehr ähnelnde NN- Engines als A-B-Engines geben wird, die mithalten können, und was wird sein, wenn der einzige Sinn, den man sich als Mensch fürs Schach vorstellen könnte, das gezielte Lernen einzelner Eröffnungssysteme und -Varianten kommen wird, und so wie die Serverspieler jetzt Bücher gegeneinander antreten lassen, dann die Serverspieler eigens selbstgelehrte NNs aufeinander hetzen werden, die sie gegen die anderen Spezial- NNs gezielt werden lernen haben lassen?

Dann wirst du sicher immer noch sagen, dass das mit den Elo eh ganz gut klappt, und dass es auf Eröffnungen, TC und Ähnliches überhaupt nicht ankommt.
Und wozu machst du dann mit den vielen vielen Partien, die du sammelst und auswertest, deine Statistiken?
Parent - By Martin Steinwandter Date 2019-01-16 17:58 Edited 2019-01-16 18:01
Ingo Althöfer schrieb:


Eine Frage an die Trick-Aktivisten:
Wissen die Programme des Superfinales, wie die bis zum
jeweiligen Zeitpunkt beendeten Partien ausgegangen sind?

Falls ja, könnte man ein Programm aus zwei Engines bestehen lassen:
dem Vordermann und einem Schläfer. Es beginnt der Vordermann. Zeigt
sich z.B. nach den ersten 20 Partien, dass Programm A mit 8-12 hinten
liegt, könnte bei A der Schläfer A' zum Einsatz kommen.

Ihr Ingo Althöfer.

Lc0 lernt ja aus den gespielten Partien, also wird es auch wissen wer gewonnen und wer verloren hat.
Parent - - By Stefan Pohl Date 2019-01-16 21:13
Ingo Althöfer schrieb:

Hoffentlich setzt die Leela-Gruppe dann im SuFi eine Version
ein, die NICHT vorher in aller Öffentlichkeit bekannt ist. Sonst
könnte nämlich das StockFish-Team seine SuFi-Version direkt
darauf tunen.


Also bei allem Respekt, Herr Professor, Stockfish wurde noch nie fürs Superfinal getunt.Jedweder Stockfish-Patch wird nur durch Selfplay-Partien auf Tauglichkeit getestet, NIEMALS gegen irgeneine andere Engine. Und fürs Superfinale wird einfach eine der letzten Versionen ans TCEC gesendet.
Somit ist irgendeine Vorbereitung, irgendeine Optimierung, auf einen bestimmten Gegner ausgeschlossen. Zumal es auch gar kein Stockfish-“Team“ gibt. JEDER kann Patches ins Selfplay-Framework einspeisen und (im Erfolgsfall) somit auch in den Stockfish code.
Parent - By Ingo Althöfer Date 2019-01-17 13:22
Lieber Herr Pohl,

Stefan Pohl schrieb:
Also bei allem Respekt, Herr Professor,
Stockfish wurde noch nie fürs Superfinal getunt...

danke für die Erklärung. Da habe ich mich also als Nicht-
Wisser geoutet. Um so gespannter warte ich jetzt auf
das Superfinal.

Ingo Althöfer.
Parent - - By Guenter Stertenbrink Date 2019-01-17 05:08
wie sollte man da "tunen" ?  die Eroeffnungen sind ja nicht bekannt.
Hmm, sf koennte (noch) mehr auf Abtausch spielen und auf Lc0's
Endspielschwaeche spekulieren
Oder gezielt auf taktische Tricks und Fallen gehen.
Also z.B. einfach ein Bonus, bei eval-Spruengen
auf niedrigerer Tiefe.
Es ist Zeit fuer eine Fallensteller-Engine !
Parent - - By Peter Martan Date 2019-01-17 07:32
Guenter Stertenbrink schrieb:

Es ist Zeit fuer eine Fallensteller-Engine !

Mann, Günter, du spielst aber offenbar überhaupt nicht mit verschiedenen Settings und Branches und mit anderen Engines als mit der gerade aktuellen dev.- Version von SF selbst, oder?
Fallenstellerengines haben wir wirklich genug, und jetzt mit LC0 halt eine mehr, will keiner so einfach sehen, ist ja auch nicht so einfach, bei Fallen kommt's drauf an, wie gut sie sind.
So gut, dass man nicht selbst auf sie reinfallen kann, sind sie nie, sonst wären's ja keine Fallen.
Wer anderen eine Grube gräbt, ist selbst ein Hilfsarbeiter.
Parent - - By Guenter Stertenbrink Date 2019-01-17 11:58
ich spiel auch manchmal mit Komodo,Houdini
Und ich hab all die Partien von CCRL,TCEC,FCP,CCCC,sp-cc,Fernschach-CD ... und mach Statistiken darueber.

LC0 stellt nicht Fallen, sie faellt hinein
Bei taktischen Kombinationen kann man als AB versuchen abzuschaetzen of LC0 das wohl sieht.

LC0 wiederum koennte taktische Kombinationen meiden, tut sie aber (noch) nicht
Parent - By Peter Martan Date 2019-01-17 12:43 Edited 2019-01-17 12:59
Guenter Stertenbrink schrieb:

LC0 wiederum koennte taktische Kombinationen meiden, tut sie aber (noch) nicht

Und meine Tante wiederum könnte ein Omnibus sein, wenn sie Räder hätte, hat sie aber (noch) nicht.

Und gleich wieder allen Ernstes, dass sie (Leela, nicht meine Tante) nicht irgendwann anfangen wird, taktische Kombinationen zu meiden, ist ebensowenig gesagt, wie dass sie nicht irgendwann anfangen wird, überhaupt hauptsächlich auf Remis zu spielen.

Wenn man die Geschichte des Menschenschachs so anschaut, war ja da nach ersten dumpfsumpfigen Anfängen auch eine romantische Ära mit großen Meistern der Opfer und der heroischen Angriffspartien, und dann ging's mehr und mehr ans strategische Todsitzen der Gegner und mittlerweile fließend aus der Eröffnungs- in die Endspieltheorie über.

Dass Leela jetzt auch noch in so einer Art romantischen Ära ihres Lernprozesses steht, sozusagen in den angriffsfreudigen Kinderschuhen, sich dann in eine langweiligere Strategin langfristiger Pläne ändert und schließlich wie WOPR zum Schluss kommt, a strange game, the only winning move is not to play, wer weiß?

Logisch wär's insofern schachlich schon, weil wie auch immer wir dem begegnen wollen, um dem Remistod im Eng-Eng noch eine Weile zu entgehen, dass das Spiel als solches mit annhähernd fehlerfreiem solchen doch mit ziemlicher Wahrscheinlichkeit Remis ist, das kristallisiert sich einfach irgendwie halt mehr und mehr heraus, glaube ich. Wenn das NN jetzt lernt und lernt und lernt, was wird es, wenn das Lernen immer weiter funktioniert, dann wohl irgendwann genauer und genauer herausgefunden haben?
Parent - - By Michael Scheidl Date 2019-01-17 01:41
Der Vollständigheit halber:

N Engine              Rtng  Pts Gm     SB X  Elo Perf St     Ko     Lc     Ho     Km     Fi     An     Et   
1 Stockfish 181224    3612 29.0 42 572.00 0  -76 69.0 ······ ==1=11 ===1== =1=1== 1===1= 1===== 111=1= 1==1=1
2 Komodo 2227.00      3565 24.0 42 469.75 0 -155 57.1 ==0=00 ······ ====1= ====== 11==1= =1=1=1 =====1 ===1==
3 LCZero v20rc2-32194 3297 23.5 42 466.25 0 +341 56.0 ===0== ====0= ······ ====== ===1== =1=101 =111== ===1==
4 Houdini 6.03        3527 23.5 42 464.75 0 -101 56.0 =0=0== ====== ====== ······ ==1=11 1===== 1==1== ===1==

5 KomodoMCTS 2227.00  3249 18.0 42 362.75 3 +247 42.9 0===0= 00==0= ===0== ==0=00 ······ =1==== ==1==0 ==1=1=

6 Fire 7.1            3452 17.5 42 364.75 0 -148 41.7 0===== =0=0=0 =0=010 0===== =0==== ······ ====== 1=====
7 Andscacs 095        3391 16.5 42 333.75 0  -60 39.3 000=0= =====0 =000== 0==0== ==0==1 ====== ······ ==1===
8 Ethereal 11.14      3377 16.0 42 342.00 0  -48 38.1 0==0=0 ===0== ===0== ===0== ==0=0= 0===== ==0=== ······


Bzw., da die KomodoMCTS-Punkte ja entfallen:  Final Div p Standings 1.SF (25) 2.LC0 (20) 3.K (19.5) 4.H (19) 5. F (15) 6.E(14) 7.A(13.5) 8.KMC (0). Somit steigen Andscacs und Kmtcs ab und Ethereal bleibt etwas glücklich in DivP, obwohl kein einziger Sieg gelang.

Derzeit läuft bis 20.1. als Pausenfüller ein Zweikampf Lc0-SF8(*), 100 Partien bei 10m+10s auf etwas kleinerer Hardware. Vermutlich laufen gleichzeitig Stabilitätstests für die neuen Engineversionen. Dann beginnt der 2. TCEC-Cup und danach, voraussichtlich Anfang Februar, beginnt dann endlich das Superfinale...

*) Um eines der A0-Matches nachzubilden sozusagen; Lc0 mit 2x2070 GPU.
Parent - - By Heiko Krauß Date 2019-01-17 16:33
Michael Scheidl schrieb:
e>

Derzeit läuft bis 20.1. als Pausenfüller ein Zweikampf Lc0-SF8(*), 100 Partien bei 10m+10s auf etwas kleinerer Hardware. Vermutlich laufen gleichzeitig Stabilitätstests für die neuen Engineversionen. Dann beginnt der 2. TCEC-Cup und danach, voraussichtlich Anfang Februar, beginnt dann endlich das Superfinale...

*) Um eines der A0-Matches nachzubilden sozusagen; Lc0 mit 2x2070 GPU.


Zwischenstand 15:10 für LCO bei 7:2 Gewinnpartien
Parent - - By Heiko Krauß Date 2019-01-18 12:53
Heiko Krauß schrieb:

Michael Scheidl schrieb:
e>

Derzeit läuft bis 20.1. als Pausenfüller ein Zweikampf Lc0-SF8(*), 100 Partien bei 10m+10s auf etwas kleinerer Hardware. Vermutlich laufen gleichzeitig Stabilitätstests für die neuen Engineversionen. Dann beginnt der 2. TCEC-Cup und danach, voraussichtlich Anfang Februar, beginnt dann endlich das Superfinale...

*) Um eines der A0-Matches nachzubilden sozusagen; Lc0 mit 2x2070 GPU.


Zwischenstand 15:10 für LCO bei 7:2 Gewinnpartien

und nach 50 Partien
30,5:19,5     ...  14:3
Parent - - By Tom Paul Date 2019-01-18 13:07
Es zählen nur die Gewinnpartien:
14 zu 3.
Somit ist LC0 ungefähr so stark wie Stockfish Dev. auf TCEC Hardware.
Parent - - By Michael Scheidl Date 2019-01-18 14:30
Zitat:
Es zählen nur die Gewinnpartien:

Es zählen auch die Remis mit, aber aus Stockfish-Sicht furchterregend ist, daß Lc0 in diesem experimentellen Match sogar "eingebremst" läuft, um die Verhältnisse des ersten Alpha Zero-Matches nachzubilden. Mittlerweise wird das Neuralnetz von Leela noch weiter trainiert. Für das SuFi würde ich nicht mehr hoch auf Stockfish wetten wollen...
Parent - By Klaus S. Date 2019-01-18 15:46
Ich habe mich bisher nicht mit Lc0 beschäftigt, mich wundert aber das Lc0 auf
einer Nvidia GPU schneller/besser sein soll (oder gleich stark) als DeepMind/Google mit ihrer
doch überlegenden Hardware plus AlphaZero !

DeepMind hat sicherlich AZ auch in 2018 weiter lernen lassen und müsste
doch jetzt auch einen großen Sprung nach vorne gemacht haben.

Also einmal Lc0 für jedermann zu Hause, gegen einen großen Konzern - gleich stark?!

Hmm... seltsam.
Parent - By Martin Steinwandter Date 2019-01-18 16:47
Michael Scheidl schrieb:

Zitat:

Für das SuFi würde ich nicht mehr hoch auf Stockfish wetten wollen...

Ich bin dabei und setze einen Hunderter gegen LC0!
Up Topic Hauptforen / CSS-Forum / TCEC: Dritter KomodoMCTS-Crash begünstigt Finalchancen von Lc0

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill