Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / CCRL und CEGT sollten mehr up to date sein !
- - By Reinhold Stibi Date 2019-03-23 11:39
Diese Überschrift gilt besonders für CCRL mit dem Test 40/4.

Schon längst ist Lc0 vor Komodo 11.2 und jetzt auch vor Houdini 6.03.

Nur bei CCRL befindet sich Lc0 0.20.2  mit Net 32930 an vierter Stelle.

Dazu ist zu bemerken dass Net 32930 nicht das stärkste 32er Net ist, sondern mit
Abstand das Net 32877.

Zwar wurde  das Net 32930 bei TCEC als stärkstes Net angeführt. Doch dies gilt wahrscheinlich
nur für absolute Spitzenhardware die von durchschnittlichen Menschen nicht eingesetzt wird.
Für erschwingliche Hardware wie die GTX 960 oder GTX 1050 ist eindeutig das Net 32877 besser.

Auch kann Lc0 mit Net 41513, 41412 und 41541 mit Stockfish 10 mithalten.

Die Tester sollten nicht stur die alte Suppe löffeln sondern sich modernisieren.

Kaum ein Anderer dürfte Lc0 mehr getestet haben wie ich, da meine Computer mit GTX 960
und GTX 1050 Ti   z.T. Tag und Nacht laufen.
Parent - - By Michael Scheidl Date 2019-03-23 12:07
Du brauchst die Option fp16, die einen riesigen Geschwindigkeitsvorteil bewirkt. Ob sich die Ratingagenturen auf ein Modell einigen können, bleibt abzuwarten...
Parent - By Reinhold Stibi Date 2019-03-23 17:01
Soviel mir bekannt ist lässt sich die Option Sp16 nicht bei der GTX 960 oder GTX 1050 Ti einstellen sondern nur auf den
RTX Karten.

In 1 oder 2 Monaten werde ich mir eine RTX 2070 zulegen, wo diese Option möglich ist.
Parent - - By Benno Hartwig Date 2019-03-24 07:29

> Dazu ist zu bemerken dass Net 32930 nicht das stärkste 32er Net ist, sondern mit Abstand das Net 32877.


Woran machst du dies so selbstbewusst fest?
Parent - - By Reinhold Stibi Date 2019-03-24 10:39 Edited 2019-03-24 10:47 Upvotes 1
Meine Testergebnisse mit dem 30er Net jeweils mit GTX 960  gegen Stockfish 10  sonst wie üblich bei mir.

Net 32390   77 Partien   +10  =47  -20   =33,5 %   = - 45 Elo

Net 32877   64   "          +7   =46  -11    =46,88 %  = -22  Elo

Net 32930   50   "          +4   =36  -10    =44,0 %    =-42 Elo

Nfet 32997  62   "          +7   =34  -21    =38,71 %  =-80 Elo

Außerdem läuft bei mir auf GTX 960 gerade ein Riesenturnier mit über 750 Partien und  28  Engines

Momentaner Stand:  1  Stockfish 10  24.0  aus 33 Partien      bei gespielten 466 Partien insgesamt
                              2   Lc0 32877    24.0      "                  etwas schlechterer Feinwertung
                              3   Lc0 41432    23.0      "
                              4   Lc0 41513    22.5      "
                              5   Lc0 41537    22.0      "
                              6   Hou 6.03     22.0    aus 34   P
                              9   Lc0 32856   20.5    aus 33   P
                             13  Lc0 32930
                             17  Komodo 12.3
                             20  Laser 1.7
Parent - - By Benno Hartwig Date 2019-03-24 18:30 Upvotes 3
Thanx, aber meiner Meinung nach bist du viieel zu schnell bereit, aus saukurzen Testläufen irgendwas herauszuspekulieren.

Ich hatte bei meinen Versuchen mit SF-Änderungen schon so häufig Testläufe, bei denen "mein Baby" zunächst mit 10 oder auch 15 Punkten in Führung ging ("Hey, nun habe ich was Tolles gemacht!"), um am Ende dann doch nur ungefähr Gleichstand zu haben oder sogar schwächer geworden zu sein.
Du hast immer ein erhebliches Rauschen der Ergebnisse, und bei Sequenzen unter 100 Parien wirkt sich dies drastisch aus.

Wenn "mein Baby" deutlich Mist zusammen spielte, dann habe ich das auch schon aus  100 Partien gelesen.
Ansonsten habe ich mich nicht gern mit Testläufen unter 1000 Partien zufrieden gegeben.

Deine Ergebnisse taugen als Indiz für ein "ja es könnte so sein", aber die Irrtumswahrscheinlichkeit ist aus meiner Sicht deutlich zu groß, um draus was zu schlussfolgern!
Aber jeder ist frei, dies auch anders zu sehen.

Benno
Parent - - By Reinhold Stibi Date 2019-03-25 05:50
Oh, wir haben bald Frühling und es zwitschert ein Vögelein.
Parent - - By Reinhold Stibi Date 2019-03-25 10:27 Upvotes 1
Benno, mit deinen Äußerungen "saukurzen Testläufen ..." liegst du vollkommen daneben.

58 Testdurchläufe,  die ich in der Regel absolviere, sind bestimmt nicht saukurz und dabei wird auch bestimmt
nicht herausspekuliert.
Diese sind vollkommen ausreichend und sehr aussagekräftig.

Bei der menschlichen Schachweltmeisterschaft waren es 12 Partien. Bei mir mit Computerschach ca. 5 x  mehr.

Sage mir einen Wettkampf wo es mehr als 58 Durchläufe gibt.

Deine Angabe mit 1000 Partien ist vollkommener Quatsch. Dann richte doch 2000 Partien aus und behaupte,
dass eine Engine die eine  Partie mehr gewonnen die bessere Engine wäre.

Wenn bei 10 Partien 9 remis ausgehen und eine gewonnen wird ist das ein Elovorteil von 35.

Von einer besseren Engine würde ich sprechen von mindestens + 20 Elo.

Mit meinen Testbedingungen würde ich sagen, dass die Fehlerquote bei ca. 20 Elo liegt, also sehr genau ist.

Mehr als 58 Durchgänge finde ich unsinnig, da unbedeutend aussagekräftiger,  das habe ich aus großer Praxis erfahren.

Wer denn hier im Forum macht denn mehr und von deiner Seite kommt da gar nichts.
Parent - - By Guenter Stertenbrink Date 2019-03-25 13:02 Edited 2019-03-25 13:14 Upvotes 1
ich mach meist 1000 standardmaessig. Die meisten "Buecher" habe 500 Eroeffnungen,
die mit vertauschten Faeben gespielt werden.
Durchschnittliche Abweichung von echter Elo = 4.5  bei 1000 Partien.
Bei 58 Partien muesste die durchschnittliche Abweichung von der echten Elo bei ca.20 liegen.

95% confidenzintervall ist glaub ich ca +-4 Elo bei 10000 (nextchessmove)
==>+-13 bei 1000 , +-40 bei 100 , +-126 bei 100 , +-400 bei 10 Partien

stockfish regression tests sind 40000 Partien
Parent - By Horst Sikorsky Date 2019-03-25 20:43
Guenter Stertenbrink schrieb:

ich mach meist 1000 standardmaessig. Die meisten "Buecher" habe 500 Eroeffnungen,
die mit vertauschten Faeben gespielt werden.
Durchschnittliche Abweichung von echter Elo = 4.5  bei 1000 Partien.
Bei 58 Partien muesste die durchschnittliche Abweichung von der echten Elo bei ca.20 liegen.

95% confidenzintervall ist glaub ich ca +-4 Elo bei 10000 (nextchessmove)
==>+-13 bei 1000 , +-40 bei 100 , +-126 bei 100 , +-400 bei 10 Partien

stockfish regression tests sind 40000 Partien

warum testen wenn es sowieso gleich bleibt
Parent - By Benno Hartwig Date 2019-03-25 13:16 Upvotes 2

> Sage mir einen Wettkampf wo es mehr als 58 Durchläufe gibt.


Beim Computerschacht: überall

bei Menschenwettkämpfen: kaum
Aber da wird dann auch nur erklärt, dass in diesem Wettkampf ein Sportler überlegen war
und nicht ernsthaft, dass dadurch erkannt wurde, dass er objektiv der beste ist.

Benno
Parent - - By Wolfgang Battig Date 2019-03-25 13:52 Upvotes 3
Reinhold Stibi schrieb:

Benno, mit deinen Äußerungen "saukurzen Testläufen ..." liegst du vollkommen daneben.


Nein, tut er nicht.

Zitat:
58 Testdurchläufe,  die ich in der Regel absolviere, sind bestimmt nicht saukurz und dabei wird auch bestimmt
nicht herausspekuliert.
Diese sind vollkommen ausreichend und sehr aussagekräftig.


Nein, sind sie nicht, bei weitem nicht.

Zitat:
Bei der menschlichen Schachweltmeisterschaft waren es 12 Partien. Bei mir mit Computerschach ca. 5 x  mehr.


Ja, aber nach der WM hat niemand behauptet (!), dass Carlssen (außer im Schnellschach, was vorher schon bekannt war) der bessere war, so wie du es ständig tust, wenn du ein Netz für "klar" besser hältst, weil es in einem (!), kurzen (!) Wettkampf etwas (!) besser abgeschnitten hat als ein anderes.

Das ist statistischer Unfug, sorry.

Zitat:
Sage mir einen Wettkampf wo es mehr als 58 Durchläufe gibt.


Du lernst es nicht oder? In den bekannten Ranglisten (CCRL, CEGT, SPCC usw. usw.) werden fast immer (!) deutlich mehr gespielt.
Bei uns (CEGT) sind es bei den kürzeren Bedenkzeiten 100-200, nur bei 40/120 Turnierbedenkzeit sind es 50. Und nicht nur gegen ein oder zwei Engines, sondern gegen möglichst viele im Rahmen einer gewissen ELO-Range. Das ist das Wesen einer Rangliste

Stefan Pohl (SPCC) spielt m.W. nochmal deutlich mehr.

Zitat:
Deine Angabe mit 1000 Partien ist vollkommener Quatsch. Dann richte doch 2000 Partien aus und behaupte,
dass eine Engine die eine  Partie mehr gewonnen die bessere Engine wäre.


Wer behauptet das? Niemand.

Zitat:
Mit meinen Testbedingungen würde ich sagen, dass die Fehlerquote bei ca. 20 Elo liegt, also sehr genau ist.
Mehr als 58 Durchgänge finde ich unsinnig, da unbedeutend aussagekräftiger,  das habe ich aus großer Praxis erfahren. 


Jetzt wird's aber wirklich skuril. Für ein Fehlerintervall von +- 20 Punkten brauchst du den gängigen Auswertungsprogrammen (ELOStat, Ordo) zufolge ca. 1000 Partien. Was für ein Intervall bei 58 herauskommt, will ich gar nicht wissen...

Aber ok, das sind wahrscheinlich alles "Fake News", die deiner "großen Praxis" natürlich nicht standhalten.

Ehrlich, langsam kommst Du mir wie ein Geisterfahrer vor, der meint ALLE anderen fahren in die falsche Richtung.

Ich habe nichts gegen deine Tests, jeder soll das machen, was ihm Spaß macht. Nur die Schlussfolgerungen daraus sind teils mehr als grenzwertig. Vor allem wenn man daraus dann noch Vorwürfe generiert, siehe dein Eingangsposting von wegen alter Suppe und so.

Besonders ärgert es mich, dass Du so etwas schreibst, OHNE dich offensichtlich vorher korrekt zu informieren.
Ich spreche nur für CEGT, aber wir haben das Network 32930 (ist das das vom letzten Superfinale?) bereits seit Ende Januar im Test, siehe http://cegt.forumieren.com/t1082-testing-lczero-v0-20-2-32930#2253

Daraus ergab sich der zweite Platz in der Rangliste, siehe http://www.cegt.net/40_4_Ratinglist/40_4_single/rangliste.html.

Allerdings sind die Bedingungen recht "leela-freundlich" bei einem durchschnittlichen Ratio von 1,4

Auch ein Test für unsere 5'+3"-Liste mit Ponder läuft. Da wir die Liste momentan aber etwas umstellen, z.B. auf 100 Partien pro Wettkampf statt bisher 50 (!!), findet das noch im internen Bereich statt, der nur für Tester zugänglich ist. Wird aber bald veröffentlicht.

Fazit aus beiden Tests bisher: Unter Ranglistenbedingungen kommt Leela an Stockfish bei weitem noch nicht heran, was an der immer noch vorhandenen taktischen Schwäche (wird aber besser) und der ab und zu auftauchenden Unfähigkeit liegt, gewonnene Stellungen auch wirklich zu gewinnen

Und natürlich werden wir auch zukünftig aktuelle Networks testen, allerdings zwei bis maximal drei mal pro Jahr ein dann jeweils aktuelles, ähnlich wie bei Stockfish-Development Versionen. Wir betreiben nämlich keine Leela-Listen sondern Computerschach-Listen und dazu gehört die 2300er oder 2500er Engine genauso wie Stockfish, Leela, Komodo, Houdini usw.

Unabhängig davon welche Sau gerade durchs Dorf getrieben wird.
Parent - - By Benno Hartwig Date 2019-03-25 14:29

> Unter Ranglistenbedingungen kommt Leela an Stockfish bei weitem noch nicht heran,...


Ich finde toll, dass ihr auch Leela im Rating-Ablauf habt!
Ich fand eben auf euren Seiten nicht, mit welcher Hardware Leela arbeiten darf.
Für mich ist halt immer noch so eine große Unbekannte, welche GPU-vs.-CPU-Paarung tatsächlich als "gerecht" angesehen werden sollte. Und woran diese Gerechtigkeit eigentlich festgemacht werden sollte.

Benno
Parent - - By Reinhold Stibi Date 2019-03-25 15:28 Upvotes 1
Hauptsächlich an Wolfgang Battig:

Anscheinend habe ich voll ins Schwarze getroffen mit meiner Meinung, dass CCRL und CEGT mehr up to date
sein sollten.

Jeder der von der Materie etwas versteht weiß dass Lc0 inzwischen mit Stockfish 10 von der Spielstärke gleich
steht und besser ist wie Houdini 6.03 und Komodo 12.3 oder 12.1 .

Deine Aussage dass Leela an Stockfish bei weitem noch nicht herankommt ist vollkommen falsch.
Das zeigt dass  du überhaupt nicht auf dem laufenden bist. Wie kannst du auch, da du dich selber überhaupt nicht
oder kaum mit Lc0 beschäftigt hast.

Deine weitere Aussage dass ihr aktuelle Leela Networks nur 2 bis 3 Mal pro Jahr testen wolllts zeigt ja weiterhin
eure Rückständigkeit. Jeden Tag kommen zig neue Networks mit z.T. erheblichen Verbesserungen die ich mit
meinen eigenen Testsh überprüfe.

Z.Zt. läuft bei mir der Test mit dem Network 41680 vom 24.03.19  mit GTX 1050 Ti  gegen Stockfish 10
mit Xeon E5345  mit 3 CPU. Also die Hardware dürfte da ausgeglichen sein.

Bis jetzt sind 64 Partien gespielt  mit meinen üblichen Testbedingungen   +9   =48   -7    = 51,6 %    =+11 Elo für Lc0.

Da kommst du mit deiner hanebüchenden Behauptung, die einfach nicht stimmt, dass Leela bei weitem nicht an Stockfish
herankommt.
Du bist bestimmt nicht der Fachmann für Lc0.

Inzwischen sind die von dir angeführten Schwächen von Lc0 weitgehend (fast ausschließlich) behoben, das ist dir aber
nicht bekannt.

Meine Kritik ändert aber nicht, dass ich CCRL und CEGT gut finde und die unermüdliche Arbeit der Tester schätze.
Lc0 ist einfach zu schnell für euch, da kommt ihr nicht mehr mit.
Parent - - By Reinhold Stibi Date 2019-03-25 16:10 Upvotes 1
Ergänzend:

Ich bleibe bei meiner Meinung, dass 58 Testdurchläufe gegen eine Engine vollkommen ausreichend und sehr
aussagekräftig sind.

Warum sollte das menschliche Schach nicht mit dem Computerschach verglichen werden.

Wenn ich im Schachclub 58 Partien gegen einen Menschen spiele, dann sagt das Ergebnis schon sehr viel.

Da würde mich jeder auslachen wenn ich sagen würde, das sagt ja nichts; es müssten mindestens 100
oder mehr Partien gegen einen Gegner gespielt sein.

Wenn eine Engine 58 Chancen hat zu zeigen, dass sie die bessere Engine ist, dann muss das reichen.

Wolfgang Battig sollte auch mehr auf Argumente eingehen die leider überflogen werden.

CEGT testet Lc0 mit Net 32930 das nicht das stärkste 32er Net ist. Da beruft man sich auf TCEC
bedenkt aber nicht dass diese absolute Spitzenhardware sonst niemand hat, also für den normalen
Bürger gar nicht aussagekräftig ist.
Bei mir hat Lc0 mit GTX 960 nach 50 Partien gegen Stockfish 10  mit -42  Elo abgeschnítten.
Das Net 32877 dagegen nach 64 Partien mit  -22 Elo.
Mich würde interessieren ob CEGT mehrere 32er Nets geprüft hat oder einfach Net 32930 übernommen hat.

Auch ging an CEGT vorbei, das es schon längst das 40er Net gibt und inzwischen mit Stockfish 10 von der
Spielstärke gleichgezogen hat. Natürlich ist Stockfish 10 die ausgereiftere Engigne die für die Analyse einer
Partie viel besser geeignet ist.

Stefan Pohl hat, so viel ich in Erinnerung habe, Lc0 je mit 36 Partien gegen eine Engine geprüft. Das ist
auch vollkommen in Ordnung.

Lieber Wolgang Battig, du solltest dich mit deinem Besserwisserton zurückhalten, besonders in Sachen
in denen du wenig Ahnung hast.

Trotzdem schöne Grüße

Reinhold
Parent - - By Florian Wieting Date 2019-03-25 16:28 Edited 2019-03-25 16:37 Upvotes 1
Reinhold Stibi schrieb:


Lieber Wolgang Battig, du solltest dich mit deinem Besserwisserton zurückhalten, besonders in Sachen
in denen du wenig Ahnung hast.



Hallo, Reinhold,

erstens hat Wolfgang keinen Besserwisserton benutzt, sondern klare und deutliche  Argumente formuliert.
Zweitens hast du deine Thesen jetzt häufig genug hier dargestellt, sie werden durch ständige Wiederholung nicht wahrer.
Drittens scheinst du es zu sein, der im Thema Statistik etwas zu schwimmen scheint.

Gruß
Florian

PS. Grammatikfehler korrigiert
Parent - - By Reinhold Stibi Date 2019-03-25 17:09 Upvotes 1
Hallo Florian,

Wolfgang hat eben nicht mit klaren und deutlichen Argumenten formuliert sondern
eindeutige Unrichtigkeiten behauptet die durch die Tatsachen klar widerlegt sind.

Es sind bei mir keine Thesen sondern handfeste Testergebnisse und die sind objektiv.

Ich will auch gar kein Statistiker sein und ob ich da mit 10 Elo falsch liege ist
vollkommen egal.

Wolfgang braucht auch deine Hilfe nicht, besonders wenn sie nicht angebracht ist, da er
sich selbst genug darstellen kann.

Unrichtigkeiten werden auch durch Unterstützung nicht wahrer.

Gruß

Reinhold
Parent - - By Florian Wieting Date 2019-03-25 17:44
Reinhold Stibi schrieb:

Wolfgang braucht auch deine Hilfe nicht, besonders wenn sie nicht angebracht ist, da er
sich selbst genug darstellen kann.


Klare Ansage: Wen ich unterstütze, das entscheide ich und nicht du.
Da sind bei dir offensichtlich ein paar Maßstäbe verrutscht. Das zeichnete sich aber bereits ab!
Parent - - By Hauke Lutz Date 2019-03-25 17:50
Ich glaube Tom heißt jetzt Reinhold..
Parent - By Florian Wieting Date 2019-03-25 17:59
Nein, Hauke,

Tom wird auf Jahre unvergleichlich bleiben.
Da tust du wiederum Reinhold unrecht. Er schreibt eindeutig über Themen, über die man trefflich diskutieren kann. Das sind ja keine inhaltsleeren Beiträge.

Viele Grüße
Florian
Parent - By Wolfgang Battig Date 2019-03-25 18:09 Upvotes 1
Reinhold Stibi schrieb:


Anscheinend habe ich voll ins Schwarze getroffen mit meiner Meinung, dass CCRL und CEGT mehr up to date
sein sollten.

voll daneben trifft es wohl eher

Zitat:
Jeder der von der Materie etwas versteht weiß dass Lc0 inzwischen mit Stockfish 10 von der Spielstärke gleich
steht und besser ist wie Houdini 6.03 und Komodo 12.3 oder 12.1 .

Für Einzelwettkämpfe stimmt das sogar (habe nie was anderes behauptet), ist auch an unseren Einzelmatches nachzulesen. Gegen Stockfish etwa ausgeglichen, gegen Houdini und Komodo hat LC0 gewonnen.

In einer Rangliste, wo auch gegen "schwächere" Gegner zu spielen ist, kommt LC0 mit Stockfish (noch) nicht ganz mit.

Übrigens ist das im Menschenschach oder anderen Sportarten wie z.B. Tennis auch so oder spielst du im Verein nur gegen gleichstarke??

Zitat:
Deine Aussage dass Leela an Stockfish bei weitem noch nicht herankommt ist vollkommen falsch.

Ich schrieb "unter Ranglistenbedingungen". Bitte alles lesen was da steht, danke.

Zitat:
Das zeigt dass  du überhaupt nicht auf dem laufenden bist. Wie kannst du auch, da du dich selber überhaupt nicht
oder kaum mit Lc0 beschäftigt hast.

Wie kannst Du beurteilen, was ich weiß und was nicht? Oder mit was ich mich beschäftige?
Ich beschäftige mich mit Computerschach und damit auch mit LC0. Aber nicht ausschließlich.
Und ich binde vor allem nicht jedem alles auf die Nase. Dafür sind andere zuständig...

Zitat:
Deine weitere Aussage dass ihr aktuelle Leela Networks nur 2 bis 3 Mal pro Jahr testen wolllts zeigt ja weiterhin
eure Rückständigkeit.


Vielseitig nicht rückständig, Reinhold.
Nur weil wir uns nicht auf dieselbe Art mit Computerschach beschäftigen wie du, heißt nicht dass ahnungslos oder rückständig sind. Warum sollten wir alles stehen und liegen lassen und uns nur noch mit LC0 beschäftigen? Ist doch langweilig. Wenn es das für dich nicht ist, meinetwegen, alles gut. Aber höre bitte auf, andere, die nicht alles so machen wie du es für richtig hältst, als ahnungslos oder rückständig zu bezeichnen.

Zitat:
Jeden Tag kommen zig neue Networks mit z.T. erheblichen Verbesserungen die ich mit
meinen eigenen Testsh überprüfe.

Es steht dir frei, dich so mit der Materie zu beschäftigen wie du willst. Schön wäre, wenn du einfach andere Sicht- und Herangehensweisen akzeptieren und nicht verunglimpfen würdest.

Zitat:
Z.Zt. läuft bei mir der Test mit dem Network 41680 vom 24.03.19  mit GTX 1050 Ti  gegen Stockfish 10
mit Xeon E5345  mit 3 CPU. Also die Hardware dürfte da ausgeglichen sein.
Bis jetzt sind 64 Partien gespielt  mit meinen üblichen Testbedingungen   +9   =48   -7    = 51,6 %    =+11 Elo für Lc0.
Da kommst du mit deiner hanebüchenden Behauptung, die einfach nicht stimmt, dass Leela bei weitem nicht an Stockfish
herankommt.

Reinhold, ein (aller)letztes Mal: Für einzelne Wettkämpfe LC0 vs. Stockfish bestreite ich das gar nicht. Bei mir hat LC0 auch schon gegen SF gewonnen.
Meine angeblich "hanebüchene Behauptung" bezieht sich auf Ranglistenbedingungen und da ist sie einigermaßen korrekt.

Zitat:
Du bist bestimmt nicht der Fachmann für Lc0.

Habe ich das behauptet?
Frage ist nur, ob man ein "Superexperte" sein muss, um mitzureden...

Zitat:
Inzwischen sind die von dir angeführten Schwächen von Lc0 weitgehend (fast ausschließlich) behoben, das ist dir aber
nicht bekannt.

Unser nächster LC0-Test mit einem dann aktuellen Network wird es zeigen

Zitat:
Lc0 ist einfach zu schnell für euch, da kommt ihr nicht mehr mit.

Glaub mir, wenn wir wollten, kämen wir da locker mit. Genauso wie wir bei den Stockfish-Development-Versionen hätten mitkommen können, als diese gehypt wurden.

Und ich wiederhole mich gern, aber auch zum letzten Mal: Wir machen Computerschach, nicht Leela-Schach.

Für mich ist hier EoD
Parent - - By Wolfgang Battig Date 2019-03-25 17:26 Upvotes 2
Die Hardwareverteilung findest Du unter dem ersten Link, http://cegt.forumieren.com/t1082-testing-lczero-v0-20-2-32930#2253

Bei Gerhard Sonnabend:
GTX1060 <=> Intel i7-8750H @ 4.0 GHz
(ist ein Notebook)

Bei mir:
GTX970 <=> Intel i7-4770 @ 3,4 GHZ

Für das Problem der Vergleichbarkeit zwischen CPU und GPU gibt es m.W. nur die Leela-Ratio. Vielleicht nicht optimal, aber nicht zu ändern.
Als wir starteten haben GS und ich das länger diskutiert, v.a. wie wir mit dem für Leela positiven Ratio (ca. 1,4 ist eigentlich deutlich zuviel) umgehen sollen. Man kann natürlich der anderen Engine mehr Cores geben. Für eine Single-Core Liste wie z.B. die 5+3 ist das aber irgendwie komisch. Man gibt der Engine 2 Cores und tut so als ob es nur einer wäre?! Denn in der Liste steht ja z.B. Stockfish 10.0 x64 1CPU.

Wir haben uns dann entschieden, das für Leela positive Ratio hinzunehmen, obwohl es einem unserer wichtigsten Grundsätze widerspricht, nämlich "gleiche Hardware". Aber das ist halt schwierig und wird immer schwieriger, da sich die Grafikkarten viel schneller entwickeln als die CPUs. Das was wir da im Einsatz haben ist ja noch nicht mal mehr Mittelklasse.

Bei einer GTX1080 (auch nix dolles mehr) im PC eines meiner Söhne mit einer i7-4790k CPU mit 4,4 GHZ liegt das Ratio bei einem Core bei ca. 3,0. Über die neuen RTX-Karten will ich gar nicht sprechen.

Zumindest kann uns kein Leela-Fanboy oder sonstiger Superexperte, der sich hier rumtreibt, vorwerfen wir würden die aktuell durchs Dorf getriebene Sau benachteiligen...
Parent - - By Reinhold Stibi Date 2019-03-25 18:14
Hallo Wolfgang,

es freut mich wenn wir im sachlichen und freudlichen Ton zurückfinden.

Man kann ja unterschiedlicher Meinung sein und trotzdem den Anderen respektieren.

Eine aussagekräftige Rangliste braucht natürlich erheblich mehr Zeit als die die
aktuellen Matches mit Lc0 und Stockfish 10 als Standard.

Bei Lc0 ändert sich halt sehr viel schnell. Es gab auch etliche Enttäuschungen und Rückschläge.

Es gibt auch sicherlich noch viele Verbesserungen bei Lc0 besonders z.B. beim Mattsetzen mit
wenigen Figuren, da schlägt man manchmal die Hände über den Kopf, dass eine absolute Spitzenengine
so umständlich spielt. Insgesamt ist Lc0 aber inzwischen wesentlich sicherer geworden.

Bin selber überrascht dass Lc0 nach 72 Partien mit GTX 1050 Ti  gegen Stockfish 10  mit + 10 Elo führt
und mit meinem anderen Computer mit GTX 960 nach 35 Partien mit + 60 Elo (mit heutigem Net 41688).

Bin aber nach wie vor auch ein Stockfish Fan.

Gruß

Reinhold
Parent - By Tom Paul Date 2019-03-25 18:25
Reinhold Stibi schrieb:

Hallo Wolfgang,

es freut mich wenn wir im sachlichen und freudlichen Ton zurückfinden.

Man kann ja unterschiedlicher Meinung sein und trotzdem den Anderen respektieren.

Eine aussagekräftige Rangliste braucht natürlich erheblich mehr Zeit als die die
aktuellen Matches mit Lc0 und Stockfish 10 als Standard.

Bei Lc0 ändert sich halt sehr viel schnell. Es gab auch etliche Enttäuschungen und Rückschläge.

Es gibt auch sicherlich noch viele Verbesserungen bei Lc0 besonders z.B. beim Mattsetzen mit
wenigen Figuren, da schlägt man manchmal die Hände über den Kopf, dass eine absolute Spitzenengine
so umständlich spielt. Insgesamt ist Lc0 aber inzwischen wesentlich sicherer geworden.

Bin selber überrascht dass Lc0 nach 72 Partien mit GTX 1050 Ti  gegen Stockfish 10  mit + 10 Elo führt
und mit meinem anderen Computer mit GTX 960 nach 35 Partien mit + 60 Elo (mit heutigem Net 41688).

Bin aber nach wie vor auch ein Stockfish Fan.

Gruß

Reinhold


Lc0 ist und bleibt stärker/besser als Stockfish und das ist doch das Wichtigste.
Parent - By Lothar Jung Date 2019-03-25 18:27
PCs schlugen Schachcomputer.
Smartphones gewannen gegen Schachcomputer.
Mehrkern-CPUs gewinnen gegen Single-Core-CPUs.
Aktuelle GPUs (RTX) gewinnen gegen Mehrkern-CPUs.
GPU-Rig gewinnt gegen Multi-CPU-Server.
KI gewinnt gegen A/B.
Up Topic Hauptforen / CSS-Forum / CCRL und CEGT sollten mehr up to date sein !

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill