Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / AMD veroweffentlicht unerwartete zen3+ Details, +20 pritent
- - By 2phil4u Date 2021-06-01 19:14
Stacked memory, riesen Cache.
Performance +20 Prozent
Szene ist begeistert.
https://www.anandtech.com/show/16725/amd-demonstrates-stacked-vcache-technology-2-tbsec-for-15-gaming
Parent - - By Reinhold Stibi Date 2021-06-01 20:03 Edited 2021-06-01 20:05
Parent - - By 2phil4u Date 2021-06-01 21:39 Edited 2021-06-01 22:07
Bedeutet mehr nodes per second.
Wieviel Steigerung speziell fuer Schach engines Weiss ich nicht.
Aber fuer Sachen wie hash sollte es einiges bringen.
Durch die Nnue bedingte rechenintensivere Bewertung hat sich eh viel verändert.
Generell ist so ein Cache bei Sachen wie hash von grosser Bedeutung.
Fuer chess engines würde ich von etwa
10 % ausgehen, was schon eine Menge ist nur fuer cache
Parent - By Benno Hartwig Date 2021-06-01 23:07 Upvotes 1

> Aber fuer Sachen wie hash sollte es einiges bringen.


Warum?
Gerade da hätte ich nur besonders kleine Effekte erwartet.
Der Cache ist im Vergleich zum Hash-Bereich sehr klein, und auf den Hash-Bereich wird typischerweise in seiner ganzen Breite "buntgesprenkelt" hineingegriffen. Ein Griff auf eine Stelle lässt keine Erwartung zu, wohin der nächste Zugriff geht. Dass bei solche einem Zugriff "irgendwohin" etwas getroffen wird, was bereits im Cache ist, hätte ich nun eher nur ganz besonders selten erwartet.

Aber grundsätzlich hast du natürlich Recht: etwas schneller wird die Engine sein.
10% könnte sein, aber das ist Spekulation.
Wir werden es erst bei ersten praktischen Tests sehen.
Parent - - By Max Siegfried Date 2021-06-01 20:09 Upvotes 1
Was bedeutet das für Schach Engine Nutzer?
Parent - - By Reinhold Stibi Date 2021-06-02 08:26
Richtig interessant wird es wenn AMD 2022 mit der Zen 4  Technik kommt mit 5 nm
und vielleicht 2023 oder 2024 mit 3 nm.

Aber auch die jetzige Technologie von AMD mit Zen 2, Zen3 ist für Schach vollkommen
ausreichend.
Der Fortschritt, auch wenn er nicht zwingend notwendig ist, lässt sich nicht aufhalten.

Für Schach bringen 20 % Steigerung nicht viel; erst eine Verdoppelung oder Verdreifachung
bringen einen merkbaren Fortschritt.
Parent - - By Max Siegfried Date 2021-06-02 08:35
Oder 128 echte AMD Threadripper Kerne.
Parent - By Reinhold Stibi Date 2021-06-02 08:54 Edited 2021-06-02 09:15
128 Threadripperkerne bringen doch für Schach nicht viel,
wenn schon mit dem 4 Kerner schon meistens der optimale
Zug gefunden wird.
Für eine sehr schnelle, gute Analyse genügt auch jetzt schon
ein AMD 9  5950.

Wichtig finde ich auch einen geringen Energieverbrauch; dieser
wirkt sich dann auch positiv für die Kühlung des Prozessors aus
und damit auf die Lautstärke des PCs.

Der AMD 9 5950 ist da mit 105 Watt schon sehr gut.

Für eine vergleichbare Leistung/Spielstärke bei Lc0 bräuchte man 2 RTX 3080er
und die brauchen mit ca. 500 Watt viel zu viel Energie.
Parent - - By 2phil4u Date 2021-06-02 15:37
Die Annahme, dass sehr starke Hardware bei Schach kaum was bringt halte ich fuer zu kurzgegriffen
Würde man zb remis nicht zaehlen, dann Waere der Unterschied sehr gross.
Bei sehr langen Bedenkzeit und wenig Elo Unterschied gewinnt wohl nur noch die bessere Engine mit Weiss
Lc0 läuft auf Gpu, die Performancesteigerungen waren hier in den letzten 10 Jahren viel groesster.
Und es wird massiv an spezieller KI Hardware geforscht.
Mehr als 10 fache Performance fuer spezielle Aufgaben.
Was nnue betrifft, wahnsinnige Verbesserung der Bewertung, aber rechenintensiver.
Könnte man die Bewertung nicht auf spezielle Hardware auslagern.
Die sollte doch sicherlich 10 mal schneller sein.
So könnte man ein grosses Netz nehmen und Waere schneller als stockfish classic.
Parent - - By Olaf Jenkner Date 2021-06-02 15:42 Upvotes 1
2phil4u schrieb:

Was nnue betrifft, wahnsinnige Verbesserung der Bewertung, aber rechenintensiver.
Könnte man die Bewertung nicht auf spezielle Hardware auslagern.
Die sollte doch sicherlich 10 mal schneller sein.

Das gibt es schon - nennt sich GPU.
Parent - By 2phil4u Date 2021-06-03 08:27
10 Mal schneller als Gpu.
Zahlreiche start ups forschen an Hardware und Software fuer KI.
Und genau solche Berechnungen finden ja bei Lc0 statt.
Parent - By Lothar Jung Date 2021-06-02 17:42 Edited 2021-06-02 17:54
Die beide Berechnungsmethoden, der seriellen CPU und der Parallelen GPU, sind mathematisch sehr unterschiedlich.
Eine moderne CPU beherrscht durch ihre Vektoreinheiten auch paralelle Vektorberechnungen (AVX).

Eine Ryzen 3970 CPU erreicht 1,9 (fp16) Terraflops, eine RTX 3080 238 Tensor-TFLOPs.
Aber die Algebra bei der KI ist viel aufwändiger, als bei NNUE, die mit Vektorenalgebra arbeitet.
Ist eine GPU über 100 mal schneller, ja, aber nur in ihrem parallelen Spezialbereich.

Eine Übertragung der Vektorenberechnung auf einer GPU ist derzeit nicht sinnvoll, da die Latenzen der Übertragung über den PCI-Bus viel höher sind als ein RAM-Speicherzugriff.

Beide Ansätze (Lc0 und NNUE) greifen auf Netze zu, die aber mathematisch unterschiedlich ge- und verrechnet werden.
Man sieht es auch an den Trainings- und Engine-Parametern, daß der Lc0-Ansatz wesentlich komplizierter ist.
Auch ist die Suche der beiden Bereiche unterschiedlich angelegt (A/B, Punct, MonteCarloSearch); also Suchbaumberechnung/Wahrscheinlichkeitsberechnung.

Aber die KI steckt noch in ihren Kinderschuhen, der Fortschritt ist schwer vorherzusehen. Beim Schach könnte sich jedoch eine Sättigung abzeichnen.

Lothar
Up Topic Hauptforen / CSS-Forum / AMD veroweffentlicht unerwartete zen3+ Details, +20 pritent

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill