Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Lc0 auf Mac mini wurde optimiert
- - By Lothar Jung Date 2026-03-16 16:37 Upvotes 1
https://github.com/LeelaChessZero/lc0/pull/2401

Parallel auf GPUs und NPU.

Es wird nicht die schnellste Hardware sein aber die leiseste und sparsamste.
Parent - - By Max Siegfried Date 2026-03-17 01:55
Das sieht mir eher aus nach einer Einführung als nach einer Optimierung.
Trotzdem doppelte NPS - siehe Median.
Es ist schon unglaublich gut das LC0 auf einmal doppelt so schnell auf Apple Hardware ist wie kurz zuvor.
Ich hatte eigentlich nur mit +30% gerechnet aber +100% sind auch ganz nett   
Hoffentlich denken die Entwickler daran die anderen Sachen für Apple Hardware "einzuführen" zu "optimieren".

Was sagen eigentlich die Stockfish Entwickler dazu?
Gab es da auch schon irgendwelche ersten Tests diesbezüglich?
Das bei Stockfish noch gigantisch viele Verbesserungen für Apple Hardware offen sind, +300% bis +400%, ist allseits bekannt.
Parent - By Lothar Jung Date 2026-03-17 08:03 Upvotes 1
Deine Fragen werden bei Discord Lc0 adressiert.
Parent - - By Lothar Jung Date 2026-03-17 09:32 Upvotes 1
Trying the full lc0 benchmark on BT4 testing master onnx-coreml v multiplexing however yielded the following. The first is your PR then master onnx-coreml

```(venv) george@MacBook-Pro-M5 lc0 % time build.ccy/release/lc0 benchmark -w BT4 \        
  -b multiplexing \
  -o "gpu(backend=onnx-coreml,compute_units=CPUAndGPU,threads=2,max_batch=64),npu(backend=onnx-coreml,compute_units=CPUAndNeuralEngine,threads=2,max_batch=64)" \
  --minibatch-size=64 -t 4
===========================
Total time (ms) : 347577
Nodes searched  : 1451794
Nodes/second    : 4177

(venv) george@MacBook-Pro-M5 lc0 % time ../../lc0/build/release/lc0 benchmark -w BT4 -b onnx-coreml
===========================
Total time (ms) : 341331
Nodes searched  : 1479210
Nodes/second    : 4334```
Parent - - By Max Siegfried Date 2026-03-17 10:38
Wie viele nps erreichen die verschiedenen RTX GPUs unter gleichen Bedingungen mit dem BT4 Netz?
Parent - By Christian Petersen Date 2026-03-17 22:42
Max Siegfried schrieb:

Was sagen eigentlich die Stockfish Entwickler dazu?
Gab es da auch schon irgendwelche ersten Tests diesbezüglich?


Frag sie doch einfach. Die sind erreich- und ansprechbar. Discord. Github.

Max Siegfried schrieb:

Das bei Stockfish noch gigantisch viele Verbesserungen für Apple Hardware offen sind, +300% bis +400%, ist allseits bekannt.


Aha.
1. Wie - bzw. womit/wodurch wären denn bei Stockfish noch
Zitat:
gigantisch viele Verbesserungen für Apple Hardware offen
?
2. Wo wäre das
Zitat:
allseits
bekannte konkret zu finden?

Beste Grüße!
Parent - By Max Siegfried Date 2026-03-18 09:19
Nicht die schnellste Hardware... wohl eher nicht die schnellste Software(LC0) auf Apple Geräten.

Es fehlen bzw. sind noch nicht erledigt und daher noch offen:
1. Use fp16 data type for metal tensors https://github.com/LeelaChessZero/lc0/pull/2132
2. Optimize metal/graph inference https://github.com/LeelaChessZero/lc0/pull/2245
3. Use constant tensors for metal backend https://github.com/LeelaChessZero/lc0/pull/2320
4. fix: use correct AArch64 NEON/FP16 flags in meson.build https://github.com/LeelaChessZero/lc0/pull/2390
5. Add configurable MLComputeUnits option to onnx-coreml backend https://github.com/LeelaChessZero/lc0/pull/2401
6. Add MLX backend for Apple Silicon https://github.com/LeelaChessZero/lc0/pull/2381 !!!

Das wäre dann RTX 5090 Niveau 
Wobei ein M5 ULTRA jetzt schon ungefähr auf RTX 5070 Niveau bzgl. LC0 wäre.
Up Topic Hauptforen / CSS-Forum / Lc0 auf Mac mini wurde optimiert

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill