1. Beim BT3 Netz kann man 3 Policies auswählen. Vanilla ist für 1 GPU. Optimistic ist für stärkere Hardware und taktische Herausforderungen, also besonders für die Analyse und Suites.
2. Das Trainingsprogramm für BT4 wurde fertiggestellt.
3. Das Schach-Plugin für GPT 4.0 ermöglicht Schachpartien in Stufen bis 3.000 Elo, tiefe und breite Eröffnungsbibliothek mit Erklärungen bis ins späte Mittelspiel und besonders FEN-Stellungsanalysen in Textform. Diese Features heben die Schachapplikation von Schachcomputer ab.
Auf meine früheren Beiträge wird verwiesen.
Zu BT4 ist nun folgendes auf Discord veröffentlicht worden:
Big transformer 4. New network architecture which builds off of BT3 by adding two types of auxiliary heads, future heads and categorical value heads. The categorical value heads predict a distribution over values of q rather than a WDL outcome distribution, and the future heads predict the moves that will be played over the next two plies. The hope is that these heads will give additional information to the net to improve training speed. We've also fixed half-precision training, so this model may be slightly larger. The tentative model has embedding size 1024, ffn projection size 1536, 32 attention heads per layer, and 15 smolgen encoder layers with mish nonlinearities.