Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / AlphaZero
1 2 3 4 5 Previous Next  
Parent - By Peter Martan Date 2017-12-08 18:24
Benno Hartwig schrieb:

Ich hatte sowas jetzt nicht für möglich gehalten. Ganz sicher nicht. Und ich staune.

D'accord.
Parent - By Benno Hartwig Date 2017-12-08 15:13
Die Aussagekraft mag größer sein als das Ergebnis von wenigen Partien. OK.
Ansonsten finde ich Partieergebnisse aber schon weit interessanter.
Benno
Parent - By Ingo Althöfer Date 2017-12-09 09:09
Hallo Herr Krauß,

Heiko Krauß schrieb:

wäre interessant AZ mal auf Stellungstests anzusetzen

und noch ein Vorschlag in ähnliche Richtung:
Alpha Zero auf interessante Stellungen aus 6-Steiner- oder
7-Steiner-Daten loszulassen.

Ich denke z.B. an Stellungen aus
KTS vs KLS.
Über solche Endspiele hatte ja Kasparow mal gesagt, dass er keine
Strukturen in den Siegführungen erkenne, solange es weit vom Matt
weg sei.

Ingo Atlhöfer.
- - By Christian Paluch Date 2017-12-09 15:31
Hallo

Nvidia hat vor kurzem erste Grafikkarte auf Basis der "Volta"-Architektur - die Titan V vorgestellt.
Unter anderem ist sie mit 640 "Tensor"-Kernen ausgestattet. Diese sind angeblich für die Verwendung
von selbstlernenden Softwarealgorithmen spezialisiert und sollen im Vergleich zur vorherigen Generation
eine Verbesserung um den Faktor 9 bringen. Die Karte soll eine Leistung von bis zu 110 Teraflops
an "Tensor-Performance" bringen. Für den Betrieb wird zumindest ein 600-Watt-Netzteil empfohlen.
Das Ding kostet 3000 Dolar . Ob der Karte Alpha Zero laufen wurde .

Viele Grüße
Christian
Parent - By Ingo Althöfer Date 2017-12-09 15:43
Lieber Herr Paluch,

Christian Paluch schrieb:

... Die Karte soll eine Leistung von bis zu 110 Teraflops
an "Tensor-Performance" bringen. Für den Betrieb wird
zumindest ein 600-Watt-Netzteil empfohlen.


bedeutet das, dass man die Fussbodenheizung ausschalten kann,
während das Teil läuft?

Unabhängig davon: Vielleicht wird es ein paar Monate dauern, aber
ich erwarte viele tolle Anwendungen vieler schlauer Köpfe für viele
schwere Probleme.

Ingo Althöfer.
- By 2phil4u Date 2017-12-15 21:30
Unkerufen zum Trotz.
Self learning und im 2. Schritt
Selbstprogrammierung Beats menschliches verstaendnis, ganz klar.
- - By 2phil4u Date 2017-12-20 22:21 Edited 2017-12-20 22:32
Ich habe mir das ganze nochmal durchgerechnet.
Zuerst war ich fasziniert von  den nur 40 TKnoten.
Aber dann habe ich mir mal überlegt was da an Flops pro knoten zusammenkommt.
Ich stelle mir das so vor.Es gibt Abertausende von Parametern, die immer getuned werden, jenachdeem die Maschine gewinnt  oder nicht.
Da nun falls eine Stellung wesentlich besser beurteilt wird die ganzen Parmameterarithmetik gändert werden muss, ohne das andere Stellungen nicht falsch bewertet werden muss es so  vielegeben.
So ein Knoten  ist nicht  wirklich ein Knoten, wie wir  ihn kennen, sondern es ist eine Stellung  die bei 500 Teraflops 10 Mia Berechnungen macht !!!
Das Programm sucht alle Züge, die vorkommen und die Bewertungen die sich aus unvorstellbar langen Berechnungenzusammenstellen.
In der Trainingsphase werden diese Milionen von Parmatern so geändert, das das Programmm meistens gewinnt, also es werden kleine Bereiche der Trilionen Bewertungsfaktoren geändert und wenn  das Vorteilhaft ist wird es  übernomme.
Sogesehen ist  so eine Bewertung nicht annähernd so simpel sondern  extrem rechenintensiv.
Ich vermute, das die Limitierung der engine darauf beruht, das irgendwann keine Änderungen mehr vorgenommen werden können um  eine spezielle Stellung besser zu bewerten ohne das dabei bei anderen  Stellungen schlechter bewertet  wird.
also ich stell mir das wie eine elendskomplizierte Multiplikation aus drölf Milionen Variablen vor.
Deshalb kann  die engine Monte Carlo spielen, die später nicht mehr NAchvollziehbaren Bewertungen, die entstehen werden einfach abgefragt und weil diese viel genauer sind muss auch nicht so viel bruteforce gerechnet werden, oder anders gesagt, diese drölf Milionen Parameter sehen eine Taktik aus dem Schachmuster selbst heraus.
Man könnte auch denken, das die engine das Spiel gegen sich selbst zu Ende spielt und sogesehen 40 oder waren es 80 T Züge pro Sekunde gemacht werden oder von der Stellung werden wenn einePartie  100 Züge hat 800 Partien pro Sekunde gespielt..
Sogesehen ist das zwar erstaunlich, aber dann eben doch sehr rechenintensiv.
Trotzdem ist der Ansatz der richtige. Eine engine mit  tausenden von parametern lernt aus Spielen die Gewinnschancen abzubilden.
Ich denke aber, wenn sie noch wesentlich stärker werden sollte braucht es noch mehr Parameter und noch mehr Training.
Aber das System skaliert und sie haben nicht so viel Zeit reingesteckt  speziell  für Schach, die Computerschachprogrammierung hatte mehr Zeit.
500 TFlops,  das sind 1000 CPU, ich  meine wennjemand einen Stockfish  endlich mal  auf Many Cores gut  optimmierenwürde, dann hättenwir  mit 1000 CPU locker 200 Elo mehr  bei 1 Min.

Vermutlich ist das ganze noch sehr umständlich, ich denke das bei sehr viel  stärkerer hardware sich dann irgendwann wesentlich einfachere und schnellere Algorithmen bilden.
Mit dieser Methode wäre schcach wohl in 20 Jahren  schwach gelöst, wenns bsp selbst eine 100-fach stärkere engine kein Spiel mehr gewinnt.

Es ist wohlein  tipping point, es sind so viele Variablen nötig, aber um nochmal viel besser zu sein reicht es irgendwann und in der ganzen  Berechnung  werden Vereinfachungen gefunden.
Es ist jetzt der Punkt gekomen, wo die  Rechenleistung ausreicht um maschinelles Lernen  sehr effekiv zu machen,  google hat wohl auch die intelligentesten Köpfe der KI Forschung.
Die Folgen des Ganzen sind klar.
Irgendwann bauen die Computer  sich selbst, da der Mensch zu dumm ist,Terminator.
Parent - By Frank Brenner Date 2017-12-21 02:01
Zitat:
Die Folgen des Ganzen sind klar.
Irgendwann bauen die Computer  sich selbst, da der Mensch zu dumm ist,Terminator.


Du bist ja volle Kanne auf die Google Propaganda hereingefallen.

Das ist es doch was Google der Weltbevölkerung suggerieren will, nämlich daß die Google Company sehr effiziente (also dem Menschen überlegene) Intelligenz in die Software und in die Maschinen einhauchen kann.

In Wahrheit dagegen, handelt es sich um pure Mathematik (Statistik).

Dabei ist diese Art des maschinellen Optimierens eines Spiels bereits seit vielen Jahren bekannt:
Logistello hat in den 90er Jahren hunderttausend Othello (Reversi) Partien studiert ( auf heutiger Hardware würde das Studium nur einige Sekunden dauern) und daraufhin - ohne Vorkenntnisse - eine exzellente Bewertungsfunktion selbst erstellt.
In dieser Bewertungsfunktion waren implizit alle menschlichen Weisheiten enthalten die menschliche Spitzenspieler im Laufe Ihres Lebens mit ihrem Gehirn durch mühevolles und ständiges Spielen erlernt haben
Menschliche Othello-Meister wurden daraufhin selbst auf einem Pentium 233Mhz mit 10:0 besiegt.

Das wurde aber nicht in der Weltpresse veröffentlicht.
- - By Guenter Stertenbrink Date 2017-12-29 13:35
hier eine oeffentliche Version :
https://github.com/Zeta36/chess-alpha-zero

Using supervised learning on about 10k games, I trained a model (7 residual blocks of 256 filters)
to a guesstimate of 1200 elo with 1200 sims/move. One of the strengths of MCTS is it scales
quite well with computing power.
Parent - By Guenter Stertenbrink Date 2018-01-04 02:20 Edited 2018-01-04 02:47
hier eine andere github Seite mit Tutorial und Othello Programm

http://web.stanford.edu/~surag/posts/alphazero.html
A Simple Alpha(Go) Zero Tutorial

Othello for a 6x6 board on a single GPU.
3 days (80 iterations) for training to saturate on an NVIDIA Tesla K80 GPU.
performed pretty well
https://github.com/suragnair/alpha-zero-general
A clean and simple general purpose implementation of a self-play algorithm based on AlphaGo Zero
Python Updated Dec 19, 2017
------------------------------------------------
leela zero :
https://github.com/gcp/leela-zero/
550 issues

Elo History:
https://docs.google.com/spreadsheets/d/1QhYWYQvXBhI5eHJm45fvf97CaV2rRmgrATwVgBFGKoU/htmlview#
- By 2phil4u Date 2017-12-29 20:42
Nein,ich bin nicht auf Propaganda reingefallen, ich habe das system gelobt.
Ein Nosimuliertes neuronaler Netz, welches erst Mal Sau viel computing Power braucht ist langsam, bewertet aber sehr gut.
Wenn Carlsen 40000 Knoten pro Sekunde hätte wäre er noch stärker als Alpha. Alpha skaliert ja auch noch viel besser als die Programme,
Da es ja nur eine Art gepimpter Mensch ist und diese neuralen Netzwerke brauchen 1 exaflop um das menschlichzu
Bilden. Es ist wie ein Insekt, dass Schach spielen muss um zu überleben
- - By Guenter Stertenbrink Date 2018-01-04 01:30
ich kann mir nicht vorstellen, wie das gehen soll,
mit Monte Carlo, ohne alphabetaminmax, ohne konkret Varianten durchzurechnen
auf hoher Rechentiefe.
Freilich gibt es einige Vorteile durch geschickten Vergleich mit vielen Stellungen,
sammeln von Erfahrungswerten, Ideen , welches in Stockfisch usw. nicht gemacht wird.
Aber letzten Endes muss man doch durchrechnen
Parent - - By Peter Martan Date 2018-01-04 07:39 Edited 2018-01-04 07:55
Guenter Stertenbrink schrieb:

Aber letzten Endes muss man doch durchrechnen

Unter den wenigen auf CCC verbliebenen namhaften Skeptikern, dich sich noch was zu sagen trauten, was nicht nur A0- Fanpost war, ist zuletzt immerhin auch Ed Schröder (gewesen), jetzt halten aber, scheint mir, ohnehin mal alle den Atem an, bis man wieder was von dem "Papier" hört, der "Peer Review" ist offenbar auch nicht ganz so eine "gmahte Wiesn", wie man bei uns daheim sagt, sonst wäre die finale Version der "Veröffentlichung" bereits zumindest irgendwo angekündigt worden, denke ich.

MC als solches muss natürlich auch nicht einfach so funktionieren, wie wir das schon kennen, da gab's z.B. mal ein Programm, das hieß Cockroach, ich hab's noch auf einer Festplatte, da konnte man die Berechnungstiefe und die Länge und Zahl der Varianten, die ausgespielt wurden, einstellen, die Bewertung der Lines an ihren Enden war, wenn ich mich recht erinnere, eine Frage einer bestimmten auch adaptierbaren Evalgrenze, sodass der Übergang zu einem automatischen FW- BW- Feature eines GUIs eigentlich schon fast fließend war.
Aber natürlich bestand die Basis  immer noch aus Alpha-Beta und Evals, wie wir sie kennen (so weit ich das damals verstanden und noch richtig in Erinnerung habe), ich glaube sogar, es war Stockfish- basiert.

Bin wirklich neugierig, ob Google überhaupt weiter was mit Schach machen wird und wenn ja, wie und wann.

Und ob 2018 ein Engine- unabhängiges für den User bedienbares Sirius- GUI, mit dem man selber viele kleine Kleinhirne (Cerebella ) basteln (lassen) könnte, rauskommen wird.

Prosit, Günter!
Parent - - By Guenter Stertenbrink Date 2018-01-04 09:36 Edited 2018-01-04 09:59
ich meine, diese monte carlo tree search kann im Prinzip auch nur so aehnlich
sein wie alpha-beta, nur eben mehr zufaellig.
Man kann eben normalerweise nicht erkennen welcher Zug gut ist, ohne zu rechnen.
Das ist mein Schachverstaendnis.
Und deswegen seh auch kein so grosses Potential fuer alphazero [so wie bei Go].
Konventionelle engines machen sich vielleicht deren neuronale erlernte Datenbank
zunutze und bekommen eine bessere eval  - oder besser : Gewinnwahrscheinlichkeit
Parent - - By Thorsten Czub Date 2018-01-08 01:41
Also beim nullmove kann man auch erkennen welcher Zug gut ist ohne großartiges wissen.
Ähnlich wird es bei az sein.
Stockfish kann das auch nicht widerlegen.
Die hätte. Stockfish auch 128 CPUs geben können.
Das hätte nix geändert. Das sieht man doch in den Partien.
Stockfish wird da in was reingezogen und kommt mit der alpha beta suche nicht wieder raus.
Ähnlich wie Chess System Tal damals Leute in den fuzzy Bereich des suchbaum zog, wo
Sie mit dem präzisen ausrechnen nicht mehr rauskamen weil die exponentialfunktion es nicht erlaubte.

Es ist wie die Geschichte mit der Schildkröte und dem Hasen.

Az hat keine präzisen Bewertungen. Und es spielt auch keinen Bestmove.
Und es vergrößert nicht den score.

Diese Transformation in den 10 Partien die wir alle so beeindruckt bestaunt haben, und die Stockfish wie einen Anfänger aussehen lässt,
kann kein Programm finden das AUCH materiell bewertet oder AUCH präzise ausrechnen muss was geht, oder was nicht geht.
Der Gag ist das az das anders macht, fuzzy. So kann man nur transformieren wenn man nicht in diesen Kategorien denkt.
Parent - - By Guenter Stertenbrink Date 2018-01-08 05:10
die Spielstarke nimmt zu mit laengerer Bedenkzeit oder bessererer Hardware.
Also ist die ganze Rechnerei nicht sinnlos
Parent - - By Benno Hartwig Date 2018-01-08 10:08
In welchem Maße müsste die Rechenleistung denn zunehmen, damit die beobachteten Schwächen einfach durch Tieferrechnen ausgeglichen worden wären?
Sollte dazu die Geschwindigkeitssteigerung nicht ausreichen, die in den letzten 50 Jahren realisiert wurde, dann wäre mein Bedenkzeit- und Hardware-begründeter Optimismus heute auch schwach.


Benno
Parent - - By Guenter Stertenbrink Date 2018-01-08 12:10
64:36 sind ca.90 Elo oder ca. 10mal mehr Rechenleistung
Parent - - By Benno Hartwig Date 2018-01-08 13:08
Stimmt.
Wie ich es verstand, soll es aber Situationen gegeben haben, in denen SF sich "in etwas hineinziehen ließ" was wohl auch eine sehr deutlich tiefere Suche noch lange nicht erkennen lassen würde.
1 mal mehr Rechenleistung mag so ca. 4 Plys mehr bedeuten.
Das hätte in diesen Fällen wohl nur wenig bewegen können.
Das SF mit seiner exakten Suche in anderen Situationen sehr gut aussieht, will ja sicher niemand bestreiten.

Benno
Parent - - By Thorsten Czub Date 2018-01-09 00:12
Naja Stockfisch hat keinen einzigen Punkt gemacht. Er hat gerade mal eben ein Remis hinbekommen.
Und so wie Ich es sehe ist bei AZeine zugwiederholung was ganz normales.
D.h. Da sind remisen quasi integraler Bestandteil der spielweise.

Stockfish hat nichts geblickt.
Alles was die Programmierer in den letzten 50 Jahren so erfunden haben, az hat es nicht gebraucht.
Und weil az so anders ist, hatte stockfish keine Chance da raus zu finden.
Parent - - By Guenter Stertenbrink Date 2018-01-09 02:24
ich denke AZ hat es sehr wohl gebraucht. Nur eben anders programmiert, aber im Prinzip
dieselbe Suche, aehnliche evals.
Dazu ein paar Verbesserungen, z.B. das "forward backward" , nun enthalten im MCTS
Parent - - By Benno Hartwig Date 2018-01-09 07:44

>...aber im Prinzip dieselbe Suche,...


Wie meinst du denn das?
Ich dachte, es sei so überhaupt nicht(!) dieselbe Suche. So ganz und gar überhaupt nicht.
Benno
Parent - - By Guenter Stertenbrink Date 2018-01-09 11:08
gute Zuege, Stellungen muessen erkannt und rausgefiltert werden.
Dazu braucht man Parameter wie Materialbewertung.
Selbst wenn das nicht vorbestimmt ist, so werden vermutlich Funktionen
angepasst, optimiert, ausgewaehlt die dem nahe kommen.
Parent - By Michael Scheidl Date 2018-01-09 12:36
Ich bin nicht einmal sicher ob A0 überhaupt eine Bewertungsfunktion hat. Angeblich wurde NICHTS vorgegeben, somit also auch keine Initialisierung irgend einer Materialbewertung. Des weiteren hat es MCTS (Monte Carlo Tree Search) und nicht Alpha-Beta. Das ist wohl fundamental anders und funktioniert nur mit gigantischer Rechenkapazität. Ich strebe nicht an das Zeugs verstehen zu wollen.
Parent - By Benno Hartwig Date 2018-01-09 17:38
Du vermutest aber mutig.
Verglichen mit den Unterschieden SF vs. A0 werden wohl fast alle Engines der letzten Jahrzehnte "sowieso fast gleich"  sein,
und dabei schließe ich den aktuellen SF und H und K auf der einen Seite und Fritz1 und wohl auch Colossus2 und fast schon historische Großrechnerprogramme auf der anderen Seite unbedingt mit ein!

Nein, A0 macht es wohl wirklich schon reichlich was anders als alles(!), was sich in den Ranglisten so seit Jahrzehnten tummelt!
Die Tatsache, dass es Software ist, die die Prozessoren zum Arbeiten bewegt, rechtfertigt in meinen Augen nicht "ähnlich".
Aber Konkretes weiß ich natürlich auch nicht.

Benno
Parent - By Thorsten Czub Date 2018-01-09 18:28
Materialbewertung?! In welcher von den 10 Partien siehst du das denn heraus ?! Bei stockfish ja. Bei Alpha z sehe ich das eher nicht.
Parent - - By Guenter Stertenbrink Date 2018-01-11 05:19 Edited 2018-01-11 05:26

> 4. The typical number of legal moves is used to scale the exploration noise


kann das funktionieren ? Anzahl der moeglichen Zuege als Ersatz
fuer Materialzaehlung ?
ein blockierter Bauer ist immer noch ein Bauer

-------------------------------

AlphaZero evaluates positions using non-linear function approximation
Parent - - By Thorsten Czub Date 2018-01-11 23:24
Lustigerweise hat AZ gegen stockfish aber so gespielt das dieser viele unbenutzte Figuren gar nicht mehr bewegen konnte.
Als ob diese Figuren nicht mehr da wären.
Was nützen alle diese MATERIALwerte an Figuren wenn diese nicht ziehen können.
Parent - - By Frank Brenner Date 2018-01-12 01:15 Edited 2018-01-12 01:19
Es wurden von den 100 gespielten Partien nur 10  Partien veröffentlicht.
Bei der Auswahl wurde so vorgegangen, daß die 10 Partien nicht per Zufall ausgewählt wurden, sondern es wurden die 10 überragendsten Partien veröffentlicht.

Du brauchst nur 100 Partien SF-Beta gegen eine  alte Houdini oder Komodo  Version  oder gegen den aktuellen Shredder spielen lassen, und dann wird es dir stets gelingen auch hier 10 Partien aus den 100 herauszupicken die SF im gleichen Glanz scheinen lassen wie AZ.

Wenn du einmal bei Wikipedia  ( https://en.wikipedia.org/wiki/AlphaGo_Zero  ) die tabelle "Comparison with predecessors" studierst, dann ist die Entwicklung von AlphaGoZero schon HAMMER beeindruckend! Absolut.
Und dafür hat sich Stockfish 8.0 ganz schön wacker geschlagen  mit 36 - 64

Es sind schätzungsweise 130 ELO Unterschied auf TCEC Bedenkzeitniveau.

Am spannendsten finde ich aber nach wie vor die Tatsache, daß fast alle Gewinnpartien mit Weiß erzielt wurden.
Parent - - By Kurt Utzinger Date 2018-01-12 10:34 Upvotes 1
Frank Brenner schrieb:

Es wurden von den 100 gespielten Partien nur 10  Partien veröffentlicht.
Bei der Auswahl wurde so vorgegangen, daß die 10 Partien nicht per Zufall ausgewählt wurden, sondern es wurden die 10 überragendsten Partien veröffentlicht.

Du brauchst nur 100 Partien SF-Beta gegen eine  alte Houdini oder Komodo  Version  oder gegen den aktuellen Shredder spielen lassen, und dann wird es dir stets gelingen auch hier 10 Partien aus den 100 herauszupicken die SF im gleichen Glanz scheinen lassen wie AZ.

Wenn du einmal bei Wikipedia  ( <a class='urs' href='https://en.wikipedia.org/wiki/AlphaGo_Zero'>https://en.wikipedia.org/wiki/AlphaGo_Zero</a>  ) die tabelle "Comparison with predecessors" studierst, dann ist die Entwicklung von AlphaGoZero schon HAMMER beeindruckend! Absolut.
Und dafür hat sich Stockfish 8.0 ganz schön wacker geschlagen  mit 36 - 64

Es sind schätzungsweise 130 ELO Unterschied auf TCEC Bedenkzeitniveau.

Am spannendsten finde ich aber nach wie vor die Tatsache, daß fast alle Gewinnpartien mit Weiß erzielt wurden.


Hallo Frank
Langsam frage ich mich, weshalb die übrigen 90 Partien nicht öffentlich gemacht werden. Da ist
meines Erachtens etwas faul im Staate Dänemark.
Gruss
Kurt
Parent - - By Thorsten Czub Date 2018-01-12 12:25
Warum sollte etwas faul sein ?
Parent - By Kurt Utzinger Date 2018-01-12 13:53
Thorsten Czub schrieb:

Warum sollte etwas faul sein ?


... eben wegen der Geheimniskrämerei.
Kurt
Parent - By Frank Brenner Date 2018-01-12 15:44
Zitat:
Da ist meines Erachtens etwas faul im Staate Dänemark.


Nach meinem Gefühl ist da nichts Faul.
Die Ergebnisse von AlphaGoZero sind derart phänomenal,  DeepMind hat mit dem GO Projekt eine ordentliche Portion Vertrauensvorschuß erworben.

Ich tippe aber für Google und Deepmind ist das Schachprojekt beendet und es wird auch keinerlei zusätzliche Information mehr veröffentlicht.
DeepBlue wurde ja auch  nach dem zweiten match gegen Kasparov zerlegt.
Parent - - By Thorsten Czub Date 2018-01-08 01:33
Die interessantesten Dialoge habe ich im rybka Forum gelesen zwischen Ed Schröder und Chris Whittington.
Ed macht den Skeptiker.

Computerschach war noch nie so interessant Leute.
Parent - By Guenter Stertenbrink Date 2018-01-08 06:23
10x, ist wohl der thread ueber Partie 99, ich dachte den kann ich ignorieren

rebel hat die Lai-Giraffe thesis studiert
- By Guenter Stertenbrink Date 2018-01-10 03:13
glaubt ihr, da sind irgendwelche Tricks dabei, die absichtlich verschwiegen werden
weil sie es zu leicht machen wuerden alphazero zu reproduzieren ?

oder ist es einfach zu schwierig, zu kompliziert fuer Normalprogrammierer

oder wird einfach eine besondere teure Hardware benoetigt und bei reduzierter
Hardware sinkt die Performance ungewoehnlich schnell
- - By Guenter Stertenbrink Date 2018-02-09 10:12
https://www.chess.com/article/view/whats-inside-alphazeros-brain

nur 80 mal mehr Rechenkraft als ein PC ?  Schlappe 300 Elo , immer noch besser
als Fire,Shredder usw.

diese TPUs werden vermutlich bald verfuegbar sein ,
und man kann ja auch solcher Server mieten
Parent - - By Benjamin Bahnsen Date 2018-02-13 11:18
Keine Details, keine Partien, kein Peer-Review - es ist still geworden um AlphaZero. Ich denke wir können an dieser Stelle AlphaZero in das Regal mit den Märchenbüchern stellen und es gut sein lassen.

Google hatte jede Menge positive Presse und hat damit sein Ziel erreicht. Kritische Stimmen waren rar und wurden überall (auch hier) zu Skeptikern und Verschwörungstheoretikern degradiert. Wenn allerdings ein gewinnorientiertes Unternehmen behauptet 30 Jahre Schachprogrammierung vaporisiert zu haben und keinerlei Beweise liefert, dann ist es eigentlich die Pflicht eines Jeden skeptisch zu sein. Ich hoffe die vielen "Naivlinge" überdenken ihr Weltbild und reagieren in Zukunft etwas kritischer. Auch die Presse wurde ihrem schlechten Ruf gerecht, indem wieder einmal unbewiesene Ergebnisse als Tatsachen verkauft wurden. Vielleicht gab's als Belohnung ein paar Rating-Punkte im Google-Index...
Parent - By Patrick Götz Date 2018-02-13 11:48
Parent - By Benno Hartwig Date 2018-02-13 22:17 Edited 2018-02-13 22:19

> Kritische Stimmen waren rar und wurden überall (auch hier) zu Skeptikern und Verschwörungstheoretikern degradiert.


Na, jetzt versuchst du aber intensiv sonderbare Legenden zu stricken.
Hier wurde doch sehr offen und mit sehr unterschiedlichen Standpunkten diskutiert.
Arme Opferchen, deren Degradierung heute bejammert werden müsste, hat es sicher nicht gegeben.

Benno
Parent - - By Guenter Stertenbrink Date 2018-02-14 03:38
diese google-Verschwiegenheit bedautet ja nicht, dass da ein Haken an der
Sache ist. Nur eben dass sie sich nicht an gewohnte Standarts wie
Partien der Ratinglisten halten. Oder evtl. auch, dass sie die Sache beschoenigen,
einige Sachen verschweigen. Aber das Grundresultat kann nicht angezweifelt werden.
Oder schaetzen wir die Elo halt 100 Punkte niedriger wegen der Widrigkeiten.
Immer noch sehr gut.
Wie lange mag es dauern bis wir aehnliche engines mit reproduzierbaren Ergebnissen
und Testst der Ratinglisten [evtl. mit neuer Hardware] haben ?
Vielleicht 1 Jahr, schaetz ich mal. Dann werden wir wissen, was google verschwiegen hat
und warum ...
Parent - - By Peter Martan Date 2018-02-14 06:09 Edited 2018-02-14 06:12
Gutes Statement Günter.

Mir ging's ja auch immer in erster Linie um die Art der Darbietung und die Bewertung dessen, was da (an sich durchaus löblich, dass es überhaupt) veranstaltet wurde.

Das Preprint war Sch...marrn, rein aus der Sicht von good scientific practice ganz allgemein, für mich heißt halt, dass es jetzt gar nichts mehr in diese Richtung gab, schon auch, dass da nicht nur ein paar Kleinigkeiten gefehlt haben, es durch einen "Peer Review" zu bekommen, sondern dass die Daten in der Art ihrer Gewinnung und Dokumentation für ein ordentliches Paper nicht gereicht haben.

Und selbst Google muss sich zumindest insofern auch um wissenschaftlichen Usus kümmern, als sie jetzt nicht einfach noch einmal eine irgendwie behübschte Version zum Runterladen auf eine beliebige Internetsite stellen können, ohne sich vollends zu outen, dass es eben nicht um Wissenschaft, sondern nur um Werbung ging und geht.
Wenn da eine echte Veröffentlichung mit Stellenwert daraus werden soll, muss sie ein Journal mit Impact "drucken", passiert das nicht, kann's eigentlich nur an den Daten selbst liegen, meiner Meinung nach.
Passiert in diese Richtung nix mehr, hätte ich zumindest gern mal die restlichen 90 Partien gesehen, um mir wenigstens selbst schachlich ein eigenes mehr oder weniger schlüssiges Urteil bilden zu können.

Außerdem hoffe ich immer noch, dass das gezielte Nachfragen in Fachforen mehr bringt als reine Beweihräucherung des Bisschens, was geboten wurde, jetzt in Hinblick darauf, dass überhaupt noch weiter daran gearbeitet wird.
Parent - - By Benno Hartwig Date 2018-02-14 13:42

> Und selbst Google muss sich zumindest insofern auch um wissenschaftlichen Usus kümmern...


Warum müssen die das denn?
Machen sie Wissenschaft?
Oder behaupten sie dies denn?

Google ist ein kommerzielles Unternehmen.
Und per se will ich ihnen dies auch sicher nicht vorwerfen.
Und so forschen sie also in dem Maße, wie es ihrem Geschäft förderlich ist,
und auch wie es der Werbung für sie nützlich ist.

Der Stil mag manchem missfallen,
trotzdem sind es doch Leistungen, die da erbracht werden.
Und im Übrigen hat niemand im Anschluss den Anspruch, dass ihm etwas von dieser Leistung geschenkt wird.

Benno
Parent - - By Guenter Stertenbrink Date 2018-02-14 14:25
Deepmind beschaeftigt Wissenschaftler. In diesen Kreisen ist man es gewohnt
papers zu schreiben und Leute nach ihren Veroeffentlichungen zu beurteilen.
Auch Google-Deepmind waehlt so die Leute aus, die sie einstellen.
Und wer spaeter mal eine andere Stellung anstrebt, der achtet auf "gute"
Veroeffentlichungen bei Deepmind.
https://deepmind.com/research/publications/
Allerdings steht dem die Heimlichtuerei des Wirtschaftssystems mit den
copyrights und Patenten entgegen.

Ich finde ja, eine internationale Organisation sollte Forscher,Programmierer,
Kuenstler,Erfinder... bezahlen , je nach geschaetztem Wert fuer die Allgemeinheit.
Parent - By Benno Hartwig Date 2018-02-14 14:35
Ich will ja gern glauben, dass Google gern Leute aus der Wissenschaft einstellt, die sauber wissenschaftlich gearbeitet haben.
Erwarten will ich von diesem kommerziellen Unternehmen deshalb aber nicht, dass es die eigene Arbeit gemäß dieser Kriterien der Öffentlichkeit anbietet.
Parent - By Heinz Hagenstein Date 2018-02-14 14:49
Bei Deepmind sind zwei Wissenschaftler aus Deutschland dabei,die haben ihr Wissen rüber gebracht.

Gruß Heinz
Parent - - By Benjamin Bahnsen Date 2018-02-27 12:44
Google suggeriert in dem Paper, dass AlphaZero überzeugend gegen Stockfish gewonnen hat (Zitat: "AlphaZero convincingly defeated Stockfish"). Stockfish ist hier nicht einmal mit einer Fußnote versehen, die unmittelbar klarmachen würde, dass hier eine veraltete und kastrierte Version gewählt wurde. "2016 TCEC world-champion program Stockfish" wird Stockfish im Paper mehrfach genannt. Ob man an dieser Stelle Stockfish der Ehre halber einfach nur seinen letzen großen Titel voranstellt, oder ob man tatsächlich genau diese Version gewählt hat, wird im Paper gar nicht erwähnt, sondern bewusst offen gelassen. Eine genaue Versionangabe von Stockfish gibt Google nämlich nicht an. Die Hardware wird auch nicht klar definiert. 64 Cores - mehr Information gibt es nicht. Ein paar findige Leute im Internet haben versucht die Rechenleistung, die Stockfish tatsächlich zur Verfügung hatte, anhand der Züge zu ermitteln. Ergebnis: die 64 Cores müssen sehr langsam gewesen sein. All diese Information verschweigt Google. Und dass Stockfish ohne Eröffnungsbuch gespielt hat, wird im Paper auch nicht erwähnt, sondern ist nur für Experten erkennbar, die die Eröffnungsfehler von Stockfish in den Beispielpartien sehen. Die Masse den Menschen, die von Computerschach wenig Ahnung hat, wird hier ganz bewusst getäuscht. "Google schlägt das stärkste Schachprogramm der Welt" ist die Aussage des Papers - und das ist eine glatte Lüge.

Um auf deinen Kommentar zurückzukommen: wir sprechen hier nicht von 100 Elopunkten, die Google sich "ergaunert" hat, sondern von 500-800 Punkten! Es wird der Eindruck vermittelt, als wenn Google ein Schachprogramm mit 3450 Elo an die Wand spielt, also selbst 3550 Elo erreicht. Der verwendete Stockfish dürfte auf vielleicht 3100 Elo kommen. Ganz geschickt verwendet man in in dem Diagramm bei der Skalierbarkeit hinsichtlich der Bedenkzeit nur relative Elo-Zahlen, aber keine absoluten. Bei den ganzen "Wahrheitsverschleierungsaktionen" muss man zudem davon ausgehen, dass Google auch die Ergebnisse zu seinen Gunsten ausgelegt hat und nur die "Perlen" in die Statistik eingeflossen sind. Ich schätze AlphaZero auf klar unter 3000 Elo ein - auf Consumer-Hardware dürften es nochmal deutlich weniger sein. Natürlich hat AlphaZero ein paar brilliante Züge gespielt - aber das macht jede 2800 Elo-Engine von Zeit zu Zeit.
Parent - - By Heinz Hagenstein Date 2018-02-27 13:11
Mir ist aufgefallen das AZero nur mit einer Minute pro Zug zieht,ich nehme mal an das er gar nicht blitzen kann,sondern er braucht die eine Minute um einen Zug zu generieren.

Gruß Heinz
Parent - By Benno Hartwig Date 2018-02-27 14:51

> ich nehme mal an das er gar nicht blitzen kann


Das halte ich aber für mutig geschlossen.
Aber wirklich wissen tue ich natürlich auch nicht.
Benno
Parent - By Ludwig Buergin Date 2018-02-27 15:20
Hallo Heinz

  Du könntest schon richtig liegen.AZero braucht vermutlich die Zeit um den guten Stockfish jeweils Zug für Zug auszubaldowern.

     Gruß Ludwig
Up Topic Hauptforen / CSS-Forum / AlphaZero
1 2 3 4 5 Previous Next  

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill