Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Fortschritt des Stockfish in den kommenden 10 Jahren
Poll Stockfish-Fortschritt in den kommenden 10 Jahren
50% oder weniger :o) 1 14%
51% 0 0%
52% 0 0%
53% 0 0%
54% 0 0%
55% 0 0%
56% 0 0%
57% 0 0%
58% 0 0%
59% 1 14%
60% 0 0%
61% 0 0%
62% 0 0%
63% 0 0%
64% 0 0%
65% 1 14%
66% 0 0%
67% 1 14%
68% 0 0%
69% oder mehr 3 43%
- - By Benno Hartwig Date 2022-02-25 11:25
Bisweilen findet man hier die These vertreten, die hohe Remis-Wahrscheinlichkeit heutiger SF-Begegnungen sei ein Beleg dafür, dass das SF-Spiel schon so "perfekt" sei.
Ich habe da Zweifel!
Und ich wäre heute gern schon Mäuschen, welches beobachten kann, wie der SF in 10 Jahren mit dem heuteigen SF umspringen würde.

Und ich mache mal eine Umfrage draus.
Was schätzt ihr: Welche Quote würde der in-10-Jahren-SF gegen den heutigen SF erreichen?
bei mittleren Zeiten (15 min / Partie vielleicht) und ganz Büro-üblicher in-10-Jahren-Hardware.
Parent - By Max Siegfried Date 2022-02-25 11:36
Stockfish entwickelt sich super, siehe heute:

Author: mstembera
Date: Fri Feb 25 08:37:57 2022 +0100
Timestamp: 1645774677

Clean up and simplify some nnue code.

Remove some unnecessary code and it's execution during inference. Also the change on line 49 in nnue_architecture.h results in a more efficient SIMD code path through ClippedReLU:ropagate().

passed STC:
https://tests.stockfishchess.org/tests/view/6217d3bfda649bba32ef25d5
LLR: 2.94 (-2.94,2.94) <-2.25,0.25>
Total: 12056 W: 3281 L: 3092 D: 5683 Elo +5.45
Ptnml(0-2): 55, 1213, 3312, 1384, 64

passed STC SMP:
https://tests.stockfishchess.org/tests/view/6217f344da649bba32ef295e
LLR: 2.94 (-2.94,2.94) <-2.25,0.25>
Total: 27376 W: 7295 L: 7137 D: 12944 Elo +2.01
Ptnml(0-2): 52, 2859, 7715, 3003, 59

closes https://github.com/official-stockfish/Stockfish/pull/3944

No functional change

bench: 6820724
see source
Parent - - By Max Siegfried Date 2022-02-25 12:19
1000 Partien
+450 -50 =500
= 70% Gewinnwahrscheinlichkeit
Das sind gerade einmal = +147 echte elo +/-15 (nicht Stockfish elo)

Ich habe jetzt einfach mal angenommen dass du nicht nur 1000x 1.e4 sehen willst, sondern auch andere Eröffnungsvorgaben die etwas größere Bewertungsschwankungen haben.
Stockfish elo Steigerung dürfte zwischen 50 und 30 Stockfish elo pro Jahr liegen. Wobei die niedrigere elo Zahl eher nach 8, 9, 10 Jahren der Fall sein dürfte.
Sagen wir ungefähr 400 bis 450 Stockfish elo in 10 Jahren dürften auf jeden Fall mindestens +150 echte, von normalen Menschen messbare, elo sein.

Viel interessanter finde ich das dazugekommene/bessere Schachverständnis. Das mag zwar auf dem Niveau für nur +150 echte elo sorgen, aber bei einem Menschen, wenn dieser selbst sein eigenes Wissen so sehr verbessern würde, dürfte sich das wie eine 1000 echte elo Steigerung anfühlen. Mit anderen Worten: Der Stockfish wird für Analysen ziemlich genial sein.

Das bedeutet aber auch das je stärker man selbst ist, desto besser wird man Stockfish verwenden können.

+ In 10 Jahren wird man wahrscheinlich auch keine Amateurhardware wie einen AMD Threadripper 3990X mit nur 64 echten Kernen verwenden, sondern einen einen AMD Threadripper der 1xxxxWX Generation mit 256 echten Kernen der auch noch mehr GHz pro Kern schafft und weniger Watt verbraucht.

+ Deutlich größere und bessere Netze.

+ 8-Steiner Syzygy Tablebases.

Die Enginepartien werden durch den veränderten Spielstil deutlich länger. Die 50 Züge Regel wird dann nicht erst von der Engine verwendet wenn nur noch 1 Bauer auf dem Brett ist und dieser nur noch 2x ziehen kann, sondern viel früher und intensiver bevor der erforderliche Zug gespielt wird, denn die gegnerische Engine könnte ja patzen.
Parent - By Benno Hartwig Date 2022-02-25 23:14

> Das sind gerade einmal = +147 echte elo +/-15 (nicht Stockfish elo)


Was unterscheidet eigentlich "echte elo"  von "Stockfish elo" ?
Parent - - By Frank Quisinsky Date 2022-02-25 12:41 Upvotes 1
Hallo Benno,

ich glaube nicht das Stockfish in 10 Jahren noch so rege weiterentwickelt wird.
In der Regel zerfallen nach einer Zeit solch große Projekte oder splitten sich.

Glaube auch nicht das die Elo noch deutlich nach oben geht.
Vielleicht sind 200 Elo in 10 Jahren noch möglich.

Frage mich nur wo diese herausgeholt werden sollen.
Mittelspiel bei vielen Figuren ist sehr schwierig.

Bei 200 Elo im direkten Vergleich ist das leicht zu simulieren.

Mich interessiert eher wie gut KI zukünftig eingesetzt werden kann.
Werden wir in der Lage sein Spielstile von starken Schachspieler zu simulieren.

Ob die Spielstärke nun um 200 Elo höher geht oder nicht oder wie hoch die Remisquote ist, ist im Grunde fast egal.
Ob also 3500 Elo oder 3700 Elo (kann kein Mensch unterscheiden).

Viele Grüße
Frank
Parent - - By Max Siegfried Date 2022-02-25 12:51
Solange ein Stockfish mit 1 Sekunde pro Zug auf einer schwachen CPU nicht so stark ist wie ein 64 Kerner mit 10 Minuten pro Zug, sind ausreichend Elos für die Weiterentwicklung vorhanden.
Parent - By Frank Quisinsky Date 2022-02-25 12:57
Mit mehr Zeit geht die Elo im Verhältnis zum Menschen nach unten.
Grundsätzlich ein Problem für Blitz, Schnellschach, Turnierschach, Fernschach mit vergleichbaren Elos zu arbeiten.

Alles nicht so einfach!

Werden Schachprogramme nun wirklich nochmals 200 Elo oder mehr stärker ...
Dann geht es wirklich der Eröffnungstheorie so langsam an den Kragen.
In vielen Varianten sicherlich jetzt schon der Fall.

Aber es gibt spannendere Themen als Elo.
z. B. um wieder mehr Leute zum Schachsport zu bringen sind Entwicklungen im Bereich Schachcomputer wieder interessanter geworden.

Es bleibt spannend, natürlich auch bei der Hardware!
Parent - - By Benno Hartwig Date 2022-02-25 14:20

> Mittelspiel bei vielen Figuren ist sehr schwierig.


Na, gerade dann hat die KI doch noch eine sehr ergiebige Spielwiese

> Werden wir in der Lage sein Spielstile von starken Schachspieler zu simulieren.


Dies könnte sehr interessant sein, auch um dem Menschen Unterhaltung zu bieten.
Im Sinne einer Spielstärkesteigerung wäre das aber wohl eher kein hilfreicher Beitrag.
Engines haben ihren eigenen Spielstil, der sie eben zum Erfolg führt.
Parent - By Frank Quisinsky Date 2022-02-25 16:55
Hallo Benno,

das sehe ich so.
Spielwiese ist in der Tat das Mittelspiel.

Die Idee mit der Simulation eines Menschen wäre z. B. wirklich eine sinnvolle Idee wenn der Mensch sich über KI stellen möchte.
Nach dem Motto, wir nutzen die KI-Vorteile bzw. setzen vielseitig um.

Gibt ja viele andere denkbare Szenarien!

Da sehe ich sehr viel Potential im Computerschach!
Max. Spielstärke wird je höher diese wird im Grunde für den Menschen ab einen gewissen Punkt unwichtiger.

Spielstärke aber für neue Features einzusetzen halte ich für sehr spannend!

Viele Grüße
Frank
Parent - By Benno Hartwig Date 2022-02-25 23:20

> Ob die Spielstärke nun um 200 Elo höher geht oder nicht oder wie hoch die Remisquote ist, ist im Grunde fast egal.
> Ob also 3500 Elo oder 3700 Elo (kann kein Mensch unterscheiden).


Hier sind die Interessenlagen eben unterschiedlich.
Und wenn sich das Computerschach noch mal um Größenordnungen vom Menschenschach entfernt hat, mich interessiert dann trotzdem beispielsweise
- wie die Dynamik weitergeht
- welches Programm was leistet, welche Überlegenheit gegenüber anderen besteht
- welche konkreten Leistungen erbracht werden (Leistung in konkreten Stellungen)
- und auf welche Weise dies geschafft wird (soweit ich es verstehen kann), welche Varianten bestehen
Parent - - By Andreas Matthies Date 2022-02-25 13:08
Entscheidend bei der Frage ist: Welches Eröffnungsbuch wird verwendet?
Wenn es um Elo aus der Startposition geht, ist da wohl tatsächlich schon sehr viel ausgereizt.
Das zeigt ja auch das Ergebnis des anderen Threads mit 100 von 100 Remis aus der Startposition zwischen einem aktuellen und einem 1 Jahr alten Stockfish / Sugar.

Die Entwickler nutzen deshalb auch heute schon zum Test und Tuning (fast) ausschließlich die UHO-Bücher von Stefan Pohl mit Startpositionsbewertungen von +1 oder größer.

Gruß, Andreas
Parent - - By Benno Hartwig Date 2022-02-25 13:28 Edited 2022-02-25 13:30
Wenn mich ein Vergleich zweier Engines interessiert, nutze ich gern eine Vorgabendatei, bei der jeweils zufällig 2 Bauern um 1 Feld vorgerückt sind.
Jede Stellung wird dann 2 mal ausgespielt, zusammen dann also gut 6000 Partien. (Wer mehr Partien braucht, könnte auch jeweils 3 oder 4  Bauern vorrücken lassen, solch eine Datei ist per Skript schnell erzeugt)
Diese Partieanfänge fordern von den Engines, dass sie sich selbst um die Eröffnung kümmern. Das finde ich gut.
Meistens attestiert SF Weiß auf diese Weise einen Vorteil von weniger als einem halben Bauern. Eigentlich auch ok so. Aber remis-lastig.

Mich interessiert aber auch gerade so besonders, ob der in-10-Jahren-SF vielleicht dann doch wirksam diese Remis-Mauer des heute-SF durchbrechen kann.
Wenn nicht, dann könnte an dem manchmal proklamierten "perfekt" des heutigen SF schon was dran sein.
Ich vermute aber, der heutige SF würden gegen solch einen Gegner doch auch reichlich verlieren. (Ok: "Was zu beweisen wäre!")

10 Jahre, das erlebe ich noch (und vielleicht auch noch mehr).
Dann sollte ich mich gern daran erinnern und diesen Test machen.
Parent - By Andreas Matthies Date 2022-02-25 13:43 Upvotes 1
Okay, wir legen uns das mal auf Wiedervorlage für 2032
Hoffentlich sind die Rechner/Betriebssysteme/Compiler dann noch kompatibel mit x86_64.
Parent - - By Frank Quisinsky Date 2022-02-25 16:51 Edited 2022-02-25 16:56
Hallo Andreas,

nur mit solchen Positionen kannst Du keinen Engine-Test aufziehen.
Macht keinen Sinn schwächere Engines damit hochzuhiefen.

Der Einfluss von Eröffnungsbüchern wurde immer schon sehr überschätzt.

Wichtig ist im Grunde max. viele unterschiedliche Startpositionen für einen Test zu haben.

Könnte, mittels FEOBOS und Statistiken danach sehr leicht ausgeglichene Stellungen generieren, die zu einer deutlich geringeren Remisquote
führen. Das ist einfach wenn alles aus A00-E99 vorhanden ist. Der Nachteil wäre, das viele ECO Codes einfach wegfallen. Leider gehören
alle 500 zur Theorie.

Habe gar eine solche Datenbank und teste in der Tat auch mal Wasp Versionen damit ab.
Trotz ausgeglichener Vorgaben (sind von den 41.614 FEOBOS Positionen genau gesagt 11.223 Positionen) reduziert sich die Remisquote
ca. um 27%.

Wie gesagt, dass ist keine große Kunst und dafür muss ich keine Vorgaben nutzen die über +1 gehen.

Viele Grüße
Frank
Parent - By Frank Quisinsky Date 2022-02-25 17:00
Korrektur: 17% (Verschreiber)
Aber ich habe das in KI Zeiten nicht weiter verfolgt.
Schon ältere Ergebnisse vor Wasp 4.50.
Parent - - By Andreas Matthies Date 2022-02-25 17:31
Frank Quisinsky schrieb:

Hallo Andreas,

nur mit solchen Positionen kannst Du keinen Engine-Test aufziehen.
Macht keinen Sinn schwächere Engines damit hochzuhiefen.

Der Einfluss von Eröffnungsbüchern wurde immer schon sehr überschätzt.

Dein Kommentar ist leider entweder off-topic oder falsch.
Es geht in diesem Thread um Stockfish heute versus Stockfish in 10 Jahren. Dann kannst du ja wohl nur den heutigen Stockfish mit "schwächere Engine" meinen. Naja...
Außerdem ist doch eher das Gegenteil der Fall: Siehe Thread "Perfekt bekommt man nicht mehr perfekter". Da wurde gerade durch das Fehlen eines Buches der schwächere ein Jahr alte Stockfish/Sugar zu einem 50-50 hochgehievt. Mit einem UHO-Buch wäre es eher 55-45 oder vielleicht sogar 60-40 ausgegangen.

Es geht doch einfach darum, zu differenzieren, wo aus der Startposition keine Differenzierung mehr möglich ist.

Und den positiven Effekt des UHO-Buches auf die Weiterentwicklung von Stockfish bzw. die Tests im Fishtest werden dir alle direkt Beteiligten inkl. Stefan Pohl sicherlich besser erklären können als ich, deshalb lasse ich es.

Gruß, Andreas
Parent - - By Frank Quisinsky Date 2022-02-25 17:54 Edited 2022-02-25 17:58
Hallo Andreas,

Stefan benutzt doch das FEOBOS Material, schrieb er selbst mal.
Glaube er hat aber später auch Stellungen hinzugefügt, die bei FEOBOS im Vorfeld aussortiert wurden.
Hatte mir die Datenbank von Stefan auch mal angesehen.

Er hat durchaus sehr interessante Ansätze drin Remisquoten zu senken.
Ein Ansatz sind z. B. unterschiedliche Rochaden die lt. Engine Bewertungen in der Tat öfters zu einem ungerechtfertigten zu hohen Nachteil führen und mithin
im Vorfeld von FEOBOS nicht durch die Filter ging. Ein weitere und absolut richtiger Ansatz ist "Damen auf dem Brett". Verschwinden die Damen durch die
Eröffnungenssysteme zu früh steigt in der Tat die Remisquote an.

Mein eigenes Projekt muss ich mir nicht erklären lassen Andreas!
Damit habe ich mich wirklich 4 Jahre intensiv beschäftigt.

Ich meinte eher, dass es generell keinen Sinn macht durch unausgeglichene Vorgabstellungen Engines zu stärken oder zu schwächen.
Dies passiert logischer Weise wenn die Vorgabestellungen nicht ausgeglichen sind.

Selbst 10 Programme sortieren bei FEOBOS vor NN-Zeiten Stellungen in Teamwork aus, die zu interessant sind und wurden mithin auch falsch
bewertet (die angsprochenen unterschiedlichen Rochaden).

Es ist dennoch nicht notwendig mit solchen Büchern zu testen, weil es meines Erachtens nichts bringt.
Kann keine Erkenntnisse ziehen!

Interessanter ist es die ausgeglichenen Eröffnungen zu ziehen, die in der Regel nicht schnell zum Remis führen.
Nur wenn genau das passiert gehen viele ECO Codes über den Jordan.
Alle ECO Codes gehören zum Schachspiel.

Verstehe schon den Sinn der dahintersteckt aber meines Erachtens bringt das nichts.
Weil die Erkenntnisse führen ins Niemandsland.

Genau, dass ist eine Aufgabe zu differenzieren aus welchen Startpositionen keine Differenzierung mehr möglich ist.
Aber ich denke es ist zu früh um das Thema sinnvoller aufzugreifen.
Weil dafür fehlt Spielstärke so krass sich das anhört.

Viele Grüße
Frank

Bin immer auf der Suche nach neuen Ideen für die Vorbereitung des nächsten FEOBOS Projektes.
Da dies auch wieder auf Engine Teamwork in NN-Zeiten beruht macht es alles sehr kompliziert.
NN-Bewertungen nach Vorgabe der Buchzüge sind teils eine Katastrophe und stimmen wirklich kaum mit Realitäten überein.
Parent - By Frank Quisinsky Date 2022-02-25 18:06 Edited 2022-02-25 18:18
Also, das Hauptziel Remisquoten zu senken geht auch mit ausgeglichenen Stellungen aus dem FEOBOS Projekt.
Und zwar um bis zu 17%!

Dafür muss ich keine unausgeglichenen Stellungen einsetzen.

Wobei wie beschrieben:
Vor 5-Jahren ohne NN sind in der Tat ausgeglichene Stellungen verschwunden z. B. wie angesprochen bei unterschiedlichen Rochaden.
Dies wurde von Engines lange nicht unbedingt korrekt bewertet wie auch andere Dinge.

Zu den 41614 Stellungen liegen mir heute über 2 Millionen Partien vor.
Da kann man natürlich kräftig verbessern!

Nur, wenn ich aussortieren lasse fehlen ECO Codes.
Und genau das geht gar nicht!

Im Grunde wäre es eine sehr gute Idee mit den BookUp Ansätze FEOBOS neu aufzuziehen.
Kennst wahrscheinlich die BookUp Software. Da war z. B. das Programm von John Stanback lange Zeit die Standard Analyse Engine.
Der Grund warum John seinen Zarkov seinerzeit nicht frei geben konnte.

Fishtest ...
Was da eingesetzt ist bedingt gut.
Produziert viel zu hohe Remisquoten bis 20 und bis 30 Zügen.
Da ist FEOBOS trotz ausgeglichenen Stellungen bei eingearbeiteten Contempt Faktoren deutlich besser.

Beispiel: Beim Fishtest liegen die Remisquoten von Partien unter 20 Zügen bei 0.7%. Hier und da auch mal bei 0.5-0.6%.
Bei dem aktuellen Buch von den FCP Turnieren bei 0.25% ... trotz ausgeglichen, trotz das alle ECO Codes ausgespielt werden.
Noch krasser bei Remispartien unter 30 Zügen!

Mit Engine-Teamwork und Excel bei einem vernünftigen Bewertungssystem ist vieles möglich.
Also, unausgeglichene Bücher sind meines Erachtens fragwürdig, dennoch stecken Ansätze drin die durchaus sehr gut sind aber sich bei Verwendung aller ECO Codes schwierig realisieren lassen.
Alles mit Handtuning bei 4 Züge nach ECO-Code Bildung ist man sicherlich 1-2 Jahre beschäftigt (bei ca. 2-3 Stunden pro Tag).

Senken von Remisquoten durch Büchzüge kann nur begrenzt ziehen.
Der Einfluss vom Buch ist spätestens nach dem frühen Mittelspiel fast verschwunden (in genau gesagt 78% der Fälle).
Gibt einige ECO Codes die zu schnell ins Endspiel ableiten und leider die Remsiquoten puschen.
Parent - - By Benno Hartwig Date 2022-02-25 20:07

> nur mit solchen Positionen kannst Du keinen Engine-Test aufziehen. Macht keinen Sinn schwächere Engines damit hochzuhiefen.


Es ging um Stellungen mit gut 1 Bauer weiß-Vorteil!
Ich denke schon, dass solche Eröffnungen Startbedingungen bieten, bei denen Remis und weiß-Sieg so ganz grob gleichwahrscheinlich sind, bei gleichstarken Engines.
Das bietet IMHO wirklich gute Chancen, dass die tatsächlich bessere Engine dies dann auch in einem mehr an Siegen umsetzen kann.
Doch mit gefallen solche Eröffnungen schon.

Mit "Schwächere hochhieven" hat das sicherlich nicht zu tun.
Im Gegenteil: so kommt es weniger zu endlosen Remis-Serien, die Differenz wird größer --> die Schwächere landete weiter unten.
Parent - - By Frank Quisinsky Date 2022-02-25 20:29
Hi Benno,

natürlich, interessant sind die Stellungen für einen Test immer.
Erst Recht wenn es spannende Systeme sind, gibt z. B. viele spannende Gambit-Varianten!!

Nur zum Engine testen, z. B. für eine Ratingliste eignen sich die Stellungen nicht.

Wenn Halogen 10 mit 450 Elo weniger gegen Stockfish mit einer solchen Stellung dann ein Remis erzielt, drückt das die Elo von Stockfish und hieft die Elo von der schwächeren Engine hoch.
Sind es zu viele von diesen Stellungen oder nur solche Stellungen kommt kein wirklich gutes Rating zu Stande.
Benutzt man dann solche Bücher für Ratinglisten kann man sich die Arbeit auch schenken!

Natürlich ist es richtig, dass eine stärkere Engine selbst bei echtem -1 meist gewinnt.

Was ich sagen wollte ist eigentlich auch nur, dass solche Stellungen mit Vorteil auch nicht notwendig sind.
Es gibt reichlich ausgeglichene Stellungen die sehr geringe Remisquoten produzieren.

Das sehe ich ja anhand der vorliegenden Partien die mit den FEOBOS Stellungen produziert wurden.

Viele Grüße
Frank
Parent - - By Benno Hartwig Date 2022-02-25 22:04
Ob die schwächere Engine dann wirklich eine bessere Quote erreicht, bliebe praktisch zu überprüfen.
Ich habe da aber Zweifel!
Vermutlich werden aber ungefähr gleichstarke Engines damit leichter Quoten herausarbeiten, die die Reihenfolge der Spielstärken korrekt anzeigt.
Und der Spielstärkeunterschied wird sich damit auch besser quantifizieren lassen.
Dies als Alternative zu endlosen Remisserien finde ich gut.
Parent - By Frank Quisinsky Date 2022-02-25 22:19 Edited 2022-02-25 22:40
Hi Benno,

das muss im Grunde nicht überprüft werden weil das logisch ist.

Die Stärken und Schwächen sind zu berücksichtigen.
Gleichstarke Engines sind nicht "gleichstark" wenn die unterschiedlichen Partiephasen betrachtet werden.

Das erkennst Du Verlust Quoten im Mittelspiel.

Engines, die also im Endspiel stärker sind haben einen Nachteil im Mittelspiel (spreche von ca. gleichstarken Engines bei +1 Vorteil).
Engines, die mehr schnelle Gewinne prodzieren, kaum schnelle Verluste erspielen, haben einen Vorteil.
Denen fällt es einfach mit den schnellen Verlust umzugehen, können gar taktisch Stärken besser entwickeln.

Sprich, würde Wasp mit +1 Stellungen getestet werden, würde das Ergebnis leicht besser sein.
Was sich im Detail hier intern beim Test auch immer wieder herausstellt.

Nochmal:
Solche Dinge können nicht über einen Kamm ..., es sei denn es wird die Auffassung vertreten das alle Engines alles gleich machen.
Es keine Schwächen und Stärken gibt.

Dem ist aber nicht so!!

Wo ich aber teils zustimme ...

1.
Wenn wir mit +1 Stellungen Engine Turniere durchführen werden sich die Elo's "nur" rund um 30-40 Elos verschieben.
Je nach Stärken oder Schwächen, siehe oben. Würde das nicht so krass schreiben wenn ich mir nicht sicher wäre.
Bin ich mir aber, weil ich viele Stichprobem in meinen Datenbanken gemacht habe.

Basis 1: Datenbanken 0001 - 0500 zu den ECO-Codes
Basis 2: Datenbanken 0501 - 0999 zu den ECO-Codes (hier sind die Zugumstellungen drin).
Basis 3: Datenbanken 1000 - 1501 zu den ECO-Codes (hier habe ich aussortierte Stellungen drin die bis zu 0.75 durchschnittlich höher liegt als erlaubt).

Vergleiche ich z. B. einen Run zwischen Basis 1 und 3 komme ich auf die oben geannten Elo Werte.

2.
Teils können Engine Wettkämpfe interessanter gestaltet werden.

3.
Neural Network Vorteil ist auch unausgegliche Kräfteverhältnisse.
Vergleichbar zu ... lange Rochade wird oft zu schlecht bewertet.

Das ist seit vielen Jahren ein Thema. Wenn Du FEOBOS verfolgt hast, was da an Daten überprüft wurde bzw. veranstaltet wurde sollte das auch klar sein.
Ich möchte beim Test sicher stellen, dass keine Engine bevorzugt wird und betreibe da seit sehr vielen Jahren einen wahnsinnigen Aufwand.

Endlose Remisserien können durch Eröffnungsbücher nur sehr bedingt beeinflusst werden.
Du kannst Remisquoten senken (verhindern von schnellen 3fachen Stellungswiederholungen) aber der Einfluss vom Buch geht meist nich weiter als max. 30 Züge wenn denn die Eröffnungsvorgabe nicht direkt in ein bevorstehendes Endspiel endet.
Wir wissen der Zügedurchschnitt steigt bei höher werdenden Elos an. Mithin auch die Remisquote in Endspielen. Und wenn das Wissen hinzukommt das die Endspiele von vielen Engines schon nahe an der Perfektion gespielt werden, hagelt es genau dort Remise!

Für die endlosen Remis-Serien sind eher die Endspiele verantwortlich.
Siehst Du aber anhand jeder Datenbank mit vielen Partien.

Max. beeinflusst werden kann das es zu weniger schnellen Remisen kommt.
Aber das kannst Du auch händeln mit einem ausgeglichenen Buch, siehe vorherige Postings.

Bucheinfluss macht bei der Gesamtzahl aller erzielen Remisen nur einen geringen Prozentsatz aus.

Halte also überhaupt gar nichts von unausgeglichenen Büchern beim Test von Engines.
Hätte ich andere Erkenntnisse aufgrund der vielen Arbeiten um FEOBOS gewonnen würde ich das natürlich schreiben.

Viele Grüße
Frank
Up Topic Hauptforen / CSS-Forum / Fortschritt des Stockfish in den kommenden 10 Jahren

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill