Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / CSS-Heft August 2000 - Frage
- - By Ingo Althöfer Date 2010-04-06 09:06
Hallo allerseits,

leider habe ich vor wenigen Jahren meine alten CSS-Hefte weggegeben.  

Jetzt würde ich gerne einen Artikel von Frank Schubert nachlesen,
aus CSS-Heft August 2000, S. 50 - 54. "Das Ende der Fahnenstange? ..."
Darin beschreibt er (unter anderem) Autoplay-Experimente mit
Hiarcs 7.32.

Kann mir jemand sagen, für welche Bedenkzeiten/Suchtiefen diese
Experimente gemacht wurden?
Insbesondere interessiert mich das
untere Ende (der Fahnenstange), also Läufe bei flacher Tiefe bzw.
kurzer Bedenkzeit.

Dank im Voraus allen Helfenden.
Parent - - By Klaus S. Date 2010-04-06 10:35 Edited 2010-04-06 10:42
Hallo,

habe gerade mal nachgeschaut, hier die Tabelle mit den Fritz6a Ergebnissen:

Tiefe    Spiele   Siege  Remis  Verlust  ELO
3 <> 2    204      169    17      18     +330
4 <> 3    204      156    29      19     +283
5 <> 4    204      158    28      18     +292
6 <> 5    204      148    33      23     +248
7 <> 6    204      148    28      28     +234
8 <> 7    204      129    46      29     +186
9 <> 8    204      118    66      20     +182
10 <> 9    204      123    58      23     +186
11 <>10    204      111    65      28     +150
12 <>11    204      104    67      33     +126

Tabelle 2: Ergebnisse des Fritz6a-Expiriments von Frank Schubert



Tiefe    Spiele   Siege  Remis  Verlust  ELO
3 <> 2    204      154    34      16     +286
4 <> 3    204      153    35      16     +283
5 <> 4    204      141    44      19     +240
6 <> 5    204      147    39      18     +259
7 <> 6    204      130    55      19     +212
8 <> 7    204      114    69      21     +171

Tabelle 3: Ergebnisse des Hiarcs7.32-Expiriments von Frank Schubert


Gruß
Wilfried
Parent - - By Ingo Althöfer Date 2010-04-06 10:55
Lieber Herr Lübkemann,

danke für die schnelle und ausführliche Antwort.
Das sind genau die Daten, die ich haben wollte.

Leider hat Frank Schubert damals ja nur Serien von je 204
Partien pro Paarung "Tiefe t gegen Tiefe t+1" gespielt. So
ist die Schwankungsbreite noch ziemlich gross.

Eine Frage an alle: Hat zufällig jemand mal längere Serien
für "Tiefe t gegen Tiefe t+1" für kleine (und ganz kleine) t
gemacht?

Hintergrund: Experimente mit Monte-Carlo-Algorithmen (für
viele verschiedene Spiele ungleich Schach) zeigen, dass es
dort oft einen mittleren Parameter k* gibt, so dass für MC-Werte
kleiner als k* beim Vergleich MC(k)-gegen-MC(2k) die k-Version
nicht so schlecht abschneidet wie MC(k*)-gegen-MC(2k*). Und
auch für k grösser als k* schneidet MC(k)-gegen-MC(2k) nicht
so schlecht ab wie MC(k*)-gegen-MC(2k*). k* ist also ein
Parameter, wo doppelte Rechenzeit den meisten Vorteil gegenüber
einfacher Rechenzeit bringt.

Es wäre interessant zu wissen, ob etwas ähnliches für Schach
und alpha-beta-Suche auch bei irgendeiner kleinen Tiefe t*
passiert.

Ingo Althöfer.
Parent - - By Gerhard Sonnabend Date 2010-04-06 15:55
Hallo !

Im Jahr 2007 hatte ich einige Plytests durchgeführt, finde z.Zt.
jedoch leider nur noch diesen:

Code:

Tiefe  Tiefe  Ergebnis                    Elo-Diff.   Zeitverbrauch
     vs                                 (lt. ELO-Stat)   (Faktor)
...................................................................
6  vs  5      107.0 - 33.0  (+90 =34 -16)   +204          n/a
-------------------------------------------------------------------
7  vs  6      106.5 - 33.5  (+85 =43 -12)   +201          n/a
-------------------------------------------------------------------
8  vs  7       99.5 - 40.5  (+75 =49 -16)   +156         2.292
-------------------------------------------------------------------
9  vs  8      101.0 - 39.0  (+77 =48 -15)   +165         2.300
-------------------------------------------------------------------
10 vs  9       96.5 - 43.5  (+61 =71 -08)   +138         2.288
-------------------------------------------------------------------
11 vs 10       97.5 - 42.5  (+69 =57 -14)   +144         2.310
-------------------------------------------------------------------


Mal wieder ein Ply-Test, zusätzlich mit Angabe des Zeitverbrauchs.
Durchgeführt mit LOOP 10.32f unter CB-GUI. 70 Vorgabestellungen =
140 Games pro Match. Keine TBs.

Viele Grüsse,
G.S.
Parent - - By Ingo Althöfer Date 2010-04-06 19:53
Lieber Herr Sonnabend,

danke für die Datenreihe.

Leider ist auch sie mit den eher grossen Suchtiefen gemacht.

Was ich "brauche", sind Daten für ganz flache Suchen, also
bei abgespeckter Suche (ohne grosse Erweiterungen; ohne Hashtables
usw, auch ohne Endspiel-DB)
Tiefe 1 vs Tiefe 2
Tiefe 2 vs Tiefe 3
Tiefe 3 vs Tiefe 4
Tiefe 4 vs Tiefe 5
und pro Testserie mindestens 10.000 Partien.

Warum 10.000 oder mehr Partien?
Weil man sonst ein "flaches Becken" wie
Tiefe 1 vs Tiefe 2 - 33,0 %
Tiefe 2 vs Tiefe 3 - 32,5 %
Tiefe 3 vs Tiefe 4 - 32,0 %
Tiefe 4 vs Tiefe 5 - 32,5 %
nicht erkennen würde, wegen des Rauschens.

Auf Ergebnisse von langen Serien und flache Becken hoffend,
Ingo Althöfer
Parent - - By Gerhard Sonnabend Date 2010-04-06 19:58
[quote="Ingo Althöfer"]
Leider ist auch sie mit den eher grossen Suchtiefen gemacht.
Was ich "brauche", sind Daten für ganz flache Suchen, also
bei abgespeckter Suche (ohne grosse Erweiterungen; ohne Hashtables
usw, auch ohne Endspiel-DB)
Tiefe 1 vs Tiefe 2
Tiefe 2 vs Tiefe 3
Tiefe 3 vs Tiefe 4
Tiefe 4 vs Tiefe 5
und pro Testserie mindestens 10.000 Partien.
Warum 10.000 oder mehr Partien?
Weil man sonst ein "flaches Becken" wie
Tiefe 1 vs Tiefe 2 - 33,0 %
Tiefe 2 vs Tiefe 3 - 32,5 %
Tiefe 3 vs Tiefe 4 - 32,0 %
Tiefe 4 vs Tiefe 5 - 32,5 %
nicht erkennen würde, wegen des Rauschens.
Auf Ergebnisse von langen Serien und flache Becken hoffend,
[/quote]

Dies sollte heutzutage kein Problem sein, lediglich die
Ausführungsbedingungen werden äusserst schwer bei
+10000 Games (woher "gerechte" Stellungen/Bücher nehmen ?)
Die "angezeigten" Suchtiefen der heutigen Engines sind
enorm hoch, ich bin mir noch nicht mal sicher ob "Ply 3 - Ply 4"
überhaupt noch funktioniert resp. "angenommen" wird ?!

Viele Grüsse,
G.S.
Parent - By Thomas Müller Date 2010-04-06 20:08
denke ich auch.
in vielen stellungen springen die engines sehr schnell (millisekunden?) auf ply 5/6 oder noch höher.

--
TM
Parent - - By Ingo Althöfer Date 2010-04-06 20:16
[quote="Gerhard Sonnabend"]
Dies sollte heutzutage kein Problem sein, lediglich die
Ausführungsbedingungen werden äusserst schwer bei
+10000 Games (woher "gerechte" Stellungen/Bücher nehmen ?)


Kein Problem. Gerecht muessen die Stellungen nicht sein,
wenn man einfach für jede Stellung zwei Partien spielt:
Einmal hat Tiefe 1 Weiss, das andere Mal Tiefe 2.
Bei den flachen Tiefen muss die Stellung auch nicht total
ausgeglichen sein, weil die Kisten ja doch nicht richtig
verstehen, was passiert.

Ich könnte auch gut damit leben, wenn die Startstellungen
auf den 960 Stellungen des Shuffle-Schach basieren. Laesst
man dabei noch verschiedene Anordnungen für Weiss und Schwarz
zu, so hat man schon 960*960 verschiedene Startstellungen,
also ein knappe Million.

Zitat:

Die "angezeigten" Suchtiefen der heutigen Engines sind
enorm hoch, ich bin mir noch nicht mal sicher ob "Ply 3 - Ply 4"
überhaupt noch funktioniert resp. "angenommen" wird ?!


Deshalb muesste es ein Programm sein, wo man explizit die Plyzahl
vorgeben kann. Zumindest der betreffende Programmierer sollte
dazu in der Lage sein. Vielleicht könnten Sie ja Dr. Reul mal
darauf anspitzen ?!

Viele Gruesse,
Ingo Althöfer
Parent - - By Gerhard Sonnabend Date 2010-04-06 20:32
Hallo !

Ich denke, Ply 3 vs Ply 2, funktioniert wohl mit fast jeder Engine.
Nur weis ich momentan nicht, ob ein GUI das auf die Dauer "mitmacht".
Ein Versuch wäre es allemal wert, würden Sie mir eine entsprechende
"Vorgabe-Datenbank" zukommen lassen ?
Falls ja, so kann ich hier durchaus mal zumindest einen Versuch starten.

Viele Grüsse,
G.S.
Parent - By Ingo Althöfer Date 2010-04-06 21:24
Lieber Herr Sonnabend,

gerade habe ich die Frage auch mit Ernst A. Heinz diskutiert (ja,
den gibt es immer noch). Er hat mich auf ein grosses Problem (seiner
Meinung nach)  bei kleinen Suchtiefen hingewiesen: Durch Spezialcode
wie Nullsuche kann man bei flachen Suchen Ply-t und Ply-(t+1) wohl
nicht fair vergleichen.
Seiner Meinung nach sollte ich jemand suchen, der bereit wäre, ein Open-
Source-Programm (z.B. Crafty) radikal abzuspecken, um dann mit dem
Gerüst die Experimente zu machen.

Gäbe es zufällig hier im Forumskreis einen Programmierer, der
daran Interesse hätte?

[quote="Gerhard Sonnabend"]
Ich denke, Ply 3 vs Ply 2, funktioniert wohl mit fast jeder Engine.
Nur weis ich momentan nicht, ob ein GUI das auf die Dauer "mitmacht".
Ein Versuch wäre es allemal wert, würden Sie mir eine entsprechende
"Vorgabe-Datenbank" zukommen lassen ?
[/quote]

Unabhängig von den oben genannten Bedenken: In welchem Format
sollten die Startstellungen sein? (Ich würde eine Teilmenge der
asymmetrischen Shuffle-Chess-Stellungen ohne Rochade-Rechte
nehmen.)

Wie sieht es konkret mit Ply2 gegen Ply 1 aus? Welche Programme
können das?

Ingo Althöfer
Parent - - By Benno Hartwig Date 2010-04-06 14:54
Oft las ich von der Einschätzung, dass der Spielstärkegewinn durch einen Ply Suchtiefe mehr nach und nach abnimmt.
Und das ist wohl direkt übertragbar auf den Spielstärkegewinn durch Verdopplung der Rechengeschwindigkeit.
Interessant, dies auch mal in konkreten Testreihen bestätigt zu sehen.

Benno
Parent - - By Ingo Bauer Date 2010-04-06 17:39
Hallo

[quote="Benno Hartwig"]
Oft las ich von der Einschätzung, dass der Spielstärkegewinn durch einen Ply Suchtiefe mehr nach und nach abnimmt.
Und das ist wohl direkt übertragbar auf den Spielstärkegewinn durch Verdopplung der Rechengeschwindigkeit.
Interessant, dies auch mal in konkreten Testreihen bestätigt zu sehen.

Benno
[/quote]

Testreihen deren Fehlerquote größer ist als der maximale Elogewinn ... !?

Auch mein "Bauchgefühl" sagt mir das der Nutzen abnimmt (Beweise gibt es nicht), was aber, gerade in den letzten Jahren sichtbar, auch heißt, dass Enignes durch Softwareentwicklung deutlich mehr zulegen können als durch Hardware.

Gruß
Ingo
Parent - By Benno Hartwig Date 2010-04-06 19:11
[quote="Ingo Bauer"]Testreihen deren Fehlerquote größer ist als der maximale Elogewinn ... !?[/quote]Klar, jeweils 204 Spiele sind nicht eben viel, und das ergibt wohl Toleranzangaben von ungefähr (doch auch nur) +-40.
Aber man soll sich ja nicht auf einen solchen Wert verlassen, denn die Reihen mit recht vielen Werten zeigen eine sehr schön erkennbare Tendenz.
Statistiker mögen ausrechnen, mit welcher vermutlich sehr kleinen Wahrscheinlichkeit eine so deutliche Tendenz herauskommen würde unter der Annahme, dass die Spielstärkesteigerungen jeweils gleich groß sind.

Benno
Parent - By Gerhard Sonnabend Date 2010-04-06 19:26
Hi Ingo !

[quote="Ingo Bauer"]
[...snip...]
Testreihen deren Fehlerquote größer ist als der maximale Elogewinn ... !?
[...snip...]
[/quote]

Wie kommst Du darauf ?
Bei einem Match über 140 Partien (mein Beispiel siehe oben) sind
"es" lt. ELO-Stat +-82 bei 99.7% und lediglich +-54 bei 95%.

Viele Grüsse,
G.S.
Up Topic Hauptforen / CSS-Forum / CSS-Heft August 2000 - Frage

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill