Not logged inCSS-Forum
Forum CSS-Online Help Search Login
CSS-Shop Impressum Datenschutz
Up Topic Hauptforen / CSS-Forum / Houdini 1.5 x64 1CPU (CEGT-Test inoffiziell)
- - By Wolfgang Battig Date 2010-12-20 14:57
Hallo zusammen,

mittlerweile sind 800 Partien mit 40/3 gespielt, weitere 600 enden heute abend.

Nach diesen 800 Partien liegt die Performance von Houdini bei (sensationellen) 3256 ELO und damit einem Plus von 76 Punkten (!!!) zum Rating von Rybka 4.0 x64 1CPU.
Die heute endenden 600 Partien werden die Performance sogar noch steigern, denn sie liegt in allen 3 Matches teils sogar deutlich über 3256.

Alle Ergebnisse, auch die der beiden Vorversionen hier: http://cegt.foren-city.de/topic,435,-testing-houdini-1-xx-x64-1cpu-inofficial.html

Gruß
Wolfgang
Parent - - By Bram Mourik Date 2010-12-20 18:22
Vielen Dank, für das Testverfahren und veröffentlichen davon

grüsse Bram
Parent - - By Kurt Utzinger Date 2010-12-22 09:19
[quote="Bram Mourik"]
Vielen Dank, für das Testverfahren und veröffentlichen davon

grüsse Bram
[/quote]

Diesem Dank kann man sich anschliessen.

Einzig die "3256 ELO" sind einfach lächerlich und es wäre an der
Zeit, eine massvolle Eichung nach unten vorzunehmen.
Mfg
Kurt
Parent - By peter struwel Date 2010-12-22 09:41
hi kurt,

deine meinung kann ich nachvollziehen, ist aber prinzipiell völlig falsch!
wie willst du eichen/kalibrieren?? z.b. shredder auf 0 setzen? kann man machen! völlig in ordnung.
macht aber auch keinen sinn! o.k. setze shredder auf 1500 elo, viel zu niedrig würdest du sagen?
aber wenn trotzdem, dann musst du nur lange genug warten bis es wieder engines gibt die auf
einen elo wert von 3000 zu laufen, wieder viel zu hoch würdest du darauf sagen?

du unterliegst einem gedankenfehler indem du diese enginewerte mit menschlichen elos vergleichst.
die elo ausgangswerte sind willkürlich festgelegt. ich erinnere mich noch an ingo werte, da sah es noch anders aus, obwohl
beide direkt umrechnbar sind.

grüße
peter
Parent - - By Ralf Hübner Date 2010-12-22 13:04
Hallo zusammen,

so lächerlich ist diese Elo-Zahl gar nicht. Schauen wir uns mal folgenden Vergleich an:

2006 hat Kramnik seinen Wettkampf gegen Deep Fritz 10 mit 4:2 verloren. Kramnik hatte eine Elo von 2800, die Elo von Deep Fritz 10 schätzen wir vorsichtig auf 2850. In der CEGT 40/20-Liste hat Deep Fritz 10 4 CPU 2946 Elo, also etwa 100 Punkte "zu viel". Deep Rybka 4 führt die Liste mit 3248 Elo an, Houdini soll 90 Elo mehr haben, ergäbe 3338. Um diesen Wert mit menschlichen Elos zu vergleichen, ziehen wir davon die 100 Punkte ab, die Deep Fritz 10 zu viel hatte und wir kommen für Houdini 1.5 auf 3238 menschliche Elo.

Grüße
Ralf
Parent - - By Frank Quisinsky Date 2010-12-22 16:50 Edited 2010-12-22 16:53
Wiederhole das gerne auch wenn schon x-mal geschrieben:

GM Hickl und meine Wenigkeit haben mit GM Meyer zu Beginn des Jahres ein Interview durchgeführt. Unter anderem stellte ich auch ein paar Computerschachfragen. GM Mayer aus Trier war zu diesem Zeitpunkt mit ca. 2.660 ELO die Nummer 2 in Deutschland. Er selbst, wie fast alle anderen GMs, sind meist mit einem Notebook unterwegs. Als Kiebitz läuft bei den GMs meist Rybka 3 mit, zu diesem Zeitpunkt war Rybka 3 die aktuelle Rybka Version. Auf meine Frage wie stark er denn real Rybka 3 im Schnellschach einschätzt kam direkt ca. knappe 2.900 ELO Frank. Allerdings setze ich Rybka jetzt ganz normal ein (w32 und 1 Core). Fragte ein wenig nach und dann kam ... also wenn ich mal gegen Rybka 3 spiele, was mir nicht sonderlich viel bringt, mache ich ca. 30%. Andere GMs teilen meine Meinung hinsichtlich der Rybka Spielstärke beim Schnellschach. Wenn ich keinen Fehler mache spiele ich dann meist Remis, so GM Mayer.

Also Schnellschach, 32bit und 1 Core = Rybka 3 ca. bei knapp 2.900 ELO auf einem 2GHz Dual Core Notebook mit einem Core!

Glaube es steht auch im Interview, welches Jörg in der Zeitung hatte, vielleicht mittlerweile auch freigegeben hat.

Die ganzen ELOs von CEGT und CCRL sind definitiv deutlich zu hoch.
Die SWCR ELO wurde aufgrund des Interviews entsprechend angepasst.

Gruß
Frank
Parent - By Frank Quisinsky Date 2010-12-22 17:06 Edited 2010-12-22 17:08
Ach so vergessen ...
40 in 10 (SWCR) ist so die unterste Grenze beim Schnellschach.
Rybka 3 1Core w32 auf 2.86 GHz hat bei mir derzeit ... 2.859 ELO.

GM Meyer sprach von knapp 2.900 ELO bei ca. 2.0GHz

Insofern müsste das passen.
Leichte Anhebung da "schnelles Schnellschach bei der SWCR".

Ingo und meine Wenigkeiten haben dann zu Beginn des Jahres unsere Listen einander angepasst.
Die Anfrage ging auch an CEGT aber CEGT wollte nicht was aber in dem Fall auch nicht so wichtig ist.
Ist eh sehr kompliziert mit CEGT zu vergleichen, weil dort auch noch ELOstat eingesetzt wird.

Bayesian setzt Ingo, CCRL und ich selbst ein.
ELOstat hat nachweisbar ein paar Berechnungsmängel, die hier aber auch schon x-mal beschrieben wurden.

Und wenn jetzt von x Usern behauptet wird, stimmt nicht ... Rybka 3 1Core w32 auf 2.0 GHz hat 3.100 ELO dann haben diese x User  Recht und die GMs sind im Unrecht, PUNKT.
Ist mir auch egal.

Finde allerdings, dass die Ausgaben der SWCR sehr realistisch sind.
Bei Ingo müsste wegen der deutlich geringeren Bedenkzeit im Vergleich zur SWCR eigentlich noch 50 ELO drauf gerechnet werden.
Bekanntlich spielen die Programme ja bei weniger Bedenkzeit im Vergleich zu Menschen deutlich stärker.

Gruß
Frank
Parent - - By Wolfgang Battig Date 2010-12-22 14:56 Edited 2010-12-22 14:58
[quote="Kurt Utzinger"]
[quote="Bram Mourik"]
Vielen Dank, für das Testverfahren und veröffentlichen davon

grüsse Bram
[/quote]

Diesem Dank kann man sich anschliessen.

Einzig die "3256 ELO" sind einfach lächerlich und es wäre an der
Zeit, eine massvolle Eichung nach unten vorzunehmen.
Mfg
Kurt
[/quote]

Hallo Kurt,

richtig, sie ist lächerlich! Liegt nämlich jetzt bei 3273...

Sorry für die Ironie, aber was soll ich dazu sagen? Gerade Du als früherer Tester
solltest die Zahlen zu bewerten wissen und nicht - wie Peter Struwel schon
schrieb - mit menschlichen Maßstäben messen. Es geht doch nicht um die
absoluten Zahlen sondern vor allem um die Abstände zueinander. Ich dachte,
das Thema wäre genügend durchgekaut, habe mich aber offenbar geirrt, wenn
selbst erfahrene (Ex)Tester immer wieder darauf rumreiten.

Ingo setzt das Startrating tiefer an, zweifelt aber wenn ich das richtig gelesen habe
mittlerweile ein wenig daran. Natürlich können "wir" unser Startrating einfach mal um
200 ELO senken, an den Realitäten, sprich Abständen untereinander ändert sich dadurch
nichts. Die Werte sehen halt nur aus menschlicher Sicht "realistischer" aus.

Was wäre denn ein Startwert nach Deinem Geschmack? Wieviel "darf" denn die beste
Engine, z.B. Houdini nach Deinem Dafürhalten haben? Weniger als die menschliche Nr.1?
50 mehr, 100 mehr? Die Werte mögen zu hoch sein, aber soooo unrealistisch sind sie
m.E. gar nicht. Ich bin fest davon überzeugt, dass es auf dieser Welt KEINEN Menschen
gibt, der gegen Houdini mehr als 10-15 % macht. Ich meine realistisches Schach, nicht
spezielle Anti-Computer-Strategien oder gar Nutzung "illegaler" Hilfsmittel wie Premove.
Und dies vorausgesetzt sind mind. 300-350 ELO Unterschied (10% sind etwa -370 ELO) gar
nicht so falsch.

Leider werden wir wohl nie erfahren, ob ich da falsch liege...

Gruß
Wolfgang
Parent - By Kurt Utzinger Date 2010-12-22 19:27
[quote="Wolfgang Battig"]
[quote="Kurt Utzinger"]
[quote="Bram Mourik"]
Vielen Dank, für das Testverfahren und veröffentlichen davon

grüsse Bram


Diesem Dank kann man sich anschliessen.

Einzig die "3256 ELO" sind einfach lächerlich und es wäre an der
Zeit, eine massvolle Eichung nach unten vorzunehmen.
Mfg
Kurt


Hallo Kurt,

richtig, sie ist lächerlich! Liegt nämlich jetzt bei 3273...

Sorry für die Ironie, aber was soll ich dazu sagen? Gerade Du als früherer Tester
solltest die Zahlen zu bewerten wissen und nicht - wie Peter Struwel schon
schrieb - mit menschlichen Maßstäben messen. Es geht doch nicht um die
absoluten Zahlen sondern vor allem um die Abstände zueinander. Ich dachte,
das Thema wäre genügend durchgekaut, habe mich aber offenbar geirrt, wenn
selbst erfahrene (Ex)Tester immer wieder darauf rumreiten.


Das ist mir (natürlich) klar, doch da die Elo-Wertung für Menschen gemacht
wurde, kann sich wohl fast niemand bewusst oder unbewusst vom Vergleich
zum menschlichen Schach entziehen.

Zitat:
Ingo setzt das Startrating tiefer an, zweifelt aber wenn ich das richtig gelesen habe
mittlerweile ein wenig daran. Natürlich können "wir" unser Startrating einfach mal um
200 ELO senken, an den Realitäten, sprich Abständen untereinander ändert sich dadurch
nichts. Die Werte sehen halt nur aus menschlicher Sicht "realistischer" aus.

Was wäre denn ein Startwert nach Deinem Geschmack? Wieviel "darf" denn die beste
Engine, z.B. Houdini nach Deinem Dafürhalten haben? Weniger als die menschliche Nr.1?
50 mehr, 100 mehr? Die Werte mögen zu hoch sein, aber soooo unrealistisch sind sie
m.E. gar nicht. Ich bin fest davon überzeugt, dass es auf dieser Welt KEINEN Menschen
gibt, der gegen Houdini mehr als 10-15 % macht. Ich meine realistisches Schach, nicht
spezielle Anti-Computer-Strategien oder gar Nutzung "illegaler" Hilfsmittel wie Premove.
Und dies vorausgesetzt sind mind. 300-350 ELO Unterschied (10% sind etwa -370 ELO) gar
nicht so falsch.

Leider werden wir wohl nie erfahren, ob ich da falsch liege...


Hier driften unsere Meinungen auseinander. Dass kein Mensch mit realistischem Schach
gegen Houdini mehr als 10-15 % macht ["doofe" Blitzpartien ausgenommen] kann ich
mir schlicht nicht vorstellen, wiederum vorausgesetzt, dass der Mensch durch rein
solides Spiel und nicht auf Gewinn spielen wollen die Sache verpatzt. So gesehen
sind Deine 300-350 Elo weit übertrieben. Dass für solche Wettkämpfe Spieler wie
Shirov und Morozewich nicht geeignet sind, ist auch klar, weil die wahrscheinlich
einfach nicht aus ihrer Haut heraus können. Aber Du sagst es: fast müssig ist es,
darüber zu spekulieren, weil solche Matches nicht mehr stattfinden werden.

Zitat:
Gruß
Wolfgang
Parent - - By Frank Quisinsky Date 2010-12-20 18:40
Hi Wolfgang,

das ist aber nicht gerade inoffiziell wenn Du offiziell dazu im Detail schreibst.
Ganz ehrlich, ist doch ein wenig inkonsequent, oder sehe ich das falsch?

Entweder ist teste für mich oder offiziell.
Aber eine offizielle Liste zu betreiben in dem dann die Tester inoffiziell testen um die Ergebnisse dann offiziell wieder bekannt zu geben ist zumindest offiziell verwirrend.

Wie dem auch ist, schön die Ergebnisse zu haben!

Also im schnellen CEGT Blitz etwas besser als im langsamen IPON Blitz und das deutet darauf hin, dass wenn die Bedenkzeit weiter ansteigt die Leistung etwas abfällt. Wäre jetzt meine Schlussfolgerung aber die muss ja auch nicht richtig sein.

Gruß
Frank
Parent - - By Günther Höhne Date 2010-12-20 18:53 Edited 2010-12-20 18:57
Hallo Frank,

vielleicht muss man das ein bisschen anders sehen, die CEGT Tester sind alle privat, können da testen was sie wollen.
Was die Interessen der gesamten Gruppe angeht, ist wieder ein anderes Thema, die letzte Abstimmung war 4:2 dagegen, also war Houdini bisher nicht in der Liste.

Gruß
Günther
Parent - By Frank Quisinsky Date 2010-12-20 18:59 Edited 2010-12-20 19:04
Hallo Günther,

sehr richtig!

Wird differenziert:
Interessen des Einzelnen / Interessen der Gruppe

Wäre die Vorgehensweise logisch.
Nicht immer ist Gruppenbildung gut, wobei ich eigentlich auch ein Fan dieser Gruppenbildung bin.

Dagegen steht:
Welche Interessen gehen vor, die des Einzelnen oder die der Gruppe.
Sind die Interessen der Gruppe vordergründig sind logischerweise die Interessen des Einzelnen nachrangig.
Insofern hat sich der Einzelne den Interessen der Gruppe zu fügen, damit das gemeinschaftliche Auftreten der vordergründig stehenden Interessenlage "Gruppe" nicht angezweifelt werden kann.
Wäre die richtige Auslegung!

Aber da die Gruppe selbst keine kommerziellen Interessen verfolgt, sondern das Interesse an diesem Hobby auf privater Ebene vordergründig ist, schaut es wieder anders aus.
Schwieriges Thema!

Wie dem auch ist, bin ja froh die Ergebnisse der CEGT zu haben, so auch die vom inoffiziellen Houdini Test.
Kann auch jedes Wort so gedreht werden wie man es gerne hätte ... war jetzt aber nicht meine Absicht.

Wir haben heit einen inoffiziell offiziellen Test, der offiziell inoffiziell ausgelegt werden sollte damit weitere offizielle Anhaltspunkte inoffiziell zur Verfügung stehen PUNKT. Ist doch ganz einfach!

Aber, wir hatten das heute erst ...
Jeder liest das was er gerne lesen möchte!

Gruß
Frank
Parent - - By Ingo Bauer Date 2010-12-20 19:00 Edited 2010-12-20 19:03
[quote="Frank Quisinsky"]
... Also im schnellen CEGT Blitz etwas besser als im langsamen IPON Blitz und das deutet darauf hin, dass wenn die Bedenkzeit weiter ansteigt die Leistung etwas abfällt. ...
[/quote]

Nein Frank, das glaube ich nicht.

Die CEGT Blitz ist die Liste der CEGT bei dir ich am meisten Bauchschemrzen habe. Um nur einmal Aufzuzeigen was los ist im Vergleich zu meiner Liste: Mehrere Leute (OK ,das ist logisch - und wenn man es richtig macht kein Problem!), unterschiedliche Hardware, Bedenkzeiten werden nicht mehr vollumfänglich angeglichen (und wenn dann nach einem veraltetem und falschem Schlüssel), da man sonst zu schnell spielen würde, verschiedene Bücher - oder verschiedene Eröffnungsstellungen und natürlich Ponder OFF.

Wer da Unterschiede zu erst auf die Bedenkzeit zurückführt springt bestimmt zu kurz!

Wenn ich z.B. die 40/4 mit meiner Liste vergleiche, die ich dir am WE zugeschickt habe, kommt nur Müll raus, während sich zur 40/20 eigentlich erstaunliche Paralellen finden lassen, Was dann in der logischen Fortführung bedeutet das die 40/4 der CEGT nicht zur 40/20 der CEGT passt.

Gruß
Ingo
Parent - - By Frank Quisinsky Date 2010-12-20 19:08
Hallo Ingo,

ja, das ist auch wieder etwas dran.
Habe meine SWCR Blitz-Ratingliste aus diesem Grund in den Müll geworfen.
Waren einfach zu viele Dinge die mir unlogisch erschienen und für mich dann nicht mehr zu erklären waren.
Darauf hatte ich auch keine Lust mehr!

Selbst tausende von Partien bringen oftmals keinen Aufschluss.

Die 40 in 20 Liste der CEGT, auch ohne Ponder, ist z. B. auch für mich absolut logisch und plausibel.

Bei Dir sind es ein paar Engines die ca. 20-30 ELO abweichen.
Auch immer die Gleichen wie Junior, Naum etc. wie von Dir auch bei dem neuen Vergleich festgestellt.

Das deutet dann wieder darauf hin, dass Du Deine Meinung zu ... nimmt mit mehr Zeit ab oder zu zumindest mal leicht überdenken solltest.
Glaube ja auch nicht, dass z. B. ein Junior mehr als 30 ELO zunehmen würde wenn ich z. B. mit 4facher Bedenkzeit spielen würde aber das sind dann wieder Glaubensfragen die kaum im Detail wirklich beantwortet werden können.

Gruß
Frank
Parent - By Ingo Bauer Date 2010-12-20 19:29
Hi

[quote="Frank Quisinsky"]
Die 40 in 20 Liste der CEGT, auch ohne Ponder, ist z. B. auch für mich absolut logisch und plausibel.
[/quote]

Ja, hier mußte ich lernen und kann nicht gravierendes mehr gegen die CEGT 40/20 sagen!

[quote="Frank Quisinsky"]
Bei Dir sind es ein paar Engines die ca. 20-30 ELO abweichen.
Auch immer die Gleichen wie Junior, Naum etc. wie von Dir auch bei dem neuen Vergleich festgestellt.

Das deutet dann wieder darauf hin, dass Du Deine Meinung zu ... nimmt mit mehr Zeit ab oder zu zumindest mal leicht überdenken solltest.
Glaube ja auch nicht, dass z. B. ein Junior mehr als 30 ELO zunehmen würde wenn ich z. B. mit 4facher Bedenkzeit spielen würde aber das sind dann wieder Glaubensfragen die kaum im Detail wirklich beantwortet werden können.
[/quote]

Na ja Frank, hast du ien Mail ganz gelesen? Ich bleibe bei deinen Bsp.

>es ein paar Engines die ca. 20-30 ELO abweichen

Ein einzige Engine weicht 31 Elo ab, aber die könnte auch asuserhalb der 95% liegen, oder Hauptsächlich von einem tester getestet worden sein, oder gerade schlechte oder gute Eröffnungen erwicht haben ... viele Möglichkeiten. (und wenn es jemanden interssiert, es ist "Zappa Mexico 1", die einzige Engine die ausserhalb zweier Error Bars zw. IPON und CEGT 40/20 liegt - und wen es noch interessiert: ZM2 weicht zw. IPON und CEGT 40/20 um 0.29 ELo ab, trotz doppelter Bedenkzeit ...)

Die 20 ELO Enignes Junior und Naum will ich näher beleuchten:

Der aktuelle J12 weicht 5 Elo ab ... ich schrieb auch in der Mail das ist praktisch nichts, ich würde es "Rauschen" nennen! Der direkte Vorgänger, J11.2 ist bei längerer Bedenkzeit schlechter(!), was ja der vorgefassten Meinung wiederspricht (22 Elo, aber innerhalb der 95% Errorbars!) die beiden Vor-Vorläufer(J11.1/J2010) sind 27, respektive 26 Elo besser bei längerer Bedenkzeit. Da sich diese Engine so unterschiedlich verhält, weiß ich nicht, warauf das zurückzuführen ist - logisch kann ich es nicht erklären?

Naum: bis zur Version 4.1 war Naum bei der CEGT 40/20 praktisch immer besser als bei IPON. Ich habe das damals auf POFF und PON zurückgeführt, muß heute aber sagen, die kleinen Unterschiede, die niemals beide 95% Errorbars verlassen bekomme ich nicht erklärt. Der aktuelle Naum 4.2 weicht 11 Elo ab, das ist jetzt nicht unbedingt wenig, aber auch nicht soo ungewöhnlich.

Wenn ich also deinen obigen Test lese, und das mit meinen Ausführungen verlgeiche, sind wir wieder bei: Jeder nimmt das war das ihm passt

Gruß
Ingo
Parent - By peter struwel Date 2010-12-20 19:14
hi ingo,

die vorgehensweise bei deiner testerei erscheint mir vorbildlich!
trotzdem sehe ich bei deiner liste und eloberechnung ein manko,
denn die aufgeführten engines haben eine ungleiche gewichtung!
frank's liste weist diesen mangel in stärkerer weise auf.

korrekt ist es nur wenn wirklich alle engines gleich gewichtet werden.

nix für ungut, weiter so

peter
Parent - - By Wolfgang Battig Date 2010-12-21 13:30
[quote="Frank Quisinsky"]
Hi Wolfgang,

das ist aber nicht gerade inoffiziell wenn Du offiziell dazu im Detail schreibst.
Ganz ehrlich, ist doch ein wenig inkonsequent, oder sehe ich das falsch?

Entweder ist teste für mich oder offiziell.
Aber eine offizielle Liste zu betreiben in dem dann die Tester inoffiziell testen um die Ergebnisse dann offiziell wieder bekannt zu geben ist zumindest offiziell verwirrend.

Wie dem auch ist, schön die Ergebnisse zu haben!

Also im schnellen CEGT Blitz etwas besser als im langsamen IPON Blitz und das deutet darauf hin, dass wenn die Bedenkzeit weiter ansteigt die Leistung etwas abfällt. Wäre jetzt meine Schlussfolgerung aber die muss ja auch nicht richtig sein.

Gruß
Frank
[/quote]

Hallo Frrank,

vielleicht hätte ich die Überschrift anders formulieren sollen, dachte allerdings, es wäre klar.

Aber ok, dann für alle, die es nicht verstanden haben (oder nicht verstehen wollten?)

Es handelt sich um einen "privaten Test unter den üblichen CEGT-Bedingungen, dessen Partien b.a.w nicht in unsere Liste einfließen und der von daher als inoffiziell zu betrachten ist"!!!
Natürlich werden die Partien - wie auch die der 1.02 und der 1.03a - gesammelt, sodass sie für den Fall, dass sich die Haltung der CEGT ändert, umgehend in die Liste integriert werden können!

Alle Klarheiten beseitigt? Bin zuversichtlich...

Gruß
Wolfgang
Parent - By Frank Quisinsky Date 2010-12-21 13:38
Hallo Woofgang,

Jo!
Aber für mich war das schon klar

Habe mir ja für diesen Zweck auch ein nettes Wortspielchen ausgedacht.

Die SWCR-32 und die experimentelle SWCR-64
Bei der experimentellen mit und bei der SWCR-32 ohne diese Engines.
Wobei mir wirklich die SWCR-32 wichtiger ist ich aber derzeit an der SWCR-64 aufgrund der vielen Updates regelrecht kleben bleibe.

Irgendwie nimmt mir das ja auch jeder ab

Gruß
Frank
Parent - - By Wolfgang Battig Date 2010-12-21 13:33
[quote="Wolfgang Battig"]
Hallo zusammen,

mittlerweile sind 800 Partien mit 40/3 gespielt, weitere 600 enden heute abend.

Nach diesen 800 Partien liegt die Performance von Houdini bei (sensationellen) 3256 ELO und damit einem Plus von 76 Punkten (!!!) zum Rating von Rybka 4.0 x64 1CPU.
Die heute endenden 600 Partien werden die Performance sogar noch steigern, denn sie liegt in allen 3 Matches teils sogar deutlich über 3256.

Alle Ergebnisse, auch die der beiden Vorversionen hier: http://cegt.foren-city.de/topic,435,-testing-houdini-1-xx-x64-1cpu-inofficial.html

Gruß
Wolfgang
[/quote]

die zusätzlichen 600 Partien ergaben ein weiteres Plus von 16 ELO, sodass die Performance jetzt bei 3272 ELO liegt. Einzelergebnisse unter dem o.a. Link
Parent - - By Wolfgang Battig Date 2010-12-22 08:57
[quote="Wolfgang Battig"]
[quote="Wolfgang Battig"]
Hallo zusammen,

mittlerweile sind 800 Partien mit 40/3 gespielt, weitere 600 enden heute abend.

Nach diesen 800 Partien liegt die Performance von Houdini bei (sensationellen) 3256 ELO und damit einem Plus von 76 Punkten (!!!) zum Rating von Rybka 4.0 x64 1CPU.
Die heute endenden 600 Partien werden die Performance sogar noch steigern, denn sie liegt in allen 3 Matches teils sogar deutlich über 3256.

Alle Ergebnisse, auch die der beiden Vorversionen hier: http://cegt.foren-city.de/topic,435,-testing-houdini-1-xx-x64-1cpu-inofficial.html

Gruß
Wolfgang
[/quote]

die zusätzlichen 600 Partien ergaben ein weiteres Plus von 16 ELO, sodass die Performance jetzt bei 3272 ELO liegt. Einzelergebnisse unter dem o.a. Link
[/quote]

Test beendet (2000 Partien), keine wesentlichen Veränderungen mehr (3273)
Parent - By Bert Rinzel Date 2010-12-22 09:42
Spätestens wenn es Rybka nicht gelingt in Kürze mit Houdini gleichzuziehen oder möglichst noch zuzulegen, wird wohl niemand mehr daran glauben, dass VR es war, der die Szene jahrlang dominiert hat.
Parent - - By Ulrich Harm Date 2010-12-22 13:45
Hallo Wolfgang und die ganze Runde,

Angesichts einer solchen Performance von Houdini 1.5 (nach Deiner aktuellen
Rating-Liste Elo 3273 von 2000 games bei 1 CPU / 64 bit/ 40/3 - Zeitkontrolle)
wird die Luft für die gesamte Konkurrenz sehr dünn (insbesondere für die
kommerzielle Konkurrenz, evtl. mit Ausnahme von Rybka) !
Mit 117,5 - 82,5 gegen Rybka 4 (58 %);  157 Punkte aus 200 Partien gegen
Naum 4.2 (79 %) ;  158, 5 Punkte aus 200 Partien (79 %) gegen Shredder 12, 
und sogar 172,5 Punkte aus 200 Partien gegen Fritz 12 (86 % !!)
oder 178 Punkte aus 200 Partien geben Hiarcs 13.1 (89 % !) 

scheint die gesamte kommerzielle Konkurrenz ausser Rybka total abgehängt
zu sein mit einem Abstand von etwa 150-200 Elopunkten (Naum, Shredder)
bis hin zu 200-300 Elopunkten (Fritz, Hiarcs ;  => beim neuen, noch schwächeren
Junior 12 möchte ich das Resultat lieber erst gar nicht mehr wissen !).

Da stellt sich dann schon die Frage, ob die kommerzielle Konkurrenz ausser
Rybka hier noch in absehbarer Zeit den Anschluss wieder wird finden können !
Daran kommen dann schon Zweifel auf. Die meisten kommerziellen Engines
haben ja schon Jahre gebraucht, um den damals ebenfalls grossen Vorsprung
von Rybka 3 bei seinem Erscheinen aufzuholen (=> bis auf Naum haben das
die anderen kommerzielle Engines sogar bis heute nicht geschafft !! ).

Und nun noch das ! Ein weiterer Sprung nach vorn mit Houdini 1.5 um mindes-
tens 70-80 Elopunkte (vor Ryka 4), und das auch noch kostenfrei (sogar 
sofort auch noch mit voller 64 bit- und Multiprozessor - Unterstützung !).

Ich schätze, das bedeutet das Aus für die Weiterentwicklung der meisten
kommerziellen Engines ausser Rybka, es sei denn, sie werden künftig
sehr billig oder gar kostenfrei angeboten, was natürlich für einige
Computerschach-Liebhaber sehr reizvoll wäre.

Für uns als User solcher Programme zur Analyse von Stellungen oder Partien
oder zum Eröffnungsstudium, für Engineturniere etc. etc. ist das natürlich super,
da wir nun z.B. mit Houdini 1.5, Stockfish 1.9.1 und Critter 0.90 schon kostenfrei
hervorragend ausgestattet sind ! Vielen Dank an die Entwickler dieser tollen und
auch anderer starker und talentierter kostenfreier Engines (Spark, Komodo etc.) !

 


      Gruss Ulrich
______________________

   



  
Parent - By peter struwel Date 2010-12-22 18:30
[quote="Ulrich Harm"]

...
Da stellt sich dann schon die Frage, ob die kommerzielle Konkurrenz ausser
Rybka hier noch in absehbarer Zeit den Anschluss wieder wird finden können !
Daran kommen dann schon Zweifel auf. Die meisten kommerziellen Engines
haben ja schon Jahre gebraucht, um den damals ebenfalls grossen Vorsprung
von Rybka 3 bei seinem Erscheinen aufzuholen (=> bis auf Naum haben das
die anderen kommerzielle Engines sogar bis heute nicht geschafft !! ).

Und nun noch das ! Ein weiterer Sprung nach vorn mit Houdini 1.5 um mindes-
tens 70-80 Elopunkte (vor Ryka 4), und das auch noch kostenfrei (sogar 
sofort auch noch mit voller 64 bit- und Multiprozessor - Unterstützung !).
...

 


      Gruss Ulrich
______________________
 
[/quote]

hi ulrich,

fritz ist doch schon lange mausetot, die schaffen es ja noch nicht mal eine funktioniernde gui beizubehalten wie
man hier vor kurzem lesen konnte. chessbase hat kein qualitätsmanagement, trotzdem kommen immer neue fritzens raus,
immer neue inkompatibilitäten werden hinzugefügt, anstatt fehler zu beseitigen. preis und leistung stimmen hier nicht mehr.
viel schrott für viel zu viel geld!

auch rybka ist mausetot, denn VR schafft ja noch nicht einmal, dass sein Rybka alle Schachregeln beherrscht! lachhaft.

und wenn ich im rybka forum lese was das fischbecken macht, graust es mich! ein murx produkt! ich möchte es noch nicht einmal geschenkt bekommen!!!

ebenso haben namhafte andere programmierer es nicht geschafft sich von alten zöpfen ihrer programmierkunst zu lösen.
wenn sie weiter erfolg haben möchten, müssen sie ihre programme von grund auf neu strukturieren, anders geht es nicht.

also programmierer fangt von vorne neu an, gute gui`s mit sinnvollen funktionen auch ausfürliche datenbank auswertefunktionen
sind gefragt. schnickschnack ist überflüssig!
Parent - - By Benno Hartwig Date 2010-12-22 21:56
[quote="Wolfgang Battig"]mittlerweile sind 800 Partien mit 40/3 gespielt, weitere 600 enden heute abend. [/quote]Seit die ersten Robbolitos in die Szene purzelten, haben sie Rybka3 und dann auch 4 auf sehr kurzen Zeiten den Garaus gemacht.
Bei langen Zeiten, die dutlich mehr an Turnier als an Blitz erinnern, schienen die Burschen nach meinem Eindruck aber nicht recht an Rybka4 vorbei zu kommen, aucn wenn vereinzelt gemeldet wurde "Doch bei mir lag Robbolito auch bei langen Zeiten vorn".
Wie schlägt sich der neue Houdini denn bei so langen Zeiten gegen den alten Spitzenreiter? Hat da schon jemand was ertestet?
Benno
Parent - By peter struwel Date 2010-12-22 23:12
Up Topic Hauptforen / CSS-Forum / Houdini 1.5 x64 1CPU (CEGT-Test inoffiziell)

Powered by mwForum 2.29.3 © 1999-2014 Markus Wichitill