コンピュータ将棋レビュー
駒落ち王者決定戦(笑) 総対局数112局!
2003.9.6 作成
本稿は、かずさんが白砂掲示板に投稿していただいたものをまとめたものです。
元の投稿はこちら(http://www.hakusa.net/bbs2/mibbs.cgi?mo=p&fo=shogi&tn=0025&rs=157&re=157&rf=no&al=on)にあります。
東大5ライトを買いました!
東大の試用を兼ねて、前から気になっていた各ソフトの駒落ちでの棋力をテストしてみました。棋力を確定するのに充分な対局数とは言えませんが、各ソフトの差は現われたと思います。ちょっと特殊な話題なので、こちらに書き込ませてもらいます。
「白砂自身も、駒落ちのヘタレ部分については「議論の対象」にはしたいと思っています(白砂掲示板149)」の意図もちょっと気になってますので。終わっていたスレに長文失礼。
テストは柿木6・東大5・激指2による二枚落ち戦です。各ソフトの最強対局レベルを上手にして他ソフトのどのレベルとつりあうかを調べて、下手側をものさしに各ソフトの駒落ちでの棋力を比べようという事です。
使用マシン:Celeron1.4GHz(Tualatin,FSB=100MHz,L2=256KB),512MB(PC100,CL2),Windows XP。マシン一台での対局。先読み・学習オフ、他デフォルト設定。柿木は定跡のみ乱数使用。
持ち時間:激指2は30秒で打ち切るので30秒に統一すれば公平に思えますが、それでは激指の特性に合わせた条件とも言えます。まずは柿木=一手60秒、東大=無制限(実質40秒)で50局ほど試した所……
明らかに 柿木>>東大>>激指 です。
しかし上の順位は持ち時間の長さとも一致しているので、東大・柿木も1手30秒の条件を加えてテストを続けました。
さらに本当の最強レベルを味わう為に、柿木=1手600秒、東大=持ち時間999分でのテストもしました。ただし思考時間による差はかなり数をこなさないと現われないでしょうから、長時間>短時間という前提で各データを総合して判断しています。
各条件のテストは差が現われた時点で打ち切っているので、条件ごとの対局数はバラバラです(厳密には「何処でテストを打ち切るか」という作為が混入している)。
それではデータを紹介します。
柿木上手20戦、激指上手9戦。∴柿木600・60・30は中級程度。
- 柿木600:上級に2連敗。中級に1勝3敗。初級に1勝1敗。
- 柿木 60:上級に2連敗。中級に2勝1敗。初級に1勝。
- 柿木 30:上級に3連敗。中級に3連勝。
- 激指 30:上級に1敗。中級に4連敗。初級に4連勝。
激指は中級と初級の間。
柿木600≧柿木60≧柿木30>激指
東大上手17戦、激指上手13戦。∴東大999・40・30はL5の少し下。
- 東大999:L6に1敗。L5に3連敗。L4に1勝。
- 東大 40:L6に2連敗。L5に1勝1敗。L4に1勝。
- 東大 30:L6に2連敗。L5に1勝2敗。L4に2連勝。
- 激指 30:L6に1敗。L5に4連敗。L4に3勝3敗。L3に2連勝。
激指はL4と互角。
東大999≧東大40≧東大30>激指
柿木上手24戦、東大上手29戦。∴柿木600・60は二段の少し下。柿木30は初段と2級の間。
- 柿木600:三段に1敗。二段に2連敗。初段に1勝1敗。2級に1勝。
- 柿木 60:三段に2連敗。二段に1勝3敗。初段に3連勝。
- 柿木 30:二段に1敗。初段に4連敗。2級に4連勝。
- 東大999:三段・二段に1敗。初段に2連敗。2級に1勝1敗。4級に1勝。
- 東大 40:三段に1敗。二段に3連敗。初段に2勝1敗。2級に1勝2敗。4級に2連勝。
- 東大 30:二段に1敗。初段に1勝2敗。2級に2勝2敗。4級に2連勝。
東大999・40・30は初段と2級の間。
柿木600≧柿木60>柿木30≧東大999≧東大40≧東大30■参考:後述する「19局時点」のデータ:同一局を含む
東大 40:三段に1敗。二段に2連敗。初段に6連敗。2級に1勝3敗。4級に2連勝。
東大 30:初段に1勝。2級に1勝1敗。4級に1勝。
柿木600=19.1秒、柿木60=14.6秒、柿木30=13.3秒
東大999=13.3秒、東大40=10.3秒、東大30=9.31秒
激指=4.71秒
柿木600≧柿木60>柿木30≧東大999≧東大40≧東大30>激指やはり
柿木>>東大>>激指
棋譜は保存していませんが、各対局の手数・上手の消費時間・何手目で定跡から外れたかは記録を取りました。ちなみに「どちらが先に定跡を外すか」についても同じ順位が現われ、駒落ちへの取り組みの差が感じられます。
激指が先に外した局数はなんと74/75(唯一は対東大上手)。
激指の下位レベルは定跡を外してくるせいもありますが、この数字はひど過ぎる。
東大が先に外した局数は20/75、柿木は18/74。
東大vs柿木戦に限ると東大が19/37。差は小さいのですが、東大が相手を外させた局面では実は東大側にも続きのデータが無いものが目立ちます。
幾つか同一棋譜が出現しましたが基本的には気にせずカウントしてます。やはり駒落ちの定跡は貧弱ですね。
東大上手vs激指下手の場合には19局の時点で10局が同形となり(激指のレベル・東大の思考時間が同じなら同一棋譜になるので)、この顔合わせに限り同一局を除外し以後は激指の学習機能をオンにしました。注:激指の学習機能には、指し手をランダムにする以上の効果はないと私は思っています。上の変更(学習機能オン)においては逆に東大有利に作用しています。比較対象になる柿木上手戦でも激指を学習オンにして追加データを取りましたが、こちらも僅かに柿木有利に作用しました。
柿木600も東大999も短時間モードより悪い結果になりました。対局数が少ないので運が悪かったのでしょうか。まさか本当に時間が長いほど弱くなってたりして……。
二枚落ちでは時間を使うような局面が少なく、その時にはもう手遅れだったりもするので、持ち時間による差は(ある程度以上なら)あまり出ないという事でしょうか。注:逆転した結果が出た場合は両データを平均して判断した上、長時間≧短時間としている。なお柿木600が東大中級に喫した3敗は全て同一棋譜、上級への2敗も17手目から同手順。この顔合わせでは同一棋譜はこれだけなので、かなりの偶然だ。つまり当てにならないデータな訳だが、多少続けても短時間モードより良い結果にはならないのでテストを打ち切った。
同じ30秒設定で比べても、激指は実思考時間が格段に短い。なので、このデータから「強さと実思考時間がほぼ比例しており、アルゴリズムに差は無い」という解釈も出来るかも。まぁそれでも平手戦でのよくある評価とは違う結果なので良しとするか・・・。
上手での棋力と下手での棋力にも違いがあるかも知れません。
将棋タウンの考察文11でも、下手では棋力が落ちるが上手ではそうでもない、との記述がありました。駒落ちは需要が少ない為に重視されていないとすれば、ソフト下手の需要はさらに少ないからでしょうか。