電王戦においてプロ棋士敗北(考察)

電脳戦が忘れられません。気になり色々と調べたので意見や感じたことを織り交ぜながら記述します。
ニュースでも流れましたが、山崎8段がポナンザに負けました。この一局は色々なことを示唆するような対局でした(この対戦が、どうして負けたのかどうすれば勝てるのかというヒントを満載していたから)。
印象的だったのが途中で電脳ポナンザが、「王を前に出す」というポカを指してしまったときのことです。
山崎8段はそれを咎めませんでした。後の感想では、「そういう手もあるのか。すごいな」という感想。このことから三ヶ月の練習試合においてコンピューターの繰り出す新手・奇手に対して何百回も苦渋を舐めさせられていたことが想像されます。
もう一つの問題が疲労です。おそらく山崎8段がロボットであればそのポカをポカと見破り勝利していたことでしょう。しかし疲れていたために判断力が低下していたようです。
強さの秘密)
さて興味を惹くのはこの強さです。一体どうして強いのでしょうか?
調べたところその秘密は、「勝利の形」と「深層学習」という方法にあります。
ざっくり説明すると勝利の形とは勝者が作る三点を結んだ駒の三角形(例:歩・飛・角)。深層学習とはポナンザ対ポナンザで対戦を重ねて勝敗を比較検討することで自己学習して強くなる方法です(数年で80億回の対局)。
印象的だったのは一般的な常識(最初は飛車先の歩を進める)を一切そぎ落としてしまう手を平気で打つのです。例えるならば剣道において礼をしたらいきなりメンをくらうような感じです。
この方法を知ったときに深層学習の先には何があるのだろう?と想像しました。
意外や意外に巡り巡って一周するのだろうか。それともパーフェクトな定石が発見されるのではないか(丸暗記したプログラマーが将棋で7冠達成を成し遂げてしまう未来)。
まとめ)
感じているのは電脳戦は数回しか対局が成されていません。本当の戦いはプロがコンピューターはミスをしないという呪縛から逃れたときだと思います(それというのも中後半はコンピューターに有利を判断した棋士が勝利したからです)。
またポカをポカと見破る能力や奇手を繰り出す勇気があれば勝てるような気がしました。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です