将棋ソフト「ボナンザ」開発者・保木邦仁さんの話がいくらかわかりやすくなっていた件

こんにちは。

前回のあらすじ

前の記事「【メモ】羽生善治さん、2000年の対談でコンピュータ将棋へコメント。など」（2014/05/04）で、当時の羽生さんの発言をふり返りました。

2007年の中間マイルストーン

そこから現在までのあいだに、関連する本は『ボナンザVS勝負脳』（2007）の1冊だけ読みました。時間軸上では、ちょうど中間地点に位置します。

ボナンザＶＳ勝負脳　――最強将棋ソフトは人間を超えるか (角川oneテーマ21)[Kindle版]

posted with ヨメレバ

保木邦仁,渡辺明 KADOKAWA / 角川書店 2014-01-27

Kindle

Amazon[書籍版]

将棋ソフト「ボナンザ」の開発者・保木邦仁さんと、そのソフトと2007年3月に対局し勝利を収めた棋士・渡辺明さんの原稿と対談とで構成されている本です。

保木さんは当時化学系の研究者を本職としていたらしいのですが、ど天然です。ど天然のカシコです。

とにかく素で賢いのです。

2007年の保木邦仁さん

保木さんは素で賢いので、たとえばこんな話を平気で放り込んできます。

　熟練した人間の棋譜との指し手一致の度合いを測る目的関数を設計し、これに停留値を与える静的評価関数の特徴ベクトルを求める。そしてこの特徴ベクトルがゼロとなる自明な解を除去し、棋譜サンプル数の不足に起因するオーバーフィッティングを回避するために、ラグランジュ未定乗数法というものを用いて、目的関数に拘束条件を課した。目的関数の停留値であるが、これは静的評価関数の勾配を用いて探索される。これは、古くから知られている最適制御理論の枠組みに沿った手法なのである。（p.28）

思考アルゴリズムのデザインプランを述べているのでしょうが、自分の頭には全然入ってきません。

2013年の保木邦仁さん

そこから7年経っているので、保木さんの近況を知ろうと検索してみると、こんな記事が見つかりました。

《戦経インタビュー》◎国立大学法人電気通信大学特任助教　将棋ソフト『ボナンザ』開発者　保木邦仁氏に聞く　将棋ソフトは人知を超えたのか…（『戦略経営者』2013年8月号より転載）｜tkc.co.jp

一部抜粋して紹介しておきます。

──それから、『ボナンザ』でもう一つ画期的だったのが、人工知能分野でさかんに研究されている「機械学習」という手法を採用したことだったと聞いています。

保木　はい。機械学習とはコンピュータ自身が学んでいく自動学習のことで、力づく探索によるしらみつぶしの手法に「命を吹き込む」作業でした。機械学習は従来の将棋ソフトでうまく活用されている例を見つけることができなかったので、僕はそこに本業で研究していた制御理論（化学反応制御）を持ち込んでみました。

保木　単純化していうと、大量のプロ棋士など強い人の棋譜を入力し、その棋譜と同じような手を指せるように一手ごとの「評価関数」（有利・不利の度合い）を自動調整する仕組みです。棋譜の数は約6万件にも及び、古いものでは江戸時代、1607年にさかのぼる棋譜まで入力しました。これが、「『ボナンザ』の指す手は人間の感覚に近い」と言われるゆえんなのかもしれません。もちろん力づく探索によって生じる大量の手の「枝刈り」の工夫は機械学習だけではなく「アルファベータ法」や「ナルムーブ法」など多数施してあるのですが……。

素で賢いのは相変わらずですが、2007年の本よりいくらかわかりよかったです。何度も話して保木さんもこなれてきたのでしょうか。この記事を構成している人が優秀なんでしょうか。

素で賢いのは相変わらず

──ところで、先［引用者注: 2013年］の電王戦ではコンピュータが3勝1敗1引き分けと勝利しました。率直に言ってコンピュータはプロ棋士を超えたと思われますか。

保木　それは分かりませんが、僕はまだじゃないかと。

というあたりも、相変わらず素で賢いなと思いました。つづき。

保木　まず言えるのはデータが少なすぎます。チェスにしても最初にディープブルーが世界王者に「勝った」とされた時の成績は2勝1敗3引き分けという微妙なものでした。その後も互角の競り合いが6、7年は続いたように思います。将棋にしても人とコンピュータの競り合いは始まったばかり。しかも、（略）圧倒的に将棋の方が複雑なのです。つまり、その分だけソフト開発が難しいということですね。だとすれば、今後も互角に近い競り合いがしばらくは続くのではないでしょうか。

──コンピュータには「入玉戦法（王や玉を相手陣地に入り込ませ、詰みにくくする戦法）に弱い」という点も指摘されています。

保木　『ボナンザ』も例外ではありません。その最大の理由は入れ込むべき過去の入玉の棋譜データが少ないからです。これ以外にもコンピュータには明らかなくせや弱点があります。人間がそれらのくせを徹底研究し、どんどん発見するような状況になれば、再度、コンピュータはプロ棋士に勝てない時代が来ないとも限りません。

──一方で、将棋ソフト開発者のなかには「コンピュータは名人を超えた」と豪語されている方もおられるようです。

保木　超えたのかもしれませんし、超えてないのかもしれない。これは分からないとしか言いようがありません。分かるためにはどんどん対局を行い、結果を積み上げること。そうすれば徐々にはっきりしてくるということでしょう。少なくとも5戦では分かりません。ただ、いずれコンピュータが人を超える時がくるというのは間違いないと思います。

こういうのが賢い人のものの言い方、考え方です。賢くなりたいので、手本にします。

2009年のエポック

同じ記事には

2009年には、『ボナンザ』の思考ルーチンのソースコードを公開され、

とありました。

保木　（前略）2012年の世界コンピュータ将棋選手権では6チーム、2013年の大会では9チームが『ボナンザ6.0』のライブラリを採用していたようです。

電王戦では、ボナンザぽい名前のソフトがちょいちょいあるのに、保木さんが出てこないなあと思ってたら、そういう経緯だったのですね。はじめて合点がいきました。

ここ10数年のコンピュータ将棋の進化の歴史がどこかにまとまってないかなと他人頼みでいましたが、ひとつミッシングリンクが見つかりました。

さしあたりこれでいいです。