黙ってボナメソ

昨日からgpw2006.pdfを読んでいる。ひたすらボナメソ。
見れば見るほど、うまい方法だ。
利きだけで評価関数が作れたらかっこいいと思っていたが、勝てる気がしない。
各局面に対して、プロの指し手とそれ以外の合法手を分ける評価関数を作る。
現在の評価値がプロの手と近い手について、探索した結果局面を比較して、
異なっている特徴があれば、プロの手に有利に更新する。
この更新は、すべての局面・合法手について足しあわせ一括で行う。
駒割の和を一定に保つ。駒割を更新したときだけいじればいい。
歩の価値を高く更新したとき、歩以外の駒の価値が微妙に下がるけど、別にいい。
そして、駒割以外の特徴ベクトルの大きさが小さくなるようにペナルティをかける。
出現頻度の高い特徴には、特に圧力をかける。
ペナルティがこの形である必然性が全然イメージつかない。
しかし、しばらくコーディングしてないと、書くのが億劫になるなあ。
目先のto do は王手関係だけど、難しい。効率を無視すれば書けるけど。
この一手というきれいなコードが見えないと、筆が進まないのだ。