ホーム開発関連深層学習コンピュータ将棋PyTorch系エンジンの説明→V1.0.2

【バージョン】
V1.0.2

【入力特徴】
駒の配置、持ち駒(歩は6枚まで、その他は全部)、手番、自玉の8近傍にある金銀の配置、金銀を3枚以上持っているか、桂を2枚以上持っているか、香を2枚以上持っているか、歩切れか、自分だけ龍を作っているか、自分だけ馬を作っているか、自玉に王手がかかっているか、盤上と駒台の金銀の合計が6枚以上か、龍が敵陣にあるか、自玉の8近傍に自分の馬・角が長い利きをつけているか、敵玉の8近傍に自分の馬・角が長い利きをつけているか(合計105個)

【学習に使用したデータ】
技巧2で生成した対局データ220,099局分。思考時間は1手1秒。

【テストデータの一致率】
46.41%

【学習の概要】
オプティマイザはSGDを使用, lr = 0.003, momentum = 0.9, weight decay = 0.0001, nesterov = True, ResNet5層, 処理の前にデータをシャッフルする。

【備考】
Policy Networkのみ学習。lrはプラトーになったら0.8を掛ける。ResNetは5層しか使用していないが、一致率は向上した。
Copyright © 2011-2024 I&T Soft All rights reserved.