ホーム開発関連深層学習コンピュータ囲碁PyTorch系エンジンの説明→V1.0.2

【バージョン】
V1.0.2

【入力特徴】
石の配置、空白、40手前までの手(合計43個)

【学習に使用したデータ】
プロ棋士の対局データ66,480局分(回転や対称性を考慮したので実際の数は8分の1)。

【テストデータの一致率】
52.23%

【学習の概要】
オプティマイザはSGDを使用, lr = 0.003, momentum = 0.9, weight decay = 0.0001, nesterov = True, ResNet8層, 処理の前にデータをシャッフルする。

【備考】
Policy Networkのみ学習。lrはプラトーになったら手動で半減する。2019年度のNHK杯棋譜全体での一致率は50.00%であった。モンテカルロ木探索に組み込む予定の劣化版として学習させたのだが、たまたまPolicy Network専用のものよりもテスト結果が良かったので採用することにした。

Copyright © 2011-2024 I&T Soft All rights reserved.