Skip to content

v41

Compare
Choose a tag to compare
@yssaya yssaya released this 08 Dec 10:13
· 7 commits to release since this release
b452d10

【ビルド済みバイナリ】
・aobazero-41-w64-opencl.zip (64ビット版 Windows で GPU を利用したいユーザ用)
・aobazero-41-w64-cpu-only.zip (64ビット版 Windows で GPU を利用したくないユーザ用)
【主な変更点】
強化学習で生成する棋譜の強さを1手平均1600playoutsから3200playoutsに変更しました。
400playoutごとに探索を停止するか判定し(kldinterval 400)、前回と比べて探索数の分布が似てるなら(kldgain 0.0000004)停止します。最短で1手400playout、最大で1手12800playout行います。
正確には1手3180playouts/moveぐらいです。
推定で+80 ELOほど生成される棋譜が強くなり、これで学習したWeightが今後強くなるのを
期待しています。
ほぼ同じ設定でfloodgateで流しています。
http://wdoor.c.u-tokyo.ac.jp/shogi/view/show-player.cgi?event=LATEST&filter=floodgate&show_self_play=1&user=AobaZero_w4260_kld_avg_3200p