从随机选择到倾向选择,AlphaGo这样工作