首页>要闻>悦读 悦读
为什么说AlphaGo的胜利是件惊天动地的大事?
“国际象棋和西洋棋与围棋不同,它们不需要选手对棋局做复杂的形势评估,”乔纳森·谢弗(Jonathan Schaeffer)说道,他是加拿大阿尔伯塔大学的计算机科学家,此前他的Chinook程序曾战胜过顶级的西洋棋选手?!霸诠氏笃搴臀餮笃逯?,只需简单的启发,你就知道下一步该怎么走,衡量各个棋子的价值是选手最重要的任务——如果在国际象棋中多一个车的棋子,那你已经基本胜券在握了。但这些方式在围棋中都行不通,从人类的角度来看,围棋的棋路过于复杂,电脑很难学会。不过AlphaGo做到了,它拥有世界上首个有效的评估函数系统。
那么DeepMind是如何做到的呢?其实解决这个问题的关键是深度学习和类神经网络技术,有了它们,研究人员就能教AlphaGo下棋。就像Google Photos能帮你从无数图片中找出猫咪一样,其背后是该应用对超大量级的猫咪图片做分析后的结果,这些分析处理甚至细化到了像素级别。而AlphaGo能有如此成绩,则得益于对数百万项围棋数据的学习,包括各种棋路和棋手的比赛。
眼下,AlphaGo还在不断学习,其能力也在不断增强。起初,它还是靠学习套路(策略网络)来预测对手的落子方式,不过随着价值网络训练的深入,AlphaGo已经有了那么点“直觉”,它可以分析出比赛的态势了。在棋局中,AlphaGo已经可以通过快速对各种可能性做分析,提前考虑后面几步的落子和排兵布阵了。其实AlphaGo拥有的各项技术都是相互辅助的,类神经网络可以降低电脑的负载,提高工作效率;套路学习则可以减小其搜索范围,而价值网络则可让它从每次的比赛中总结出自己的经验。

AlphaGo拥有自己的“思考”能力
这一增强版的学习系统让AlphaGo变得更像人类,而不是靠惊人计算能力战胜国际象棋大师的IBM深蓝电脑,毕竟围棋和国际象棋在复杂程度上不属于一个量级,用深蓝电脑的方法是无法在围棋上战胜人类的。在五场比赛的间歇,DeepMind都不会对AlphaGo做调整,因此电脑只能靠自己来学习,但每天一场比赛的量确实有些少。此外,DeepMind公司创始人杰米斯?哈萨比斯(Demis Hassabis)称AlphaGo的计算能力在去年十月的比赛后一直都没有得到增强,因此现在它的能力已经达到现有硬件条件下的顶峰。
编辑:薛晓钰
关键词:AlphaGo 李世石 尾气
 
       
 

 贵阳机场冬日为客机除冰 保证飞行安全
贵阳机场冬日为客机除冰 保证飞行安全 保加利亚古城欢庆“中国年”
保加利亚古城欢庆“中国年” 河北塞罕坝出现日晕景观
河北塞罕坝出现日晕景观 尼尼斯托高票连任芬兰总统
尼尼斯托高票连任芬兰总统 第30届非盟首脑会议在埃塞俄比亚开幕
第30届非盟首脑会议在埃塞俄比亚开幕 保加利亚举办国际面具节
保加利亚举办国际面具节 叙政府代表表示反对由美国等五国提出的和解方案
叙政府代表表示反对由美国等五国提出的和解方案 洪都拉斯首位连任总统宣誓就职
洪都拉斯首位连任总统宣誓就职
 法蒂玛·马合木提
法蒂玛·马合木提 王召明
王召明 王霞
王霞 辜胜阻
辜胜阻 聂震宁
聂震宁 钱学明
钱学明 孟青录
孟青录 郭晋云
郭晋云 许进
许进 李健
李健 覺醒法師
覺醒法師 吕凤鼎
吕凤鼎 贺铿
贺铿 金曼
金曼 黄维义
黄维义 关牧村
关牧村 陈华
陈华 陈景秋
陈景秋 秦百兰
秦百兰 张自立
张自立 郭松海
郭松海 李兰
李兰 房兴耀
房兴耀 池慧
池慧 柳斌杰
柳斌杰 曹义孙
曹义孙 毛新宇
毛新宇 詹国枢
詹国枢 朱永新
朱永新 张晓梅
张晓梅 焦加良
焦加良 张连起
张连起 龙墨
龙墨 王名
王名 何水法
何水法 李延生
李延生 巩汉林
巩汉林 李胜素
李胜素 施杰
施杰 王亚非
王亚非 艾克拜尔·米吉提
艾克拜尔·米吉提 姚爱兴
姚爱兴 贾宝兰
贾宝兰 谢卫
谢卫 汤素兰
汤素兰 黄信阳
黄信阳 张其成
张其成 潘鲁生
潘鲁生 冯丹藜
冯丹藜 艾克拜尔·米吉提
艾克拜尔·米吉提 袁熙坤
袁熙坤 毛新宇
毛新宇 学诚法师
学诚法师 宗立成
宗立成 梁凤仪
梁凤仪 施 杰
施 杰 张晓梅
张晓梅


