100:0!新版AlphaGo秒杀旧版AlphaGo

东网 2017-10-19 10:33+-

100:0!新版AlphaGo秒杀旧版AlphaGo

  围棋世界第一的中国九段棋手柯洁,今年5月与人工智能程式AlphaGo对决,最终三战全败。而开发AlphaGo的公司DeepMind,周四(19日)发布一款新版本的AlphaGo程式“AlphaGo Zero”。经过大约40天的训练后,“AlphaGo Zero”击败曾战胜柯洁的版本AlphaGo Master。

  柯洁得悉后亦不禁赞叹,并在网上留言称:“一个纯净、纯粹自我学习的AlphaGo是最强的...对于AlphaGo的自我进步来讲...人类太多馀了。”

  据了解,AlphaGo的前几代版本,一开始都从人类棋手的棋谱开始,进行训练和学习围棋。而最新版本的AlphaGo Zero则跳过这个步骤,通过自我对弈学习下棋,完全从乱下开始,可说是“从一张白纸开始”。

  经过三天、数百万盘的训练,AlphaGo Zero以100比0的必胜姿态击败AlphaGo Lee。AlphaGo Lee是去年击败了南韩选手李世石的版本。经过约40天的训练、约2900万场自我对弈,AlphaGo Zero击败AlphaGo Master。

  • 最新评论
  • 破棉袄

    从零开始学习,这是似是而非的误导。阿尔法狗有价值网络,可以判断棋局势好坏,狗是从零开始,但是是向其价值网络学习的,最后走出好棋。任何人不学习任何棋谱,知道围棋规则后,就下棋,只要有价值网络告诉这个人每走一步棋,棋盘形式变好或变坏的程度,这个人不需要学习,自己早晚也会总结出来棋谱和定势。所以说,阿尔法狗是向价值网络学习的,自己走出来了棋谱。

    屏蔽
  • MaoIsSnake

    真正的恐怖!

    屏蔽
2