您现在的位置:海峡网>新闻中心>IT科技>科技前沿
分享

「机器人故事」最新版阿尔法狗诞生,机器人可以不依靠人类了

今年5月,阿尔法狗以3:0的比分打败中国棋手柯洁,胜利宣布退役。之后,阿尔法狗的开发公司继续深化研究,终于在昨天,10月18日,最新版的阿尔法狗诞,代号AlphaGo Zero。

这个阿尔法狗0,最厉害的地方在于它能自我学习、自我成长。它是从一片空白开始,零基础学习。通过自己学习,很快成为当今世界的顶级高手,水平超过之前所有版本的阿尔法狗。

阿尔法狗0一开始就和曾拿下韩国棋手李世石那版阿尔法狗进行对决,结果取得了100:0的压倒性战绩。

这么厉害的版本,竟然是靠它自己学习成长的,这才是真正的突破,是人类在机器人领域迈出的新的一步。

「机器人故事」最新版阿尔法狗诞生,机器人可以不依靠人类了

它是如何自己成长的?原来,作为围棋机器人,它竟然没有使用到任何人类围棋数据!它是自己思考得来了!

这不是有点像人了吗?靠自己思考,而不是靠数据算法。

就是说,此前各个版本的阿尔法狗,都是通过对几百万人类围棋专家的棋谱进行分析计算,并在有监督的学习中进行了训练。而现在这版的阿尔法狗,从来没有接触过人类棋谱,不再需要人类数据,仅依靠多台机器和48个TPU(TPU,是谷歌专为加速深层神经网络运算能力而研发的芯片),自由随意地在棋盘上下棋,然后进行自我博弈。

短短三天时间,进行了近5百万盘的自我博弈以后,这个阿尔法狗就击败了此前所有版本的阿尔法狗,而且,已经完全超越人类。

最要命的是,即使到了这一步,它还是在继续进行训练,还是在继续取得进步。它的自我博弈的成绩也越来越好,神经网络也变得更准确。

「机器人故事」最新版阿尔法狗诞生,机器人可以不依靠人类了

它自我学习的过程是:一开始什么都不知道,相当于一片空白。它从单一神经网络开始,通过神经网络的搜索算法,进行自我对弈。在自我博弈不断增加的过程中,神经网络也不断调整,逐步地提升预测下一步的能力。在这过程中,它还能够独立发现游戏规则,制订新的策略,打出新的方法。这些策略与方法,是人类从没有过的。

这意味着什么?

这意味着,机器人的成长,不再需要灌输人类知识,不再受到人类知识限制,它可以自己向自己学习。

这就像,当现代科学出现以后,人类就不再依靠上帝,开始自己发展、自己进化一样。

想想现在,科学的信徒们是怎么嘲笑宗教的,是怎么蔑视上帝的,就可以想象,以后机器人也会嘲笑我们、蔑视我们。

「机器人故事」最新版阿尔法狗诞生,机器人可以不依靠人类了

这并不是天方夜谈地乱说,这正是新版阿尔法狗的方向!因为它在围棋方面的突破,只不过是一个试验而已,它的目标,正如它所在公司的创始人所说:“最终,我们想要利用它的算法突破,去帮助解决各种紧迫的现实世界问题。”

也就说,围棋只是阿尔法狗进行学习成长的第一个步骤罢了,它的目标,是要成为通用的、探索宇宙的终极工具,在成为改变人类命运的有力武器。

照这个趋势,人类是挡不住它的脚步了。

本文来源:【狂赞派】版权归原作者所有

责任编辑:金林舒

最新科技前沿 频道推荐
进入新闻频道新闻推荐
国投泰康信托举办“正大美好 赫奕传家
进入图片频道最新图文
进入视频频道最新视频
一周热点新闻
下载海湃客户端
关注海峡网微信