人工智能 训练 推理-tensorflow训练集人工标注
作者 | DANIEL OBERHAUS
编译 | 刘小楚、范玥灿、宁云州
如果我们要创造广义的人工智能,我们必须教会它和我们一样思考。
去年,人工智能AlphaGo首次在人机围棋大赛中战胜了人类世界冠军。鉴于围棋的巨大复杂性,这次胜利抓取了所有人的目光。虽然AlphaGo打败了多位世界级围棋棋手的胜利令人印象深刻,但这种人工智能仍然被认为是狭义的人工智能。也就是说,这种人工智能只能在有限的任务领域强于人类。
因此,即使AlphaGo在世上最复杂的棋牌游戏中完胜人类,我们也不会在平凡的日常生活中依靠它,比如让它给我们泡杯茶或者为家里的车安排一次保养。
相比之下,经常出现在科学小说中的AI是广义的人工智能,和人类具有同等级别和多样性的智力。虽然我们已经有了从疾病诊断到无人驾驶的各种人工智能,但如何把这些狭义的人工智能整合到一起仍然充满了挑战。
根据上周发布的两篇新论文,这家Alphabet神秘子公司-DeepMind的研究人员正在为一种广义的人工智能奠定基础。虽然他们目前还没有做到,但初步的实验结果仍然在一些领域显得非常有前景,在这些领域内,AI甚至具备了能超越人类的能力。
两篇论文的主题都是关系推理,这种关键的认知能力帮助人们在许多不同的目标和想法上进行比较,例如比较一个物体是否较大或者一个物体是否比起另一个物体更靠左。
人们在每次尝试解决问题时,总会使用关系推理,但是研究者们目前还没想到如何赋予AI这种简单的能力。
DeepMind的研究人员采用了两种不同的方法来试图解决这个问题。一种是通过一个简单的静态3D数据集来训练一个神经网络,这种模仿人类大脑的神经网络叫做CLEVR。另外一种神经网络则用来理解2D对象如何随着时间而变化。
在CLEVR中,首先给神经网络展现一系列简单的事物,例如棱锥、立方体和球体。然后研究者们用自然语言对AI提出一系列例如“立方体和圆柱是同种质地吗?”的关系推理问题。令人惊喜的是,这种神经网络在关系推理上的的准确性能达到95.5%人工智能 训练 推理,超过了人类的基准水平92.6%。
在让神经网络理解2D目标是如何随着时间变化时,DeepMind的研究人员创造了一种叫做视觉交互网络(VIN)的神经网络人工智能 训练 推理,这种神经网络能够在一个视频序列中,根据过去的运动来预测一个物体将要出现的位置。研究人员首先为VIN提供了一个视频的三个连续帧,用它来生成一个状态码。这个状态码在视频帧中用一系列向量来表示帧内每个物体的位置或者速度。然后,研究人员为VIN提供一串状态码,这个组合成的序列被用来预测下一帧中的状态码。
为了训练视觉交互网络,研究者使用了五种不同的物理系统。这些系统中的2D对象跨越了“自然图像背景”并和各种力量交互作用。例如,其中一个系统就是研究人员根据牛顿万有引力定律来模拟彼此相互作用的物体。在另一个系统中,提供给神经网络一个台球游戏,来预测球未来的位置。
根据研究人员的结论,他们的视觉交互网络特别成功,并且优于目前最领先的视频预测模型。
这项工作是实现广义人工智能的重要一步,但是在人工智能真正接管世界之前还有很多工作要去完成。哈佛计算神经科学家山姆·格什曼(Sam Gershman)在谈到如何实现广义人工智能的时候对麻省理工学院技术评论讲道:“任何特定机器学习任务的超人类表现都不意味着超人类智慧。”
一切皆未然。
原文链接: