人工智能时代读书笔记-人工智能的未来笔记
近日,有幸看到UCLA(加州大学洛杉矶分校)统计学与计算机科学教授、视觉/认知/学习与自主机器人中心主任朱松纯教授在《视觉探秘》上发文微信公众号(人工智能计算机视觉领域公众号)文章:》,感觉受益匪浅,原文虽然通俗易懂,但是比较长(约4万字),经过认真学习,航旅IT圈对这篇文章进行了重新整理,吸取精华形成了这篇读书笔记,也是想通过这种方式来帮助航旅业的朋友们,对人工智能这个热门领域有一点深入的了解,以及可以在实际工作中以正确的姿势使用人工智能。
审查
虽然我们的目的是应用人工智能,而不是进行研究,但我们首先应该知道:到底什么是“人工智能”。 但是,由于人工智能涵盖的学科和技术非常广泛,要想在短时间内全面了解和了解人工智能,对于本行业的研究人员来说都是一项非常困难的任务,更何况是非专业人士。
在文章中,朱老师将与“人工智能”相关的领域概括为六个部分:
(1)计算机视觉(暂包括模式识别、图像处理等问题),如“车牌识别”、“人脸识别”等是很小的应用领域;
(2) 自然语言理解与交流(暂且包括语音识别与合成,包括对话):例如微软Windows 10操作系统中的“人工智能助手”Microsoft Cortana就是其中的一款小应用
(3) 认知和推理(包括各种物理和社会知识)
(4) 机器人学(力学、控制、设计、运动规划、任务规划等)
(5) 博弈与伦理(多智能体的交互、对抗与合作,机器人与社会的融合等)
(6) 机器学习(各种统计建模、分析工具和计算方法),如深度学习是该领域的热门流派。
因此,很多人将机器学习等同于人工智能肯定是不合适的,他们犯了过度概括的罪过。 文章认为“当前人工智能和机器人的关键问题是缺乏物理常识和社会常识Common Sense”,认为这是人工智能研究的最大障碍。 下面这篇文章通过乌鸦和鹦鹉的例子来讨论人工智能的认知架构。
人工智能研究的认知架构:小数据、大任务和大数据、小任务
鹦鹉有很强的语言模仿能力人工智能时代读书笔记,但和聊天机器人一样,它们无法理解对话的语境和语义,也就是没有智能。 但是乌鸦不一样。 他们会制作工具,懂得各种物理知识、人类活动和社会常识。 文章举了一个例子。 为了吃坚果,城市里的乌鸦学会了让汽车压碎坚果壳; 他们通过观察还发现,当人行道上的绿灯亮时,车辆不会通过斑马线,这样他们就可以吃东西了,不用担心高速行驶被抓。 行驶中的车辆跑过来,就停在斑马线上方的电线上伺机而动。 这个例子至少可以说明两个问题。 首先,真正的智能不是简单地重复相同的内容,而是可以举一反三,推演并帮助获得其他知识; 另外,智能不是通过大量的试错获得的(错一次就死)——也就是说,目前基于统计概率模型的大数据分析方法,包括机器学习或者深度学习学习,不能产生真正的智慧; 智力是由任务(吃食物)驱动的,通过“感知、认知、推理、学习和执行”。
据此,文章将“智能”的认知架构分为“小数据、大任务范式”和“大数据、小任务范式”两种范式。 智能的“鹦鹉”模式,或称“强智能”与“弱智能”(详见本公众号上周文章《航空决策辅助与人工智能的结合或将成为下一个行业热点》)。 当然,“鹦鹉”模型的智能对于业务中的某些垂直应用还是相当有效的,目前实际使用的大部分工具都属于这种智能,尤其是依赖机器学习和深度学习的领域基于大量的训练数据。
五颗钉子和一把好锤子
有了上面这样一个认知框架,我们就来分析人工智能相关的六个领域。 文章从更深层次的理论角度,将人工智能60年的发展史分为两个阶段。 第一阶段是前30年数理逻辑的表达和推理; 第二阶段是后30年的概率统计。 在这个阶段的后期10多年,前5个领域都找到了概率统计的新“体系”,即统计建模、机器学习和随机计算。 朱老师做了一个形象的比喻。 计算视觉、认知推理、语言交流、博弈论、机器人学都是各个层次的“问题领域”,称为Domains。 它们就像五颗钉子,而机器学习是一把研究锤。 ,目的是将这些钉子敲下来。 深度学习是一个比较好用的锤子,五个问题领域的锤子很多,但是深度学习的锤子是近几年比较流行的。
“学习”也是一个很宽泛的概念。 机器学习只是一个非常狭义的定义,并不代表整个学习过程。 通常机器学习只有三个步骤:(1)定义一个效用函数,代表一个小任务,比如人脸识别,正确则奖励1,错误则减1。 (2)选择模型,比如10层神经网络,上亿参数,需要数据进行拟合。 (3) 获取大量数据。 这里假设有人已经准备好标注好的数据,然后开始拟合参数。 但这个过程没有因果关系,没有主动的认知和推理,而是纯粹被动的统计学习。 这种方法目前用于视觉识别、语音识别和基于统计的预测。
在解释五个问题领域时,文章涉及许多研究细节和术语。 为了便于理解,只摘取要点如下:
计算机视觉:对于一张二维图片,图像感知信息往往只占5%,提供一些线索; 而后95%,包括功能、物理、因果、动机等,都是靠人的想象和推理过程完成的。 所以能看得见的东西现在都可以用深度学习来解决,比如人脸识别、语音识别,这只是看得见的一小部分; 看不见的东西都在后面,这才是我们真正的智慧,乌鸦可以做到。
认知推理:对他人的想法进行感知和推理,知道对方在想什么,在做什么
语言交际:交际的认知基础。 语言产生的基础是人们寻求合作,但在语言产生之前,人类已经具有非常丰富的认知基础。 没有这样的认知基础,语言就是空洞的符号,对话就无法进行。
博弈论:获取和分享人类价值。 机器要与人类交流,就必须理解人类的价值观。 哲学和经济学中有一个基本假设,一个理性的人,其行为和决策是由利益和价值观驱动的,总是追求自身利益的最大化。 因此,价值可以用效用函数来表示。
机器人:搭建一个大的任务平台,也就是让机器人根据需要在综合环境(不是预设环境)中处理一些任务。
结语:智能科学——牛顿与达尔文理论体系的统一
文章的最后部分终于如期上升到哲学层面,讨论智能如何成为一门科学,是否有一个统一的解释。
首先,文章为智能科学借用了物理学发展中的这样一个信念:“物理世界存在完整的因果链”。 不过,“与物理学相比,遗憾的是,人工智能的研究至今很少关注成为一门科学的问题。顶尖的工科学校不教这件事,大家都忙着教一些技能。解决一些小问题,20世纪80年代,一些知名教授曾公开表示,智能现象非常复杂,不可能有一个统一的解释,更有可能是“一袋子”的把戏。 “
此外,物理学将生物的意志排除在研究之外,而生物的意志恰恰是智力科学的对象。 智能科学研究的是一个复杂的系统,它是物理学和生物学的混合体。 这种复杂性表现在:首先,“物理学面对的是一个客观世界,当这个客观世界映射到每个人的大脑中时,就形成了一个主观和客观融合的世界,也就是每个人大脑中的模型。这个模型被映射进入其他人的头脑。每个头脑都包含数百个其他模型的估计。这些模型驱动着人类的运动和行为。” 二、“物理学可以将各种现象隔离开来人工智能时代读书笔记,但是,一张图片包含着大量的图案,一个简单的人的动作包含着复杂的心理活动,是很难隔离开来的。” 而且,现在基于大数据集的“深度学习”学派非常流行,它们只能单独研究小问题,对智能来说基本没用。
最后,“人工智能要成为智能科学,本质上必须是达尔文和牛顿两大理论体系的统一。”
(全文)
本文为航旅IT圈(微信公众号AirTIT)原创文章,任何形式的转载均需授权。
●●●●●●