人工智能基础-Chatgpt的来龙去脉——人工智能的基础概念
你好,我是Russel。
这是我的第二篇原创文章。
Chatgpt是2022年底被OpenAI做出来的一个人工智能对话程序,今年年初的时候彻底在中国互联网上面爆火,普通的网友、投资界的大佬、IT专家等等都在热烈讨论。
华东师范大学教育学部的论坛
国内一方面惊叹Chatgpt的效果,一方面又焦虑中国能不能搞出来这种优异的人工智能程序。
不少网友应该都从新闻、抖音上面见识过chatgpt的对话效果,但是网络上相关的信息太过杂乱,有不少错落,甚至有打着chatgpt学习名号来骗钱的各路培训辅导机构。
本着对技术正本清源的态度,我决定写一系列的科普文章,在这篇文章中不会有任何数学的知识,都是从概念上清晰简单的给大家科普下chatgpt的来龙去脉。
了解chatgpt之前,咱们非常有必要先对人工智能的基础概念有个了解。
1,什么是人工智能?
人工智能也可以叫做AI(Artificial Intelligence),简单来说就是让计算机来实现像人类一样的智能。你可以简单的把AI理解为计算机科学研究中的一个分支,就像医学里面有人研究神经内科人工智能基础,也有人研究骨科一样。但是近几年AI的边界也更加的广泛,融入了神经科学、数学等多个学科的知识,是一个交叉学科。
“人工智能”这个词汇是在1956年被提出来的,当时一大群科学家在美国达特茅斯学院开学术研讨会,在会上很多科学家发表了对“智能”的看法、研究等,最终被汇编在一起,提出了人工智能这个概念。
参会部分科学家合影
2,什么是机器学习?
机器学习(machine learning)是人工智能领域的一种研究方法,就像人吃米饭时,有人用勺子,有人用筷子,有人用叉子一样。机器学习就是人工智能领域中的一个研究方法或者工具。一般在计算机相关的研究中被称作“机器学习”,早些年在偏自动化专业的研究中被称作“模式识别”。
问题是,如何才能让机器去学习呢?依据这个问题,几十年来在学术界被分成了2条路线。
一条路线偏好基于规则或者专家知识。比如要做一个中英文翻译系统,那么就需要去请翻译、语言学方面的专家,去制定各种中英文相关的语法、文法规则,然后基于这些规则来构造翻译系统。
一条路线偏好基于统计的方法。这一派的学者往往把一个研究问题经过抽象后,转化成一个纯粹的数学问题,基于数学优化、信息论等知识来进行系统设计。
几十年来两种路线,你方唱罢我登场。最近十几年来基于统计的路线基本统治了机器学习领域的研究。
著名的自然语言处理专家贾里尼克
贾里尼克是早期较早转向基于统计路线的专家,他在约翰霍布金斯大学创建的语音与语言智能实验室至今仍是世界顶级的研究机构。
有趣的是他当年曾经说过:"我每开除一名语言学家,我的语音识别系统错误率就降低一个百分点。"
来以此证明其对基于规则路线的深恶痛绝。
3,什么是深度学习?
深度学习(Deep learning)是属于机器学习中,基于统计路线的一个子方向。
讲深度学习之前,需要先给大家简单介绍下什么是神经网络(neural network)。
人体神经网络
可以看到我们人体的神经网络,由树突、细胞体、轴突等各个部分构成,电信号就在这些个部分中层层传递。
因此当时的一些科学家受到生物神经学研究的启发,就在想人工智能基础,如果我们用计算机方法来模仿人体神经信号传递的过程,是不是就能实现像人类一样的智能呢?
一个简单的神经网络
一个简单的神经网络大概长这个样子,是不是跟人工神经网络结构有略微的相似?只不过各个节点之间传递的都是由数学数字表示的“信号”而已。
那么把N多个神经网络堆叠起来,组成一个深度的神经网络,然后在一定目标的指引下进行“学习”的模式,就可以算是深度学习了!
4,什么是自然语言处理、计算机视觉?
自然语言处理,顾名思义是要用计算机的方法来处理人类的语言。比如大家日常用到的翻译软件、siri或者小爱同学之类的人机对话助手都大量应用到了自然语言处理技术。
计算机视觉,是要用计算机来模拟人类或者动物的视觉能力。大家日常使用的美颜相机、智能摄像头的拍照、车牌号识别机器等都属于计算机视觉技术。
相比于上面介绍的人工智能、机器学习等概念,自然语言处理、计算机视觉是属于应用层面的东西。
本讲到这里就完了,下文再给大家具体讲讲chatgpt的技术。