人工智能技术原理-智能电表怎么人工断电
卷积神经网络和递归神经网络在当今的 ML 中很常用。 但是,它们通常用于完全不同的用例。
人工智能中CNN和RNN技术的原理和区别?
在机器学习中,每种类型的人工神经网络都是为特定任务量身定制的。 下面介绍两种类型的神经网络:卷积神经网络 (CNN) 和递归神经网络 (RNN)。
CNN 和 RNN 之间的主要区别在于处理时间信息或顺序出现的数据(例如句子)的能力。 此外,卷积神经网络和递归神经网络用于完全不同的目的,并且神经网络本身的结构也存在差异以适应这些不同的用例。
CNN 使用卷积层中的过滤器来转换数据。 另一方面,RNN 重用序列中其他数据点的激活函数来生成序列中的下一个输出。
尽管这是一个经常被问到的问题,但一旦您查看了这两种神经网络的结构并了解了它们的用途,CNN 和 RNN 之间的区别就会变得很明显。
接下来,让我们看一下 CNN 以及它们如何用于解释图像。
卷积神经网络是计算机视觉中最常用的神经网络之一人工智能技术原理,用于识别图像中的对象和模式。 它们的定义特征之一是在卷积层中使用过滤器。
卷积层 CNN 具有称为卷积层的独特层,将它们与 RNN 和其他神经网络分开。
人工智能中CNN和RNN技术的原理和区别?
在卷积层中,输入在传递到下一层之前进行转换。 CNN 使用过滤器转换数据。
CNN 中的过滤器只是一个随机数矩阵,如下图所示。
人工智能中CNN和RNN技术的原理和区别?
过滤器中的行数和列数可能会有所不同,具体取决于用例和要处理的数据。 在卷积层中,有许多过滤器在图像上移动。 这个过程称为卷积。 过滤器对图像的像素进行卷积,在将数据传递到 CNN 的下一层之前改变它们的值。
要了解过滤器如何转换数据,让我们看看如何训练 CNN 识别手写数字。 下面是 MNIST 数据集中数字 7 的 28 x 28 像素图像的放大版本。
人工智能中CNN和RNN技术的原理和区别?
从 MNIST 数据集中获取的图像
下面是转换为像素值的同一图像的图像。
人工智能中CNN和RNN技术的原理和区别?
当滤波器通过图像进行卷积时,滤波器中值的矩阵与图像的像素值对齐,并获得这些值的点积。
人工智能中CNN和RNN技术的原理和区别?
过滤器在每个 3 x 3 像素矩阵中移动或“卷积”,直到所有像素都被覆盖。 然后,将每次计算的点积用作下一层的输入。
最初,过滤器中的值是随机的。 结果,第一遍或卷积成为训练阶段,初始输出不是很有用。 每次迭代后,CNN 都会使用损失函数自动调整这些值。 随着训练的进行,CNN 会不断调整过滤器。 通过调整这些滤镜,可以区分图像的边缘、曲线、纹理以及更多图案和特征。
虽然这是一项了不起的壮举,但为了实现损失函数,需要以标记训练数据的形式向 CNN 提供正确输出的示例。
当无法应用迁移学习时,许多卷积神经网络需要大量标记数据。
如果您仍然无法摆脱 CNN,请查看 Jeremy Howard 关于 Fast.ai 的出色但冗长的视频讲座。
CNN 擅长解释视觉数据和非时序数据。 然而,它们不能很好地解释时间信息,例如视频(基本上是单个图像的序列)和文本块。
文本中的实体提取是说明序列中数据的不同部分如何相互影响的一个很好的例子。 对于实体,句子中实体前后的词直接影响它们的分类方式。 为了处理诸如句子之类的时间或顺序数据,我们必须使用旨在从序列中的过去数据和“未来数据”中学习的算法。 幸运的是,递归神经网络正是这样做的。
人工智能中CNN和RNN技术的原理和区别?
递归神经网络架构
递归神经网络是设计用于解释时间或顺序信息的网络。 RNN 使用序列中的其他数据点来做出更好的预测。 他们通过获取输入并重用序列中先前或后续节点的激活来影响输出来实现这一点。 如前所述,这在实体提取等任务中很重要。 以下文为例:
罗斯福总统是美国历史上最有影响力的总统之一。 然而,曼哈顿的罗斯福街并不是以他的名字命名的。
在第一句话中,罗斯福应该被标记为个人实体。 在第二句中,应标记为街道名称或位置。 如果不考虑前面的“总统”和后面的“街道”,就不可能知道这些区别。
为了更深入地了解 RNN 的工作原理,让我们看一下它们如何用于自动校正。 在基本层面上,自动更正系统将您键入的单词作为输入。 使用该输入人工智能技术原理,系统可以预测拼写是否正确。 如果单词与数据库中的任何单词都不匹配,或者不符合句子的上下文,系统会预测正确的单词可能是什么。 让我们想象一下这个过程如何与 RNN 一起工作:
人工智能中CNN和RNN技术的原理和区别?
RNN 将接受两个输入源。 第一个输入是您键入的字母。 第二个输入将是与您之前输入的字母对应的激活函数。 假设您打算输入“network”,但错误地输入了“networc”。 系统接受您输入的前一个字母“networ”和当前字母“c”的激活功能。 那么“k”就是最后一个字母的正确输出。