Root Nation文章技术什么是神经网络以及它们如何工作?

什么是神经网络以及它们如何工作?

-

今天我们将尝试弄清楚神经网络是什么、它们如何工作以及它们在创建人工智能中的作用。

神经网络。 我们几乎到处都能听到这句话。 甚至在冰箱里你也会发现神经网络(这不是玩笑)。 神经网络被机器学习算法广泛使用,如今不仅可以在计算机和智能手机中找到,还可以在许多其他电子设备中找到,例如家用电器。 您有没有想过这些神经网络是什么?

别担心,这不会是一场学术讲座。 有许多出版物,包括乌克兰语的出版物,非常专业且可靠地解释了精确科学领域的这个问题。 此类出版物已有十几年历史。 这些旧出版物怎么可能仍然具有现实意义? 事实上,神经网络的基本原理并没有改变,这个概念本身——人工神经元的数学模型——是在第二次世界大战期间创建的。

什么是神经网络以及它们如何工作?

与互联网一样,今天的互联网比发送第一封电子邮件时要先进得多。 互联网的基础、基本协议从其创建之初就存在。 每个复杂的概念都是建立在旧结构的基础上的。 我们的大脑也是如此,如果没有最古老的进化元素:脑干,最年轻的大脑皮层就无法发挥作用,脑干的历史远远早于我们这个星球上物种的存在。

我是不是让你有点困惑了? 那么让我们更详细地了解一下。

也很有趣: ChatGPT:简单的使用说明

什么是神经网络?

网络是某些元素的集合。 这是数学、物理或技术中最简单的方法。 如果计算机网络是一组互连的计算机,那么神经网络显然就是一组神经元。

神经网络

然而,这些元素的复杂性与我们大脑和神经系统的神经细胞根本无法相提并论,但在一定的抽象水平上,人工神经元和生物神经元的一些特征是常见的。 但有必要记住,人工神经元的概念比其生物神经元简单得多,我们仍然对生物神经元知之甚少。

- 广告 -

另请阅读: ChatGPT 的 7 个最酷的用途

首先有一个人工神经元

第一个人工神经元的数学模型是由两位美国科学家 Warren McCulloch 和 Walter Pitts 于 1943 年开发的(是的,这不是一个错误,是在第二次世界大战期间)。 他们成功地在跨学科方法的基础上做到了这一点,结合了脑生理学的基础知识(记住这个模型创建的时间)、数学和当时年轻的 IT 方法(他们使用了阿兰·图灵的可计算性理论等) )。 McCulloch-Pitts人工神经元模型是一个非常简单的模型,它有很多输入,其中输入信息通过权重(参数),其值决定神经元的行为。 结果被发送到单个输出(参见 McCulloch-Pitts 神经元图)。

神经网络
人工神经元的方案 1. 其输出信号被输入到给定神经元的输入的神经元 2. 输入信号的加法器 3. 传递函数计算器 4. 给定神经元的信号应用于其输入的神经元 5. ωi — 输入信号的权重

这种树状结构与生物神经元有关,因为当我们想到描绘生物神经细胞的图画时,我们想到的就是树突的特征树状结构。 然而,人们不应该屈服于一种错觉,认为人工神经元至少在某种程度上接近真实的神经细胞。 这两位研究人员是第一个人工神经元的作者,他们成功地证明了任何可计算函数都可以使用互连神经元网络来计算。 然而,让我们记住,这些最初的概念只是作为仅存在于“纸上”的想法而创建的,并且没有以操作设备的形式进行真正的解释。

另请阅读: 用简单的话说关于量子计算机

从模型到创新实施

麦卡洛克和皮茨开发了一个理论模型,但第一个真正的神经网络的创建却等了十多年。 它的创造者被认为是人工智能研究的另一位先驱弗兰克·罗森布拉特 (Frank Rosenblatt),他于 1957 年创建了 Mark I 感知机网络,而您自己则证明,由于这种结构,机器获得了一种以前只有动物和人类所固有的能力:可以学。 然而,我们现在知道,实际上还有其他科学家提出了机器可以学习的想法,包括在罗森布拉特之前。

马克一号感知器

1950 世纪 1952 年代,许多研究人员和计算机科学先驱提出了如何让机器完成其自身无法完成的任务的想法。 例如,阿瑟·塞缪尔(Arthur Samuel)开发了一个与人类下跳棋的程序,艾伦·纽厄尔(Allen Newell)和赫伯特·西蒙(Herbert Simon)创建了一个可以独立证明数学定理的程序。 甚至在罗森布拉特的第一个神经网络创建之前,人工智能领域的另外两位研究先驱马文·明斯基(Marvin Minsky)和迪恩·埃德蒙兹(Dean Edmonds)就在 年,也就是在罗森布拉特的感知器出现之前,就构建了一台名为 SNARC(随机神经网络)的机器。 Analog Reinforcement Calculator) - 随机神经模拟强化计算器,被许多人认为是第一台随机神经网络计算机。 应该指出的是,SNARC 与现代计算机无关。

纳克

这台功能强大的机器使用了 3000 多个电子管和 B-24 轰炸机的备用自动驾驶装置,能够模拟 40 个神经元的操作,结果足以在数学上模拟老鼠寻找迷宫出口的过程。 当然,没有老鼠,只是一个推演、寻找最优解的过程。 这辆车是马文·明斯基博士的一部分。

阿达琳网络

神经网络领域另一个有趣的项目是 ADALINE 网络,由 Bernard Withrow 于 1960 年开发。 因此,人们可以问这样一个问题:既然半个多世纪前,研究人员就了解了神经网络的理论基础,甚至创建了此类计算框架的第一个工作实现,为什么花了这么长时间,直到 21 世纪,才基于神经网络创建真正的解决方案? 答案是:计算能力不足,但这并不是唯一的障碍。

神经网络

尽管在 1950 世纪 1960 年代和 年代,许多人工智能先驱都对神经网络的可能性着迷,其中一些人预测,相当于人类大脑的机器只需十年的时间。 今天读起来甚至很有趣,因为我们还没有接近创造出相当于人脑的机器,而且我们距离解决这项任务还很远。 人们很快就发现,第一个神经网络的逻辑既令人着迷,又存在局限性。 使用人工神经元和机器学习算法的人工智能的首次实现能够解决某些狭窄范围的任务。

然而,当涉及到更广阔的空间,解决一些真正严肃的事情,比如模式和图像识别、同声翻译、语音和手写识别等,也就是今天计算机和人工智能已经可以做到的事情时,事实证明,神经网络的最初实现根本无法做到这一点。 为什么会这样呢? Marvin Minsky(是的,来自 SNARC)和 Seymour Papert 的研究给出了答案,他们在 1969 年证明了感知器逻辑的局限性,并表明仅仅通过缩放来提高简单神经网络的能力是行不通的。 还有一个但非常重要的障碍——当时可用的计算能力太小,神经网络无法按预期使用。

也很有趣:

- 广告 -

神经网络的复兴

在 1970 世纪 1980 年代和 年代,神经网络几乎被遗忘了。 直到上世纪末,可用的计算能力变得如此强大,人们才开始回归并发展自己在该领域的能力。 就在那时,新的函数和算法出现了,能够克服第一个最简单的神经网络的局限性。 正是在那时,出现了多层神经网络深度机器学习的想法。 这些层实际上发生了什么? 如今,在我们的环境中运行的几乎所有有用的神经网络都是多层的。 我们有一个输入层,其任务是接收输入数据和参数(权重)。 这些参数的数量根据网络要解决的计算问题的复杂性而变化。

神经网络

此外,我们还有所谓的“隐藏层”——这就是与深度机器学习相关的所有“魔法”发生的地方。 隐藏层负责该神经网络学习和执行必要计算的能力。 最后,最后一个元素是输出层,即给出期望结果的神经网络层,在本例中:识别的笔迹、面部、语音、基于文本描述形成的图像、断层扫描分析的结果诊断图像等等。

另请阅读: 我测试并采访了 Bing 的聊天机器人

神经网络如何学习?

众所周知,神经网络中的各个神经元借助参数(权重)处理信息,这些参数被分配了单独的值和连接。 这些权重在学习过程中发生变化,这使您可以调整该网络的结构,以生成所需的结果。 网络到底是如何学习的? 显然,它必须不断地训练。 不要对这句话感到惊讶。 我们也在学习,这个过程不是混乱的,而是有序的,可以说。 我们称之为教育。 无论如何,神经网络也可以进行训练,这通常是使用适当选择的一组输入来完成的,这以某种方式为网络将来执行的任务做好准备。 而这一切都是一步步重复的,有时学习过程在某种程度上类似于训练过程本身。

例如,如果这个神经网络的任务是识别人脸,那么它是在大量包含人脸的图像上进行预训练的。 在学习过程中,隐藏层的权重和参数会发生变化。 专家在这里使用了“成本函数最小化”这个短语。 成本函数是一个告诉我们给定神经网络犯错误程度的量。 我们越能最小化训练结果的成本函数,该神经网络在现实世界中的表现就越好。 将任何神经网络与使用经典算法编程的任务区分开来的最重要特征是,在经典算法的情况下,程序员必须逐步设计程序将执行的操作。 就神经网络而言,网络本身能够自行学习正确执行任务。 没有人确切知道复杂的神经网络如何执行其计算。

神经网络

如今,神经网络被广泛使用,但令人惊讶的是,神经网络常常不了解给定网络中的计算过程实际上是如何工作的。 没有必要这样做。 程序员使用现成的机器学习神经网络,这些网络是为某种类型的输入数据准备的,以只有他们知道的方式处理它们并产生所需的结果。 程序员不需要知道神经网络内部的推理过程是如何工作的。 也就是说,一个人远离大量的计算,这是一种获取信息及其通过神经网络进行处理的方法。 人类对人工智能模型的某些恐惧由此而来。 我们只是担心有一天神经网络会给自己设定一项任务,并在没有人帮助的情况下独立找到解决它的方法。 这让人类感到担忧,导致人们对机器学习算法的使用感到恐惧和不信任。

聊天工具

这种功利主义的做法如今很常见。 我们也是如此:我们知道如何在特定活动中培训某人,并且我们知道如果做得正确,培训过程将是有效的。 一个人将获得所需的技能。 但我们是否准确地理解了他大脑中的演绎过程是如何发生的,从而导致了这种效果呢? 我们不知道。

科学家的任务是尽可能多地研究这些问题,以便它们在必要时为我们服务和帮助,而且最重要的是,它们不会成为威胁。 作为人类,我们害怕我们不知道的东西。

也很有趣: 

Yuri Svitlyk
Yuri Svitlyk
喀尔巴阡山脉之子、不为人知的数学天才、“律师”Microsoft,实用的利他主义者,左右
- 广告 -
注册
通知关于
客人

0 评论
嵌入式评论
查看所有评论