Root Nation文章数据分析人工智能幻觉:它们是什么以及为什么重要

人工智能幻觉:它们是什么以及为什么重要

-

© ROOT-NATION.com - 本文由人工智能自动翻译。如有不准确之处,敬请谅解。若要阅读原文,请选择 English 在上面的语言切换器中。

在人工智能革命中,我们很难相信我们正在见证真正具有突破性的事件。这与政治无关,而是与数学有关。问题在于人工智能幻觉。

想象一下这样一个世界:计算器偶尔会算出 2+2=5。或者会计软件会编造从未发生过的交易。听起来很荒谬,对吧?然而,这正是我们今天在人工智能革命中踏入的世界。

从数字时代一开始,有一件事是肯定的——计算机可能会崩溃,打印机可能会出现故障,用户可能会被死机蓝屏逼疯。但在这一切中,人们相信它们可以完美地完成一件事:进行计算。这种数十年来建立起来的信任基础,现在正被专家们所说的人工智能幻觉逐渐侵蚀。

人工智能幻觉

计算机的历史并非始于社交媒体或视频游戏,而是始于执行复杂计算的需求。第一台通用电子计算机 ENIAC 占据了一个 7 米乘 13 米的房间,里面装有近 18,000 个真空管和数千个继电器。这台庞大的机器是为了计算火炮射击表和协助氢弹的研制而开发的。它每秒可以执行 5,000 次加法、350 次乘法或 40 次除法——比当时可以想象的任何东西都快。

从那时起,已经过去了 75 多年,计算机经历了翻天覆地的变化。它们从房间大小的庞然大物进化为可以装进口袋的小巧设备。然而,尽管经历了各种技术革命,计算机的核心目的始终未变 — 计算机首先是用来计算的机器。

阅读: 技术封建主义——世界秩序的新形式

Excel – 值得信赖的数学

这种连续性的一个很好的例子是 Microsoft Excel——本质上仍然是一个高级可视化计算器的程序。几十年来,Excel 已成为全球经济的支柱,从小型企业到跨国公司,从家庭预算到华尔街复杂的财务模型,每个人都在使用。虽然它有批评和局限性,但有一件事始终如一:它的计算是可靠的。

人工智能幻觉

当然,Excel 中也会出现错误。一个常见的例子是 #VALUE! 消息,当我们尝试对文本而不是数字执行数学运算时会出现该消息。但是——这是关键的区别——此类错误总是有明确、可识别的原因和直接的修复方法。更重要的是,Excel 从不猜测或编造结果。公式 =SUM(A1:A10) 总是会为相同的输入返回相同的输出,无论您是第一次运行它还是第一千次运行它。

传统软件的这种确定性几十年来增强了我们对计算机的信任。我们可能会抱怨用户界面、性能或兼容性,但我们从未质疑过结果的数学准确性。

阅读: 巴拿马运河:其修建历史和美国索赔依据

人工智能幻觉——当数学开始幻想时

这引出了当今人工智能革命的核心问题。现代人工智能模型(尤其是大型语言模型 (LLM))与传统软件有着根本区别。它们不是执行特定的确定性操作,而是被设计用来识别海量数据集中的模式并根据这些模式生成合理的响应。

这种架构上的根本性转变导致了专家们所说的 AI 幻觉,即 AI 模型生成的信息看似真实,但实际上完全不正确或与现实脱节。重要的是,这些幻觉不是随机错误;它们是这些系统的本质所致,即训练数据、模型构建和模型解释查询的方式之间的复杂相互作用。

人工智能幻觉

最令人担忧的是,人工智能幻觉的可信度往往与事实信息相同。模型可以自信地说基辅是乌克兰首都(这是真的),并说它主办了 1995 年夏季奥运会(这完全是捏造的)。对于用户,尤其是非专家来说,区分事实和幻觉可能极其困难。

阅读: 用进废退:人工智能如何改变人类思维

幻觉问题的严重程度

虽然很难对人工智能幻觉的频率进行准确的统计,但专家们一致认为,这是一个影响所有大型语言模型的普遍问题。最容易出现幻觉的系统是那些缺乏有效的信息验证机制、依赖过时数据、无法正确解释查询上下文的系统。

人工智能幻觉

幻觉的成因复杂且多层次。专家指出,主要因素包括:

  • 训练数据中的不完善:如果用于训练模型的数据包含错误、不准确或矛盾的信息,模型可能会复制这些问题或生成新的虚假内容。

  • 模型过度拟合:当算法过于贴近训练数据集时,就会出现这种情况,失去其概括和正确识别新模式的能力。
  • 模型设计中的错误假设:如果人工智能开发人员在错误的假设上进行设计,模型可能会持续产生幻觉。

特别容易产生幻觉的人工智能系统的具体例子包括中国的解决方案,如 Qwen 和 DeepSeek尽管技术进步,这些模型仍然面临这个问题。它们经常生成看似合理但实际上错误或与现实不符的信息,尤其是在数据可能不完整或相互矛盾的情况下。

阅读: 所有关于 Microsoft“ Majorana 1 量子处理器:突破还是进化?

信任问题——98% 还不够

这里我们谈到了信任的基本问题。在传统软件中,错误是例外,而不是常态。在人工智能中,幻觉是系统运行的固有部分。即使模型 98% 的时间都能生成准确的信息,剩下的 2% 也是一个严重的问题。

想象一下,一台计算器 98% 的时间都能给出正确的结果,但在 2% 的情况下,它会给出错误的答案。我们会相信这样的设备可以完成诸如计算税款、开发药物或设计桥梁之类的任务吗?答案很明显。

人工智能幻觉

人工智能幻觉问题在需要完全准确和事实正确的领域尤为关键,例如医学、法律、金融和工程。在这些领域,哪怕是最微小的错误都可能导致灾难性的后果。

阅读: 人工智能的结构性转变: Microsoft 下注 DeepSeek?

Excel 与人工智能:计算与虚构

在 Excel 中,当出现 #VALUE! 之类的错误时,程序会明确指出出现了问题。它不会试图猜测结果或隐藏问题。此外,还有关于如何解决此类错误的具体建议 - 例如,确保数学公式中的所有值都是数字,而不是文本。

另一方面,在人工智能系统中,当模型不知道答案时,它通常会生成令人信服但错误的响应,而不是承认其缺乏知识。最糟糕的是,用户甚至可能没有意识到所提供的信息是一种幻觉。

人工智能幻觉

根据 Salesforce的数据和分析现状报告中,9%(近 10%)的分析师和 IT 领导者认为,人工智能的进步使数据管理变得更加重要。然而,同一份报告也强调了受访者对数据准确性的不确定性以及对人工智能背景下数据安全性的担忧。

阅读: 台湾、中国和美国如何争夺技术主导地位:芯片大战

验证成本是人工智能的隐藏劣势

人工智能的支持者认为,幻觉问题可以通过信息验证来解决。事实上,事实核查和验证人工智能系统的输出正在成为每个使用这些技术的组织的基本做法。然而,问题在于,对验证的需求大大降低了这些系统的价值。

想象一下这种情况——我们要求人工智能助手撰写一份关于电动汽车市场的报告。系统会生成一份 20 页的文件,里面充满了统计数据、趋势和预测。这份文件看起来很专业,包含令人信服的论据。问题是我们不知道哪些信息是准确的,哪些是人工智能幻觉的结果。为了确定这一点,我们需要验证每一个统计数据、每一个陈述、每一个事实。这意味着,实际上,我们正在做人工智能系统应该为我们做的工作。

人工智能幻觉

这是当前人工智能革命的基本悖论——原本应该为我们节省时间的系统往往需要额外的工作来验证其结果。在使用 Excel 等传统软件的情况下,我们可以简单地信任计算结果并专注于解释数据。

阅读: 关于 USB 标准和规范的所有信息

数学上不完美的人工智能世界

对人工智能系统缺乏信任并不是技术恐惧症或抵制变革的问题。这是对人与计算机关系发生根本性转变的理性反应。几十年来,我们建立的关系都是基于计算机的确定性可靠性。现在,我们正进入一个概率模型时代,而概率模型本质上无法保证同样的可靠性。

也许最准确的描述方式是通过类比人类交流。传统软件就像一本百科全书——它可能不完整或包含过时的信息,但其中包含的内容可以被视为经过验证的。另一方面,人工智能就像与一个拥有令人印象深刻但不完美知识的人的对话——有时他们会犯错误,偶尔会感到困惑,有时他们会歪曲事实。

在计算机的背景下,这种类比意味着可靠性的根本性倒退。我们一直期望机器比人类更准确。现在,矛盾的是,我们发现自己需要以与验证来自陌生人的信息相同的谨慎态度来验证人工智能生成的结果。

阅读: 什么是 DeepSeek 为什么大家都在谈论它?

寻求数学可靠性

这是否意味着我们应该完全放弃人工智能?绝对不是。人工智能系统在各个领域都具有巨大的潜力——从生成创意内容到分析大量数据集。问题在于我们必须学习一种使用这些系统的新方法,一种承认其根本局限性的方法。

人工智能幻觉

目前,人们正在深入研究如何减少人工智能的幻觉。提出的解决方案包括提高训练数据的质量(数据越好,幻觉出现的可能性就越低)、开发更透明的训练方法(可理解和可解释的模型不太可能产生虚假信息)以及推进事实核查机制(系统会自动根据权威来源验证生成的内容)。

阅读: 仿生学:大自然如何激发工程师创新

数字现实的新伦理

当前的人工智能革命不仅需要新的工具和方法,还需要新的数字道德框架。我们需要重新思考人与机器之间的信任意味着什么、人工智能引发错误的责任界限,以及如何在一个事实与虚构之间的界限越来越模糊的世界里保护自己免受错误信息的侵害。

根据一个 Salesforce 报告探讨了人工智能时代的数据信任问题,安全风险和数据协调的缺乏阻碍了其可靠性。因此,使用基于人工智能的数据进行关键决策的公司认为数据安全威胁是他们最大的担忧。

人工智能幻觉

这在所谓的生成人工智能的背景下尤其重要,因为它还存在公司数据泄露到公共大型语言模型的额外风险。

阅读: 人工智能最奇怪用途的 10 个例子

无需千言万语……

我之所以不信任当前的人工智能革命,并不是因为我看不到它的潜力,而是因为我了解它的根本局限性。几十年来,我们在可靠的计算基础上建立了我们的数字文明——从最早的机械计算器,到具有里程碑意义的 ENIAC,再到无处不在的电子表格。这种数学上的确定性一直是无数生活领域进步的基石。

当前的人工智能浪潮将我们带入了一个概率世界,其中 98% 的确定性是新常态。虽然这对于许多应用来说可能已经足够,但在医疗保健、金融和安全等关键领域则需要更高的标准。

人工智能幻觉

因此,真正的挑战在于如何充分利用人工智能的潜力,同时又不丧失几十年来我们信任技术的基础——数学确定性。虽然计算机现在可以交谈、创建图像和写诗,但它们最重要的功能仍然是无懈可击的计算——当它们曾经占据整个房间并由穿着实验室工作服的科学家团队操作时,它们所执行的功能是一样的。因为在这个区分事实与虚构变得越来越困难的世界里,数学确定性比以往任何时候都更有价值。

阅读: 

Yuri Svitlyk
Yuri Svitlyk
喀尔巴阡山脉之子,未被认可的数学天才, Microsoft “律师”,实用的利他主义者,左普拉沃舍克
该作者的更多内容
订阅
通知
客人

0 留言
最新
最老的 最投票
内联反馈
查看所有评论
其他文章
关注我们
现在流行