Phi-3-mini 是一个突破 Microsoft 在人工智能领域？

Phi 人工智能模型 Microsoft - 小、便宜并且不会产生“幻觉”。这就是他们对新语言模型的评价，预计它会有一个美好的未来。

GPT 绝对很棒，但同时它也非常昂贵，并且不可能适合所有人。由于这些和许多其他原因 Microsoft 正在试验更小的人工智能模型。据说 Phi-3-mini 甚至让 OpenAI 工程师的工作相形见绌。

也很有趣：未来的晶体管：芯片的新时代正在等待着我们

内容

1. ChatGPT 不是万能药

2. 什么是已知的 Microsoft 披

3. 如何使用Phi-3-mini？

4. Microsoft Phi 会取代 ChatGPT 类型的模型吗？

5. Phi-3 来自 Microsoft 只听得懂英语

ChatGPT 不是万能药

ChatGPT 是一项得到资助、策划和改进的发明 Microsoft。其实它不属于 Microsoft，以及 OpenAI 公司， Microsoft 不拥有（她是主要投资者，但不是最大的投资者）。 GPT 语言模型给出了 Microsoft 与其他正在奋起直追的大型科技公司相比，这是一个巨大的优势。然而，GPT 存在大量问题，其中许多问题尚未解决。

首先，这是一个资源非常密集的语言模型。面向网络 Microsoft OpenAI 的 Copilot 或 ChatGPT 会产生非常高的运营成本 Microsoft。这不仅是GPT的特征，也是所有主要语言模型的特征。此外，GPT 与其竞争对手一样，很容易产生“幻觉”，即它可以生成对包含虚假或误导性信息的查询的响应。这样的模型吸收的数据越多，就越倾向于生成相似的内容。因此，幻觉和虚假陈述并不是从数字手指中吸出来的神话。用户经常注意到大型语言模型经常会犯错误，提供不准确的数据，并根据不存在的事实进行操作。

这两个问题都非常严重，这就是为什么OpenAI， Microsoft、Meta、Google 等公司不仅致力于开发大语言模型技术，还致力于开发小语言模型，在实践中可以产生更好的结果。

数字会计师的助手不需要了解太多量子物理学。它可以更小、更简单（因此更便宜），并且通过仅对其目的所需的数据进行训练，理论上应该更少产生幻觉。虽然，这说起来容易做起来难。 GenAI 技术仍然是一项疯狂的 IT 冒险。尽管工作进展前所未有，但在根本性问题上仍难以取得实际突破。但公司 Microsoft 最近宣布了这样的突破。我们正在谈论一个小语言模型 Microsoft 皮皮

也很有趣：台湾、中国和美国如何争夺技术主导地位：芯片大战

什么是已知的 Microsoft 披

首先需要说明的是，该实验是在没有OpenAI公司参与的情况下进行的。也就是工程师的开发 Microsoft.

- 广告 -

楷模 Microsoft Phi 是一系列小语言模型 (SLM)，在各种测试中取得了优异的结果。第一个模型 Phi-1 拥有 1,3 亿个参数，在现有 SLM 中取得了最好的 Python 编码结果。

随后，开发人员专注于语言理解和思考，创建了 Phi-1.5 模型，该模型也拥有 1,3 亿个参数，并且表现出与参数五倍的模型相当的性能。

Phi-2 是一个 2,7 亿参数模型，展示了出色的推理和语言理解能力，其性能达到具有 13 亿参数的最佳基线模型的水平。 Phi-2 因其在模型扩展和数据管理训练方面的创新而从其他模型中脱颖而出。

它可以在Azure AI Studio模型目录中找到，这有助于语言模型领域的研究和开发。 Phi-2 于 2023 年 2 月发射。开发人员保证它的性能与 Meta 的 Mistral 或 llama 3 一样好。而且 Phi- 的性能甚至比之前的版本还要好。

然而，刚刚发布的 Phi-3 型号在品质上是全新的。至少从提供的信息中你可以判断出这一点 Microsoft。该公司表示，根据所有已知基准测试的指标，Phi-3 的表现优于任何其他类似规模的模型，包括语言分析、编程工作或数学工作。

Phi-3-mini 是该型号的最小版本，刚刚向所有感兴趣的各方提供。也就是说，从23月3日起就可以使用了。 Phi-3,8-mini 有亿个参数，根据测量 Microsoft，效率是相同尺寸的任何其他型号的两倍。可以在云服务的AI模型目录中找到 Microsoft Azure，Hugging Face 机器学习模型平台，以及 Ollama，用于在本地计算机上运行模型的框架。

正如他所说 Microsoft,Phi-3-mini不需要强大的芯片 Nvidia。该模型可以在普通计算机芯片上工作。或者甚至可以安装在未连接到互联网的手机上。

较低的功率也意味着模型不会那么准确。 Phi-3 不适合医生或税务会计师，但有助于完成更简单的任务。例如，用于定位广告或总结互联网上的评论。

由于较小的模型需要较少的处理，因此私营公司使用起来会更便宜。也就是说，在 Microsoft 将会有更多的客户希望将人工智能纳入他们的工作，但认为它太昂贵了。不过，目前尚不清楚它们的成本是多少。

目前尚不清楚中小型号何时出现。但后者会更强大，也更昂贵。虽然已经知道Phi-3-small将有7亿个参数，Phi-3-medium将有多达14亿个参数。

- 广告 -

另请阅读：

如何使用Phi-3-mini？

GPT-4 Turbo 需要强大的 AI 芯片，但价格仍然非常昂贵。 Phi-3小型语音模型可以离线工作，无需云端，甚至可以在手机上安装芯片。

Phi-3 不是面向最终用户的产品，而是一种开发人员能够在其应用程序中使用和实施的技术 - 包括基于云的（即远程定位的）以及本地和离线工作的技术。它有望与设备及其组件无缝协作，例如手机、汽车及其信息娱乐系统，甚至物联网传感器。在某些情况下，这项技术的价值可能是无价的。

Microsoft 甚至还给出了一个具体的例子，这样我们就不用发挥我们的想象力了。想象一下，一位农民检查他的农作物，发现叶子、茎和树枝上有疾病的迹象。由于远离电信塔，他只需要拿出手机，拍下受损情况的照片，将其放入使用 Phi-3 技术的应用程序中，模型就会快速离线分析照片并给出建议究竟如何对抗这种疾病。

正如他解释的那样 MicrosoftGPT成功的关键是利用海量数据进行训练。对于如此大的数据集，高数据质量是不可能的。同时，在训练 Phi 模型时，使用了完全相反的 OpenAI 方法。重点不是在模型中塞满信息，而是增量和彻底的学习。

研究人员没有使用原始互联网数据， Microsoft 创建了 TinyStories 数据集，生成了数百万个微型“婴儿”故事。这些故事被用来训练非常小的语言模型。然后，研究人员进一步创建了 CodeTextbook 数据集，该数据集使用精心挑选的公开数据，并根据教育价值和内容质量进行筛选。然后，这些数据经过多次过滤，并反馈到大型语言模型 (LLM) 中以进行进一步综合。

所有这些使得创建足以训练功能更强大的 SLM 的数据数组成为可能。此外，Phi-3模型的开发采用了多层次的风险管理和缓解方法，包括评估、测试和手动调整。结果，正如他声称的那样 Microsoft，使用 Phi-3 模型系列的开发人员可以利用 Azure AI 中提供的工具集来构建更安全、更可靠的应用程序。

另请阅读： 从科学的角度来看隐形传态及其未来

Microsoft Phi 会取代 ChatGPT 类型的模型吗？

一点也不。小语言模型 (SLM) 即使在高质量数据上进行训练，也有其局限性，并且不是为深度学习而设计的。由于其规模和计算能力，大型语言模型 (LLM) 在复杂推理方面的表现优于 SLM。法学硕士现在并将继续在药物发现等领域特别有用，在这些领域，人们必须搜索大量科学论文并分析复杂的模式。另一方面，SLM 可用于更简单的任务，例如总结长文本文档的要点、创建内容或为客户服务聊天机器人提供支持。

Microsoft她说，已经在内部使用混合模型集，其中 LLM 发挥主导作用，将某些需要较少计算能力的查询引导至 SLM，同时由 SLM 自行处理其他更复杂的查询。 Phi 的定位是在设备上进行计算，而不使用云。然而，小型语言模型与云端大型模型所能获得的智能水平之间仍然存在差距。由于法学硕士的不断发展，这种差距不太可能很快消失。

Phi-3 尚未得到外部独立机构的验证。 Microsoft 有时会谈到在极端情况下效率或能源效率比竞争对手高 25 倍，这听起来相当不可思议。虽然，另一方面，人们不能忘记这些年已经过去了 Microsoft 它是 IT 创新领域明显的领导者，这一事实让我们稍微放弃了一点，也许这就是为什么我们并不真正相信它。基于人工智能的程序可以立即响应并离线运行而不是生成？这将是当前革命的一个有价值的高潮。不幸的是，有一个关键问题。

另请阅读：关于 Neuralink Telepathy 芯片的所有信息：它是什么以及它如何工作

Phi-3 来自 Microsoft 只听得懂英语

Phi-3 并没有吞噬掉大量扔给它的 PB 数据。仔细而严格的模型训练涉及到一个小问题。 Phi-3 接受过英语信息训练，目前还不知道任何其他语言。不仅有乌克兰语，还有德语、西班牙语、法语或汉语。当然，这大大降低了它对全球大多数用户的吸引力。

但在 Microsoft 保证其开发和改进工作正在进行中。尽管您不应该欺骗自己，因为乌克兰市场是任何大公司的优先市场。因此，我们还需要等待很长时间才能获得乌克兰语的支持。但这一事实从未阻止爱好者和那些想要跟上进步的人。

另请阅读：

作者的更多内容

注册

0 评论

嵌入式评论

查看所有评论

其他文章