东京大学的一个团队推出了 Alter3，这是一款人形机器人，可以使用 GPT-4 大语言模型 (LLM) 执行动作。 Alter3使用最新工具打开AI 动态地摆出不同的姿势，从自拍姿势到重影，所有这些都不需要预先编程的数据库条目。

研究人员表示：“Alter3 使用面部表情和手势对对话内容进行响应，这是人形机器人技术的重大进步，它可以轻松适应其他机器人，只需进行最小的改变。”

在法学硕士与机器人集成领域，重点是改善基本沟通和模拟现实反应。研究人员还在深入研究法学硕士的能力，使机器人能够理解和执行复杂的指令，从而增强其功能。

传统上，低层管理机器人与硬件相关，不属于法学硕士公司的职权范围。这给基于法学硕士的作品的直接管理带来了困难。为了解决这个问题，日本团队开发了一种将人体动作表达转换为 Android 可以理解的代码的方法。这意味着机器人可以随着时间的推移独立生成动作序列，而无需开发人员对每个身体部位进行单独编程。

在交互过程中，人们可以向 Alter3 发出命令，例如“用 iPhone 自拍”。随后，机器人向 GPT-4 发起一系列请求，以获得必要步骤的指导。 GPT-4 会将其翻译成Python代码，让作品能够“理解”并执行必要的动作。这项创新使 Alter3 能够移动他的上半身，同时他的下半身保持固定，固定在支架上。

Alter3 是 Alter 系列人形机器人自 2016 年以来的第三次迭代，拥有 43 个执行器，负责由压缩空气驱动的面部表情和肢体运动。这种配置提供了多种富有表现力的手势。该机器人不能行走，但可以模仿典型的行走和跑步动作。

https://cdn-uploads.huggingface.co/production/uploads/60f1abe7544c2adfd699860c/DsQuQEGQLazo-shrUvF_4.mp4

Alter3 还展示了使用相机和 OpenPose 框架复制人体姿势的能力。机器人根据观察到的姿势调整其关节，并保存成功的模仿以供以后使用。与人类的互动导致了更多不同的姿势，支持了不同的动作来自模仿人类的观点，类似于新生儿通过模仿学习的方式。

在获得法学硕士学位之前，研究人员必须仔细控制所有 43 个执行器，以重现人的姿势或模拟行为，例如倒茶或下棋。这需要大量的手动调整，但是人工智能帮助团队摆脱了这种惯例。 “我们希望 Alter3 通过显示与上下文相关的面部表情和手势来有效地参与对话。它展示了反映情绪的能力，例如，表现出悲伤或快乐的反应，从而与我们分享情绪，”研究人员说。

另请阅读：

Dzherelo有趣的工程

注册

0 评论

嵌入式评论

查看所有评论

其他文章

在东京，展示了基于 GPT-3 的 Alter4 人形机器人的成功

最近的评论