Root Nation消息资讯资讯在东京,展示了基于 GPT-3 的 Alter4 人形机器人的成功

在东京,展示了基于 GPT-3 的 Alter4 人形机器人的成功

-

东京大学的一个团队推出了 Alter3,这是一款人形机器人,可以使用 GPT-4 大语言模型 (LLM) 执行动作。 Alter3使用最新工具 打开AI 动态地摆出不同的姿势,从自拍姿势到重影,所有这些都不需要预先编程的数据库条目。

研究人员表示:“Alter3 使用面部表情和手势对对话内容进行响应,这是人形机器人技术的重大进步,它可以轻松适应其他机器人,只需进行最小的改变。”

Alter3

在法学硕士与机器人集成领域,重点是改善基本沟通和模拟现实反应。 研究人员还在深入研究法学硕士的能力,使机器人能够理解和执行复杂的指令,从而增强其功能。

传统上,低层管理 机器人 与硬件相关,不属于法学硕士公司的职权范围。 这给基于法学硕士的作品的直接管理带来了困难。 为了解决这个问题,日本团队开发了一种将人体动作表达转换为 Android 可以理解的代码的方法。 这意味着机器人可以随着时间的推移独立生成动作序列,而无需开发人员对每个身体部位进行单独编程。

在交互过程中,人们可以向 Alter3 发出命令,例如“用 iPhone 自拍”。 随后,机器人向 GPT-4 发起一系列请求,以获得必要步骤的指导。 GPT-4 会将其翻译成Python代码,让作品能够“理解”并执行必要的动作。 这项创新使 Alter3 能够移动他的上半身,同时他的下半身保持固定,固定在支架上。

Alter3 是 Alter 系列人形机器人自 2016 年以来的第三次迭代,拥有 43 个执行器,负责由压缩空气驱动的面部表情和肢体运动。 这种配置提供了多种富有表现力的手势。 该机器人不能行走,但可以模仿典型的行走和跑步动作。

Alter3 还展示了使用相机和 OpenPose 框架复制人体姿势的能力。 机器人根据观察到的姿势调整其关节,并保存成功的模仿以供以后使用。 与人类的互动导致了更多不同的姿势,支持了不同的动作来自模仿人类的观点,类似于新生儿通过模仿学习的方式。

在获得法学硕士学位之前,研究人员必须仔细控制所有 43 个执行器,以重现人的姿势或模拟行为,例如倒茶或下棋。 这需要大量的手动调整,但是 人工智能 帮助团队摆脱了这种惯例。 “我们希望 Alter3 通过显示与上下文相关的面部表情和手势来有效地参与对话。 它展示了反映情绪的能力,例如,表现出悲伤或快乐的反应,从而与我们分享情绪,”研究人员说。

另请阅读:

注册
通知关于
客人

0 评论
嵌入式评论
查看所有评论