当前位置：首页 > 优惠 >大语言模型>文章详情

SIMA：创建一个能够在多个模拟的3D环境中遵循任意语言指令的智能代理

推荐人：暴走AI| 商城: AI | 2年前 (2024-04-17)| 分类：大语言模型 | 热度：690 ℃

已关闭评论

由Google DeepMind团队开发的项目SIMA（Scalable, Instructable, Multiworld Agent），SIMA的目标是创建一个能够在多个模拟的3D环境中遵循任意语言指令的智能代理。这个代理可以用于执行各种任务，比如在虚拟环境中导航、收集资源、建造物品或者与环境互动。想象一下，你告诉计算机程序：“在这个游戏世界里，找到一把剑并击败恶龙”，SIMA代理就能够理解指令并尝试执行这一系列动作。

主要功能和特点：

多环境适应性：SIMA代理可以在多种不同的3D虚拟环境中工作，包括研究环境和商业视频游戏。
语言理解：代理能够理解自然语言指令，并将这些指令转化为实际的游戏操作。
实时互动：代理能够实时与环境互动，使用图像观察和键盘鼠标动作来进行操作。
通用性：SIMA的设计注重通用性，使得代理能够在视觉复杂和语义丰富的环境中学习并执行任务。

工作原理： SIMA代理通过观察环境的视觉输入和接收的语言指令，来决定执行哪些键盘和鼠标动作。它使用了一系列预训练的模型，并通过行为克隆（Behavioral Cloning）进行训练，这意味着它通过模仿人类玩家的操作来学习。此外，代理还使用了一种称为分类器自由引导（Classifier-Free Guidance, CFG）的技术来提高语言指令的响应性。

具体应用场景：