
由于 Genie 3 能够保持一致性,现在可以执行更长的操作序列,从而实现更复杂的目标。研究团队预计,这项技术将在向通用人工智能(AGI)迈进的过程中发挥关键作用,而 agent 在现实世界中也将扮演更重要的角色。局限性尽管 Genie 3 在世界模型能力上突破了现有界限,但研究团队称 Genie 3 已然存在诸多局限性,如下:有限的动作空间。尽管可提示的世界事件允许对环境进行广泛干预,但这些操作并不一定由 agent 自身执行。agent 直接执行的动作范围目前仍受限。与其他 agent 的交互与模拟。在共享环境中准确建模多个独立 agent 之间的复杂交互,仍是一项持续的研究挑战。真实世界位置的准确表示。Genie 3 目前无法以完美的地理精度模拟真实世界位置。文本渲染。清晰可读的文本通常仅在输入世界描述中提供时才会生成。交互持续时间受限。该模型目前仅能支持几分钟的连续交互,而非数小时的持续交互。下一步是什么?研究团队认为,Genie 3 是世界模型发展的重要里程碑,它将开始对人工智能研究和生成式媒体的多个领域产生影响。为此,他们正在探索如何在未来向更多测试者开放 Genie 3。Genie 3 可能为教育和培训创造新机遇,帮助学生学习和专家积累经验。它不仅能为训练机器人和自主系统等 agent 提供广阔空间,还能评估 agent 的性能并探索其弱点。原文链接:https://deepmind.google/discover/blog/genie-3-a-new-frontier-for-world-models/整理:小瑜如需转载或投稿,请直接在公众号内留言原标题:《DeepMind 世界模型再升级:一句话「创造」多样化交互世界!》