本文作者是SpaceTime Labs的董事长
人类智力建立在三大支柱之上:看(观察世界)、做(对其进行干预)和想象(模拟不同选择下可能发生什么)。目前,AI只立足于其中一个支柱。
扩展现有的前沿AI模型并不能解决这个问题。引爆当下热潮的突破是谷歌(Google)开发的 transformer架构,以及在此基础上利用互联网上大量公开数据训练而成、用于生成文本和代码的大型语言模型。随后出现了把这些模型串联成自动化工作流的“智能体”。如今焦点转向了“世界模型”,试图通过海量视频及其他输入理解物理环境。
您已阅读17%(249字),剩余83%(1190字)包含更多重要信息,订阅以继续探索完整内容,并享受更多专属服务。