仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接
首先要问的是,随着LLM、VLM的兴起,研究人员是否已经创造出了至少在某种程度上像人一样思考的机器。为了回答这个问题,作者选取了四个近期的多模态大模型,并探究了它们在三个核心认知领域的能力:直觉物理学、因果推理和直觉心理学。
1.直觉物理学
直觉物理学研究了人们如何感知和解释物理现象。过去关于这一主题的研究强调,人类具有预测和理解物体的物理属性及其相互作用的天生能力,甚至从小就有这种能力,这种概念有时被概括为人们头脑中的“物理引擎”。这种理解包括重力、惯性和动量等概念。该领域一些最经典的任务涉及测试人们对积木塔稳定性的判断。这些任务已经进入机器学习基准,用于测试对神经网络的直觉物理理解(有关使用类似人类的物理知识构建模型的概述,请参阅参考文献)。
2.因果推理
因果推理研究研究了个体如何推断和思考因果关系。过去关于这一主题的研究表明,人类具有一种直觉能力,可以推断、理解和预测其环境中的因果关系,通常使用因果学习的贝叶斯模型来描述。这种认知能力包括识别模式、从干预中推断原因以及根据假设事件预测未来事件。该领域的典型任务通常涉及评估个体推断因果关系的能力,例如,判断一个物体导致其他物体运动的责任。因果推理仍然是一个挑战,即使对于当前的机器学习方法。
3.直觉心理学
直觉心理学研究探索了个体如何推断、理解和解释社会现象以及其他主体的心理状态。过去关于这一主题的研究强调了人类具有推断和推理他人心理状态、意图和情感的固有能力,通常被称为“心智理论”。这种能力被建模为贝叶斯推理问题。该领域的典型任务通常涉及评估个体在理解他人观点或意图的基础上预测行为的能力,比如根据主体在特定环境中的行为确定其效用函数。现代算法是否表现出任何形式的直觉心理学是持续争论的主题。