涌现何时发生？机器观察者可以像人类一样识别涌现吗？

发布日期: 2025-06-08

仅用于站内搜索，没有排版格式，具体信息请跳转上方微信公众号内链接

摘要
当前大语言模型的流行带火了一个概念——涌现。人们发现当人工智能参数足够多的时候，可以涌现出很多神奇的能力，比如逻辑推理，还有像人一样说话。其实涌现是复杂系统的重要特征，在我们的生活中无处不在。比如至今还没有被人工智能超越的人类大脑，为什么会有自我意识和自由意志？天空中的鸟群和地上的蚁群为什么可以自发地形成灵活而又有序的集群行为？作为观察者，我们常常惊讶于这些涌现现象，然而事实上，涌现也可以被科学量化和研究——机器观察者可以像人类一样识别涌现的发生。
今天跟大家聊聊我们课题组关于量化涌现的一项最新研究。
关键词：量化涌现，观察者，机器学习
来源：集智俱乐部
作者：杨明哲
编辑：任侠
审校：桑妮
论文题目：Findingemergenceindata:causalemergenceinspireddynamicslearning
论文地址：https ://academic. oup.com/nsr/advance-article/doi/10. 1093/nsr/nwae279/7732052
论文作者：杨明哲，王志鹏，刘凯威，荣英淇，袁冰，张江
论文解读：“涌现”发现之旅：人工智能观察者与涌现的量化
1. 涌现如何量化？
看到天空中的云彩，我们很容易把它们看成各种图案，比如一个人，一只兔子，一台机器。同样地，观察蚁群这样的复杂系统，有的人在看几只蚂蚁之间的互动，而有人会把整个蚁群看成一个具备智能的有机体。
当我们观察一个系统时，下意识地会在多个尺度上观察。比如构成云彩的水分子在运动和碰撞，是在微观尺度；而我们看到云彩形成的“人脸”图案，则是在宏观尺度。发生涌现是说，宏观尺度上的因果效应大于微观尺度上的因果效应。
这里所说的因果效应强度是什么意思呢？当我们看一团气体分子的时候，固然可以用牛顿定律来描述每一个分子的运动轨迹，但这太复杂了，几乎是不可能的。而当我们可以用温度、压强等宏观量来描述系统时，就有了理想气体状态方程PV=nRT这样简洁明了的公式，这就是因果效应更强的尺度。因果效应最强的尺度是我们对一个系统建模研究的最佳尺度。
好比我们看云彩的时候，更愿意讨论云朵的形状是像人脸还是某个动物，而不会一直想着水分子在云彩中如何激烈碰撞，因为用关于整体形状的描述把云朵变幻的规律说的更明白。这一点对于每个人来说都是非常自然的。可究竟为什么人们如此自然地选择在这一尺度上观察，而不是那一个尺度上观察呢？比如我们在看一幅高清图片时，尽管你知道它是由像素组成的，但不会去想像素的事。而当我们不断让图像“放大”，直至每一个像素或其他构成图像的基本单元粒粒可数，你会开始犹豫，是应该把注意力放在一个个像素上，还是放在图画所承载的整体内容上？我们的大脑似乎总是在依据某种指标或目标对比不同的尺度，寻找着最佳观测尺度。
因果涌现理论便是试图用科学的定量框架来描述这种多尺度变化的过程。在因果涌现理论中，科学家们用有效信息这一定量指标来度量因果效应的强弱。有效信息作为一个专业术语，刻画的是一个系统动力学受到扰动后变化的波动大小以及确定性程度。我们在观察时，其实大脑中自动在“计算”究竟哪个尺度上有效信息更高，然后选择了对自己当前来说有效信息最高的尺度。现在想象观察云彩和蚂蚁的不是人类，而是机器人。“机器观察者”可以替代人类观察者，对系统是否发生涌现现象给出更加清晰、客观的判断。
2. 机器观察者如何识别涌现？
如何搭建这样一个机器观察者呢？人工智能与机器学习的发展，让我们自然意识到，可以用人工神经网络代替因果涌现理论中需要给定或拟合的函数，以宏观因果效应强度为优化目标搭建机器学习框架。其中用以度量因果效应强度的有效信息指标也可以在神经网络上计算。
回顾人类观察云彩的过程：原本万亿个水分子聚集在天空中的某一处位置上，光线所反映的信息经过我们眼睛和相关神经系统的转换和过滤，对应到我们过往经验中的某一种图案上，这时候我们会说云朵的形状看起来像是人脸或者猫啊狗啊。这一系列过程中我们有选择地损失了很多信息，可以说是一种粗粒化过程。粗粒化得到的“图案”随着时间流逝一直维持着稳定，这便是一个宏观动力学。
在搭建机器时，我们可以用一种神经网络“编码器”代替粗粒化过程，再用一个神经网络学习宏观动力学，于是机器观察者就被搭建起来了，我们把它叫做神经信息压缩器（NeuralInformationSqueezer，简称NIS）。这里编码器就好似机器观察者的眼睛，把观察到的万事万物粗粒化到一个虚拟的“脑海”里。而为了能训练好这个机器观察者，我们还需要把它脑海里“想”的那些事情解码出来，对现实世界做预测，以防止它“胡思乱想”。
那么对于机器观察者，我们如何保证，机器不是去计算每一个分子运动的微分方程，而是像人一样尽可能去寻找PV=nRT这样简洁的视角呢？机器如何寻找到最佳观测尺度，识别出涌现的发生呢？关键在于前面所说的，要最大化宏观动力学的有效信息。我们在初始机器学习框架的基础上，在宏观尺度上添加一个反向动力学的预测，不仅要让它从过去预测未来能预测准，同时从未来的状态反过来猜测过去的状态时，也能溯因比较准，以此来保证宏观动力学这个狭窄的信息瓶颈中，流通的都是有效信息。这个改进的框架我们称之为扩展版本的神经信息压缩器（NIS+），它可以通过训练得到有效信息最大的宏观动力学，从而客观地识别出涌现。
3. 机器观察者
是不是可以像人类一样识别出涌现？
有了更加完善的机器观察者，我们就可以拿来识别复杂系统的涌现了。那么机器观察者是不是可以像人类一样识别出涌现呢？我们给它输入了各式各样的多维时间序列，比如鸟群运动轨迹、脑电波序列等等，它会告诉你有没有发生涌现，涌现的程度有多大，以及涌现出来的斑图长什么样子。
1）预测鸟群的运动轨迹
在第一个实验中，我们让机器观察者预测鸟群的运动轨迹。我们在计算机上模拟鸟群，只需要设定好局部规则，让每只鸟尽可能和周围的鸟保持一定的距离，同时在方向上保持平行，就可以复现栩栩如生的鸟群和复杂的集群行为。在足够的训练之后，机器观察者可以预测鸟群的运动轨迹，同时在8维的尺度上观察到最大程度的因果涌现。这是因为每个鸟群有平均的速度和位置两个属性，而每个属性有两个维度，所以两个鸟群一共有8个维度。并且我们画出了宏微观变量关系对应图，证明机器真的是如我们所说的那样在做粗粒化。
2）捕捉生命游戏涌现出的斑图
再来看另一个好玩的模拟实验，生命游戏。这是一个方格世界，每一个方格是一个元胞，都有生或死两种状态，而且局部作用规则非常简单。每一个元胞会因为周围过于拥挤或孤独而死亡，也会因为活细胞比例合适的环境而获得新生。当我们站在宏观的角度去看整个生命游戏世界，会发现很多有意思的斑图，比如滑翔机、飞船、信号灯等等。这都是我们人类给起的名字啦，而机器观察者也可以捕捉到这些有意思的图案，呈现在宏观尺度上。
3）识别大脑动力学
最后，我们来让机器观察者进行实战，在真实的大脑核磁共振数据上识别涌现和大脑动力学。数据来自800多个被试者在观看电影时收集的脑核磁共振数据，同时还有静息态数据做对比，也就是被试者在什么都不做的情况下收集的数据。结果发现，机器观察者从数据中识别出的涌现的宏观动力学，主要反映的是最为活跃的大脑视觉区域。虽然目前没有涉及到意识的问题，但以后我们可以发展这套机器学习框架，让它观察意识产生的脑电数据或行为数据，来识别对于意识产生最关键的区域或某种模式。
大量水分子聚集而成的云彩是什么形状？人脑中数以亿计的神经元如何相互作用涌现出意识？我们该如何定量地判断涌现何时发生？当大家跟着走完这探索历程，会发现观察者的主观解读是非常重要的一环。而机器观察者可以代替人类观察者，在与所观察的系统进行互动时，更加清晰、客观地去研究涌现问题。或许在以后，这将是对复杂问题研究的新范式。
阅读最新前沿科技趋势报告，请访问欧米伽研究所的“未来知识库”
https ://wx. zsxq.com/group/454854145828
未来知识库是“欧米伽未来研究所”建立的在线知识库平台，收藏的资料范围包括人工智能、脑科学、互联网、超级智能，数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。欢迎扫描二维码或访问https ://wx. zsxq.com/group/454854145828进入。
截止到3月31日”未来知识库”精选的百部前沿科技趋势报告
（加入未来知识库，全部资料免费阅读和下载）
牛津未来研究院《将人工智能安全视为全球公共产品的影响、挑战与研究重点》
麦肯锡：超级智能机构：赋能人们释放人工智能的全部潜力
AAAI2025关于人工智能研究未来研究报告
斯坦福：2025斯坦福新兴技术评论：十项关键技术及其政策影响分析报告（191页）
壳牌：2025能源安全远景报告：能源与人工智能（57页）
盖洛普&牛津幸福研究中心：2025年世界幸福报告（260页）
Schwab：2025未来共生：以集体社会创新破解重大社会挑战研究报告（36页）
IMD：2024年全球数字竞争力排名报告：跨越数字鸿沟人才培养与数字法治是关键（214页）
DS系列专题：DeepSeek技术溯源及前沿探索，50页ppt
联合国人居署：2024全球城市负责任人工智能评估报告：利用AI构建以人为本的智慧城市（86页）
TechUK：2025全球复杂多变背景下的英国科技产业：战略韧性与增长路径研究报告（52页）
NAVEXGlobal：2024年十大风险与合规趋势报告（42页）
《具身物理交互在机器人-机器人及机器人-人协作中的应用》122页
2025-2035年人形机器人发展趋势报告53页
EvaluatePharma：2024年全球生物制药行业展望报告：增长驱动力分析（29页）
【AAAI2025教程】基础模型与具身智能体的交汇，350页ppt
Tracxn：2025全球飞行汽车行业市场研究报告（45页）
谷歌：2024人工智能短跑选手（AISprinters）：捕捉新兴市场AI经济机遇报告（39页）
【斯坦福博士论文】构建类人化具身智能体：从人类行为中学习
《基于传感器的机器学习车辆分类》最新170页
美国安全与新兴技术中心：2025CSET对美国人工智能行动计划的建议（18页）
罗兰贝格：2024人形机器人的崛起：从科幻到现实：如何参与潜在变革研究报告（11页）
兰德公司：2025从研究到现实：NHS的研究和创新是实现十年计划的关键报告（209页）
康桥汇世（CambridgeAssociates）：2025年全球经济展望报告（44页）
国际能源署：2025迈向核能新时代
麦肯锡：人工智能现状，组织如何重塑自身以获取价值
威立（Wiley）：2025全球科研人员人工智能研究报告（38页）
牛津经济研究院：2025TikTok对美国就业的量化影响研究报告：470万岗位（14页）
国际能源署（IEA）：能效2024研究报告（127页）
Workday：2025发挥人类潜能：人工智能（AI）技能革命研究报告（20页）
CertiK：Hack3D：2024年Web3. 0安全报告（28页）
世界经济论坛：工业制造中的前沿技术：人工智能代理的崛起》报告
迈向推理时代：大型语言模型的长链推理研究综述
波士顿咨询：2025亚太地区生成式AI的崛起研究报告：从技术追赶者到全球领导者的跨越（15页）
安联（Allianz）：2025新势力崛起：全球芯片战争与半导体产业格局重构研究报告（33页）
IMT：2025具身智能（EmbodiedAI）概念、核心要素及未来进展：趋势与挑战研究报告（25页）
IEEE：2025具身智能（EmbodiedAI）综述：从模拟器到研究任务的调查分析报告（15页）
CCAV：2025当AI接管方向盘：自动驾驶场景下的人机交互认知重构、变革及对策研究报告（124页）
《强化学习自我博弈方法在兵棋推演分析与开发中的应用》最新132页
《面向科学发现的智能体人工智能：进展、挑战与未来方向综述》
全国机器人标准化技术委员会：人形机器人标准化白皮书（2024版）（96页）
美国国家科学委员会（NSB）：2024年研究与发展-美国趋势及国际比较（51页）
艾昆纬（IQVIA）：2025骨科手术机器人技术的崛起白皮书：创新及未来方向（17页）
NPL&Beauhurst：2025英国量子产业洞察报告：私人和公共投资的作用（25页）
IEAPVPS：2024光伏系统经济与技术关键绩效指标（KPI）使用最佳实践指南（65页）
AGI智能时代：2025让DeepSeek更有趣更有深度的思考研究分析报告（24页）
2025军事领域人工智能应用场景、国内外军事人工智能发展现状及未来趋势分析报告（37页）
华为：2025鸿蒙生态应用开发白皮书（133页
《超级智能战略研究报告》
中美技术差距分析报告2025
欧洲量子产业联盟（QuIC）：2024年全球量子技术专利态势分析白皮书（34页）
美国能源部：2021超级高铁技术（Hyperloop）对电网和交通能源的影响研究报告（60页）
罗马大学：2025超级高铁（Hyperloop）：第五种新型交通方式-技术研发进展、优势及局限性研究报告（72页）
兰德公司：2025灾难性网络风险保险研究报告：市场趋势与政策选择（93页）
GTI：2024先进感知技术白皮书（36页）
AAAI：2025人工智能研究的未来报告：17大关键议题（88页）
安联Allianz2025新势力崛起全球芯片战争与半导体产业格局重构研究报告
威达信：2025全球洪水风险研究报告：现状、趋势及应对措施（22页）
兰德公司：迈向人工智能治理研究报告：2024EqualAI峰会洞察及建议（19页）
哈佛商业评论：2025人工智能时代下的现代软件开发实践报告（12页）
德安华：全球航空航天、国防及政府服务研究报告：2024年回顾及2025年展望（27页）
奥雅纳：2024塑造超级高铁（Hyperloop）的未来：监管如何推动发展与创新研究报告（28页）
HSOAC：2025美国新兴技术与风险评估报告：太空领域和关键基础设施（24页）
Dealroom：2025欧洲经济与科技创新发展态势、挑战及策略研究报告（76页）
《无人机辅助的天空地一体化网络：学习算法技术综述》
谷歌云（GoogleCloud）：2025年AI商业趋势白皮书（49页）
《新兴技术与风险分析：太空领域与关键基础设施》最新报告
150页！《DeepSeek大模型生态报告》
军事人工智能行业研究报告：技术奇点驱动应用加速智能化重塑现代战争形态-250309（40页）
真格基金：2024美国独角兽观察报告（56页）
璞跃（PlugandPlay）：2025未来商业研究报告：六大趋势分析（67页）
国际电工委员会（IEC）：2025智能水电技术与市场展望报告（90页）
RWS：2025智驭AI冲击波：人机协作的未来研究报告（39页）
国际电工委员会（IEC）：2025智能水电技术与市场展望报告（90页）
RWS：2025智驭AI冲击波：人机协作的未来研究报告（39页）
未来今日研究所2025年科技趋势报告第18版1000页
模拟真实世界：多模态生成模型的统一综述
中国信息协会低空经济分会：低空经济发展报告（2024-2025）（117页）
浙江大学：2025语言解码双生花：人类经验与AI算法的镜像之旅（42页）
人形机器人行业：由“外”到“内”智能革命-250306（51页）
大成：2025年全球人工智能趋势报告：关键法律问题（28页）
北京大学：2025年DeepSeek原理和落地应用报告（57页）
欧盟委员会人工智能与未来工作研究报告
加州大学伯克利分校：面向科学发现的多模态基础模型：在化学、材料和生物学中的应用
电子行业：从柔性传感到人形机器人触觉革命-250226（35页）
RT轨道交通：2024年中国城市轨道交通市场数据报告（188页）
FastMoss：2024年度TikTok生态发展白皮书（122页）
CheckPoint：2025年网络安全报告-主要威胁、新兴趋势和CISO建议（57页）
【AAAI2025教程】评估大型语言模型：挑战与方法，199页ppt
《21世纪美国的主导地位：核聚变》最新报告
沃尔特基金会（VoltaFoundation）：2024年全球电池行业年度报告（518页）
斯坦福：2025斯坦福新兴技术评论：十项关键技术及其政策影响分析报告（191页）
国际科学理事会：2025为人工智能做好国家研究生态系统的准备-2025年战略与进展报告（英文版）（118页）
光子盒：2025全球量子计算产业发展展望报告（184页）
奥纬论坛：2025塑造未来的城市研究报告：全球1500个城市的商业吸引力指数排名（124页）
FutureMatters：2024新兴技术与经济韧性：日本未来发展路径前瞻报告（17页）
《人类与人工智能协作的科学与艺术》284页博士论文
《论多智能体决策的复杂性：从博弈学习到部分监控》115页
《2025年技术展望》56页slides
大语言模型在多智能体自动驾驶系统中的应用：近期进展综述
【牛津大学博士论文】不确定性量化与因果考量在非策略决策制定中的应用
皮尤研究中心：2024美国民众对气候变化及应对政策的态度调研报告：气候政策对美国经济影响的多元观点审视（28页）
空间计算行业深度：发展趋势、关键技术、行业应用及相关公司深度梳理-250224（33页）
Gartner：2025网络安全中的AI：明确战略方向研究报告（16页）
北京大学：2025年DeepSeek系列报告-提示词工程和落地场景（86页）
北京大学：2025年DeepSeek系列报告-DeepSeek与AIGC应用（99页）
CIC工信安全：2024全球人工智能立法的主要模式、各国实践及发展趋势研究报告（42页）
中科闻歌：2025年人工智能技术发展与应用探索报告（61页）
AGI智能时代：2025年Grok-3大模型：技术突破与未来展望报告（28页）
上下滑动查看更多