超低维降维技术助力复杂系统临界转变预警


超低维降维技术助力复杂系统临界转变预警

仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接

将ScienceAI设为星标
第一时间掌握
新鲜的AIforScience资讯
编辑|ScienceAI
自20世纪非线性动力学理论发展以来,如何从高维数据中提取可解释的动态特征并进行刻画始终是复杂系统研究的核心挑战。
传统降维方法(如PCA、t-SNE、UMAP)虽能压缩数据维度,但在保留时序动态信息方面存在困难,并且对异常值较为敏感,容易受到噪声的干扰。
深度学习方法虽能捕捉非线性特征,但计算成本高且可解释性差。例如在ICU患者监护、胚胎发育、气象变化预警等具有状态临界转移的复杂动态场景中,迫切需要一种高效与稳健的方法来捕捉早期预警信号。

团队开发了一种名为「时空主成分分析(spatial-temporalprincipalcomponentanalysis,stPCA)」的超低维动力学降维方法。该stPCA方法能够通过单一隐变量实现高维时间序列的无损降维与状态临界转变预警,可实现高维数据的动态刻画和表征。
论文链接:https ://doi.org/10.1002/advs.202408173
在现实世界中,众多物理、生物等过程均可被视作高维非线性动态系统,其中状态的临界转变频繁发生。
然而,由于这些系统复杂度极高,难以用明确的模型进行描述,因此研究者们通常需要借助高维时间序列数据来分析其动态特性,尤其是识别临界转变前的征兆。
这一过程往往需要对数据进行降维处理以及线性或非线性表示,这对于动态分析及动力学刻画、模式识别和可视化至关重要。
针对以上问题,对于现行的PCA、tSNE、UMAP方法等,研究者开发的stPCA方法基于广义Takens嵌入理论,将高维空间信息转换为一维时间信息,利用非线性延迟嵌入理论,将高维时间序列数据的动态特性完整地映射到单一隐变量中,实现高维数据的动力学刻画。
算法的优化目标由两项组成:第一项最大化投影变量Z的方差,第二项确保投影后的Hankel矩阵Z满足延迟嵌入条件。通过求解特征方程H(X)V=αV,可获得变换矩阵W和一维投影z,其中H(X)是一个分块三对角矩阵(图1)。
这一过程不仅保留了原始高维数据的动力学特征,而且能够通过解析求解的方式获得该隐变量,避免了传统迭代数值优化算法对参数初始值的依赖,从而提高了计算效率和结果的稳定性。
此外,该一维隐变量可被视为临界点附近表征中心流形的近似量,因此可通过检测该表征变量的波动性,识别具有余维1的分岔的动力系统中即将发生的状态临界转变。
图1:stPCA算法示意图。
研究团队通过一系列实验验证了stPCA方法的有效性。首先,利用耦合Lorenz模型生成的合成时间序列数据集,在不同噪声条件下进行测试,结果表明stPCA能够在强噪声干扰下依然保持对动态系统的准确表示,其降维后的单一隐变量与传统PCA方法等的多个主成分投影结果高度相似,且具有更强的抗噪性。
此外,stPCA还被应用于具有Fold和Hopf分叉的多节点网络仿真模型等,成功检测到了临界转变点前的早期预警信号(图2)。
图2:以具有Hopf分岔的16维动力系统的16节点模型为例。将原始的高维时间序列划分为滑动窗口,一维潜在变量z是通过stPCA从每个滑动窗口获得的。z的SD是在滑动窗口中计算的,因为参数τ和λ对于16节点模型会发生变化。
特别地,在MIMIC-III和MIMIC-IV数据库ICU患者的真实数据应用中,stPCA表现出适用性和可靠性。通过对患者高维异质性时间序列数据的降维分析,stPCA能够为每位患者提供个性化的临界状态预警信号,为ICU患者的出院决策提供了量化参考(如图3所示)。
图3:以肺炎和充血性心力衰竭患者为例,结合stPCA的降维结果和2-5个诊断相关指标,可以判断患者是否应该从ICU出院。红色间期表示患者应继续接受ICU治疗或观察,而蓝色间期表示患者病情相对稳定,可以从ICU出院。
同时,stPCA还成功应用于单细胞胚胎发育数据集,识别出细胞命运转变的关键时刻,即分化为确定性内胚层的临界点(图4)。
图4:检测胚胎发育过程中的临界点。(A)细胞从多能状态分化到中间内胚层,最后分化到最终内胚层(DE)细胞的生物过程。(B)采用滑动窗口方案的潜变量z的SD曲线。结果表明,在分化过程中36小时突然增加。
总结而言,stPCA作为一种超低维动力学降维方法,不仅在理论上具有坚实的数学基础,能够完整地保留高维数据的动态特性,而且在实际应用中展现出了适用性和稳健性。
相较于传统的降维方法,stPCA在处理高维时间序列数据时具有其动力学降维的特殊优势:它通过解析方式得到的一维隐变量可有效地对复杂系统进行动力学表征和刻画,这使得在面对噪声干扰和数据维度较高时,stPCA能够快速地识别到状态临界转变点。
这一方法为复杂系统的研究、疾病诊断与治疗决策、气候变化预测等多个领域提供了一种全新的视角和量化分析工具,有望推动相关领域的研究和应用取得更大的突破。
人工智能×[生物神经科学数学物理化学材料]
「ScienceAI」关注人工智能与其他前沿技术及基础科学的交叉研究与融合发展。
欢迎关注标星,并点击右下角点赞和在看。
点击阅读原文,加入专业从业者社区,以获得更多交流合作机会及服务。


文章作者: ZejunCao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ZejunCao !
  目录