仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接
将ScienceAI设为星标
第一时间掌握
新鲜的AIforScience资讯
编辑丨@
在能源危机的当下,核能,或者说,微型核反应堆(后称核微反应堆)凭借规模化优势,成为了当下可再生能源的一大重要供应来源。
通常来说,核微反应堆的经济可行性取决于通过自主控制技术降低成本,尤其是这些反应堆与其他能源系统协同运行的时候。
密歇根大学研究人员领导了一项研究,探讨了深度强化学习(RL)模型在微反应器实时鼓控制中,特别是在负荷跟随场景中的性能。
论文链接:https ://www. sciencedirect.com/science/article/pii/S2590174525002223?via%3Dihub
成果简介
在自主核控制领域的先前研究主要集中在传统的控制方法,如比例-积分-微分(PID)控制和模型预测控制(MPC),这些研究通常使用点动力学模型,忽略了中子群的时空变化。
研究团队模拟了一个来自加拿大的反应堆调节系统,使用更高精度的MOOSE模型,将反应堆的完整维度中子动力学和热液压模型耦合在一起。
实验中,团队首次将强化学习应用于基于汽包的实时控制,引入了一种多智能体强化学习(MARL)框架,利用反应堆的对称性提高训练效率,提升控制器性能,并释放汽包控制的全部潜力。
提高训练效率将有助于研究人员更快地对反应堆进行建模,向实时自动化核微反应器控制迈出一步,以便在远程位置或最终在太空中运行。
图示:Holos-Quad微反应器设计的轴向切片。
这些紧凑型反应堆能够产生高达20兆瓦的热能,可以直接用作热能或转化为电能,可以很容易地运输或可能用于希望在不加油的情况下进行长途旅行的货船。
验证结果证明,与传统的比例-积分-微分(PID)控制器进行比较,包括单代理RL和MARL框架在内的RL控制器,可以在一系列负荷跟随场景中实现与传统PID控制相似甚至更优的负荷跟随性能。
图示:HolosGenLLC出示的标准ISO尺寸.
短暂态过程中,RL代理将跟踪误差率降低了约一半到三分之一。氙反馈成为主要因素时,即使RL仅在短时场景下进行训练,其误差仍保持在1%以内。
尽管测试时团队在功率测量中增加了高斯噪声,RL控制器仍能保持较低的误差率,且所需的控制努力至少减少了10%,有时候甚至高达150%。
方法简述
作为迈向自动化的第一步,研究人员正在模拟负载跟踪,即发电厂增加或减少输出以匹配电网的电力需求。与反应器启动相比,这个过程的建模相对简单,反应器启动包括更难预测的快速变化的条件。
本研究中建模的Holos-Quad微反应器设计通过八个控制鼓的位置来调节功率,这些控制鼓以反应堆的中心核心为中心,中子在那里分裂铀原子以产生能量。控制鼓圆周的一侧衬有中子吸收材料碳化硼。
向内旋转时,鼓会吸收堆芯中的中子,进而使中子数量和功率降低。向外旋转铁芯可将更多的中子保持在铁芯中,从而增加功率输出。
上文中所叙述的MARL框架训练8个独立智能体控制特定的鼓,同时共享有关整个内核的信息,利用对称性成倍增加学习经验来帮助减少训练时间。
未来方向
在实际应用之前,该技术需要在更复杂、更现实的条件下进行广泛验证,但研究结果为自主核微反应器中的强化学习建立了一条更有效的前进道路。
密歇根大学核工程和放射科学助理教授、研究者MajdiRadaieh表示,这项研究是朝着向前数字孪生迈出的一步。接下来的目标是通过逆向校准和高保真仿真来闭合循环,以提高控制精度。
人工智能×[生物神经科学数学物理化学材料]
「ScienceAI」关注人工智能与其他前沿技术及基础科学的交叉研究与融合发展。
欢迎关注标星,并点击右下角点赞和在看。
点击阅读原文,加入专业从业者社区,以获得更多交流合作机会及服务。