SRL:LPPN 一个轻量化的震相拾取模型
目前,基于深度学习的震相拾取算法已获得较为充分的研究,但是均集中在提升震相拾取精度上,而深度学习模型的问题在于计算复杂度较高,在实际数据处理中需要面临较高的处理代价,且需要专用的加速处理设备,如GPU。随着数据累积,迫切需要设计一种能够保证精度的轻量化高速震相拾取模型,以提高处理海量数据的效率,这种模型同时可以方便地部署在设备端。
中国地震局地球物理研究所于子叶博士团队设计的轻量化地震震相拾取模型(LPPN)是目前少数着眼于优化速度的震相拾取模型。其精度与目前广泛使用的PhaseNet模型相近,而速度快于PhaseNet,同时模型更小。LPPN模型(中小模型)相比于PhaseNet方法所需要的可训练参数更少,同时期理论计算复杂度更低。与PhaseNet拾取精度接近的中模型所占空间仅335KB,而PhaseNet则接近771KB。优化后的模型更加适合部署在低功耗设备、CPU等计算能力有限的设备上,实现高速的震相拾取工作。基于CPU的测试表明,LPPN可以在10秒内处理单日100Hz三分量连续数据。而在GPU等设备上,LPPN可以将处理单日数据的时间缩短至0.5秒。表明LPPN可以用于密集台阵长时间的数据观测。
为测试精度,与中国地震台网一期人工标注的数据进行了对比,对比结果如图1所示:LPPN具备灵活的可配置性,可以拾取除Pg、Sg波形以外的多种震相。同时Pg波的查全率(人工标注震相被自动方法检出的比例)达到了95%,Sg波的查全率达到了92.4%,这意味着LPPN不仅可以完全用于震相拾取工作,还可以在一定程度上拾取Pn、Sn等难以区分的波形。
图1 网络自动拾取震相与人工标注震相对比
本方法的创新体现在:1. 在保证精度的前提下,设计了首个优化模型计算复杂度、加速震相拾取的深度神经网络模型。模型在保证精度的情况下(比PhaseNet精度略高)可以将单台单日100Hz三分量数据处理时间缩短至0.5秒(英伟达A100计算卡)。而在CPU上处理速度是PhaseNet的2.7倍;2. 模型优化了空间复杂度,使得中等模型的大小仅为PhaseNet的50%,小模型大小为PhaseNet的1/7。这使得模型可以部署在低功耗的边缘设备上;3. 大模型使用全国100Hz模型进行训练,在全国地区均有良好的泛化能力。在ChinArray一期连续数据测试表明,P波查全率不低于80%。并且所有模型均已开源。
LPPN模型可用于地震分析的基础工作中,为反演、地震活动性等提供数据基础。在地震预警工作中,由于模型效率较高,可以以较高的效率处理实时波形。特别是在万级以上数量的台站分析中。此外,LPPN模型可以迁移到其他工作中,比如铁路路基检测分析中,目前已于铁科院进行了相关合作。
该项成果发表于国际期刊“Seismological Research Letters ”(Yu Z, Wang W. LPPN: A Lightweight Network for Fast Phase Picking[J]. Seismological Society of America, 2022, 93(5): 2834-2846.)。受中国地震局地球物理研究所基本科研业务费专项项目(DQJB20K39,DQJB22Z01)资助。
【作者简介】
于子叶,中国地震局地球物理研究所助理研究员。毕业于中国科学院大学。从事地震数据分析、面波反演工作。并著有《深度学习算法与实践》一书。