Line spectrum extraction of underwater acoustic target using deep convolution network and adaptive enhancement learning
-
摘要:
提出了一种使用自适应增强学习的深层卷积神经网络方法对水声目标线谱进行提取。该方法利用构造的多尺度ConvNeXt算子建立滑动窗深层卷积神经网络模型(SwDCNN), 设计涵盖损失函数、学习率更新和模型迭代优化的自适应增强学习准则并用于模型训练。仿真和海试数据验证结果表明, 所提方法有以下优点: (1) 卷积算子和模型结构参数按线谱提取需求配置, 可以增强LOFAR谱图特征高性能多分辨力挖掘能力; (2) 大规模数据下的模型训练可实现渐进式精确拟合, 有助于提升模型收敛效果; (3) 模型可有效提取低信噪比、中断、弯曲漂移、粗细不均、邻近成簇、密集分布等复杂情况下的线谱, 在查全率、查准率、虚警率、线谱位置精度(LLA)和线谱幅值精度(LAA)等指标上均优于文中其他深度神经网络方法; (4) 和传统及其他文中所用的深度神经网络方法相比, 线谱最小可检测信噪比分别降低超过5 dB和2 dB, 实际复杂场景线谱提取能力更强, 综合效果更好。
Abstract:A deep convolution neural network method using adaptive enhancement learning is proposed to extract underwater acoustic target line spectrum. Firstly, a multi-scale ConvNeXt operator is constructed. Then a sliding window deep convolution neural network model (SwDCNN) for extracting line spectrum from Lofargram is established based on the operator. Finally, an adaptive enhancement learning criterion covering loss function, learning rate update and model iterative optimization is designed and used for SwDCNN model training. The numerical simulations and sea trial data show that the proposed method has four advantages: (1) The structure parameters of SwDCNN model are configured according to the line spectrum extraction requirements, which can enhance the multi-resolution mining ability of Lofargram features. (2) Under the condition of large-scale data, the model training effect of progressive accurate fitting can be achieved, and the model convergence effect can be improved. (3) The line spectrum under complex conditions such as low SNR, interruption, bending drift, uneven thickness, clustered nearest neighbors and dense distribution can be effectively extracted by the SwDCNN model. In terms of recall, precision, false alarm, LLA (Line Location Accuracy) and LAA (Line Amplitude Accuracy), the SwDCNN model is superior to other deep neural network methods used in this paper. (4) Compared with the traditional and other common deep neural network methods, the line spectrum minimum detectable SNR of the SwDCNN model is reduced by more than 5 dB and 2 dB respectively. The SwDCNN model has stronger line spectrum extraction ability and better comprehensive effect in actual complex scenes.
-
引言
无源水声目标识别的研究核心是对水声目标辐射噪声特征的表征和提取。长期以来, 国内外研究人员针对具备明确物理意义的可分性和统计不变性特征提取开展了大量研究工作[1-2], 建立了一系列物理特征模型。线谱是其中的典型代表之一, 已经广泛应用于实际目标识别场景[3-5]。因此, 水声目标线谱特征提取日益受到重视和关注, 能量判据、自适应滤波、经验模态分解、隐马尔科夫模型、自动门限等信号处理与概率统计方法[6-12], 边缘和纹理提取、谱图轨迹检测等图像处理方法[13-15]以及人工神经网络、支持向量机等机器学习与模式识别方法[16-17]纷纷被提出, 有力推动了线谱提取技术发展。然而在水声目标识别实际场景中, 多目标、强干扰已经成为常态化现象, 同时受目标发声机理复杂、海洋信道时空变异、背景和平台噪声等因素影响, 以及UUV等低辐射噪声目标的大量出现, 使得声呐接收到的信息十分复杂, 导致水声目标辐射噪声信噪比往往很低, 同时容易出现断续、弯曲等复杂线谱变异现象。上述线谱提取手段受方法本身性能瓶颈制约, 加上过于依赖先验模型和规则, 难以实现微弱线谱特征的精确提取与表征, 严重影响了水声目标识别效果。
卷积神经网络是深度学习领域的热点方法, 已经在计算机视觉、声信号处理等领域[18-20]得到了广泛应用。当前, 卷积神经网络方法呈现出结构复杂化的发展趋势, 和早期方法相比, 网络宽度和深度大幅提升, 激活函数、层归一化等方法[21-22]不断更新发展, 加上正则化、可调节学习率等方法[23-24]的应用, 使得卷积神经网络非线性关系拟合能力与日俱增。与传统信号处理方法相比, 卷积神经网络方法可通过对历史数据进行自主学习, 在掌握目标特性分布规律的基础上实现复杂非线性关系映射计算, 在理论上具备更好的特征提取能力。针对水声目标线谱特征提取与识别, 不少研究人员开展了结合卷积神经网络方法的线谱提取方法研究。Han等将标准AlexNet和VGGNet方法[25]用于LOFAR谱图线谱提取, 使用仿真数据进行模型训练和验证, 可有效提取频率起伏特性的线谱, 平均可提取信噪比达−24 dB。Park等提出一种结合U-Net网络[26]的LOFAR谱图线谱提取方法, 可对频率漂移的线谱进行提取, 随后又构建了ResNet和DenseNet网络模型[27], 对高信噪比仿真LOFAR谱图的线谱提取准确率和召回率分别达到96.2%和99.5%。然而, 线谱提取涉及的实际场景十分复杂, 将低信噪比和复杂变异的重要线谱从背景中分离, 一方面需要网络具有足够的算力支撑, 使网络结构与数据处理复杂度和线谱提取需求相适配; 另一方面, 结构复杂化的网络对训练提出了更高要求, 通过结合水声目标线谱物理知识和规律, 设计适合模型的学习方法和规则, 可以提升模型的训练优化和迭代收敛能力。
基于以上讨论, 本文提出一种使用深层卷积神经网络的水声目标LOFAR谱图线谱提取方法。该方法利用构造的多尺度ConvNeXt算子建立滑动窗深层卷积神经网络模型(SwDCNN), 其网络结构参数根据线谱分布规律、使用需求等要素进行配置, 能够实现高性能算力和多分辨力特征处理, 进一步设计模型自适应增强学习的损失函数及迭代优化方法, 可使模型渐进式掌握线谱特性并有望提升实际场景下的模型适应能力。仿真和海试数据处理结果均表明, 所提方法可有效提取复杂场景线谱, 和其他普通卷积神经网络模型、传统方法相比, 最小可检测信噪比更低, 弱线谱提取能力更强。研究成果有望为智能化水声目标特征提取与识别发展提供技术支撑。
1. 水声目标线谱提取网络模型构建与优化方法
1.1 网络建模需求分析
线谱是舰船辐射噪声重要的特征量之一, 对于水下目标探测与识别具有重要意义。线谱起因多样, 主要包括螺旋桨旋转产生的叶片速率线谱、机械噪声线谱、结构振动产生的线谱、机械旋转或往复不平衡导致的轴频线谱等。在实际场景下, 目标工况变化、水声目标噪声传播过程中的时空变性等因素都可引起线谱畸变。以上多种因素叠加导致水声目标线谱十分复杂, 部分线谱呈现低信噪比、中断、弯曲漂移、粗细不均、邻近成簇等特点。
当前, LOFAR分析是最常用的线谱特征分析方法, 可实现高频率分辨率下的线谱提取, 而LOFAR谱图则与卷积神经网络擅长二维图像处理的特点十分适配。因此, 本文以LOFAR谱图为处理对象, 提出利用深层卷积神经网络的线谱提取方法, 在建模与运用过程中, 需重点解决以上复杂变异线谱的提取问题。
1.2 基本卷积算子构造方法
卷积神经网络是深度神经网络的重要代表之一, 非常适合处理图像数据, 在图像检测、图像分割、图像分类等领域都取得了令人瞩目的成绩[28]。当前, 卷积神经网络呈现出结构复杂化的发展趋势, 非线性表征与映射能力不断增强, 涌现出了ResNet[29]、DenseNet[30]和ConvNeXt[31]等具备优异图像处理能力的方法。其中, ConvNeXt参考Swin Transformer网络[32]的训练策略和架构设置, 对ResNet模型进行优化, 结构如图1所示。和ResNet、DenseNet等方法相比, ConvNeXt性能增量提升, 是卷积神经网络发展的最新成果之一。
水声目标LOFAR谱图高维复杂、特征信息丰富, 通过构造使用ConvNeXt基本框架的深层结构网络算子, 可有效挖掘有用特征信息。为增强粗细不均、邻近成簇等特征变异情况下的线谱提取能力, 构造具有不同尺度的深层结构卷积算子, 基本结构如图2所示, 其中Nchannel_number为卷积层输出的通道数量。大尺度ConvNeXt算子可以从大范围频率跨度上挖掘线谱特征信息, 如频率变化率较大的弯曲漂移线谱、被环境噪声淹没的孤立弱线谱等, 中尺度ConvNeXt算子则能够实现更精细的特征挖掘, 可增强邻近成簇线谱、强干扰附近线谱等的计算与抽取能力。和ResNet等卷积算子相比, 该卷积算子算力性能限更高; 而和单一尺度卷积算子相比, 又具备多分辨力信息处理能力, 本文将其作为深度网络构建基础。
1.3 模型构建方法
本节构建用于线谱提取的深层神经网络模型, 通过优化卷积算子组合与运用方式, 使网络结构与整个线谱提取过程的物理现象和目的更适配, 模型结构框图如图3所示, 主要包括预处理与滑动窗、特征深度提取、特征重组与降维和线谱特征输出四部分, 本文称为滑动窗深层卷积神经网络(Sliding window deep convolutional neural network, SwDCNN)。
为充分利用深度网络的复杂非线性拟合能力实现多层次特征自主学习和精准挖掘, 结合传统LOFAR谱分析经验、线谱使用需求、声呐平台特性等要素, 采用高频率分辨率的LOFAR谱图构造样本。鉴于LOFAR谱图频率维长度要比时间维大得多, 因此以滑动窗形式将谱图沿频率维进行分割, 根据实际频点数及不同频段上线谱特征的丰富程度, 自适应设定滑动窗窗长及重叠率, 形成多尺度片段。
特征深度提取是线谱特征关键信息抽象与映射的关键, 利用1.2节提出的多尺度ConvNeXt算子作为网络基础, 增强对海洋环境和工况导致的线谱变化的适应性。各谱图片段背景噪声、特征信息等存在差异性, 线谱提取难度各不相同。因此, 分析各谱图片段特征提取需求, 构造面向各片段处理的网络模型, 形成差异性网络模块, 使其规模与谱图片段相适配。特征映射网络模型1和2主要针对水声目标特征信息丰富、存在重要线谱的片段, 其特征映射能力需求较高, 利用大尺度和中尺度ConvNeXt算子构造基本块, 通过多尺度卷积算子混合利用方式增强复杂线谱特征挖掘能力。两个网络模块分别包含4个基本块。基本块输出通道数量分别设置为(128, 256, 512, 1024)和(96, 196, 384, 768), 基本块循环次数均设置为(3, 3, 27, 3), 即各模块均包含108层; 针对特征映射网络模块3和4, 综合考虑网络动态响应性及算力需求, 兼顾全局性线谱特征信息挖掘, 使用大尺度ConvNeXt算子构造基本块, 两个网络模块同样分别包含4个基本块, 基本块输出通道数量均设置为(96, 196, 384, 768), 基本块循环数量则分别设置为(3, 3, 12, 3)和(3, 3, 9, 3), 即模块3和模块4分别包含63和54层。在特征深度提取过程中, 通过分析各谱图片段特征复杂程度、线谱提取需求等要素, 将各谱图片段分配至相应网络模块。该网络结构是在充分考虑水声目标LOFAR谱图特点、线谱提取需求、网络算力等多种要素下的架构方案, 是一种面向水声目标线谱提取的可行深度神经网络建模途径。
特征重组与降维利用若干线性变换层和Relu激活函数对多个差异性网络模块输出的关键信息片段进行融合, 得到综合决策特征。
线谱特征输出利用线性回归层对综合决策特征进行处理, 输出最终的线谱提取结果。
1.4 模型自适应增强学习方法
线谱提取网络模型学习LOFAR谱图与线谱频率/幅度之间的关系, 其模型训练属于复杂非线性关系回归拟合问题, 收敛难度要比通常的分类模型大得多。因此, 样本学习的准确性将直接对复杂条件下的弱线谱提取产生重要影响。
本文从损失函数、学习率和训练方法等方面出发, 构造与线谱提取模型结构、功能和线谱特点等要素相适配的自适应增强学习框架, 一方面引导模型训练误差梯度持续向下降方向变化, 提高模型训练效率, 降低模型陷入“过拟合”、“欠拟合”等困境的风险; 另一方面增强模型对微弱有用信息的挖掘能力, 提升线谱回归拟合精确度和综合处理效果。
(1) 模型损失函数构造方法
构造与样本和模型特点适配的损失函数, 是增强模型训练效果的基础要素之一。针对水声目标线谱提取的回归拟合计算, 利用最小均方误差构造基础损失函数
JOrin(ω) :J_{\text {Orin }}(\omega)=\frac{\displaystyle\sum_{i=1}^{N_S}\left(\boldsymbol{y}_i-\widehat{\boldsymbol{y}}_i\right)^2}{N_S}, (1) 其中,
{N_S} 为模型单次训练的样本数量,\omega 为待优化模型结构权重,{y_i} 为模型对单个样本进行处理后输出的线谱提取结果,{\widehat y}_i 为该样本对应的线谱序列标签。在此基础上, 为增强线谱提取能力, 以正则化约束方法为基础, 对基础损失函数展开优化和改进。
针对多样本混合训练条件下目标线谱特征强弱不均衡的情况, 为提高弱特征在损失项上的贡献率, 对弱特征进行强化, 添加弱特征增强损失约束项。通过对目标线谱特征强弱按能量准则进行统计, 得到特征强弱分布概率曲线, 对不同强度范围内的线谱特征贡献系数进行分阶设置:
J_{\mathrm{Inv}}=\lambda \sum_{i=1}^M\left(\mu_i \frac{\left(\boldsymbol{y}_i-{\widehat{\boldsymbol{y}}}_i\right)}{N_i}\right)^2 , (2) 其中,
\lambda 为弱特征损失项增强系数,M 为分阶数量,{\mu _i} 和{N_i} 分别为该阶弱特征贡献系数和线谱数量。水声目标线谱特征理论上应为正值, 而线谱提取模型在未收敛的情况下, 其输出可能包含负数等异常值。参考非负矩阵分解思想[33], 图像数据特征提取过程及结果应具有非负性。为加速网络中间及输出结果向正值方向收敛, 在损失函数中增加非负约束项:
\begin{split} {J_{{\text{Non}}}} =& {\gamma _1}\sum\limits_{i = 1}^l {{\left( {{\alpha _i}{{\boldsymbol{y}}_i}} \right)}^2} + {\gamma _2}\sum\limits_{j = 1}^g {{{\left( {{\alpha _j}{{\boldsymbol{y}}_{{\text{Hidden,}}j}}} \right)}^2}} ,\\&{\text{ }}({{\boldsymbol{y}}_i} < 0,{\text{ }}{{\boldsymbol{y}}_{{\text{Hidden}},j}} < 0) , \end{split} (3) 其中,
{{\boldsymbol y}_{{\text{Hidden,}}j}} 为网络隐层特征,{\gamma _1} 和{\gamma _2} 分别为结果项和隐层特征项的非负约束系数(非负矩阵分解),{\alpha _i} 和{\alpha _j} 分别为结果项和隐层特征项的负值贡献系数, 同样可利用特征能量统计分析方法对上述变量进行分阶梯设置。综合以上方法, 线谱提取模型的总损失函数如下:
J = {J_{{\text{Orin}}}}\left( \omega \right) + {J_{{\text{Inv}}}} + {J_{{\text{Non}}}}. (4) 该损失函数综合考虑了线谱提取过程的多项重要影响因素, 通过以上约束项, 可自适应调整损失函数对非线谱、弱线谱、异常值等要素的优化权重, 引导模型训练朝线谱正向拟合、弱特征精确提取方向发展, 有效增强模型训练效果。
(2) 模型学习率设置方法
设置合适的模型训练学习率, 是提升模型训练过程收敛能力的另一个重要基础要素。本文面向线谱提取的复杂回归拟合场景, 和分类识别等场景相比, 省去了Softmax等数值离散/归一化处理, 直接输出线谱幅度和频率信息。因此, 模型需具备更精准的推理能力, 其训练是对反映线谱属性的LOFAR谱图信息进行挖掘, 实现从粗糙到精细特征的渐进学习过程, 对数据规模、模型训练迭代轮数等提出了很高要求。结合以上模型渐进式训练过程, 与特征学习精度适配的学习率至关重要, 是保证模型向正确方向收敛的重要基础。
针对以上需求, 将模型训练过程划分为若干个阶段, 每个阶段综合考虑训练损失函数值和验证集性能评估结果, 对学习率进行自适应设定, 支撑模型渐进式的学习过程, 具体过程如下。
在模型每个训练阶段对训练损失值和验证集性能进行定期测试并按时间顺序均分为两个子集合, 分别记为
{L_{{\text{P,1}}}} ,{L_{{\text{P,2}}}} 和{A_{{\text{P,1}}}} ,{A_{{\text{P,2}}}} , 则自适应学习率调节方法如下式所示:\begin{split} L{r_{\text{N}}} =& \left( \alpha \left( {\frac{{2\displaystyle\sum {{A_{{\text{P,2}}}}} }}{{{N_{\text{P}}}}} - \frac{{2\displaystyle\sum {{A_{{\text{P,1}}}}} }}{{{N_{\text{P}}}}}} \right) +\right.\\& \left.\beta \left( {\frac{{2\displaystyle\sum {{L_{{\text{P,2}}}}} }}{{{N_{\text{P}}}}} - \frac{{2\displaystyle\sum {{L_{{\text{P,1}}}}} }}{{{N_{\text{P}}}}}} \right) \right)L{r_{\text{P}}}, \end{split} (5) 其中,
{N_{\text{P}}} 为当前阶段训练过程中的验证次数,\alpha 和\beta 分别为决策系数,L{r_{\text{N}}} 和L{r_{\text{P}}} 分别为下一阶段和当前阶段训练的学习率。该模型学习率设置综合考虑了损失函数值和验证正确率的变化过程, 可实现动态调整, 与模型渐进式的长时训练过程十分适配, 对加速模型前期训练收敛速度, 提升模型后期训练拟合精度都具有较强支撑作用。
(3)模型训练方法
鉴于实际水声目标数据数量少, 能够明确进行线谱特征标注的LOFAR谱图更少, 本文联合利用大规模仿真样本和少量实际样本, 提出一种与线谱提取模型特点适配的训练框架, 如图4所示。
首先使用水声目标辐射噪声仿真模型生成大规模水声目标数据, 经LOFAR分析, 生成线谱数量、频率、幅度、变异特性等随机分布的大规模高质量仿真谱图样本集和复杂低信噪比谱图样本集并用于深层卷积网络模型的训练, 使模型进行由简单到复杂的循序渐进学习, 尽可能遍历人工构造的线谱特性, 充分利用已掌握的LOFAR谱图线谱特性知识优化模型结构参数。接着利用小样本实际目标数据生成实际谱图样本并对模型进行优化, 使模型微调适应实际线谱特性。最后对模型训练结果展开分析, 反馈优化线谱提取模型。在上述过程中, 将对优化器、学习率和损失函数加权系数等要素进行自适应调节, 增强模型训练效果。
1.5 模型评价方法
在众多声呐探测与识别场景中, 水下目标的重要线谱是重点关注对象。另一方面, 本文从LOFAR谱图中提取线谱, 有线谱频点数量远少于非线谱频点数量。因此, 为增强线谱提取能力表征的敏感性并更准确反映重要线谱提取水平, 将查全率、查准率和P-R曲线作为模型评价指标。查准率反映了线谱提取正确率; 查全率与线谱提取漏警率呈反向变化关系, 查全率越高, 漏警率越低; P-R曲线则表征了模型对线谱正样本提取的综合性能。
由于本文模型所涉及的线谱提取结果包含线谱的频率和幅度信息, 利用混淆矩阵方法, 提出一种如表1所示的频率−幅度信息加权的二分类混淆矩阵构造方法, 并以此为基础计算查准率P和查全率R。其中TP1表示预测值和真实值均为有线谱且预测值和真实值幅值一致性高, TP2表示预测值和真实值均为有线谱且预测值和真实值幅值一致性低, FP表示预测值为有线谱但真实值为无线谱, FN表示预测值为无线谱但真实值为有线谱, TN表示预测值和真实值均为无线谱, k为线谱综合评价权值系数, 用于反映线谱幅值的重要性, 取值范围为[0, 1]。一般而言, 线谱频率信息重要性高于幅值信息, 结合实际数据分析结果, 将k设置为0.5。
表 1 频率 − 幅度信息加权的二分类混淆矩阵预测值 真实值 有线谱 无线谱 有线谱 幅值正确 True Positive1 (TP1) False Positive (FP) 幅值错误 True Positive2 (TP2) 无线谱 False Negative (FN) True Negative (TN) P = \frac{{{\text{T}}{{\text{P}}_{\text{1}}}{\text{ + }}k \times {\text{T}}{{\text{P}}_{\text{2}}}}}{{{\text{T}}{{\text{P}}_1}{\text{ + T}}{{\text{P}}_2}{\text{ + FP}}}}, (6) R = \frac{{{\text{T}}{{\text{P}}_{\text{1}}}{\text{ + }}k \times {\text{T}}{{\text{P}}_{\text{2}}}}}{{{\text{T}}{{\text{P}}_1}{\text{ + T}}{{\text{P}}_2}{\text{ + FN}}}}. (7) 线谱提取虚警也会对目标特征分析产生显著影响, 当虚警程度较高时, 会干扰重要线谱判别, 进而严重影响目标识别结果, 和漏警相比, 此时虚警危害更为明显。因此, 利用表1计算线谱提取虚警率
{F_a} 并作为评价指标之一:{F_a} = \frac{{{\text{FP}}}}{{{\text{TN + FP}}}}. (8) 在此基础上, 参考文献[14]和[25], 对线谱位置精度(Line Location Accuracy, LLA)进行计算, 并进一步设计线谱幅值精度(Line Amplitude Accuracy, LAA)计算方法, 如下所示:
\begin{split} {\text{LLA = }}&\frac{1}{{\max \left( {\left| {{L_P}} \right|,\left| {{L_F}} \right|} \right)}}\\&\sum\limits_{\left( {l,m} \right) \in {L_P}} {\frac{1}{{1 + {\lambda _{{\text{LLA}}}}{{\min }_{\left( {i,j} \right) \in {L_F}}}\left( {{{\left\| {\left[ {l,m} \right] - \left[ {i,j} \right]} \right\|}^2}} \right)}}}, \end{split} (9) \begin{split} & {\text{LAA = }}\frac{1}{{\max \left( {\left| {{L_P}} \right|,\left| {{L_F}} \right|} \right)}}\\&\;\;\sum\limits_{\left( {l,m} \right) \in {L_P}} {\frac{1}{{1 + {\lambda _{{\text{LAA}}}}\left. {{{\left( {{A_{l,m}} - {{\overline A}_{i,j}}} \right)}^2}} \right|{{\min }_{\left( {i,j} \right) \in {L_F}}}\left( {{{\left\| {\left[ {l,m} \right] - \left[ {i,j} \right]} \right\|}^2}} \right)}}}, \end{split} (10) 其中,
{L_P} 为预测线谱集合,{L_F} 为标签线谱集合,\left| \cdot \right| 为集合中非零值数量,\left[ {l,m} \right] 为预测线谱位置,\left[ {i,j} \right] 为标签线谱位置,\left\| {\left[ {l,m} \right] - \left[ {i,j} \right]} \right\| 为预测线谱位置和标签线谱位置的欧式距离,{A_{l,m}} 为预测线谱幅度,{\overline A_{i,j}} 为标签线谱幅度,{\lambda _{{\text{LLA}}}} 和{\lambda _{{\text{LAA}}}} 分别为LLA和LAA的加权系数, 本文参考文献[14]和[25], 将{\lambda _{{\text{LLA}}}} 和{\lambda _{{\text{LAA}}}} 均设置为1。2. 水声目标线谱提取网络模型训练
2.1 样本集构建方法
根据1.4节的模型训练方法, 构建大规模仿真样本集和小样本实际样本集, 并划分为大规模仿真训练样本集、仿真验证样本集、仿真测试样本集和实际训练、测试样本集, 上述各样本集相互独立。其中, 实际训练样本集综合利用已有多渠道海试数据, 结合部分目标属性先验信息和LOFAR分析方法, 使用人工线谱标注方法生成符合深度网络要求的规范化样本, 总数量超过1000条; 测试样本集具体描述可见第4节海试数据验证。用于仿真样本集生成的水声目标辐射噪声仿真模型以参考文献[8]的线谱仿真模型为基础, 仿真线谱时域信号
s\left( t \right) 的基础模型如下:s\left( t \right) = \sum\limits_{n = 1}^N {{a_n}\left( t \right)\sin \left[ {2{\text{π }}{f_n}\left( t \right)t + {\varphi _n}\left( t \right)} \right]} + \varepsilon \left( t \right), (11) 其中,
N 为线谱数量,t 为采样时刻,{a_n}\left( t \right) 为信号幅值,{f_n}\left( t \right) 为信号频率,{\varphi _n}\left( t \right) 为信号相位,\varepsilon \left( t \right) 为噪声。结合实际正常分布、低信噪比、中断、弯曲漂移、粗细不均、邻近成簇等特点的线谱特性知识, 对每根线谱的幅值、频率等变量进行控制,{a_n}\left( t \right) 和{f_n}\left( t \right) 可分别表示为{a_n}\left( t \right){\text{ = }}{a_{n,0}} + \eta {a_{n,t}} + {\varepsilon _a}, (12) {f_n}\left( t \right){\text{ = }}{f_{n,0}} + \theta {f_{n,t}} + {\varepsilon _f}, (13) 其中,
{a_{n,0}} 为幅值主成分项, 根据线谱信噪比设定, 本文仿真线谱信噪比在−30~0 dB区间内均匀分布,{a_{n,t}} 为幅值趋势变化项, 模拟线谱中断消失、幅值起伏等特点,\eta 为幅值趋势变化加权系数, 取值区间为[0,1], 幅值起伏和中断的单位时间(s)变化率分别不超过3%和50%,{\varepsilon _a} 为随机变量。{f_{n,0}} 为频率主成分项, 根据线谱频率分布区间设定,{f_{n,t}} 为频率趋势变化项, 模拟线谱弯曲漂移、宽度不均等特点,\theta 为频率趋势变化加权系数, 取值区间为[0,1], 频率单位时间(s)变化率不超过10%,{\varepsilon _f} 为随机变量。利用以上方法, 生成具备正常和复杂变异特点的线谱, 从而更好地模拟实际目标线谱, 增强深度学习模型的可学习性。同时, 针对实际海洋环境噪声复杂多样的情况, 本文主要以文献[8]所用的高斯白噪声为基础生成大规模训练、验证和测试样本, 利用文献[34]中的广义自回归条件异方差模型(GARCH)和双模模型, 生成非高斯背景噪声下的测试样本。训练和验证样本频率分辨率为0.25 Hz, 样本数量分别超过1000万和1万条, 训练样本按线谱信噪比和变异的复杂程度进一步划分为独立的大规模高质量仿真谱图样本集和复杂低信噪比谱图样本集; 测试样本中, 除分辨率影响分析使用多种频率分辨率样本外, 其余测试样本频率分辨率与训练样本一致, 测试样本总数量超过5万条。2.2 模型训练结果
使用第1节中提出的相关方法构建面向水声目标线谱提取的SwDCNN模型并展开训练与验证。
为对比本文所提SwDCNN模型结构、损失函数和学习率自适应增强效果, 分析各优化项作用, 构建使用图1基础ConvNeXt算子的深度网络模型(CNX)、无损失函数和学习率自适应增强的SwDCNN(SwDCNN_O)模型、仅有损失函数自适应增强的SwDCNN(SwDCNN_L)模型、仅有学习率自适应增强的SwDCNN(SwDCNN_A)模型。
同时, 参考文献[25-26]的成功经验, 利用AlexNet、VggNet、ResNet和DenseNet方法构建线谱提取对比网络模型。其中AlexNet使用V2架构标准方法建模, VggNet使用Vgg19架构建模, ResNet使用152层架构建模, DenseNet使用201层架构建模, 4个对比模型均采用最小均方误差作为损失函数并使用训练样本随机放回式抽样模式。利用2.1节生成的训练和验证样本集, 对以上各网络模型展开训练和验证。
图5(a)所示为模型训练过程损失函数值变化曲线, 每轮训练均包括10000个Batch样本。可以看到, 随着训练轮数增多, 各模型损失函数值均呈逐渐下降趋势, AlexNet模型、VGGNet模型、ResNet模型和DenseNet模型收敛较快, 而CNX模型、SwDCNN模型、SwDCNN_O模型、SwDCNN_L模型和SwDCNN_A模型模型初始阶段损失值则要高得多且变化缓慢, 此后快速下降并收敛, 说明由ConvNeXt算子构造的深度学习网络模型本身学习难度大但对大规模数据的可学习性更佳。在模型训练收敛阶段, 损失函数收敛值由低到高分别为SwDCNN模型、SwDCNN_A模型、SwDCNN_L模型、SwDCNN_O模型和CNX模型, 说明本文所提SwDCNN网络架构和多尺度卷积算子、自适应增强学习的损失函数和学习率方法在模型训练过程中均可发挥模型训练增强作用, 各优化因素综合作用下的模型训练效果最佳。
图5(b)和图5(c)所示分别为验证查全率和查准率随训练轮数的变化曲线。可以看到, 在训练后期, SwDCNN模型在查全率和查准率上均取得最佳效果, SwDCNN_L和SwDCNN_A模型次之, SwDCNN_O模型、CNX模型分别按次序随后, 均优于4个其他网络模型, 进一步说明本文提出模型和增强学习方法可以正向增强模型高维信息非线性处理能力, 提升有用线谱信息的利用水平, 实现模型迭代收敛过程与特征学习的长历程渐进适配。
3. 仿真数据验证
3.1 典型场景线谱提取结果分析
利用仿真测试样本集对线谱提取模型进行测试。根据各深度学习模型性能测试结果, 利用P-R曲线分析各深度学习模型性能在查全率和查准率上的综合表现, 如图6所示。可以看到, SwDCNN_O模型综合性能要优于CNX模型, 同时上述两个模型表现都比AlexNet模型、VGGNet模型、ResNet模型和DenseNet模型更好, 说明ConvNeXt卷积算子和本文所提SwDCNN网络架构更擅长处理LOFAR谱图。SwDCNN_L模型、SwDCNN_A模型和SwDCNN模型曲线合围面积依次增大, 均超出其他模型, 验证了本文所提自适应损失函数和学习率设置方法的有效性。
图7所示为SwDCNN模型的部分典型场景单批次线谱提取结果, 可以看到, SwDCNN模型可对中断、强干扰、邻近成簇、低信噪比、粗细不均、弯曲漂移、密集和宽频带不均衡分布等复杂情况下的线谱进行有效提取。图8所示为综合以上多种典型状况线谱的长历程结果, 谱图中主要线谱均被有效提取, 结果和标签历程基本一致。以上结果说明SwDCNN模型可充分挖掘LOFAR谱图特征, 建立各滑动窗内高维信息与不同分布规律线谱之间的映射关系, 实现复杂场景线谱特征提取。
利用2.2节训练得到的多模型对不同类型背景噪声下的LOFAR谱图进行线谱提取测试, 统计结果如表2—表4所示。可以看到, 针对不同背景噪声下的LOFAR谱图线谱提取, 各模型查全率、查准率、LLA和LAA数值差别不大。除AlexNet模型查准率、ResNet模型查全率等少数指标外, 其余指标变化差值在3%以内。另外, 除AlexNet模型和VGGNet模型外, 其余模型在不同背景噪声下的虚警率也比较稳定。其原因可能是由于深度学习模型对LOFAR谱图进行学习, 直接挖掘图像特征分布规律, 输出二维矩阵数值的复杂非线性降维与拟合信息, 实现线谱特征提取。而不同背景噪声下的图像背景噪声虽有差异性, 线谱分布与变化规律基本相同, 对深度学习而言, 其特征挖掘难度差别较小。
表 2 利用高斯白噪声背景噪声仿真LOFAR谱图的线谱提取模型评价统计结果统计准则 深度学习模型 SwDCNN AlexNet VGGNet ResNet DenseNet CNX SwDCNN_O SwDCNN_L SwDCNN_A 查全率 (%) 91.81 89.42 91.73 87.85 88.72 90.13 90.92 91.51 91.03 查准率 (%) 95.92 74.66 74.78 95.20 95.36 94.38 95.19 94.50 95.37 虚警率 (%) 0.15 2.16 1.80 0.95 0.84 0.62 0.49 0.45 0.18 LLA 0.705 0.552 0.623 0.615 0.654 0.679 0.692 0.695 0.703 LAA 0.721 0.612 0.636 0.660 0.687 0.688 0.685 0.706 0.711 表 3 利用GARCH背景噪声仿真LOFAR谱图的线谱提取模型评价统计结果统计准则 深度学习模型 SwDCNN AlexNet VGGNet ResNet DenseNet CNX SwDCNN_O SwDCNN_L SwDCNN_A 查全率 (%) 90.37 87.60 90.04 83.43 86.04 88.68 89.52 90.05 89.89 查准率 (%) 97.43 70.93 73.94 95.93 95.62 94.32 94.19 94.42 96.96 虚警率 (%) 0.17 2.20 1.67 1.08 0.87 0.59 0.47 0.44 0.22 LLA 0.716 0.564 0.659 0.683 0.688 0.683 0.701 0.675 0.711 LAA 0.702 0.591 0.606 0.634 0.638 0.658 0.695 0.704 0.693 表 4 利用双模背景噪声仿真LOFAR谱图的线谱提取模型评价统计结果统计准则 深度学习模型 SwDCNN AlexNet VGGNet ResNet DenseNet CNX SwDCNN_O SwDCNN_L SwDCNN_A 查全率 (%) 92.49 82.77 91.37 88.48 85.74 89.46 90.31 91.36 90.82 查准率 (%) 96.77 66.05 72.88 95.91 95.90 94.88 94.60 95.21 96.54 虚警率 (%) 0.16 3.22 1.46 1.03 0.84 0.58 0.45 0.42 0.18 LLA 0.695 0.601 0.605 0.628 0.624 0.659 0.686 0.695 0.698 LAA 0.741 0.578 0.604 0.669 0.665 0.676 0.675 0.688 0.713 综合表2—表4三组结果, 对各模型性能进行分析。可以看到, SwDCNN模型在各项指标上均为最佳。和AlexNet模型、VGGNet模型相比, SwDCNN模型查全率略高, 但查准率提升超过30%, 虚警率降低超过85%, LLA和LAA提升均超过10%; 和ResNet模型、DenseNet模型相比, SwDCNN模型查准率稍高, 但查全率提升超过5%, 虚警率降低超过80%, LLA和LAA提升均超过7%; 同时, CNX模型性能优于AlexNet模型、VGGNet模型、ResNet模型和DenseNet模型, CNX方法作为本文所提SwDCNN模型的基础卷积算子构造方法, 已表现出超越主流卷积神经网络方法的优异性能; SwDCNN_O模型综合表现超过CNX模型, 其虚警率降低超过30%, LLA和LAA提升超过2%; SwDCNN_L模型和SwDCNN_A模型各有所长, 均优于SwDCNN_O模型, SwDCNN_L 查全率高于SwDCNN_A模型, 但其他指标低于SwDCNN_A模型。
上述结果说明本文所提的SwDCNN模型结构参数、自适应损失函数和学习率等均可以一定程度增强特征挖掘能力, 使模型在各类线谱提取性能指标上表现更加均衡。
3.2 线谱信噪比影响分析
分析LOFAR谱图线谱信噪比对线谱提取性能影响, 如图9所示。可以看到, 各模型线谱提取能力均随线谱信噪比下降而降低, 总的来说, 针对查全率, SwDCNN模型除高信噪比时与VGGNet模型接近外, 其余阶段始终要高于对比模型; 针对查准率, SwDCNN模型在信噪比高于−15 dB时与ResNet模型、DenseNet模型接近, 在信噪比更低时也优于所有对比模型, 说明SwDCNN模型更擅长提取微弱线谱特征; 针对LLA和LAA, SwDCNN模型在各信噪比上均优于对比模型, 说明其线谱提取精度更高, 结果更为准确, 综合能力更强。
3.3 LOFAR谱图分辨率影响分析
分析LOFAR谱图分辨率对线谱提取性能影响, 如图10所示。可以看到, 当频率分辨率处于0.25 ~ 1.00 Hz范围内时, SwDCNN模型查全率、LLA和LAA总体上呈平稳趋势, 而查准率则逐渐上升, 增幅超过5%。当频率分辨率大于0.25 Hz时, SwDCNN模型查全率、查准率、LLA和LAA均呈现下降趋势, 频率分辨率从0.25 Hz增大到0.01 HZ, 查全率和LLA降幅超过30%, 查准率和LAA降幅则超过10%, 其余对比模型变化趋势与SwDCNN模型大致相同。这说明线谱提取模型适用的谱图频率分辨率最好与训练样本保持一致, 当频率分辨率从0.25 Hz上升至大幅低于训练样本分辨率时, 线谱提取查准率较低, 影响了线谱检测效果; 而当谱图分辨率太高时, 将直接导致线谱提取综合性能显著下降。同时, SwDCNN模型在各分辨率下的综合性能要优于其他对比模型, 说明其适应性相对更广, 泛化能力更好。
4. 海试数据验证
本节利用海试数据验证所提模型和方法的有效性。试验于2020年在南海某海域开展, 试验数据由某声呐设备获取, 后期结合AIS等先验目标信息, 对跟踪目标数据进行整理, 形成多型民船目标实际数据集。进一步对跟踪目标数据进行特征分析和标准化, 生成供测试的LOFAR谱图样本集。同时, 对LOFAR谱图中部分正常分布、低信噪比、漂移弯曲、低信噪比、密集分布等特点的典型线谱进行人工标注和信噪比计算, 构建具备不同信噪比线谱标签的实际测试样本集。经统计, 上述样本的线谱总数量超过2000根, 以1 dB间隔进行划分, 则−15~15 dB范围内的各区间线谱数量均超过20根。
采用上述深层卷积网络模型对实际测试样本集进行线谱提取。同时, 以文献[12]为基础, 结合已有实际线谱分布规律先验知识设计具备左右边界宽度和界斜率、谱峰幅度等门限的传统双边对比度线谱提取方法并用于对比分析。图11所示为SwDCNN模型、主流深层卷积神经网络模型和传统方法处理的典型结果, 其中主流深层卷积神经网络模型选取DenseNet模型作为代表。可以看到, 针对图10(a)中的大量正常形态线谱, 三种方法均可以有效提取线谱特征, 但SwDCNN模型提取的线谱连续性更好。针对图10(b)中的邻近成簇线谱(归一化频率0.8 ~ 1.0范围内)、图10(c)中的漂移弯曲线谱(归一化频率0.25~0.7范围内)、图10(d)中的大量密集分布线谱和粗细不均线谱(归一化频率0.1~0.3范围内), 传统方法只能提取到不完整的主要线谱, DenseNet模型对主要线谱具有较好提取效果, 而SwDCNN模型则具备对上述复杂变异线谱的高分辨提取能力。针对图10(e)中的低信噪比密集分布线谱和图10(f)中的低信噪比漂移线谱(归一化频率0.3~0.9范围内)等情况, 传统方法已很难提取到线谱, DenseNet模型可提取到部分主要线谱, SwDCNN提取的线谱特征最丰富。
利用各方法对带不同信噪比标签的实际测试样本集进行处理和结果统计分析, 图12所示为查全率随信噪比变化曲线。可以看到, 在线谱信噪比高于5 dB时, SwDCNN模型和传统方法性能相当, 优于其他深度神经网络模型; 随着线谱信噪比降低, 传统方法性能降幅较大; 当线谱信噪比低于0 dB时, SwDCNN模型查全率明显要更高。和传统方法及其他深度神经网络模型相比, SwDCNN模型线谱最小可检测信噪比分别降低超过5 dB和2 dB。
综合上述海试数据分析结果, SwDCNN模型可对邻近成簇、漂移弯曲、低信噪比等情况下的实际线谱进行提取, 和传统方法、其他主流卷积神经网络模型相比, 线谱最小可检测信噪比更低, 综合效果最好。
5. 结论
为提高实际场景下低信噪比、中断、弯曲等复杂变异水声目标线谱提取能力, 提出一种使用深层卷积神经网络和自适应增强学习方法的水声目标线谱提取方法。该方法在构造具备高性能多分辨力特征挖掘能力的多尺度ConvNeXt算子基础上, 建立了结构参数与LOFAR谱图复杂程度、线谱分布规律与使用需求等适配的滑动窗深层卷积神经网络模型, 进一步提出了损失函数构造、学习率更新和模型迭代优化方法, 形成了模型自适应增强学习准则, 实现了模型训练过程的渐进式精确拟合, 能够提供复杂非线性关系映射能力, 强化了模型对海洋环境、目标工况等因素引起线谱变化的适应性。
仿真数据验证结果表明: 该模型在大规模数据支撑下的训练过程收敛良好, 可有效提取低信噪比、中断、弯曲漂移、粗细不均、邻近成簇、密集和宽频带不均衡分布等情况下的谱线; 该模型性能随线谱信噪比降低呈下降趋势, 其最佳可处理谱图频率分辨率为其训练样本频率分辨率; 该模型对高斯白噪声、GARCH模型和双模模型背景噪声下的仿真线谱提取性能稳定, 差异性较小; 该模型P-R曲线上的表现优于本文其他对比模型, 并且和AlexNet、VGGNet相比, 查准率提升超过30%, 虚警率降低超过85%, LLA和LAA提升均超过10%, 而和ResNet、DenseNet相比, 查全率提升超过5%, 虚警率降低超过80%, LLA和LAA提升均超过7%, 综合性能要优于其他主流深度卷积神经网络模型; 经CNX模型、SwDCNN_O模型、 SwDCNN_L模型和SwDCNN_A模型、SwDCNN模型等结果联合分析, ConvNeXt基础算子、本文所提的SwDCNN模型结构参数、自适应损失函数和学习率等均可增强特征挖掘能力。
实际数据验证结果表明: 该模型可对复杂变异线谱进行提取; 和传统双边对比度方法以及其他主流卷积神经网络模型相比, 该模型线谱最小可检测信噪比分别降低超过5 dB和2 dB, 实际线谱提取能力更强, 综合效果更好。
-
表 1 频率 − 幅度信息加权的二分类混淆矩阵
预测值 真实值 有线谱 无线谱 有线谱 幅值正确 True Positive1 (TP1) False Positive (FP) 幅值错误 True Positive2 (TP2) 无线谱 False Negative (FN) True Negative (TN) 表 2 利用高斯白噪声背景噪声仿真LOFAR谱图的线谱提取模型评价统计结果
统计准则 深度学习模型 SwDCNN AlexNet VGGNet ResNet DenseNet CNX SwDCNN_O SwDCNN_L SwDCNN_A 查全率 (%) 91.81 89.42 91.73 87.85 88.72 90.13 90.92 91.51 91.03 查准率 (%) 95.92 74.66 74.78 95.20 95.36 94.38 95.19 94.50 95.37 虚警率 (%) 0.15 2.16 1.80 0.95 0.84 0.62 0.49 0.45 0.18 LLA 0.705 0.552 0.623 0.615 0.654 0.679 0.692 0.695 0.703 LAA 0.721 0.612 0.636 0.660 0.687 0.688 0.685 0.706 0.711 表 3 利用GARCH背景噪声仿真LOFAR谱图的线谱提取模型评价统计结果
统计准则 深度学习模型 SwDCNN AlexNet VGGNet ResNet DenseNet CNX SwDCNN_O SwDCNN_L SwDCNN_A 查全率 (%) 90.37 87.60 90.04 83.43 86.04 88.68 89.52 90.05 89.89 查准率 (%) 97.43 70.93 73.94 95.93 95.62 94.32 94.19 94.42 96.96 虚警率 (%) 0.17 2.20 1.67 1.08 0.87 0.59 0.47 0.44 0.22 LLA 0.716 0.564 0.659 0.683 0.688 0.683 0.701 0.675 0.711 LAA 0.702 0.591 0.606 0.634 0.638 0.658 0.695 0.704 0.693 表 4 利用双模背景噪声仿真LOFAR谱图的线谱提取模型评价统计结果
统计准则 深度学习模型 SwDCNN AlexNet VGGNet ResNet DenseNet CNX SwDCNN_O SwDCNN_L SwDCNN_A 查全率 (%) 92.49 82.77 91.37 88.48 85.74 89.46 90.31 91.36 90.82 查准率 (%) 96.77 66.05 72.88 95.91 95.90 94.88 94.60 95.21 96.54 虚警率 (%) 0.16 3.22 1.46 1.03 0.84 0.58 0.45 0.42 0.18 LLA 0.695 0.601 0.605 0.628 0.624 0.659 0.686 0.695 0.698 LAA 0.741 0.578 0.604 0.669 0.665 0.676 0.675 0.688 0.713 -
[1] 程玉胜, 邱家兴, 刘振, 等. 水声被动目标识别技术挑战与展望. 应用声学, 2019; 38(4): 653—659 DOI: 10.11684/j.issn.1000-310X.2019.04.023 [2] 方世良, 杜栓平, 罗昕炜, 等. 水声目标特征分析与识别技术. 中国科学院院刊, 2019; 34(3): 297—305 DOI: 10.16418/j.issn.1000-3045.2019.03.007 [3] Arnab D, Arun K, Rajendar B. Feature analyses for marine vessel classification using passive sonar. Undersea Defence Technology, CLARION Events, Rotterdam, Netherlands, 2015: 21—23.
[4] Vaccaro R J. The past, present, and the future of underwater acoustic signal processing. IEEE Signal Process. Mag., 1998; 15(4): 21—51 DOI: 10.1109/79.689583
[5] Rajagopal R, Sankaranarayanan B, Rao P R. Target classification in a passive sonar – an expert system approach. International Conference on Acoustics, Speech and Signal Processing, IEEE, Albuquerque, USA, 1990: 2911—2914
[6] 吴国清, 李靖, 陈耀明, 等. 舰船噪声识别(I)——总体框架、线谱分析和提取. 声学学报, 1998; 23(5): 394—400 DOI: 10.15949/j.cnki.0371-0025.1998.05.002 [7] Li N. A stochastic resonance of line-spectrum extraction method for underwater target recognition. J. Inf. Comput. Sci., 2014; 11(18): 6437—6446 DOI: 10.12733/jics20105262
[8] Paris S, Jauffret C. Frequency line tracking using HMM-based schemes [passive sonar]. IEEE Trans. Aerosp. Electron. Syst., 2003; 39(2): 439—449 DOI: 10.1109/TAES.2003.1207256
[9] 王庆福, 杜栓平. 目标辐射噪声中线谱序列的提取方法. 应用声学, 2006; 25(6): 364—369 DOI: 10.3969/j.issn.1000-310X.2006.06.008 [10] 李亚安, 冯西安, 樊养余, 等. 基于1 \frac{1}{2} 维谱的舰船辐射噪声低频线谱成分提取. 兵工学报, 2004; 25(2): 238—241 DOI: 10.3321/j.issn:1000-1093.2004.02.028[11] 郭业才, 赵俊渭, 陈华伟. 基于二级自适应滤波的水下目标动态谱线增强算法研究. 声学学报, 2004; 29(1): 68—74 DOI: 10.3321/j.issn:0371-0025.2004.01.012 [12] 陈韶华, 陈川, 赵冬艳. 噪声中的线谱检测及自动提取研究. 应用声学, 2009; 28(3): 220—225 DOI: 10.11684/j.issn.1000-310X.2009.03.012 [13] Martino J C D, Tabbone S. An approach to detect lofar lines. Pattern Recognit. Lett., 1996; 17: 37—46 DOI: 10.1016/0167-8655(95)00088-7
[14] Lampert T A, OKeefe S E M. On the detection of tracks in spectrogram images. Pattern Recognit., 2013; 46: 1396—1408 DOI: 10.1016/j.patcog.2012.11.009
[15] Abel J S, Lee H J, Lowell A P. An image processing approach to frequency tracking. IEEE Conference on International Conference on Acoustics, Speech and Signal Processing, IEEE, San Francisco, USA, 1992: 561—564
[16] Kendall G D, Hall T J, Newton T J. An investigation of the generalisation performance of neural networks applied to lofargram classification. Neural Comput. Appl., 1993; 1: 147—159 DOI: 10.1007/BF01414434
[17] Jin S L, Chi C, Li Y, et al. A supervised learning detection method with pre-processing of sparsity-based adaptive line enhancer. Chinese Journal of Acoustics, 2021; 40(4): 496—510 DOI: 10.15949/j.cnki.0217-9776.2021.04.002
[18] Shi W, Caballero J , Huszár F, et al. Real-time single image and video super-resolution using an efficient sub-pixel convolutional neural network. IEEE Conference on Computer Vision and Pattern Recognition, IEEE , Las Vegas, USA, 2016: 1874-1883
[19] 连海伦, 周健, 胡雨婷, 等. 利用深度卷积神经网络将耳语转换为正常语音. 声学学报, 2020; 45(1): 137—144 DOI: 10.15949/j.cnki.0371-0025.2020.01.017 [20] 王文博, 苏林, 贾雨晴, 等. 深海直达波区卷积神经网络测距方法. 声学学报, 2021; 46(6): 1081—1092 DOI: 10.15949/j.cnki.0371-0025.2021.06.027 [21] Clevert D A, Unterthiner T, Hochreiter S. Fast and accurate deep network learning by exponential linear units (ELUs). International Conference on Learning Representations, San Juan, Puerto Rico, 2016: 1—14
[22] Li Y, Wang N, Shi J, et al. Revisiting batch normalization for practical domain adaptation. Pattern Recognit., 2018; 80: 109—117 DOI: 10.1016/j.patcog.2018.03.005
[23] Bilgic B, Chatnuntawech I, Fan A P, et al. Fast image reconstruction with L2-regularization. J. Magn. Reson. Imaging, 2014; 40(1): 1—11 DOI: 10.1002/jmri.24565
[24] Kingma D, Ba J. Adam: a method for stochastic optimization. International Conference on Learning Representations, San Diego, USA, 2015: 1—15
[25] Han Y, Li Y, Liu Q, et al. DeepLofargram: A deep learning based fluctuating dim frequency line detection and recovery. J. Acoust. Soc. Am., 2020; 148(4): 2182—2194 DOI: 10.1121/10.0002172
[26] Park J, Jung D J. Deep convolutional neural network architectures for tonal frequency identification in a lofargram. Int. J. Control Autom. Syst., 2021; 19: 1103—1112 DOI: 10.1007/s12555-019-1014-4
[27] Jung D J, Park J, Lee S H, et al. Deep learning based tonal detection for passive sonar signals. Undersea Defence Technology, CLARION Events, Stockholm, Sweden, 2019: 1—2
[28] Khan A, Sohail A, Zahoora U, et al. A survey of the recent architectures of deep convolutional neural networks. Artif. Intell. Rev., 2020; 53(8): 5455—5516 DOI: 10.1007/s10462-020-09825-6
[29] He K, Zhang X, Ren S, et al. Deep residual learning for image recognition. IEEE Conference on Computer Vision and Pattern Recognition, IEEE, Las Vegas, USA, 2016: 770—778
[30] Huang G, Liu Z, Laurens V, et al. Densely connected convolutional networks. IEEE Conference on Computer Vision and Pattern Recognition, IEEE, Hawaii, USA, 2017: 2261—2269
[31] Liu Z, Mao H, Wu C Y, et al. A ConvNet for the 2020s. IEEE Conference on Computer Vision and Pattern Recognition, IEEE, New Orleans, USA, 2022: 11966—11976
[32] Vaswani A, Shazeer N, Parmar N, et al. Attention is all you need. Conference and Workshop on Neural Information Processing Systems, NIPS Foundation , Long Beach, USA, 2017: 1—15
[33] Lee D D, Seung H S. Learning the parts of objects by non-negative matrix factorization. Nature, 1999; 401(21): 788—791 DOI: 10.1038/44565
[34] 铁广朋, 郭新毅. 两种非高斯海洋环境噪声统计模型分析. 声学技术, 2014; 33(3): 209—212 DOI: 10.3969/j.issn1000-3630.2014.03.005 -
期刊类型引用(0)
其他类型引用(1)