Automatic recognition of frequency-modulated bionic underwater acoustic communication signals mimicking dolphin whistles
-
摘要:
针对现有水声信号特征参数无法有效识别仿海豚哨声水声通信信号调制方式的问题, 提出联合多特征的仿海豚哨声频率调制水声通信信号自动识别方法。首先, 通过预处理和最小二乘多项式拟合估计海豚哨声谱轮廓; 然后, 基于估计的海豚哨声谱轮廓提取特征参数, 仿真结果表明提取的特征对仿海豚哨声频率调制水声通信信号具有良好的识别能力和稳健性; 最后, 联合支持向量机分类器实现自动识别。湖试验证了所提方法的识别效果, 分析了调制参数(码元宽度和频率偏移量)对识别率的影响。结果表明, 调制的频率偏移量对平均识别率的影响更显著。当频率偏移量为50 Hz, 信噪比大于5 dB时, 平均识别率约90%以上; 当频率偏移量不小于100 Hz, 信噪比大于0 dB时, 平均识别率达到95%以上。
Abstract:The existing feature parameters are unable to effectively identify the modulation mode of bionic underwater acoustic communication signals mimicking dolphin whistles. This paper proposes an automatic identification method of the frequency-modulated bionic underwater acoustic communication signals mimicking dolphin whistles that combines multiple features. Initially, the whistle contour is estimated through the application of preprocessing and least squares polynomial fitting. Subsequently, the feature parameters are extracted based on the estimated whistle contour. The simulation results demonstrate that the extracted features exhibit robust and effective identification capabilities. Ultimately, the support vector machine classifier is employed to facilitate the automated identification. The recognition effect of this technology is validated through a lake experiment, and the influence of modulation parameters (symbol width and frequency offset) on recognition rate is analyzed. The results demonstrate that the modulation frequency offset exerts a more pronounced influence on the average recognition rate. When the frequency offset is 50 Hz and the signal-to-noise ratio exceeds 5 dB, the average recognition rate is approximately 90%. When the frequency offset is not less than 100 Hz and the signal-to-noise ratio is greater than 0 dB, the average recognition rate is approximately 95%.
-
引言
水声通信信号调制识别是水声对抗中的关键环节, 是通信参数估计、干扰引导和信息破译的必要前提。最初的水声信号调制识别通过人工实现, 这种方式受人的主观因素影响, 效率低, 识别的调制类型也很有限, 已经无法适应水声通信技术的发展。近十几年, 发展了基于多种分类模型的自动调制识别技术。常用的分类器由早期的最大似然分类器、决策树分类器发展到人工智能分类器, 其中, 联合特征参数提取的K邻近(KNN)、人工神经网络(ANN)、支持向量机(SVM)等分类器, 在处理水声信号样本有限问题时具有较好的稳健性和泛化能力, 且物理意义明确, 因此在水声通信信号调制识别中应用广泛[1-3]。信号调制识别中常用的特征参数有瞬时统计量、高阶统计量、循环累积量, 以及各种熵特征、时频域特征等[4-6]。识别的对象从单一体制发展到多种体制混合水声通信信号的识别[7], 从简单调制发展到直接序列扩频(DSSS)、正交频分复用(OFDM)、跳频扩频(FHSS)等水声隐蔽通信信号的识别[8-9]。随着水声通信技术的发展, 新的调制方式和隐蔽通信方法不断出现[10-11]。仿海豚哨声水声通信作为一种新型隐蔽水声通信技术, 因其良好的安全性和通信能力受到关注。然而, 现有的特征参数识别对象是常规水声通信信号, 对于仿海豚哨声水声通信信号中的不同调制方式来说, 缺少有效的特征参数提取方法和识别方案。
仿海豚哨声频率调制水声通信技术在水声隐蔽通信中具有优势[12-13]。可通过模拟海洋中固有的海豚哨声实现伪装, 使非合作方在检测到信号时, 无法分辨是海洋生物噪声还是人工通信信号, 达到伪装通信的目的[14]; 由于海豚哨声是一种调频信号, 频率随时间连续变化, 便于传输信息; 哨声的持续时间通常在几百毫秒至几秒之间, 频率变化范围在几百赫兹至几十千赫兹之间[15], 与水声换能器的工作频段相符, 因此, 将信息通过频率调制的方式嵌入海豚哨声时频谱轮廓是仿海豚哨声水声通信的主要方式。Liu等提出一种基于余弦波嵌入调制的仿海豚哨声水声通信算法, 将信息调制在余弦波上, 并在时频域上与海豚哨声谱轮廓叠加, 合成基于余弦嵌入的仿海豚哨声频率调制水声通信信号(Bio-Cos)。Bio-Cos信号与真实哨声之间的时频相关系数大于0.98, 伪装能力较好; 当码元宽度大于50 ms时, 该方法在海试8.4 km的传输距离上实现了几乎无误码的稳健通信[16-17]。Ma等提出一种基于矩形波嵌入调制的仿海豚哨声水声通信算法, 将信息调制在矩形波上, 并在时频域上与海豚哨声谱轮廓叠加, 合成基于矩形波嵌入的仿海豚哨声频率调制水声通信信号(Bio-Rec)。Bio-Rec信号与真实哨声之间的时频相关系数在0.995左右, 伪装能力进一步提高; 当信噪比大于0 dB时, 可以实现误码率低于10–5的可靠通信[18]。Bio-Cos和Bio-Rec信号都是基于海豚哨声时频谱轮廓叠加相应的波形进行频率调制, 具有较高的相似性。此时, 直接使用现有水声通信信号特征提取方法无法有效提取到具有辨识能力的参数, 分类的准确性较低。
针对现有特征参数无法有效辨识仿海豚哨声频率调制方式的问题, 本文通过分析Bio-Cos和Bio-Rec信号的调制原理, 设计了基于海豚哨声谱轮廓估计的特征参数提取方法, 基于这些特征, 提出多特征结合SVM分类器的仿海豚哨声频率调制水声通信信号自动识别技术。首先, 时域信号经过预处理后提取仿海豚哨声水声通信信号的瞬时频率, 基于最小二乘多项式拟合估计海豚哨声谱轮廓; 其次, 提取移除哨声谱轮廓后的4个特征参数: 零中心归一化瞬时幅度谱密度的最大值、模糊熵、短时平均偏度和过零率, 同时开展水声信道下的特征性能仿真, 结果验证了这些特征参数在加性高斯白噪声和水声多径衰落信道条件下的辨识能力和稳健性。最后, 联合这些特征和SVM分类器, 设计了仿海豚哨声频率调制水声通信信号调制识别方法, 分析了码元宽度和频率偏移量对识别率的影响, 并通过湖试验证了对Bio-Cos和Bio-Rec信号的识别准确率。
1. 信号模型和相似性
Bio-Cos和Bio-Rec信号都是基于海豚哨声时频谱轮廓实现调制的。首先, 从真实海豚哨声中提取哨声谱轮廓; 其次, 设置码元宽度和频率偏移量等主要调制参数后, 将信息分别调制在余弦波或矩形波上, 并与哨声时频谱轮廓叠加, 将要传输的信息嵌入海豚哨声谱轮廓, 获得仿哨声信号的谱轮廓; 最后, 根据哨声信号参数模型[14]转化为仿海豚哨声水声通信信号时域波形。
1.1 Bio-Cos水声通信信号
根据Bio-Cos的调制原理[17], 首先将信息调制到不同频率的余弦波上。假设第
i 个码元的载频为fi , 码元宽度为Td , 则fi=m⋅i/Td ,m 为整数。若每个码元传输的比特数为n , 则每个码元可表示为Si(t)=cos(2πfit+φ0), 0⩽ (1) 其中,
{\varphi _0} 为初始相位, 也是每个码元的结束相位,{\varphi _0} 通常取0。将所有码元波形在时间上首尾相连, 令海豚哨声时频谱轮廓曲线为
{f_{\text{w}}} , 持续时间为{T_{\text{w}}} , 得到的余弦波为{S_{C} }(t) = \sum\limits_{i = 1}^L {{S_i}(t - (i - 1){T_{\text{d}}})} ,{\text{ }}0 \leqslant t \leqslant {T_{\text{w}}}, (2) 其中,
L = \lfloor T_{\mathrm{w}}/T_{\mathrm{d}} \rfloor , (\lfloor \cdot \rfloor 表示向下取整), 为该段哨声所包含的最大码元个数。将带有信息的余弦波形嵌入海豚哨声谱轮廓, 合成后的Bio-Cos信号谱轮廓为
{f_{{\text{BC}}}}(t) = {f_{\text{w}}}(t) + \Delta f \cdot {S_{C} }(t),{\text{ }}0 \leqslant t \leqslant {T_{\text{w}}}, (3) 其中,
\Delta f 为Bio-Cos信号调制的频率偏移量,\Delta f 越小, Bio-Cos信号时频谱轮廓的变化越小, 与原始哨声越相似。Bio-Cos信号的调制原理如图1所示。其中, 蓝色曲线代表海豚哨声谱轮廓
{f_{\text{w}}} , 橙色曲线代表调制后的仿哨声信号谱轮廓{f_{{\text{BC}}}} 。根据海豚哨声信号参数模型, 生成Bio-Cos调制信号为
{S_{{\text{BC}}}}(t) = \cos \left(\int\limits_0^t 2\pi {f_{{\text{BC}}}}(t)\text{d}t\right), \; 0 \leqslant t \leqslant {T_{\text{w}}} . (4) 1.2 Bio-Rec水声通信信号
根据Bio-Rec信号的调制原理[18], 首先, 将信息调制在正负幅度的矩形波上。令海豚哨声时频谱轮廓曲线为
{f_{\text{w}}} , 持续时间为{T_{\text{w}}} , 码元宽度为{T_{\text{d}}} , 则该段哨声可调制的二进制信息数量是N = \lfloor{{{T_{\text{w}}}}/{{T_{\text{d}}}}}\rfloor , (\lfloor \cdot \rfloor 为向下取整), 转换为双极性码为\boldsymbol{p} = [{p_1},{p_2}, \cdots, {p_i},\cdots, {p_N}], p_i^{} \in \{ - 1,1\} , 则\boldsymbol p 经过调制后获得的矩形波为\begin{split} & {\text{S}}_{p}(t)={\displaystyle \sum _{i=1}^{N}{p}_{i}\cdot u(t-iT)},\text{ }0 < t\leqslant N{T}_{\text{d}},\text{ }\\[1mm] & u(t)=\left\{\begin{array}{c}1,\\ 0,\end{array}\text{ }\begin{array}{c}0 < t\leqslant {T}_{\text{d}},\\[1mm] 其他.\end{array} \right. \end{split} (5) 当
{p_i} \ne {p_{i + 1}} 时, 根据文献[18]的原理, 选取正弦信号的1/2对跳变点进行处理, 得到处理后的矩形波{S_{R} }(t) 。将带有信息的矩形波嵌入海豚哨声谱轮廓, 合成后的Bio-Rec信号谱轮廓为
{f_{{\text{BR}}}}(t) = {f_{\text{w}}}(t) + \Delta f \cdot {S_{R} }(t),{\text{ }}0 \leqslant t \leqslant {T_{\text{w}}}, (6) 其中,
\Delta f 为Bio-Rec信号调制的频率偏移量,\Delta f 越小, Bio-Rec信号时频谱轮廓的变化越小, 与原始哨声越相似。Bio-Rec信号的调制原理如图2所示。其中, 蓝色曲线代表海豚哨声谱轮廓
{f_{\text{w}}} , 橙色曲线代表调制后的仿哨声信号谱轮廓{f_{{\text{BR}}}} 。根据海豚哨声信号参数模型, 生成的Bio-Rec调制信号为
{S_{{\text{BR}}}}(t) = \cos \left(\int\limits_0^t 2\pi {f_{{\text{BR}}}}(t){\text{d}}t\right),{\text{ }}0 \leqslant t \leqslant {T_{\text{w}}} . (7) 1.3 相似性分析
Bio-Cos和Bio-Rec信号都是基于真实哨声谱轮廓调制的仿生伪装水声通信信号, 文献[17-18]已分别分析了与真实哨声之间较强的相似性。本文重点分析这两种仿哨声调制信号之间的相似性, 从一段瓶鼻海豚的哨声信号中提取谱轮廓, 根据调制原理, 分别生成一组Bio-Cos和Bio-Rec水声通信信号, 如图3所示。当频率偏移量小于200 Hz时, 两者从时频图上很难分辨。
为了定量描述, 通过计算时频相关系数
{R_{{\text{TFCC}}}} 分析两者的相似性, 取值范围为\left[ {0,1} \right] , 值越大, 说明相似度越高。若Bio-Cos信号时频谱轮廓曲线为{f_{{\text{BC}}}}(n) = \left\{ {{f_{11}},{f_{12}}, \cdots ,{f_{1i}}, \cdots ,{f_{1n}}} \right\} , Bio-Rec时频谱轮廓曲线为{f_{{\text{BR}}}}(n) = \left\{ {{f_{21}},{f_{22}}, \cdots ,{f_{2i}}, \cdots ,{f_{2n}}} \right\} , 则二者的时频相关系数表示为{R_{{\text{TFCC}}}} = \frac{{\displaystyle\sum\limits_{i = 1}^n {({f_{1i}} - \overline {{f_{{\text{BC}}}}} )({f_{2i}} - \overline {{f_{{\text{BR}}}}} )} }}{{\sqrt {\displaystyle\sum\limits_{i = 1}^n {{{({f_{1i}} - \overline {{f_{{\text{BC}}}}} )}^2}\displaystyle\sum\limits_{i = 1}^n {{{({f_{2i}} - \overline {{f_{{\text{BR}}}}} )}^2}} } } }}. (8) 设置码元宽度的范围为10~200 ms, 频率偏移量的范围为10~400 Hz, 依次计算Bio-Cos和Bio-Rec信号在各参数下的时频相关系数, 循环10次取均值, 仿真得到的两者时频相关系数随频率偏移量和码元宽度的变化如图4所示。从图中可以看出, 相似程度受码元宽度的影响较小, 而受频率偏移量的影响较大。当频率偏移量小于200 Hz时, 两者的时频相关系数大于0.995, 相似度很高; 当频率偏移量为400 Hz时, 时频相关系数依然大于0.965。
2. 多特征联合的仿海豚哨声频率调制水声通信信号自动识别
通过上述分析可知, Bio-Cos和Bio-Rec信号的相似度较高, 按传统水声通信信号调制识别的特征参数很难区分。但是, 根据两者的调制原理, 去除哨声谱轮廓后, 两种信号的原始调制波形具有明显的不同。因此, 本文采用基于海豚哨声谱轮廓估计的特征提取方法, 去除哨声谱轮廓后, 从Bio-Cos和Bio-Rec信号原始调制原理的角度进行识别, 识别的整体流程如图5所示。
首先, 对输入的时域信号进行预处理, 依次通过去噪、瞬时频率提取、异常值剔除等步骤得到仿哨声信号的谱轮廓曲线; 其次, 基于最小二乘多项式拟合估计出调制所用的海豚哨声谱轮廓, 去除海豚哨声谱轮廓后得到仿哨声信号的原始调制波形; 然后, 提取零中心归一化瞬时幅度谱密度的最大值
{\gamma _{\max }} 、模糊熵E{n_{\text{f}}} 、短时平均偏度{S_{{\text{st}}}} 、过零率{R_{{\text{zc}}}} 四个特征, 作为SVM的输入特征向量; 最后, 联合多特征并基于SVM分类器, 输出识别结果。2.1 谱轮廓预处理
预处理旨在去除信号中的海洋环境背景噪声和干扰, 提取Bio-Cos和Bio-Rec信号的谱轮廓, 并进一步去除海洋环境噪声和多径效应导致的异常值点[19]。需要注意的是, 预处理过程应尽量减少对信号特征的破坏。
首先, 针对信号中影响瞬时频率提取的背景噪声和干扰, 采用基于改进最小控制递归平均的最优修正对数幅度谱估计算法 (OMLSA-IMCRA)对信号去噪。该方法是对维纳滤波去噪的改进, 旨在使滤波后的信号与期望信号的对数均方误差最小, 有助于抑制音乐残差噪声现象[20]; OMLSA-IMCRA考虑了仿哨声信号是否存在的影响, 拥有更强的区分仿哨声信号与噪声的能力, 能够应对海洋环境中常见的能量突变的噪声。同时, 避免了高斯滤波、中值滤波、Savitzky-Golay滤波等平滑去噪算法导致的失真[21], 能够保留仿哨声信号的细节调制特征。对低信噪比下Bio-Cos信号采用OMLSA-IMCRA进行去噪, 去噪前和去噪后的信号时频图分别如图6(a)和图6(b)所示, 经过OMLSA-IMCRA处理后的仿哨声信号在时频图上明显增强。
其次, 采用短时傅里叶变换(STFT)和最大值搜索法提取仿哨声信号的瞬时频率。短时傅立叶变换是获得时变信号瞬时频率的经典技术, 对于哨声谱轮廓提取具有抗噪声能力强、计算速度快、适用的信号类型广的特点。短时傅里叶变换获得时频图像后, 通过搜索每个时间窗内的能量最大值点提取仿哨声信号的瞬时频率[22]。对去噪前和去噪后的信号提取瞬时频率后的结果分别如图6(c)和图6(d)所示。可以发现, 经过OMLSA-IMCRA处理后, 提取的瞬时频率中滤除了大部分噪声干扰。
最后, 针对瞬时频率中残余的海洋环境噪声和多径效应导致的异常值点, 采用二次Hampel滤波器进行异常值检测并剔除[23]。根据Hampel滤波原理, 每一次滤波中, 设置与邻近9个样本窗口的中位数相差大于3倍标准差的点作为异常值, 并用该窗口内的中位数代替异常值。结果如图6(e)所示, 经过第一次滤波和第二次滤波, 能够进一步剔除剩余的异常值点。最终, 得到仿哨声水声通信信号的谱轮廓, 如图6(f)所示。
2.2 基于最小二乘多项式拟合的哨声谱轮廓估计
为了提取仿哨声信号的原始调制特征, 首先, 需要从预处理后的仿哨声信号谱轮廓曲线中, 估计海豚哨声谱轮廓。对于Bio-Cos信号, 其调制信息对称且紧密分布在哨声谱轮廓的两侧。对于Bio-Rec信号, 其调制信息按照固定的频移均匀调制到原始哨声谱轮廓的两侧。对于这两种信号来说, 海豚哨声谱轮廓反应出的是其瞬时频率曲线的“综合趋势”。
预处理后的仿哨声水声通信信号谱轮廓具有以下特点: 第一, 数据不准确, 对于提取到的仿哨声信号谱轮廓曲线, 每个时刻
{t_i} 的瞬时频率{f_i} 一般都带有误差; 第二, 曲线的参数模型未知, 哨声变化丰富, 且码元宽度、频率偏移量等调制参数也是未知的; 第三, 预处理后的仿哨声谱轮廓曲线能反应每个时刻{t_i} 与{f_i} 的对应性态。基于这些特点, 适合通过拟合的方法估计出其哨声谱轮廓{\widehat f_{\text{w}}} 。常用的拟合方法中, Lagrange多项式和三阶样条等方法受带有误差的样本点的制约, 哨声处理中的局部加权平滑等方法[19]也并不适用Bio-Rec信号并不紧密对称的谱轮廓。最小二乘法拟合在选取了合适的函数型的情况下, 能够反映数据的综合趋势, 更加适用于仿哨声信号的谱轮廓提取, 具有较强的几何意义和统计意义。哨声谱轮廓形状变化丰富, 选择灵活的多项式作为拟合函数, 求解对应系数, 就可以估计出瞬时频率变化丰富的哨声谱轮廓曲线。最小二乘多项式拟合的原理简述如下。对于仿哨声时频谱轮廓曲线
{F_{\text{B}}} , 由已知的离散数据集({t_i},{f_i})(i = 1,2, \cdots ,n) 构造的k 阶多项式(k < n) 曲线函数表示为{\widehat F_{\text{B}}}(t) = \sum\nolimits_{j = 0}^k {{a_{^j}}{t^j}} , 根据最小二乘拟合原则, 使得误差平方和{R^2} 最小, 其中\begin{split} {R^2} =& \sum\limits_{i = 0}^n {{{[{{\widehat F}_{\text{B}}}({t_i}) - {F_{\text{B}}}({t_i})]}^2}} =\\& \sum\limits_{i = 0}^n {{{[({a_0} + {a_1}t + \cdots + {a_k}{t^k}) - {F_{\text{B}}}({t_i})]}^2}} . \end{split} (9) 对等式两边求偏导并化简得到矩阵形式, 求解系数矩阵, 得到拟合曲线。
\left[ {\begin{array}{*{20}{c}} n&{\displaystyle\sum\limits_{i = 1}^n {{t_i}} }& \cdots &{\displaystyle\sum\limits_{i = 1}^n {{t_i}^k} } \\ {\displaystyle\sum\limits_{i = 1}^n {{t_i}} }&{\displaystyle\sum\limits_{i = 1}^n {{t_i}^2} }& \cdots &{\displaystyle\sum\limits_{i = 1}^n {{t_i}^{k + 1}} } \\ \vdots & \vdots & \ddots & \vdots \\ {\displaystyle\sum\limits_{i = 1}^n {{t_i}^k} }&{\displaystyle\sum\limits_{i = 1}^n {{t_i}^{k + 1}} }& \cdots &{\displaystyle\sum\limits_{i = 1}^n {{t_i}^{2k}} } \end{array}} \right]\left[ {\begin{array}{*{20}{c}} {{a_0}} \\ {{a_1}} \\ \vdots \\ {{a_k}} \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} {\displaystyle\sum\limits_{i = 1}^n {{f_i}} } \\ {\displaystyle\sum\limits_{i = 1}^n {{t_i}{f_i}} } \\ \vdots \\ {\displaystyle\sum\limits_{i = 1}^n {{t_i}^k{f_i}} } \end{array}} \right]. (10) 利用上述最小二乘多项式拟合, 估计Bio-Cos和Bio-Rec信号的哨声谱轮廓, 结果如图7所示。其中, 图7(a)中的蓝色曲线表示Bio-Cos信号预处理后的谱轮廓, 橙色曲线表示估计出的海豚哨声谱轮廓
{\widehat f_{\text{w}}} , 图7(c)为两者的差, 即估计出的原始余弦波。图7(b)中的蓝色曲线代表Bio-Rec信号预处理后的谱轮廓, 橙色曲线代表估计出的海豚哨声谱轮廓{\widehat f_{\text{w}}} , 图7(d)为两者的差, 即估计得到的原始矩形波。从图中可以看出, 通过最小二乘多项式拟合, 能够拟合出这两种仿哨声信号谱轮廓的综合趋势, 从而估计出原始调制波形。2.3 特征提取
根据Bio-Cos和Bio-Rec信号的调制差异, 将移除海豚哨声谱轮廓后的原始波形作为输入, 提取四个特征作为分类器的特征集, 分别是: (1)零中心归一化瞬时幅度谱密度的最大值
{\gamma _{\max }} , (2)模糊熵E{n_{\text{f}}} , (3)短时平均偏度{S_{{\text{st}}}} , (4)过零率{R_{{\text{zc}}}} 。为了验证特征集在水声信道下的辨识能力和分布的集中情况, 分别在加性高斯白噪声条件下和水声多径信道下对特征值进行仿真验证, 每个信噪比下进行蒙特卡罗实验100次。Bio-Cos和Bio-Rec信号的调制参数保持一致, 频率偏移量为200 Hz, 码元宽度为20 ms。仿真中, 使用水声通信中常用的水声多径信道模型[24] 随机生成水声多径信道, 参数设置为: 路径数量15条, 相邻时延差服从指数分布(均值2 ms), 每条路径的幅值服从功率均值随时延差按复指数衰减的瑞利分布。统计结果绘制成箱线图进行对比, 每个图中, 蓝色箱代表Bio-Cos信号的特征值, 橙色箱代表Bio-Rec信号的特征值, 各个小箱型之间的虚线表示100次实验的统计平均值。
2.3.1 零中心归一化瞬时幅度谱密度的最大值
Bio-Cos信号原始余弦波具有明显的恒包络特征, 因此, 用零中心归一化瞬时幅度谱密度的最大值
{\gamma _{\max }} 表征信号瞬时幅度的起伏[3], 反映两种仿哨声调制信号包络的变化差异。{\gamma _{\max }} = \max {\left| {DFT({A_{cn}}(i))} \right|^2}/N, (11) 其中,
N 为采样点数,{A_{cn}}(i) 为零中心归一化瞬时幅度:{A_{cn}}(i) = \dfrac{{A(i)}}{{\dfrac{1}{N}\displaystyle\sum\limits_{i = 1}^N {A(i)} }} - 1, (12) 其中,
A(i) 为输入信号经过希尔伯特变换得到的瞬时幅度序列。归一化处理的目的是消除信道增益的影响。两种信号的特征值
{\gamma _{\max }} 仿真统计结果分别如图8(a)和图8(b)所示。由于Bio-Cos信号原始余弦波具有恒包络特性, 所以其特征值一直保持较小, 而Bio-Rec信号原始矩形波的特征值始终较大, 随着信噪比的增大, 差异越来越明显, 并且分布集中。在水声多径信道下, 特征值{\gamma _{\max }} 的分辨能力明显下降, 样本更加分散, 两种信号的特征值存在少量交叉。但是, 当信噪比大于0 dB时, 两种信号的特征值{\gamma _{\max }} 的平均值始终能保持明显的差异。2.3.2 模糊熵
从时域上看, Bio-Cos和Bio-Rec的原始波形具有不同的复杂度, 因此, 用衡量复杂度的统计量“熵”作为特征值。本文采用模糊熵
E{n_{\text{f}}} 计算, 具有所需样本少、变化连续、不受样本基线漂移影响等特点[5]。模糊熵的计算原理简述如下:对于输入的信号序列
\{ y(i),1 \leqslant i \leqslant N\} , 重构m(m \leqslant N - 2) 维向量:\begin{split} X(i)=&[y(i),y(i + 1)\text{, }\cdots \text{, }y(i + m-1)]-\\&\frac{1}{m}{\displaystyle \sum _{j=0}^{m-1}y(i + j)},\text{ }i=1,2,\cdots ,N-m + 1. \end{split} (13) 引入模糊函数
\mu (d_{ij}^m,n,r) 定义向量X(i) 和X(j) 的相似度:D_{ij}^m = \mu (d_{ij}^m,n,r) = {{\text{e}}^{ - {{(d_{ij}^m/r)}^n}}}, (14) 其中,
n 控制模糊函数边界的梯度,r 控制模糊函数边界的宽度。定义函数
{\phi ^m}(n,r) = \frac{1}{{N - m}}\sum\limits_{i = 1}^{N - m} {\left(\frac{1}{{N - m - 1}}\sum\limits_{ {\begin{array}{l} j = 1 \\ j \ne i \end{array}}} ^{N - m} {D_{ij}^m} \right)} , (15) 当
N 为有限值时, 模糊熵E{n_{\text{f}}} = \ln {\phi ^m}(n,r) - \ln {\phi ^{m + 1}}(n,r). (16) 模糊熵能够定量表示时域信号在维数变化时, 生成新模式的概率, 信号生成新模式的概率越大, 其复杂度越高, 熵值越大。两种信号的模糊熵仿真统计结果如图9所示。随着信噪比的增加, 两种信号的模糊熵值逐渐减小, 并趋于恒定, 当信噪比大于0 dB时, Bio-Cos信号和Bio-Rec信号的模糊熵始终保持明显的差异, 且分布比较集中; 在水声多径信道下, 特征值分布变得分散, 虽然在信噪比为0 dB时, 两种信号的特征值离散度比较大, 存在少量数据交叉, 但是, 当信噪比大于0 dB时, 两种信号模糊熵的平均值始终保持明显的差异。
2.3.3 短时平均偏度
Bio-Cos信号的原始余弦波具有更好的对称性, 这种对称性的差异在短时窗内表现得更加明显。信号波形的对称性可以用偏度进行定量表示[6], 为了提取两种信号在短时窗内的对称性特征, 本文定义短时平均偏度
{S_{{\text{st}}}} 作为特征:{S_{{\text{st}}}} = {{\sum\limits_{m = 1}^L {\alpha (m)} } \mathord{\left/ {\vphantom {{\sum\limits_{m = 1}^L {\alpha (m)} } L}} \right. } L}, (17) 其中,
L 为总帧数,\alpha (m) 表示第m 个窗口内的短时偏度。\alpha (m) = \frac{{\dfrac{1}{N}\displaystyle\sum\limits_{i = m - N + 1}^m {{{\left[ {y(i)w(m - i) - \overline {y(i)w(m - i)} } \right]}^3}} }}{{{{\left[ {\dfrac{1}{N}\displaystyle\sum\limits_{i = m - N + 1}^m {{{\left[ {y(i)w(m - i) - \overline {y(i)w(m - i)} } \right]}^2}} } \right]}^{\tfrac{3}{2}}}}}, (18) 其中,
y(i) 代表输入信号,w(i) 代表窗函数, 窗长为N 。两种信号的短时平均偏度仿真统计结果如图10所示。当信噪比大于−5 dB时, 两种信号的短时平均偏度一直保持明显的差异, 抗噪性能较好。水声多径信道对该特征的影响较大, 但是, 当信噪比大于0 dB时, 两种信号短时平均偏度的平均值能保持明显的差异。
2.3.4 过零率
Bio-Cos信号的原始余弦波, 每个码元内的过零点个数较多; 而Bio-Rec信号的原始矩形波是在一个码元宽度内进行频率的搬移, 只有在编码相反的码元之间才会穿过零点。因此, 将过零率
{R_{{\text{zc}}}} 作为区分两者的特征。两种信号的过零率仿真统计结果如图11所示。当信噪比大于0 dB时, 两种信号的过零率始终保持明显的差异, 且分布集中, 分辨能力较好; 在水声多径信道下, 特征值的分布变得分散, 但是, 当信噪比大于0 dB时, 两种信号的过零率平均值始终保持明显的差异, 且样本几乎不存在交叉。
2.4 分类器设计
相比于传统决策树分类器, SVM分类器能够自适应调整判决门限, 提升信号在水声复杂信道下的分类性能; 同时, 与神经网络相比, SVM在处理样本有限问题时有较好的分类性能和泛化能力, 应用灵活。本文中, 以上述4个特征值作为输入特征集, 使用SVM分类器, 对Bio-Cos信号和Bio-Rec信号进行分类。SVM的核心思想是将数据映射到高维特征空间, 找到最优超平面, 最大程度地使得各类样本分开。为了获得好的分类效果, 使用高斯核函数进行数据映射, 并通过贝叶斯优化模型选择两个主要的超参数(惩罚系数
c 和核函数的系数g )[25]。训练SVM模型的数据集, 参数设置为: 码元宽度范围20~100 ms, 步长20 ms; 频率偏移量范围50~400 Hz, 步长50 Hz。仿真中, 使用随机水声多径信道模型[24], 信道参数设置与2.3节一致, 信噪比范围为−5~20 dB, 步长1 dB, 每个信噪比下, 分别随机生成10组Bio-Cos信号和Bio-Rec信号。根据2.3节计算每个信号的四个特征值, 组成特征参数集
[{\gamma _{\max }},E{n_{\text{f}}},{S_{{\text{st}}}},{R_{{\text{zc}}}}] , 作为SVM的输入。在该数据集下, 基于贝叶斯优化模型, 以十折交叉验证误分类率作为目标函数, 估计得到SVM的两个超参数: 惩罚系数c 为2.96, 核函数的系数g 为0.11。此时, SVM模型验证准确率达到最优, 约为94.09%。3. 试验结果与分析
为了进一步验证在真实水声环境中的分类性能, 使用实际测量的时变水声信道进行试验, 试验地点为浙江省杭州市千岛湖。试验时, 发射换能器入水深度为15 m, 接收水听器入水深度20 m, 收发端距离1220 m。试验中, 连续测量得到的水声信道如图12所示。试验水声信道环境具有明显的多径结构, 信道冲激响应随时间变化明显, 且存在多普勒频移和扩展。
为了分析仿海豚哨声水声通信信号调制参数对识别率的影响, 根据Bio-Cos和Bio-Rec信号的常用通信参数, 将分析的调制参数分别设置为: 码元宽度20 ms, 50 ms, 100 ms, 频率偏移量50 Hz, 100 Hz, 200 Hz, 400 Hz。
试验信号集在千岛湖时变水声信道下生成, 信噪比范围为−10~20 dB。下面分别在不同参数下分析Bio-Cos信号和Bio-Rec信号的识别准确率。
3.1 Bio-Cos信号识别率
在码元宽度分别为20 ms, 50 ms, 100 ms时, 不同频率偏移量调制的Bio-Cos信号识别率如图13所示。综合图13(a)(b)(c)可见, Bio-Cos信号的识别率几乎不受码元宽度的影响, 这是由其调制原理导致的, 当码元宽度不同时, Bio-Cos的特征变化很小。但是, Bio-Cos信号的识别率受频率偏移量的影响较大, 当频率偏移量增大时, Bio-Cos信号原始余弦波的幅度越大, 其特征越明显, 所以识别效果越好。当频率偏移量为50 Hz时, 识别效果最差, 信噪比大于5 dB时, 识别率在90%左右; 当频率偏移量为100 Hz和200 Hz, 信噪比大于0 dB时, 各码元宽度下的识别率可以达到95%以上; 当频率偏移量为400 Hz时, 信噪比大于−3 dB时, 识别率接近100%。
3.2 Bio-Rec信号识别率
在码元宽度分别为20 ms, 50 ms, 100 ms时, 不同频率偏移量调制的Bio-Rec信号识别率如图14所示。综合图14(a)(b)(c)可见, Bio-Rec信号的识别率同时受码元宽度和频率偏移量的影响, 但是受码元宽度的影响更明显。随着码元宽度的增加, Bio-Rec信号的识别率有所下降, 且波动更加剧烈, 这是因为当码元宽度较大时, Bio-Rec信号谱轮廓曲线的趋势变化较大, 从中提取的特征会受到影响。从图14(a)中可以看出, 码元宽度为20 ms, 信噪比0 dB时, 各频率偏移量下的识别率可以达到90%左右; 从图14(b)中可以看出, 当码元宽度为50 ms, 频率偏移量为50 Hz时, 识别率下降明显; 从图14(c)中可以看出, 当码元宽度为100 ms时, 各频率偏移量下的识别性能约下降5 dB。
3.3 平均识别率
本节对Bio-Cos和Bio-Rec信号的平均识别准确率进行分析和对比。不同码元宽度下, 两种信号的平均识别率随信噪比的变化如图15所示, 不同频率偏移量下, 两种信号的平均识别率随信噪比的变化如图16所示。其中, 每个码元宽度下的平均识别率定义为所有频率偏移量参数下(50 Hz, 100 Hz, 200 Hz, 400 Hz)识别率的平均值, 每个频率偏移量下的平均识别率定义为所有码元宽度参数下(20 ms, 50 ms, 100 ms)识别率的平均值。根据图15和图16可知, 由于频率偏移量对Bio-Cos信号和Bio-Rec信号的相似程度影响更大, 所以频率偏移量对平均识别率的影响更加显著。
由图15可见, Bio-Cos信号的识别率几乎不受码元宽度的影响, 而当码元宽度为100 ms时, Bio-Rec信号的识别率性能有所下降。Bio-Rec信号的识别率整体优于Bio-Cos信号, 当信噪比大于−5 dB时, 码元宽度为20 ms和50 ms的Bio-Rec信号平均识别率达到95%以上; 当信噪比大于2 dB时, Bio-Rec信号和Bio-Cos信号平均识别率都达到95%以上。
由图16可见, Bio-Cos信号和Bio-Rec信号的识别率都受频率偏移量的影响。Bio-Rec信号的识别率整体优于Bio-Cos信号。当频率偏移量为50 Hz时, 两种信号的平均识别率在信噪比大于5 dB时达到90%左右。当频率偏移量不小于100 Hz, 信噪比大于0 dB时, Bio-Cos信号和Bio-Rec信号的平均识别率达到95%左右。
4. 结论
传统水声信号特征参数无法有效识别仿海豚哨声水声通信信号的调制方式, 本文通过分析仿海豚哨声频率调制水声通信信号的调制特征, 提出了联合多特征的仿海豚哨声频率调制水声通信信号自动识别方法。仿真和千岛湖验证结果表明, 设计的特征参数集在水声信道下具有良好的识别能力和稳健性, 联合多特征的自动识别方法能够实现对仿海豚哨声频率调制水声通信信号的有效识别。调制的频率偏移量对Bio-Cos信号和Bio-Rec信号的识别率影响显著, 频率偏移量越大, 平均识别率越高, 而调制的码元宽度仅对Bio-Rec信号的识别率影响明显; 当频率偏移量为50 Hz, 信噪比大于5 dB时识别率约为90%; 当频率偏移量不小于100 Hz, 该方法在信噪比大于0 dB时对仿海豚哨声频率调制水声通信信号的识别率达到95%以上, 为仿海豚哨声水声通信信号调制识别提供了一种参考方案。
-
-
[1] Liu F, Li G H, Yang H. Application of multi-algorithm mixed feature extraction model in underwater acoustic signal. Ocean Eng., 2024; 296: 116959 DOI: 10.1016/j.oceaneng.2024.116959
[2] Ge Y Z, Zhang X, Zhou Q. Modulation recognition of underwater acoustic communication signals based on joint feature extraction. IEEE International Conference on Signal, Information and Data Processing, IEEE, Chongqing, China, 2019: 9173146
[3] Zhang X L, Ge T T, Chen Z M. Automatic modulation recognition of communication signals based on instantaneous statistical characteristics and SVM classifier. IEEE Asia-Pacific Conference on Antennas and Propagation, IEEE, Auckland, New Zealand, 2018: 8538057
[4] 覃国津, 迟楠. 基于特征提取的人工智能调制格式识别算法研究现状. 激光与光电子学进展, 2023; 60(9): 228−237 DOI: 10.3788/LOP221055 [5] Chen W T, Wang Z Z, Xie H B, et al. Characterization of surface EMG signal based on fuzzy entropy. IEEE Trans. Neural Syst. Rehabil. Eng., 2007; 15(2): 266−272 DOI: 10.1109/TNSRE.2007.897025
[6] He J S, Huang S, Chang S, et al. Radio frequency fingerprint identification with hybrid time-varying distortions. IEEE Trans. Wireless Commun., 2023; 22(10): 6724−6736 DOI: 10.1109/TWC.2023.3245070
[7] 吴雄彪, 匡彪, 刘亚男, 等. 多特征联合水声通信信号调制识别方法. 数字海洋与水下攻防, 2022; 5(6): 510−517 DOI: 10.19838/j.issn.2096-5753.2022.06.005 [8] Fang T, Liu S Z, Ma L, et al. Subcarrier modulation identification of underwater acoustic OFDM based on block expectation maximization and likelihood. Appl. Acoust., 2021; 173: 107654 DOI: 10.1016/j.apacoust.2020.107654
[9] 李园园, 周明章, 孙海信, 等. 水声JANUS信号的分数低阶时频谱迁移学习识别方法. 声学学报, 2022; 47(4): 461−470 DOI: 10.15949/j.cnki.0371-0025.2022.04.008 [10] Liu Y F, Zhao Y J, Gerstoft P, et al. Deep transfer learning-based variable Doppler underwater acoustic communications. J. Acoust. Soc. Am., 2023; 154(1): 232−244 DOI: 10.1121/10.0020147
[11] Sun D J, Wu J, Hong X P, et al. Iterative double-differential direct-sequence spread spectrum reception in underwater acoustic channel with time-varying Doppler shifts. J. Acoust. Soc. Am., 2023; 153(2): 1027−1041 DOI: 10.1121/10.0017116
[12] Liu S Z, Ma T L, Qiao G, et al. Biologically inspired covert underwater acoustic communication by mimicking dolphin whistles. Appl. Acoust., 2017; 120: 120−128 DOI: 10.1016/j.apacoust.2017.01.018
[13] Li C Y, Jiang J J, Wang X Q, et al. Bionic covert underwater communication focusing on the overlapping of whistles and clicks generated by different cetacean individuals. Appl. Acoust., 2021; 183: 108279 DOI: 10.1016/j.apacoust.2021.108279
[14] Liu S Z, Qiao G, Ismail A. Covert underwater acoustic communication using dolphin sounds. J. Acoust. Soc. Am., 2013; 133(4): EL300−EL306 DOI: 10.1121/1.4795219
[15] 牛富强, 薛睿超, 周在明, 等. 印太瓶鼻海豚(Tursiops aduncus)通讯声信号分类及特征参数的环境差异性分析. 声学学报, 2020; 45(2): 189−195 DOI: 10.15949/j.cnki.0371-0025.2020.02.005 [16] Liu S Z, Ma T L, Qiao G, et al. Bionic communication by dolphin whistle with continuous-phase based on MSK modulation. IEEE International Conference on Signal Processing, Communications and Computing, IEEE, Hong Kong, China, 2016: 7753725
[17] Qiao G, Ma T L, Liu S Z, et al. A frequency hopping pattern inspired bionic underwater acoustic communication. Phys. Commun., 2021; 46: 101288 DOI: 10.1016/j.phycom.2021.101288
[18] 马天龙, 刘凇佐, 乔钢, 等. 基于频移键控的仿海豚哨声水声通信技术. 电子与信息学报, 2022; 44(6): 2045−2053 DOI: 10.11999/JEIT211322 [19] Jiang J J, Yao Z G, Li Z C, et al. Recognition method for the bionic camouflage cetacean whistle modulated by CPMFSK signals. Appl. Acoust., 2023; 207: 109326 DOI: 10.1016/j.apacoust.2023.109326
[20] Cohen I, Berdugo B. Speech enhancement for non-stationary noise environments. Signal Process., 2001; 81(11): 2403−2418 DOI: 10.1016/S0165-1684(01)00128-1
[21] Li L, Wang Q, Qing X, et al. Robust unsupervised Tursiops aduncus whistle enhancement based on complete ensembled empirical optimal envelope local mean decomposition with adaptive noise. J. Acoust. Soc. Am., 2022; 152(6): 3360−3372 DOI: 10.1121/10.0016500
[22] Wang X Q, Jiang J J, Duan F J, et al. A method for enhancement and automated extraction and tracing of Odontoceti whistle signals base on time-frequency spectrogram. Appl. Acoust., 2021; 176: 107698 DOI: 10.1016/j.apacoust.2020.107698
[23] Pehlivan H. A novel outlier detection method based on Bayesian change point analysis and Hampel identifier for GNSS coordinate time series. EURASIP J. Adv. Signal Process., 2024; 2024(1): 44 DOI: 10.1186/s13634-023-01097-w
[24] Berger C R, Zhou S L, Preisig J C, et al. Sparse channel estimation for multicarrier underwater acoustic communication: from subspace methods to compressed sensing. IEEE Trans. Signal Process., 2010; 58(3): 1708−1721 DOI: 10.1109/TSP.2009.2038424
[25] Wu J, Chen X Y, Zhang H, et al. Hyperparameter optimization for machine learning models based on Bayesian optimization. J. Electron. Sci. Technol., 2019; 17(1): 26−40 DOI: 10.11989/JEST.1674-862X.80904120