EI / SCOPUS / CSCD 收录

中文核心期刊

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

2022年  第47卷  第6期

显示方式:
U-net网络中融合多头注意力机制的单通道语音增强
范君怡, 杨吉斌, 张雄伟, 郑昌艳
2022, 47(6): 703-716. doi: 10.15949/j.cnki.0371-0025.2022.06.007
摘要:
在低信噪比和突发背景噪声条件下,已有的深度学习网络模型在单通道语音增强方面效果并不理想,而人类可以利用语音的长时相关性对不同的语音信号形成综合感知。因此刻画语音的长时依赖关系有助于改进低信噪比和突发背景噪声下的增强性能。受该特性的启发,提出一种融合多头注意力机制和U-net深度网络的增强模型TU-net,实现基于时域的端到端单通道语音增强。TU-net网络模型采用U-net网络的编解码层对带噪语音信号进行多尺度特征融合,并利用多头注意力机制实现双路径Transformer,用于计算语音掩模,更好地建模长时相关性。该模型在时域、时频域和感知域计算损失函数,并通过加权组合损失函数指导训练。仿真实验结果表明,TU-net在低信噪比和突发背景噪声条件下增强语音信号的语音质量感知评估(PESQ)、短时客观可懂度(STOI)和信噪比增益等多个评价指标都优于同类的单通道增强网络模型,且保持相对较少的网络模型参数。
融合多尺度特征的短时音频场景识别方法
王猛, 张鹏远
2022, 47(6): 717-726. doi: 10.15949/j.cnki.0371-0025.2022.06.002
摘要:
为解决短时音频场景识别任务中识别性能差的问题,提出一种融合多尺度特征的音频场景识别方法。首先将双声道音频中左右声道的和差作为输入,并使用长时帧长进行分帧处理,以保证提取出的帧级特征中包含足够多的音频信息。然后将特征逐帧输入到融合多尺度特征的一维卷积神经网络中,以充分利用网络中不同尺度的浅层、中层和深层嵌入特征。最后综合所有帧级软标签得到短时音频的场景分类结果。实验结果表明,该方法在国际声学场景和事件检测与分类挑战赛(DCASE)2021短时音频场景数据集上的准确率为79.02%,实现了该数据集上目前为止的最优性能。
次级源近场和管壁弹性对充液管路有源消声性能的影响
郭格格, 孙红灵, 孙陆阳, 曹晟楠, 杨军
2022, 47(6): 727-738. doi: 10.15949/j.cnki.0371-0025.2022.06.004
摘要:
建立了含次级源结构的充液直管有源消声系统数值模型, 重点分析了声激励下次级源近场和管壁弹性对有源消声性能的影响。结果表明:次级源近场为非均匀声场, 误差点位于该区域时部分频点控制效果较差甚至放大, 而处于声场均匀区域时可使降噪量提高10 dB以上, 增加误差点数量可使绝大多数频点的降噪量提高5 dB以上; 管壁弹性使次级源与管壁间的耦合较强, 非对称分布的次级源容易激起管壁振动, 导致降噪谷值的出现, 采用对称分布的次级源可显著提升控制效果; 增加次级源数量能够提高系统的有源无源复合控制效果, 但使得管内声场变得复杂, 多次级源模型的有源消声效果随频率升高而有所降低。
强弱耦合板—腔系统的声辐射模态计算与分析
廖金龙, 朱海潮, 侯九霄, 袁苏伟
2022, 47(6): 739-747. doi: 10.15949/j.cnki.0371-0025.2022.06.001
摘要:
针对板—腔耦合系统的声辐射模态(ARM)计算问题,提出了一种基于能量原理的声辐射模态计算方法,该方法从能量原理的动力学方程构建起声压模态幅值和结构模态幅值的关系,通过将声势能表示为结构模态幅值向量的二次型形式,得到板—腔耦合系统的声辐射模态,弥补了前人理论在解决声腔为阻抗壁面和结构—声为强耦合条件时的不足。通过数值算例验证了本文计算方法的正确性和有效性,在此基础上分析了壁面和结构—声耦合条件变化对声辐射模态特性的影响。结果表明:声辐射模态辐射效率曲线会在声腔模态频率处产生峰值,阻抗壁面的引入会降低声辐射模态辐射效率在峰值处的幅值,并且阻抗值越小,幅值衰减效应越明显,具体表现为声势能曲线在辐射效率峰值频率处幅值会下降;强耦合条件下低频段声势能响应主要由弹性板结构模态激发,响应峰值密度更高,幅值更低。低频同频宽的声辐射模态辐射效率峰值数更少,峰值频率更高。
多层多孔锂离子电池结构的导波频散特征及其应用
吕炎, 耿亮, 宋国荣, 高杰, 肖婷, 李杨, 聂新宇
2022, 47(6): 748-756. doi: 10.15949/j.cnki.0371-0025.2022.06.003
摘要:
采用状态矩阵与勒让德级数联合法, 同步联立Biot理论, 构建多层多孔锂离子电池声传播特性理论模型, 以厚1.9 mm软包钴酸锂电池为例, 数值分析了荷电状态(State of Charge, SOC)对多模态频散曲线的影响规律。同时, 建立了电池中的声传播特性频域仿真模型, 提取频域仿真中的超声导波频散曲线。此外, 以体积小、柔性强的压电纤维复合材料(Macro Fiber Composite, MFC)为基础, 实验探究了不同SOC对锂离子电池中声学行为的影响。采用互相关分析获取电池放电过程中声波渡越时间的偏移规律, 建立了1.9 mm软包钴酸锂电池的声学波动行为与电池SOC间的映射关系。
弛豫铁电单晶压电陶瓷混合激励换能器
梁家宁, 莫喜平, 柴勇, 刘永平
2022, 47(6): 757-764. doi: 10.15949/j.cnki.0371-0025.2022.06.005
摘要:
为了降低纵向换能器尺寸并提高发射带宽和发送电压响应,研究了一种弛豫铁电单晶/压电陶瓷混合激励换能器,换能器由[011]方向极化PIN-PMN-PT单晶和PZT-4压电陶瓷混合激励,利用多模态振动耦合的原理,通过单晶的32模式振动,可以灵活调整两种振子之间的驱动能力和刚度分配。首先通过四端网络法得到了换能器等效电路并计算了其谐振频率,然后利用有限元方法对换能器进行了仿真优化,最后制作了试验样机并进行了测试分析。换能器样机外径86 mm、长度80 mm,工作频带13~38 kHz,最大发送电压响应为144.9 dB,带内发送电压响应起伏小于6 dB,具有良好的宽带、小尺寸工作性能。
舰船辐射噪声贝叶斯方法反演浅海底层结构及地声参数
祝捍皓, 薛洋洋, 崔智强, 王其乐
2022, 47(6): 765-776. doi: 10.15949/j.cnki.0371-0025.2022.06.009
摘要:
针对以舰船辐射噪声为参考声源的浅海海底分层结构及地声参数反演问题, 研究了一种基于贝叶斯理论的浅海多层海底地声参数反演方法。反演中以舰船辐射噪声的线谱成分为研究对象, 进而采用非线性贝叶斯反演方法反演浅海底层结构、层中声速、声速衰减和密度, 并对反演结果的不确定性进行分析。反演结果的最大后验概率估计值和边缘概率分布分别通过拨正模拟退火算法和Metropolis-Hastings采样法在各参数先验区间内计算获得, 并根据贝叶斯信息准则确定最佳海底分层结构。海上实验表明:根据该方法反演获得海底分层结构及地声参数, 计算得到的声压场与实测舰船辐射噪声传播损失误差不超过10%, 反演结果能够准确表征实验海区海底特征。反演结果不确定性分析表明:海底纵波声速、横波声速以及密度的不确定性更小, 对声压场变化更加敏感, 反演结果更有效、准确。
一种适用于多输入多输出声呐的稳健空时自适应检测方法
陈世进, 闫晟, 郝程鹏, 侯朝焕
2022, 47(6): 777-788. doi: 10.15949/j.cnki.0371-0025.2022.06.013
摘要:
针对多输入多输出声呐在水下探测场景中获得的空时快拍数量不足导致空时自适应检测性能下降的问题, 提出一种适用于小空时快拍数情况下的稳健空时自适应检测(STAD)方法。首先将斜对称特性推广到多输入多输出(MIMO)声呐空时自适应检测中, 并利用该特性将空时快拍数量扩展至原来的两倍; 然后利用迭代自适应方法实现对空时协方差矩阵的重构; 最后根据广义似然比检测(GLRT)准则推导出检验统计量。计算机仿真结果表明, 所提方法可以在小空时快拍数情况下准确估计空时协方差矩阵, 大幅减小空时自适应检测对空时快拍数量的需求, 提高多输入多输出声呐在小空时快拍数情况下的检测稳健性。
利用深海回声多途结构匹配估计目标深度
张风珍, 李桂娟, 胡文帅, 胡晨
2022, 47(6): 789-799. doi: 10.15949/j.cnki.0371-0025.2022.06.012
摘要:
提出一种利用深海目标回声多途亮点簇时延和幅度结构匹配估计目标深度的方法。目标回声结构是双程信道传递函数和目标声散射函数的卷积,在深海近海面或近海底条件下表现出回声亮点簇的特性,且亮点簇时延幅度结构与目标深度相关,可用于估计目标深度。建立了在深度—距离网格上利用非线性规划代价函数对目标深度进行匹配估计的方法。分别对簇间时延偏差和海水声速剖面(SVP)偏差对匹配估计的影响进行了仿真分析。一次南海冬季试验结果显示,在水深1 km、距离5~8 km条件下,水下40 m处的目标回声呈现出3个时延间隔约0.3 s的亮点簇结构,将其用于目标深度匹配估计的误差范围在0~65 m。
用于浅海有源声呐目标深度估计的匹配相位处理
郭小玮, 郑广赢, 严琪
2022, 47(6): 800-809. doi: 10.15949/j.cnki.0371-0025.2022.06.011
摘要:
针对浅海波导中有源声呐目标深度估计问题, 提出了通过单个声源发射低频宽带信号, 垂直双接收水听器接收目标回波, 利用宽带目标回波比值的相位特征进行匹配相位处理的方法, 不仅消除了目标散射特性对有源声呐目标深度估计的影响, 而且仅需计算单程的信道传递函数, 运算量小, 有利于实时处理的实现需求。首先通过理论推导, 定义了一个隐含目标深度、且与目标散射特性无关的声场特征——单程传播向量宽带干涉结构, 在Pekeris波导条件下仿真分析了简正波阶数与单程传播向量宽带干涉结构的幅度和相位的关系, 发现选取较多的简正波阶数贡献的单程传播向量宽带干涉结构进行匹配相位处理可以提高目标深度估计的性能。进一步仿真分析表明, 在发射信号选取一定的时间长度和带宽的条件下, 利用全部阶简正波且信噪比大于-10dB时, 方法的深度估计误差在5m之内。最后分析了信号时间长度和处理带宽对有源声呐目标深度估计性能的影响, 以及海底声速、海深和声速剖面失配时方法的鲁棒性。
利用Doppler-warping变换的水下对空运动声源的线谱探测
毛俊杰, 彭朝晖, 张灵珊, 王光旭, 刘凯悦
2022, 47(6): 810-819. doi: 10.15949/j.cnki.0371-0025.2022.06.008
摘要:
提出了一种利用Doppler-warping变换的水下对空运动声源的线谱探测方法。该方法首先利用Doppler-warping变换线性化目标线谱的多普勒相位, 再提取线性化后的目标线谱点, 结合波束形成算法实现对目标的探测。仿真和海试数据处理结果表明, 与直接提取目标线谱实现探测的方法相比, 所提出方法有以下几个优势: (1) 将目标线谱多普勒相位线性化, 线谱跟踪更为稳定连续; (2) 将目标线谱频带展宽的能量重新集中到原频率附近, 在低信噪比环境下能更好地提取目标线谱; (3) 将干扰线谱瞬时频率非线性化, 能更好地实现干扰线谱的分离。海试数据处理结果表明, 实现了对远至16.8 km处空中运动目标的水下有效探测, 探测能力与抗干扰能力明显增强。
运动声源多普勒畸变信号自适应校正方法
刘方, 侯超强, 翟涛涛, 滕繁荣, 刘永斌
2022, 47(6): 820-831. doi: 10.15949/j.cnki.0371-0025.2022.06.016
摘要:
提出了一种自适应多普勒畸变校正方法,以声源移动速度v、初始时刻麦克风与声源横向距离x两个运动学参数为优化变量,以最大化重采样信号的频域统计指标为优化目标,通过参数寻优进行vx的估计,通过幅值还原和时域插值拟合进行畸变校正。仿真分析结果表明,频谱峭度、频谱偏度、频谱脉冲因子和频谱峰值因子4种统计指标均能准确识别运动学参数,且频谱峭度的抗噪能力最好,临界信噪比达到-3.1dB。实验分析结果表明,列车故障轴承多普勒畸变声音信号校正后,包络谱故障频率成分及其倍频成分清晰准确,说明多普勒畸变得到有效校正。该方法可基于信号本身实现多普勒畸变信号时频结构的全面校正。
球谐域混叠消除最优波束形成方法
蒋沛宏, 褚志刚, 李沛然, 杨洋
2022, 47(6): 832-842. doi: 10.15949/j.cnki.0371-0025.2022.06.010
摘要:
为解决现有的球谐域混叠消除波束形成方法设计目标单一、难以很好地兼容多变的应用场景的问题, 提出了球谐域混叠消除最优波束形成方法, 并建立了其二阶锥规划形式的多重约束凸优化数学模型。得益于该数学模型, 提出了旁瓣约束的混叠消除最大指向性波束形成器、鲁棒的混叠消除最大指向性波束形成器、混叠消除最小方差无失真响应波束形成器、零点约束的混叠消除最大指向性波束形成器。提出方法继承了现有球谐域混叠消除波束形成方法的混叠消除功能, 且能够在指向性指数、白噪声增益、旁瓣水平等多个冲突的性能指标之间寻求适宜折中, 便于用户根据实际应用需求灵活地调整约束参数得到特定场景下综合性能最优的波束形成器。
脉冲声信号影响锥特征的自适应选取
王璐, 刘小睿, 王勇, 招启军, 鲍明
2022, 47(6): 843-855. doi: 10.15949/j.cnki.0371-0025.2022.06.015
摘要:
为了解决低信噪比下脉冲声信号影响锥特征的自适应选取和检测问题, 提出了一种改进的整体嵌套边缘检测方法。利用脉冲信号小波域的时间—尺度分析谱图中明显的边缘效应特征, 构造自适应影响锥(A-COI)模型。该模型可自适应输出最适影响锥部分, 在减弱噪声干扰的同时最大程度的包含了脉冲信号的主要特征。进而将最适影响锥部分对应的小波系数用于脉冲信号检测, 有效提升了低信噪比下的检测性能。对典型直升机桨—涡干扰脉冲信号的仿真和实验数据进行分析, 结果表明在0 dB, 2 dB, 5 dB信噪比的复杂环境下, 使用基于A-COI模型的检测率分别达到了65.13%, 82.33%, 95.27%, 相对于传统固定大小影响锥的检测算法提升了42.42%, 22.99%和2.36%。
多频带期望值最大声信号时延估计
朱文龙, 印明, 佟建飞, 陈志菲, 鲍明, 朱小婷, 许耀华
2022, 47(6): 856-866. doi: 10.15949/j.cnki.0371-0025.2022.06.014
摘要:
通过分析复杂环境中不同频带声信号时延估计的差异, 提出多频带期望值最大时延估计方法。为了使各频带之间无重叠, 该方法采用独立分带划分声信号不同频带, 然后计算各频带广义互相关函数, 并对子带广义互相关函数建立最大似然模型, 最后利用期望值最大算法将多维优化转为一维优化的迭代式, 获得最优子带广义互相关函数, 在此基础上估计声信号的时延信息。数据仿真和实际实验结果表明, 多频带期望值最大化时延估计相较常规时延估计有效估计值的百分比提升了10%, 并将最优频带互相关函数应用到该定位算法中, 在网格间距为0.3 m时,得到的峰值区域汇聚更明显,定位效果更好。