为探究说话人的依恋类型(安全型、超脱型、专注型、恐惧型)对情绪语音产出的影响, 设计了符合语法规则但是无意义的伪句, 招募了有恋爱经验的被试, 采用阈下词汇启动范式激活依恋系统后, 被试观看4种基本情绪(开心、愤怒、悲伤、恐惧)的诱发影片, 用体验到的情绪向想象中的恋爱伴侣说出这些句子。对递归特征消除算法筛选出的每句14个声学参数做半参数重复测量多元方差, 结果显示依恋类型和情绪类别的主效应显著、交互效应不显著; 聚集性分层聚类分析发现, 在声学特征空间中, 超脱型和专注型距离最近, 而安全型则远离其他类型; 有监督分类发现, 14个声学参数可有效区分4类依恋类型; 特征重要性分析发现, 韵律参数对分类的贡献较大; 累积局部轮廓分析发现, 4类人群间基频特征的差异在各种情绪上基本一致, 但是音质特征的差异受到情绪类别的影响。研究揭示了依恋类型对情绪语音声学特征的作用, 验证了不同依恋类型在情绪调节策略上的差异, 为个性化人机语音交互技术的发展提供了科学依据。
探究了基于头相关传输函数(HRTF)的三维听觉显示中, 重放方式(动态/稳态重放)、HRTF种类(个性化/非个性化HRTF)、被试类型(有/无测听经验)三个因素对三维听觉显示定位精度和反应时间的影响。实验结果表明, 重放方式对听觉定位的影响显著, 动态重放的定位效果明显优于稳态重放, 该结论对于有测听经验以及无测听经验的受试者均成立; HRTF种类对听觉定位也具有较大影响, 个性化HRTF的定位效果优于非个性化HRTF, 具有测听经验的受试者较无测听经验的受试者能更好利用个性化HRTF; 具有测听经验的受试者在各个实验条件下所需的定位反应时间更短。相关结果可为三维听觉显示技术的真正应用提供重要参考。
以高速垂向运动声源宽带连续谱噪声为研究对象, 基于射线理论分析了声场干涉现象的产生机理, 推导了干涉条纹的轨迹方程, 讨论了影响干涉结构特性的因素, 揭示了声场干涉结构的特性和规律。理论和仿真结果表明: 干涉周期与多途信号时延差成反比关系; 减小接收深度或增大接收距离可以提高干涉条纹的可观测性; 较大的海面起伏易使干涉条纹形成断点, 可观测性降低。湖试数据分析结果表明, 干涉条纹主要由直达声−海面反射声干涉条纹构成, 干涉条纹宽度和干涉周期随水平距离的增大而增大。该结果可为高速垂向运动声源运动状态分析、环境参数反演等提供参考。
基于海洋环境信息、起伏海面的小斜率近似和简正波模型, 研究了浅海环境中不同季节起伏海面散射引起的声传播损失的统计特性, 给出了海面散射声传播损失−风速拟合公式以及一种快速声场预报方法, 可据此快速评估水下长期工作设备的工作性能。仿真结果表明, 对于全年运行的水声设备, 当传播距离超过10 km时, 须考虑起伏海面散射对声传播的影响。起伏海面散射对声场的影响冬季大于夏季, 在夏季负跃层环境中起伏海面散射对下发上收声场的影响大于下发下收声场。
基于射线声学理论研究了水下稳态涡流场的声传播特性。首先, 根据移动介质中的程函方程, 推导了二维稳态涡流场的射线微分方程组, 实现了声波通过涡流场的声线轨迹模拟, 获取了通过不同涡流场的声信号; 然后, 基于稳态涡流场的声传播特性, 构建了接收声信号相位与涡流场特征参数之间的映射关系, 通过数值仿真反演稳态涡流场特征参数, 仿真结果与理论值的相对误差在15%以内。仿真结果表明: 基于射线理论可以有效模拟声信号通过涡流场的声线轨迹及信号变化, 具有直观、计算效率高的优势; 随着涡环量增大, 涡流对声传播的影响更为明显; 利用声信号相位可实现对速度分布、涡核位置、涡环量等涡流场特征参数的估计。
针对海洋中存在的强干扰和环境噪声导致水下目标方位估计算法性能剧烈下降的问题, 提出了一种子空间判决分析的强干扰抑制方法(SSJ), 可实现多个强干扰下的目标方位估计。根据常规波束形成粗估的目标角度区间, 利用目标−干扰−噪声子空间与导向矢量的相关性, 设置判决项和估计合适的判决阈值来分离和抑制样本协方差矩阵中的非目标信息, 降低干扰和噪声的输出功率, 同时提高输出信干噪比, 为增强阵列的目标方位分辨能力提供方法支撑。仿真和海试数据处理结果显示, SSJ方法可抑制目标角度区间外的强干扰和噪声, 明显降低了干扰的输出功率和目标主瓣附近的旁瓣级, 提高了目标方位角度的分辨力。相比于现有的子空间干扰抑制方法, 所提方法具有更加稳健的干扰抑制能力。
提出基于波数能量频域扩展特征的水面水下目标分辨方法, 通过模态域波束形成计算频率波数谱, 并根据环境信息建立目标深度与波数扩展差异间的映射关系, 并以此作为判决模型实现目标深度辨识。仿真结果表明所提方法在目标方位预估不准时依然稳健。通过SWellEx-96数据和大连海域实测数据验证了本文所提方法的有效性, 海上试验数据处理结果表明该方法在132 m水平阵纵向有效孔径、100~800 Hz处理频段条件下, 初步具备了水面水下目标分辨能力, 且水面目标波数扩展特征高出水下目标10°左右, 两类目标差异明显。从声传播特性的角度, 所提方法为解决目标深度辨识难题提供了新的思路。
针对无源声呐目标定位问题, 提出了一种基于广义Radon变换的目标参数估计方法。首先, 基于深海直达声区推导了直达声与海底第一次反射声的到达时间差与目标运动参数的数学模型; 其次, 通过求解自相关函数得到目标的多途时延历程(MTDTR); 在此基础上引入广义Radon变换的思想, 联合两个水听器实现了水面匀速直航目标的航向角、速度、目标相对于水听器的初距和初始方位角估计。利用仿真数据和实验数据验证了该方法具有良好的参数估计性能。三亚东南部海域实验结果表明, 通过两个锚系在深海海底附近的声压水听器对水面目标进行定位, 可以实现在12.71 km范围内, 测距误差小于0.29 km, 相对误差小于3%的定位精度。
提出了基于改进频率差分(FD)技术的空间抗混叠波达方位(DOA)估计方法, 实现了阵元稀疏排布, 即在阵元间距远大于入射信号波长时, 存在栅瓣模糊情况下多水下声学目标的方位估计。首先, 确定目标方位角度搜索范围, 建立阵列信号处理模型, 对宽带信号不同频率成分之间进行频率差分处理, 从而降低信号频率以满足阵元稀疏排布阵列的空间奈奎斯特采样要求。然后, 基于投影子空间正交性检验(TOPS)算法构建一个对角变换矩阵, 利用对角酉变换矩阵正交性直接对阵列流形进行频率差分处理, 使其频率差分处理输出的信号个数与输入信号个数相等。最后, 进一步推导频率差分域等效目标方位与真实入射信号角度等价的条件, 并基于该等价条件进行频率筛选, 最终获得无模糊的空间方位谱结果。经仿真实验验证, 所提算法在信噪比为−10~20 dB范围内, 估计结果均方根误差低于0.1°, 有效抑制了栅瓣且受干扰强度影响较小。经海试数据验证, 所提算法可以有效估计出目标方位, 并避免空间混叠项干扰。所提空间抗混叠波达方位估计方法能够有效抑制栅瓣模糊, 提高目标方位估计精度, 且在强干扰条件下仍具有较好的角度估计性能。
针对检测前跟踪算法无法提供目标航迹标签以及传统算法在轨迹交叉情况下批次编号管理混乱的问题, 提出了一种标记关联的航迹管理方法。该方法为各个目标的方位航迹标记不重复的标签, 并针对标签多伯努利算法非共轭先验的问题, 采用将标签多伯努利分布逼近
为克服网格失配问题并提升阵列性能, 提出了使用重加权原子范数最小化的稀疏可重构直线阵列设计方法, 将稀疏可重构直线阵列设计问题表示为多测量矢量稀疏优化模型, 并通过重加权原子范数最小化算法解算出阵元位置和阵元激励。区别于经典压缩感知方法, 该方法借助原子范数理论建立了阵元数量、阵元位置和阵元激励联合优化的无网格稀疏优化模型, 从而可以克服网格失配问题, 并提升阵列波束图的匹配精度。仿真实验表明, 与压缩感知类方法相比, 重加权原子范数最小化算法可以设计出波束匹配精度高一个数量级的稀疏可重构直线阵列。
研究了基于全波反演(FWI)的骨骼超声层析成像方法, 用于动态监测骨质疏松性微结构退化的进程。采用雌性小鼠注射药物建立骨质疏松症模型, 在第0, 2, 4, 6周通过Micro-CT扫描活体小鼠, 重建获得小鼠股骨骨骼结构。以第0周骨骼结构为基准输入模型, 通过不同的超声收发模式(透射、反射及透射−反射双模式), 仿真分析了FWI监测不同骨质疏松进程的骨微结构退化的效果。结果表明, 初始模型为均匀介质(纯水)时, FWI反演失效, 不能准确重建骨骼结构。初始模型中考虑了基准骨骼结构(第0周)时, FWI能准确反演骨骼组织声速(均方根误差(RMSE) < 17 m/s, 平均相对误差(MRE) < 7.2%), 精确重建骨骼结构(结构相关系数(CC) > 0.85)), 因此可以准确监测不同骨质疏松进程(第2, 4, 6周)的骨微结构退化情况。对比不同超声收发模式, 透射−反射双模式FWI监测骨微结构退化的性能优于单一透射或反射FWI监测方法。考虑了基准骨骼模型的FWI可用于动态监测骨微结构退化, 对评估骨质疏松进展具有一定意义。
研究了超声Lamb波混频的激励效率与模式选择。在非零能量流和相匹配条件的基础上, 结合Lamb波在结构中的状态分布, 提出了以激励效率参量作为超声Lamb波混频模式选择的依据。根据混频条件筛选混频模式对, 计算相应的激励效率参量, 并通过超声Lamb波混频的仿真模拟与实验测量进行验证。通过对比仿真与实验中得到的非线性参量与激励效率参量的关系, 证明了激励效率参量作为模式选择依据的有效性。研究表明, 激励效率参量可以有效地表征超声Lamb波混频的激发效率, 从而筛选非线性效应明显的模式对, 更好地实现损伤的检测与表征。
针对低电导率生物组织的成像需求, 利用Sinusoid-Golay编码单脉冲激励提高磁声电信号的信噪比和定位精度, 实现了高精度的磁声电成像。首先, 在考虑换能器指向性的基础上, 推导了Sinusoid-Golay编码单脉冲激励的磁声电理论公式, 并引入激励转换因子和自相关计算, 实现磁声电信号测量和解码重建, 理论证明了
核函数中保留Dirac函数的原型, 形成关于时间的卷积积分, 是声学时域边界元法中一种稳定、有效的时间数值积分计算方法(CQ-BEM)。然而, 传统CQ-BEM中卷积积分系数的获取有计算量大、耗时长, 且对不同单元需要重新计算的问题, 极大地降低了CQ-BEM法计算时域声场的效率。针对传统CQ-BEM积分系数计算效率低的问题, 本文利用多项式展开定理给出了待求函数泰勒系数的解析表达与数值计算方法, 建立了不同单元间待求系数的转换理论, 可以在一次循环迭代内完成不同单元的积分系数的计算, 大幅降低了计算量, 提高了CQ-BEM方法的声场计算效率。脉动球源数值算例结果表明, 在相同要求下, 本文方法计算时间较传统方法减少50%以上, 相对误差小5个数量级以上, 且计算时间随单元数的增长率仅为传统方法的2.34%。因此, 本文提出的系数计算方法能够有效提高CQ-BEM方法的时域声场计算效率, 拓展了CQ-BEM在大型机电设备时域声场模拟的计算规模。
提出了施加电磁力于边界层实现流动控制和降低水动力噪声的方法。对未施加与施加电磁力后翼型模型的流场与声场进行数值计算, 结果表明: 流向电磁力可延缓翼型表面的流动分离, 抑制离散小涡生成, 减弱翼型表面的湍流脉动压力, 达到降低水动力噪声的目的。归纳了电磁力降低水动力噪声效果随雷诺数、攻角和电磁作用参数的变化规律, 同时在循环水槽中对电磁力控制翼型水动力噪声的效果进行试验验证。由于转捩区是翼型模型的压力最小区域且面积非常有限, 通过研究电磁力的作用方式, 发现只在转捩区施加电磁力, 即可达到最佳的降噪效果且减小了功耗, 并分析了磁泄露带来的影响。研究结果为抑制翼型的水动力噪声提供了一种新的思路。
为研究两端开口圆柱形液腔的低频谐振辐射特性, 建立了其在低频近似条件下的分布参数模型, 由电−力−声类比得到了等效振动模型, 给出了无声负载下的谐振频率表达式。随后利用“长度等效方法”建立了液腔在辐射条件下的自辐射等效模型和声场辐射等效模型, 给出了液腔的修正长度、谐振频率及指向性函数, 并讨论了弹性壁条件下的情况。结合有限元法研究了刚性(弹性)壁条件下, 圆管结构特征参量对液腔一阶谐振频率的影响规律, 给出了自辐射等效模型满足求解精度的条件, 并利用压电效应激励液腔一阶谐振, 讨论了其声场辐射特性。对比结果表明: 液腔一阶谐振频率的等效模型计算值与有限元仿真值符合较好, 误差低于5%; 液腔的修正长度为4
提出了Y型夹心式压电超声变压器, 基于耦合振动理论和力电类比原理, 建立了变压器的机电等效电路模型, 推导得到了其共振/反共振频率方程、电压增益和功率增益表达式。通过等效电路法、有限元仿真和实验研究了该变压器的功率传输特性和机电转换特性。结果表明, 在共振模式下, Y型夹心式压电超声变压器的输入机电阻抗最小, 电压增益和功率增益最大, 有望作为双通道压电变压器应用于电子领域。
提出了一种面向多样化声学场景自适应设计声学编码器的方法(SAE)。该方法通过学习不同声学场景下语音中包含的声学特征的差异, 适应性地为端到端语音识别任务设计出合适的声学编码器。通过引入神经网络结构搜索技术, 提高了编码器设计的有效性, 从而改善了下游识别任务的性能。在Aishell-1、HKUST和SWBD三个常用的中英文数据集上的实验表明, 通过所提场景自适应设计方法得到的声学编码器相比已有的声学编码器可以获得平均5%以上的错误率改善。所提方法是一种深入分析特定场景下语音特征、针对性设计高性能声学编码器的有效方法。
1964年创刊, 双月刊
主管单位:中国科学院
主办单位:中国科学院声学研究所
创刊主编:马大猷现任主编:李晓东
ISSN 0371-0025CN 11-2065/O4
CODEN SHGHAS
通知公告更多+


扫码订购现刊及过刊