文轩论文网 ,专注于硕士论文,博士论文,毕业论文服务多年,现已成为国内最权威的论文服务机构!

毕业论文参考范文:噪声下语音测听材料研发和相关分析

发布时间:2020-11-17 16:20 论文编辑:admin 价格: 所属栏目:毕业论文

本研究针对已有的嘈杂语噪声下汉语短句库,完成的主要工作首先是编制了普通话版的 Quick SIN,并获得了 12 张等价的测试用表,并提出了普通话版的言语测试 SNR Loss 的概念及正常值。

第一部分 普通话噪声下言语识别快测表的开发
 
 
1. 引言
有听力损失的患者与正常人在噪声环境下信噪比表现的差异是我们所感兴趣的。由于患者在噪声环境中的识别能力不能由纯音听力来估算,评价其信噪比损失(SNR Loss)就变得十分必要。我们定义这种表现差异为信噪比损失(SNR Loss)。与纯音听力损失(Hearing Loss)的定义相似,SNR Loss的定义是:与正常人的听力表现相比,听力损失患者在噪声中理解言语所需的信噪比须要提高的分贝数。利用―嘈杂语噪声下汉语短句识别测听材料‖测试正常听力者,当信噪比 SNR 为–6 dB 时,句表关键字识别就可达到 50%,即 SNR50(50%正确率对应的信噪比)所对应的 SNR。而对于听力损失患者要达到 50%正确率,言语信号大多都需要比噪声高超过–6dB,比如需要 SNR为+9 dB,那么该患者的 SNR Loss 就是 15 dB(高于正常 SNR15 dB)。因此采用SNR Loss 来表示与正常 SNR 的差异是因为它独立于校准和测试材料的差异,对于正常听力及有听力损失的人群都一样。本研究设计了普通话噪声下言语识别快测表(Quick Speech-in-Noise, Quick SIN),期望能为临床医师提供一种量化患者在噪声中聆听能力的快速方法。
 
 
2. 实验材料与实验方法
 
 
2.1. 实验材料的编制
 
 
2.1.1. 语句来源
A 目标语句的录制本研究所用的原始语料来自于14名4~5岁北京儿童日常口语语料中摘选的 1706 句,每句句长 6~11 字,邀请分别来自北京、上海和广东的10 名聋儿康复教师审核了语句对本地 4~5 岁儿童的适用性,最终保留了830 句,可通用于北方、东部和南方。这些语句包含四种语气:陈述、疑问、感叹和祈使,概括 6 类句式结构:谓宾、主谓、主谓宾、主谓+简单修饰、主谓补及复合句。录音在解放军总医院隔声室内(本地噪声低于 17 dBA)进行,由一名 20 岁语音清晰的男性播音员播音,语速稍缓,采用 B&K2230 声级计、CreativeAudigy 声卡及 Audition 软件实现数字化录音。录制后的语音材料由幼教老师和听力师审听,剔除不自然或有杂音等瑕疵的语句,最终获得 647 句,每句 6~8 个字。
B 嘈杂语噪声(Babble Noise)的录制因 4 人嘈杂语噪声最接近现实的聆听环境,由听、说能力正常的两男两女,在与语句录制相同的录音条件下朗读一年级语文课本 10 分钟以上,后期剪辑掉≥10ms 的间隙,并将 4 人语段的均方根(RMS,Root MeanSquare)调整一致后叠合成 4 人嘈杂语噪声。
C 语音合成采用 Audition 的降噪滤波器滤除本底噪声,将 647 句语句及 4-人交谈噪声在 80~8000 Hz 内的频谱与国际长时标准语谱(ILTASS)匹配,并将每句的 RMS 值均调整到-25 dB,在每句前 1 秒加一个时长为 0.5 秒的 1.6kHz 纯音作为提示音。将噪声的 RMS 也调整为-25 dB,然后将语句与交谈噪声分别录制在左、右声道上,每个短句与其所对应的嘈杂语噪声在时序上精确匹配,最后存为每个独立的测试文件。
D 同质性调整经过课题前期实验,对句中每个字都进行了识别率-SNR 函数曲线,并逐字调整 SNR,使每字的识别阈趋于同质。然后对每句进行关键词划分,除外无意义的功能词,其余划分成关键词,得到每句 3~7 个关键词,再次进行同质性验证,最终获得 252 句语句,整体 SNR50=-5.93±0.11 dB。
E 选句编制成表选取其中含有 5 个关键字的语句,共 90 句,编制成表 15 张,每张表包括 6 个句子,尽量在句式、语法结构、难度方面实现均衡。另在同质性验证后剔除的同质性差的语句中选取含有 5 个关键字的语句 18 句,编制成练习表 3 张,作为正式测试前的练习之用。
 
 
第二部分 噪声下普通话语句识别阈算法的研究
 
 
1. 引言
在噪声环境中聆听言语困难是令许多有听力损失患者苦恼的问题。一些纯音听阈基本正常或只有轻-中度听力损失的患者,在噪声环境中听懂言语的能力却很差。量化评价这种能力就需要获得该患者在噪声下的言语识别阈。言语识别阈是指受试者能够正确理解当前播放言语材料的 50%时所使用的最小声级,而对于噪声下语句的识别阈则指的是能够正确识别 50%语句时的信噪比。本研究针对已有的嘈杂语噪声下汉语短句测听表,结合计算机软件测听技术设计了一种能够获得噪声下语句识别阈的自适应的测试方法,但是使用这种算法是否会影响了测试的有效性,又或者因为改变了测试方法而提高了测试效率,这都是本实验研究的重点。以下实验使用这种算法对一组正常听力青年受试者进行了噪声下语句识别阈测试,并与既往工作获得的正常人参考值(SNR50)进行比较,验证该自适应算法的可靠性,以期能够提高临床测试的效率。
 
 
2. 实验材料和实验方法
 
 
2.1. 实验材料的编制
Adaptive 的测试方法是按照一定规则,根据受试者对前一个刺激的反应来决定下一个刺激信号/掩蔽信号的增减及增减步距的测试方法。这种方法之所以推荐用于言语可懂度的测试是由于给声强度只在较窄的范围内变化,使得在估计 SRT 和斜率时的标准差 SD 最小,同时可避免天花板和地板效应。Brand & Kollmeier(2002)得出以整句作为目标刺激对正常听力的言语可懂度测试的 PI 曲线的平均斜率是 20%/dB 的结论。他们和 Vaillancourt 等(2005)还提出至少要 20 句语句才能使 SRT获得 1 dB 以下的标准差 SD。但这种方法仍比传统先绘制 PI 曲线再计算 SRT 的的方法快捷,节约了测试时间,提高了效率。
 
 
  2. 实验材料与实验方法.......... 24-30
        2.1. 实验材料的编制.......... 24-27
        2.2. 实验对象.......... 27
        2.3. 实验地点及测试设备.......... 27
        2.4. 测试过程.......... 27-28
        2.5. 信噪比损失的计算.......... 28-29
        2.6. 统计学分析..........29-30
    3. 实验结果.......... 30-32
        3.1. 测试结果 ..........30-31
        3.2. Quick SIN的表间等价性.......... 31-32
        3.3. 医学参考值范围..........32
    4. 讨论.......... 32-36
        4.1. 评估信噪比损失的意义.......... 32-33
        4.2. Quick SIN的应用.......... 33-36
 
 
结论
 
 
噪声下言语测听在临床诊断中的应用主要有:①判断听力损伤;②评价社会交流的能力及胜任的程度;③预估手术效果;④评价听力康复的效果和为实施听力康复方案提供参考;⑤选配和评价助听器等助听装置;⑥检查中枢听功能。这其中言语识别阈是评估言语识别能力的重要指标。如何快速获得结果,是临床检查一直追求的目标。
本研究创新点在于:
1. 提出了普通话言语信噪比损失(SNR Loss)的概念并编制了噪声下言语识别速测表 Quick SIN 的普通话版。
2. 弥补 Quick SIN 对受试者自身言语识别阈值的计算的局限,设计了一种能够获得噪声下普通话语句识别阈的自适应的测试算法,并以计算机辅助言语测听软件的形式施测,提高了临床测试效率。
 
 
参考文献
[1]. Stanley A Gelfand. Speech Audiometry.  In :Stanley A Gelfand, Ed.Essentials of Audiology. New York: Thieme Medical Publishers, Inc.,1997.253~286.
[2]. Studebaker GA, Taylor R, Sherbecoc RL. The effect of noise spectrum onspeech recognition performance-intensity function. J Speech Hear Res,1994, 37 (2) : 439-448
[3]. Silverman SR, Hirsh I.Problems related to the use of speech in clinicalaudiometry.Annals of Otology,Rhinology and Laryngology, 1955, 64:1234-1244.
[4]. Katz J. Handbook of Clinical Audiology. 5th Edition. USA: Lipp incottWilliams & Wilkins, 2002: 13-17, 50-70, 96-109, 495-544.
[5]. Dirks DD, Morgan DE, Dubno JR. A prodecure for quantifying the effectsof noise on speech recognition [J]. J. Speech Hear Disord, 1982, 47: 114.
[6]. Garin PGC. A simple audiometry test of speech intelligibility inbackground noise[J ]. Rev Laryngol Otol Rhinol (Bord). 2002, 123:219.
[7]. Nilsson Michael SDS, Jean AS. Development of the hearing in noise testfor the measurement of speech reception thresholds in quiet and in noise[J ].J Acoust Soc Am, 1995, 2:1 085.
[8]. Killion, Villchur.Kessler Was right——partly:but SIN test shows someaids improve hearing in noise. The hearing Journal. 1993. 46:31-55.
相关阅读