3.1 基于特征提取的信号处理方案
语音信号的特征主要为基频(Fundamental Frequency)和共振峰(Formant)。共振峰反映语音信号频谱的峰值,一般取前3个峰值F1、F2和F3;基频反映音调的变化,即描述周期性的浊音的频率(F0)。初期的语音信号处理方案有F0/F2、F0/F1/F2、F0/F1/F2/F3等方法[6,9,10],F0决定电极电流脉冲的频率,F1、F2和F3的频点位置与电极的位置相对应,其幅度大小决定刺激脉冲的幅度。提取F0、F1、F2、F3等特征的方法主要有滤波法、自相关法、倒谱法和线性预测编码法(LPC)等,其中线性预测编码法应用较多[9]。F0的提取可采用简化逆滤波(SIFT)法等。
选择这些参数主要是因为它们有助于电子耳蜗植入者理解语言,而且比较符合电诱发听觉的某些特点。在此基础上,Cochlear公司发展了一种微型语音处理器(Mini Speech Processor,MSP),其中使用的语音信号处理方法是MPEAK(Multipeak),它是F0/F1/F2/F3方法的一种扩展,在每个刺激周期内激活四个电极,两个电极表示F1和F2,另外两个电极(靠近耳蜗底部)传送2KHz以上的高频信息。用MPEAK法实现的MSP比以前的特征信号提取法性能好,特别是在有噪音的场合[6]。
3.2 基于滤波器组的信号处理方案
随着电极数目的增加,基于滤波器组的人工电子耳蜗语音信号处理方案不断在发展,如最大谱峰声音处理法(Spectral Maxima Sound Processor,SMSP)、谱峰法(Spectral Peak,SPEAK)、压缩模拟(Compressed Analog,CA)方案和连续交替取样(Continuous Interleaved Sampling,CIS)方案等[2,3,4,6]。
3.2.1 SMSP法 SMSP法语音处理的原理如图2所示。SMSP法是将声音信号通过一组带通滤波器分为16个频带,并进行整流和低通滤波检测出该频带内信号的谱的包络。对每一时刻,可以得到16个频带内的语音信号的包络,然后选取其中6个最大的作为对应电极的刺激信号[6,8]。这6个最大的包络信号作为一帧数据传输到体内,帧频约为250 Hz/S。低通滤波器的截止频率为200 Hz。SMSP方法由奥大利亚墨尔本(Melbourne)大学的研究人中提出,最初用模拟电路实现,最近已在可编程数字信号处理器上实现,并应用于他们与Nucleus公司合作生产的22电极人工电子耳蜗系统中。这种方法既减少了无线传输时的数据量,又最大限度地利用了语音信号的主要信息。
上一页 1 2 [3] 4 5 6 7 下一页