本申請屬于聲音信號處理的,涉及一種信號重建方法,特別是涉及一種基于人工耳蝸的聲音信號的重建方法、系統(tǒng)及設(shè)備。
背景技術(shù):
1、人工耳蝸技術(shù)是目前世界公認的能使雙側(cè)重度或極重度感音神經(jīng)性耳聾患者恢復(fù)聽覺的唯一有效方法及裝置。對于大部分主流的人工耳蝸系統(tǒng)而言,外界聲音首先由麥克風(fēng)采集并轉(zhuǎn)換為電信號,經(jīng)過處理后,通過載在耳后的發(fā)射線圈傳送到體內(nèi),植入體的接收線圈感應(yīng)到信號后,經(jīng)過解碼芯片解碼,使植入體的刺激電極產(chǎn)生電流,從而刺激聽神經(jīng)產(chǎn)生聽覺。
2、一般來說,人工耳蝸植入體電極所能輸出的電流幅值位深度是有限的,對于常見的植入體而言,通??梢蕴峁?比特位深的刺激電流量(current?level,cl)用于對輸入聲學(xué)信號進行重建(即0~255cl,刺激電流幅值一般隨cl值的提高而非線性遞增,cl值所對應(yīng)的電流幅值與具體的產(chǎn)品型號相關(guān))。然而,并非所有強度的刺激電流對植入者來說都是有效或可接受的:當(dāng)cl值過小時,刺激電流無法引發(fā)足夠的聽神經(jīng)反應(yīng),即無法產(chǎn)生人工聽覺;當(dāng)cl值過大時,刺激電流容易引發(fā)植入者疼痛等不良反應(yīng)。
3、電聽覺動態(tài)范圍(electrode?dynamic?range,edr)是能夠使植入者聽神經(jīng)產(chǎn)生足夠的反應(yīng),又不會讓其感到不適的cl值的范圍。該范圍的下限稱為植入者的電閾值(electrode?threshold),簡稱為t值,低于該閾值的電刺激輸出對植入者來說是不可聽的;與之對應(yīng)的,其上限稱為舒適閾(comfort?threshold),簡稱為c值,高于該閾值的電流刺激易引發(fā)植入者不適。一般來說,常見的edr為130cl~250cl,即實際可以用于信號重建的電流幅值位深度可能小于7比特甚至6比特,這對于人工耳蝸系統(tǒng)如何對輸入信號進行處理、提高輸出語音的可懂度提出了較高的要求。
4、除此以外,深度神經(jīng)網(wǎng)絡(luò)算法近年來在語音降噪等領(lǐng)域雖然已經(jīng)有了一定的突破和發(fā)展,但是為了達到較為顯著的噪聲控制效果通常需要較大的模型實現(xiàn)。而常見的人工耳蝸聲音處理器設(shè)備大多基于低功耗數(shù)字信號處理器(digital?signal?processor,dsp)實現(xiàn),考慮到許多植入者對于設(shè)備功耗較為敏感,將大型神經(jīng)網(wǎng)絡(luò)模型在此類邊緣端設(shè)備進行部署的方法目前仍未成為主流。
技術(shù)實現(xiàn)思路
1、本申請?zhí)峁┮环N基于人工耳蝸的聲音信號的重建方法、系統(tǒng)及設(shè)備,用于解決如何在低功耗處理平臺對人工耳蝸的聲音信號進行重建的問題。
2、第一方面,本申請?zhí)峁┮环N基于人工耳蝸的聲音信號的重建方法,所述方法包括:獲取外部聲音信號,對所述聲音信號進行空域濾波,得到空域濾波信號;將所述空域濾波信號進行頻域分解,確定初始的能量譜;將所述能量譜變換為頻譜;根據(jù)所述聲音信號的噪聲譜的估計結(jié)果計算信號語音增益;結(jié)合植入者的電聽覺動態(tài)范圍對所述信號語音增益進行調(diào)幅;對所述頻譜施加調(diào)幅后的信號語音增益,輸出重建后的去噪語音能量譜。
3、在第一方面的一種實現(xiàn)方式中,所述對所述聲音信號進行空域濾波,得到空域濾波信號的步驟,包括:基于多通道波束形成方法對所述聲音信號進行空域濾波,得到空域濾波信號。
4、在第一方面的一種實現(xiàn)方式中,所述聲音信號的噪聲譜的估計過程包括:確定所述聲音信號的當(dāng)前信號幀的能量特征;根據(jù)動態(tài)的噪聲門限判斷所述當(dāng)前信號幀是否為噪聲幀;響應(yīng)于所述當(dāng)前信號幀為噪聲幀,則根據(jù)所述當(dāng)前信號幀的能量譜更新噪聲譜的估計。
5、在第一方面的一種實現(xiàn)方式中,所述根據(jù)動態(tài)的噪聲門限判斷所述當(dāng)前信號幀是否為噪聲幀的步驟,包括:基于動態(tài)設(shè)定的當(dāng)前的噪聲門限和所述能量特征,判斷所述當(dāng)前信號幀是否為噪聲幀;響應(yīng)于所述能量特征低于所述噪聲門限,判定所述當(dāng)前信號幀為噪聲幀;響應(yīng)于所述能量特征高于或等于所述噪聲門限,判定所述當(dāng)前信號幀不是噪聲幀。
6、在第一方面的一種實現(xiàn)方式中,在所述根據(jù)動態(tài)的噪聲門限判斷所述當(dāng)前信號幀是否為噪聲幀的步驟之后,所述方法還包括:若所述能量特征低于所述噪聲門限,則將該能量特征的值作為新的噪聲門限;若所述能量特征高于所述噪聲門限,則按照預(yù)設(shè)規(guī)律提高所述噪聲門限。
7、在第一方面的一種實現(xiàn)方式中,所述結(jié)合植入者的電聽覺動態(tài)范圍對所述信號語音增益進行調(diào)幅的步驟,包括:響應(yīng)于所述信號語音增益大于預(yù)設(shè)增益閾值,將所述信號語音增益乘以一小于1的特定壓縮系數(shù)對所述信號語音增益進行限幅,所述預(yù)設(shè)增益閾值、所述特定壓縮系數(shù)均與所述電聽覺動態(tài)范圍相關(guān)。
8、在第一方面的一種實現(xiàn)方式中,所述對所述頻譜施加調(diào)幅后的信號語音增益,輸出重建后的去噪語音能量譜的步驟,包括:將調(diào)幅后的信號語音增益變換為線性值,將各個子帶線性增益依次與所述頻譜對應(yīng)子帶幅值相乘,輸出結(jié)果為所述去噪語音能量譜。
9、第二方面,本申請?zhí)峁┮环N基于人工耳蝸的聲音信號的重建系統(tǒng),所述系統(tǒng)包括:波束形成模塊,被配置為獲取外部聲音信號,基于多通道波束形成方法對所述聲音信號進行空域濾波,得到空域濾波信號;頻域分解模塊,被配置為將所述空域濾波信號進行頻域分解,確定初始的能量譜;將所述能量譜變換為頻譜;增益計算模塊,被配置為根據(jù)所述聲音信號的噪聲譜的估計結(jié)果計算信號語音增益;結(jié)合植入者的電聽覺動態(tài)范圍對所述信號語音增益進行調(diào)幅;增益施加模塊,被配置為對所述頻譜施加調(diào)幅后的信號語音增益,輸出重建后的去噪語音能量譜。
10、在第二方面的一種實現(xiàn)方式中,所述系統(tǒng)還包括:幀能量計算模塊,被配置為確定所述聲音信號的當(dāng)前信號幀的能量特征;根據(jù)動態(tài)的噪聲門限判斷所述當(dāng)前信號幀是否為噪聲幀;噪聲譜估計模塊,被配置為響應(yīng)于所述當(dāng)前信號幀為噪聲幀,則根據(jù)所述當(dāng)前信號幀的能量譜更新噪聲譜的估計。
11、第三方面,本申請?zhí)峁┮环N電子設(shè)備,所述電子設(shè)備包括:處理器及存儲器;所述存儲器用于存儲計算機程序,所述處理器用于執(zhí)行所述存儲器存儲的計算機程序,以使所述電子設(shè)備執(zhí)行所述的方法。
12、如上所述,本申請所述的基于人工耳蝸的聲音信號的重建方法、系統(tǒng)及設(shè)備,具有以下
13、有益效果:
14、本申請?zhí)峁┝艘环N基于指向性波束形成和譜衰減的自適應(yīng)語音降噪和壓縮方法,能夠消除信號中的噪聲成分,達到提高信噪比的目的;通過基于植入者電聽覺動態(tài)范圍的多通道增益控制,對幅值過大的信號進行動態(tài)壓縮,達到提高輸出語音信號有效位深度,進一步增強人工聽覺語懂度的效果。本申請能夠根據(jù)植入者的edr數(shù)據(jù)按通道對輸入信號進行自適應(yīng)降噪和壓縮,有助于改善植入者在其耳蝸內(nèi)不同區(qū)域的內(nèi)耳毛細胞活躍度不同,尤其是edr范圍較窄的情況下盡可能地提高電聲重建信號的幅度分辨率,達到更好的語懂度改善效果,適用于低功耗處理平臺的人工耳蝸聲音處理器設(shè)備(例如dsp)。
1.一種基于人工耳蝸的聲音信號的重建方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對所述聲音信號進行空域濾波,得到空域濾波信號的步驟,包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述聲音信號的噪聲譜的估計過程包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)動態(tài)的噪聲門限判斷所述當(dāng)前信號幀是否為噪聲幀的步驟,包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,在所述根據(jù)動態(tài)的噪聲門限判斷所述當(dāng)前信號幀是否為噪聲幀的步驟之后,所述方法還包括:
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述結(jié)合植入者的電聽覺動態(tài)范圍對所述信號語音增益進行調(diào)幅的步驟,包括:
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對所述頻譜施加調(diào)幅后的信號語音增益,輸出重建后的去噪語音能量譜的步驟,包括:
8.一種基于人工耳蝸的聲音信號的重建系統(tǒng),其特征在于,所述系統(tǒng)包括:
9.根據(jù)權(quán)利要求8所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括:
10.一種電子設(shè)備,其特征在于,所述電子設(shè)備包括:處理器及存儲器;