本技術(shù)涉及人工智能,尤其涉及一種語音識(shí)別方法、語音識(shí)別裝置、電子設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、語音識(shí)別在實(shí)際中有著廣泛的應(yīng)用,例如:語音助手、語音質(zhì)檢、智能語音交互等場(chǎng)景。相關(guān)技術(shù)中,在將語音轉(zhuǎn)化為文本之后,文本一般會(huì)存在少量的錯(cuò)別字,十分影響對(duì)語音的語義理解。對(duì)此,目前存在一些文本糾錯(cuò)方式。方式一,在將語音轉(zhuǎn)化為文本之后,利用預(yù)先訓(xùn)練的文本糾錯(cuò)模型檢測(cè)文本確定錯(cuò)別字,然后根據(jù)錯(cuò)別字進(jìn)行文本糾錯(cuò)。方式二,在將語音轉(zhuǎn)化為文本之后,將文本轉(zhuǎn)化為拼音序列,然后根據(jù)拼音序列與預(yù)設(shè)的拼音字典進(jìn)行比對(duì),從而得到罕見拼音組合,然后基于罕見拼音組合進(jìn)行文本糾錯(cuò)。
2、上述方式一中,文本糾錯(cuò)模型一般是基于語義理解的方式檢測(cè)文本的錯(cuò)別字。但實(shí)際上文本即使存在錯(cuò)別字,文本的語義也可能是合理的。因此,模型可能檢測(cè)不出錯(cuò)別字,即檢測(cè)準(zhǔn)確性差。上述方式二中,實(shí)質(zhì)上利用統(tǒng)計(jì)的思想將文本對(duì)應(yīng)的拼音序列中的罕見拼音組合作為出錯(cuò)拼音。但實(shí)際上,罕見并不代表一定出錯(cuò),也就是罕見拼音組合所對(duì)應(yīng)的文字有可能是沒有出錯(cuò)的。因此,方式二的檢測(cè)準(zhǔn)確性也較低。
3、可見,相關(guān)技術(shù)的缺點(diǎn)在于,語音轉(zhuǎn)換為文本后,對(duì)文本的糾錯(cuò)準(zhǔn)確性較低。
技術(shù)實(shí)現(xiàn)思路
1、本技術(shù)實(shí)施例的主要目的在于提出語音識(shí)別方法、語音識(shí)別裝置、電子設(shè)備及存儲(chǔ)介質(zhì),能夠提高語音轉(zhuǎn)換為文本后對(duì)文本的糾錯(cuò)準(zhǔn)確性,從而提高語音識(shí)別的準(zhǔn)確性。
2、為實(shí)現(xiàn)上述目的,本技術(shù)實(shí)施例的第一方面提出了一種語音識(shí)別方法,所述語音識(shí)別方法包括:
3、獲取語音數(shù)據(jù);
4、通過預(yù)設(shè)的第一語音識(shí)別模型對(duì)所述語音數(shù)據(jù)進(jìn)行文本識(shí)別,得到原始文本序列;其中,所述原始文本序列包括原始詞;
5、對(duì)所述原始文本序列進(jìn)行聲韻母轉(zhuǎn)換,得到具有第一聲調(diào)標(biāo)記的原始聲韻母序列;其中,所述原始聲韻母序列包括原始聲韻母子序列,所述原始聲韻母子序列表征所述原始詞的聲韻母,所述第一聲調(diào)標(biāo)記用于表征所述原始詞的聲調(diào);
6、通過預(yù)設(shè)的第二語音識(shí)別模型對(duì)所述語音數(shù)據(jù)進(jìn)行聲韻母識(shí)別,得到具有第二聲調(diào)標(biāo)記的參考聲韻母序列;其中,所述參考聲韻母序列包括參考聲韻母子序列,所述參考聲韻母子序列表征參考詞的聲韻母,所述第二聲調(diào)標(biāo)記用于表征所述參考詞的聲調(diào);
7、根據(jù)所述原始聲韻母序列和所述參考聲韻母序列進(jìn)行差異對(duì)比,得到異常聲韻母子序列;
8、根據(jù)所述異常聲韻母子序列對(duì)所述原始文本序列進(jìn)行文本修正,得到目標(biāo)文本序列。
9、在一些實(shí)施例,所述根據(jù)所述原始聲韻母序列和所述參考聲韻母序列進(jìn)行差異對(duì)比,得到異常聲韻母子序列,包括:
10、獲取所述原始詞在所述原始文本序列中的位置,得到詞位置;
11、根據(jù)所述詞位置從所述原始聲韻母序列進(jìn)行第一子序列提取,得到第一聲韻母子序列;
12、根據(jù)所述詞位置從所述參考聲韻母序列進(jìn)行第二子序列提取,得到第二聲韻母子序列;
13、若所述第一聲韻母子序列與所述第二聲韻母子序列不一致,基于所述第二聲韻母子序列得到所述異常聲韻母子序列。
14、在一些實(shí)施例,所述根據(jù)所述異常聲韻母子序列對(duì)所述原始文本序列進(jìn)行文本修正,得到目標(biāo)文本序列,包括:
15、根據(jù)所述異常聲韻母子序列進(jìn)行文字構(gòu)建,得到候選詞;
16、將所述候選詞代入所述原始文本序列,得到候選文本序列;
17、對(duì)所述候選文本序列進(jìn)行篩選,得到目標(biāo)識(shí)別文本序列。
18、在一些實(shí)施例,所述對(duì)所述候選文本序列進(jìn)行篩選,得到目標(biāo)識(shí)別文本序列,包括:
19、通過預(yù)設(shè)的大語言模型對(duì)所述候選文本序列進(jìn)行語義分析,得到語義分析數(shù)據(jù);
20、基于所述語義分析數(shù)據(jù)對(duì)所述候選文本序列進(jìn)行選取,得到所述目標(biāo)識(shí)別文本序列。
21、在一些實(shí)施例,所述根據(jù)所述異常聲韻母子序列進(jìn)行文字構(gòu)建,得到候選詞,包括:
22、根據(jù)所述異常聲韻母子序列從所述原始文本序列進(jìn)行異常詞提取,得到目標(biāo)異常詞;
23、根據(jù)所述目標(biāo)異常詞從所述原始文本序列進(jìn)行輔助詞提取,得到目標(biāo)輔助詞;其中,所述目標(biāo)異常詞的位置與所述目標(biāo)輔助詞的位置之間的間隔在預(yù)設(shè)的位置間隔范圍內(nèi);
24、根據(jù)所述異常聲韻母子序列進(jìn)行詞生成,得到基礎(chǔ)詞;
25、將所述基礎(chǔ)詞與所述目標(biāo)輔助詞進(jìn)行詞組合,得到所述候選詞。
26、在一些實(shí)施例,在所述根據(jù)所述目標(biāo)異常詞從所述原始文本序列進(jìn)行輔助詞獲取,得到目標(biāo)輔助詞之后,所述語音識(shí)別方法還包括:
27、獲取所述目標(biāo)輔助詞的詞性,得到輔助詞詞性;
28、若所述輔助詞詞性在預(yù)設(shè)的過濾詞性表內(nèi),則刪除所述目標(biāo)輔助詞。
29、在一些實(shí)施例,在所述根據(jù)所述原始聲韻母序列和所述參考聲韻母序列進(jìn)行差異對(duì)比,得到異常聲韻母子序列之前,所述語音識(shí)別方法還包括:
30、根據(jù)所述原始聲韻母子序列進(jìn)行第一數(shù)目統(tǒng)計(jì),得到第一子序列數(shù)目;
31、根據(jù)所述參考聲韻母子序列進(jìn)行第二數(shù)目統(tǒng)計(jì),得到第二子序列數(shù)目;
32、若所述第一子序列數(shù)目和所述第二子序列數(shù)目不相等,基于預(yù)設(shè)的第三語音識(shí)別模型對(duì)所述語音數(shù)據(jù)進(jìn)行聲韻母識(shí)別,得到具有第三聲調(diào)標(biāo)記的當(dāng)前聲韻母序列;其中,所述當(dāng)前聲韻母序列包括當(dāng)前詞,所述第三聲調(diào)標(biāo)記用于表征所述當(dāng)前詞的聲調(diào);
33、將所述當(dāng)前聲韻母序列作為所述參考聲韻母序列。
34、為實(shí)現(xiàn)上述目的,本技術(shù)實(shí)施例的第二方面提出了一種語音識(shí)別裝置,所述語音識(shí)別裝置包括:
35、語音獲取模塊,用于獲取語音數(shù)據(jù);
36、文本識(shí)別模塊,用于通過預(yù)設(shè)的第一語音識(shí)別模型對(duì)所述語音數(shù)據(jù)進(jìn)行文本識(shí)別,得到原始文本序列;其中,所述原始文本序列包括原始詞;
37、聲韻母轉(zhuǎn)換模塊,用于對(duì)所述原始文本序列進(jìn)行聲韻母轉(zhuǎn)換,得到具有第一聲調(diào)標(biāo)記的原始聲韻母序列;其中,所述原始聲韻母序列包括原始聲韻母子序列,所述原始聲韻母子序列表征所述原始詞的聲韻母,所述第一聲調(diào)標(biāo)記用于表征所述原始詞的聲調(diào);
38、聲韻母識(shí)別模塊,用于通過預(yù)設(shè)的第二語音識(shí)別模型對(duì)所述語音數(shù)據(jù)進(jìn)行聲韻母識(shí)別,得到具有第二聲調(diào)標(biāo)記的參考聲韻母序列;其中,所述參考聲韻母序列包括參考聲韻母子序列,所述參考聲韻母子序列表征參考詞的聲韻母,所述第二聲調(diào)標(biāo)記用于表征所述參考詞的聲調(diào);
39、差異對(duì)比模塊,用于根據(jù)所述原始聲韻母序列和所述參考聲韻母序列進(jìn)行差異對(duì)比,得到異常聲韻母子序列;
40、文本修正模塊,用于根據(jù)所述異常聲韻母子序列對(duì)所述原始文本序列進(jìn)行文本修正,得到目標(biāo)文本序列。
41、為實(shí)現(xiàn)上述目的,本技術(shù)實(shí)施例的第三方面提出了一種電子設(shè)備,所述電子設(shè)備包括存儲(chǔ)器和處理器,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)上述第一方面所述的語音識(shí)別方法。
42、為實(shí)現(xiàn)上述目的,本技術(shù)實(shí)施例的第四方面提出了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述第一方面所述的語音識(shí)別方法。
43、本技術(shù)提出了語音識(shí)別方法、語音識(shí)別裝置、電子設(shè)備及存儲(chǔ)介質(zhì)。本技術(shù)中,一方面對(duì)利用第一語音識(shí)別模型進(jìn)行文本識(shí)別得到的原始文本序列進(jìn)行轉(zhuǎn)換得到具有第一聲調(diào)標(biāo)記的原始聲韻母序列。另一方面利用第二語音識(shí)別模型將語音數(shù)據(jù)識(shí)別為具有第二聲調(diào)標(biāo)記的參考聲韻母序列。原始聲韻母序列指示原始文本序列的聲韻母信息,可以間接指示語音數(shù)據(jù)的聲韻母信息。參考聲韻母序列可以直接指示語音數(shù)據(jù)的聲韻母信息。所以,如果原始聲韻母序列與參考聲韻母序列出現(xiàn)差異,則說明原始文本序列中存在異常。因此,本技術(shù)將原始聲韻母序列和參考聲韻母序列進(jìn)行差異對(duì)比,可以確定異常聲韻母子序列。最后,根據(jù)異常聲韻母子序列對(duì)原始文本序列進(jìn)行修正,得到目標(biāo)識(shí)別文本序列??梢?,本技術(shù)利用的第一語音識(shí)別模型和第二語音識(shí)別模型對(duì)語音數(shù)據(jù)進(jìn)行不同方面的識(shí)別,且利用原始聲韻母序列和參考聲韻母序列進(jìn)行差異對(duì)比確定異常聲韻母子序列的技術(shù)手段,提高了確定異常聲韻母子序列的準(zhǔn)確性,從而提高了文本糾錯(cuò)準(zhǔn)確性,進(jìn)而提高了語音識(shí)別的準(zhǔn)確性。