本技術(shù)涉及自動駕駛,尤其涉及一種智能座艙語音處理方法、裝置、座艙、汽車及存儲介質(zhì)和程序產(chǎn)品。
背景技術(shù):
1、隨著自動駕駛技術(shù)及智能車聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,智能汽車中智能座艙提供的功能也更加豐富。智能汽車的智能座艙中,可以為用戶提供可見即可說功能,輔助用戶和屏幕進(jìn)行交互,用戶通過語音可以對智能座艙相關(guān)設(shè)備進(jìn)行操作。
2、智能座艙提供的可見即可說功能,可以采用nlu(natural?languageunderstanding,自然語言理解)算法。nlu算法獲取客戶端上傳的場景數(shù)據(jù),通過場景數(shù)據(jù)中的節(jié)點(diǎn)的label(標(biāo)簽)與用戶發(fā)出的語音數(shù)據(jù)進(jìn)行匹配,從而獲得期望命中的結(jié)果,進(jìn)一步根據(jù)命中結(jié)果執(zhí)行相應(yīng)交互處理。相關(guān)技術(shù)提供的智能座艙語音處理方法,目前只能限于對用戶發(fā)出的語音數(shù)據(jù)與場景數(shù)據(jù)中的label進(jìn)行相似度的匹配。但是,用戶發(fā)出的語音數(shù)據(jù),有可能是不規(guī)范的語音指令,例如帶有一些口語化用詞。這些口語化用詞的存在,影響了用戶發(fā)出的語音數(shù)據(jù)與場景數(shù)據(jù)中的label的匹配的相似度,對成功匹配召回屏幕中的元素帶來一定的干擾,降低了命中結(jié)果的命中成功率。例如圖1中,智能座艙的車機(jī)大屏的屏幕中存在歌曲列表元素,當(dāng)用戶發(fā)出“播放菊花臺”的語音數(shù)據(jù)時(shí),通過相關(guān)技術(shù)可以命中屏幕中的歌曲“菊花臺”;當(dāng)用戶發(fā)出“請幫我播放菊花臺吧”的語音數(shù)據(jù)時(shí),由于用戶發(fā)出的語音數(shù)據(jù)中帶有比較多的語氣詞等口語化用詞的內(nèi)容,降低了整體的語音數(shù)據(jù)與label的匹配度,則無法命中用戶期望命中的元素,導(dǎo)致匹配召回的失敗。
3、因此,相關(guān)技術(shù)中的智能座艙語音處理方法,需要進(jìn)一步提高為用戶匹配出期望命中的結(jié)果的成功率。
技術(shù)實(shí)現(xiàn)思路
1、為解決或部分解決相關(guān)技術(shù)中存在的問題,本技術(shù)提供一種智能座艙語音處理方法、裝置、座艙、汽車及存儲介質(zhì)和程序產(chǎn)品,能夠更準(zhǔn)確匹配出用戶期望命中的結(jié)果,提高為用戶匹配出期望命中的結(jié)果的成功率。
2、本技術(shù)第一方面提供一種智能座艙語音處理方法,包括:
3、獲取用戶發(fā)出的語音數(shù)據(jù)和座艙屏幕的場景數(shù)據(jù);
4、將所述用戶發(fā)出的語音數(shù)據(jù)與根據(jù)所述場景數(shù)據(jù)生成的匹配樹中的節(jié)點(diǎn)的節(jié)點(diǎn)信息進(jìn)行匹配,得到所述用戶發(fā)出的語音數(shù)據(jù)對應(yīng)的初始節(jié)點(diǎn)信息匹配結(jié)果;
5、將所述用戶發(fā)出的語音數(shù)據(jù)按預(yù)設(shè)方式進(jìn)行過濾,得到已過濾語音數(shù)據(jù);
6、將所述已過濾語音數(shù)據(jù)與所述初始節(jié)點(diǎn)信息匹配結(jié)果進(jìn)行匹配,得到所述已過濾語音數(shù)據(jù)對應(yīng)的目標(biāo)匹配結(jié)果。
7、在一實(shí)施方式中,所述將所述用戶發(fā)出的語音數(shù)據(jù)按預(yù)設(shè)方式進(jìn)行過濾,得到已過濾語音數(shù)據(jù),包括:
8、獲取所述用戶發(fā)出的語音數(shù)據(jù)與所述匹配樹中的節(jié)點(diǎn)的節(jié)點(diǎn)信息匹配過程中未匹配到的未匹配內(nèi)容;
9、將所述未匹配內(nèi)容與預(yù)設(shè)詞庫中的預(yù)設(shè)詞語進(jìn)行匹配,將匹配到的內(nèi)容進(jìn)行掩碼標(biāo)記;
10、將掩碼標(biāo)記的內(nèi)容進(jìn)行過濾,得到已過濾語音數(shù)據(jù)。
11、在一實(shí)施方式中,所述將所述未匹配內(nèi)容與預(yù)設(shè)詞庫中的預(yù)設(shè)詞語進(jìn)行匹配,將匹配到的內(nèi)容進(jìn)行掩碼標(biāo)記,包括:
12、將所述用戶發(fā)出的語音數(shù)據(jù)的預(yù)設(shè)位置的所述未匹配內(nèi)容,與預(yù)設(shè)詞庫中的預(yù)設(shè)詞語進(jìn)行匹配;
13、將匹配到的內(nèi)容進(jìn)行掩碼標(biāo)記;
14、其中所述預(yù)設(shè)位置至少包括以下位置之一:前綴位置、后綴位置、中間位置位置。
15、在一實(shí)施方式中,所述預(yù)設(shè)詞語包括口語化用詞。
16、在一實(shí)施方式中,所述將所述用戶發(fā)出的語音數(shù)據(jù)與根據(jù)所述場景數(shù)據(jù)生成的匹配樹中的節(jié)點(diǎn)的節(jié)點(diǎn)信息進(jìn)行匹配,得到所述用戶發(fā)出的語音數(shù)據(jù)對應(yīng)的初始節(jié)點(diǎn)信息匹配結(jié)果,包括:
17、遍歷根據(jù)所述場景數(shù)據(jù)生成的匹配樹,將所述用戶發(fā)出的語音數(shù)據(jù)與所述匹配樹中的非根節(jié)點(diǎn)及所述非根節(jié)點(diǎn)的父節(jié)點(diǎn)的節(jié)點(diǎn)信息進(jìn)行匹配,得到遍歷過程中的各個(gè)節(jié)點(diǎn)標(biāo)記的第一候選匹配結(jié)果;
18、對所述第一候選匹配結(jié)果進(jìn)行第一相似度計(jì)算,根據(jù)各個(gè)節(jié)點(diǎn)的第一匹配相似度,篩選出所述用戶發(fā)出的語音數(shù)據(jù)對應(yīng)的初始節(jié)點(diǎn)信息匹配結(jié)果。
19、在一實(shí)施方式中,所述將所述已過濾語音數(shù)據(jù)與所述初始節(jié)點(diǎn)信息匹配結(jié)果進(jìn)行匹配,得到所述已過濾語音數(shù)據(jù)對應(yīng)的目標(biāo)匹配結(jié)果,包括:
20、將所述已過濾語音數(shù)據(jù)與篩選出的位于第一預(yù)設(shè)排序位置的所述初始節(jié)點(diǎn)信息匹配結(jié)果進(jìn)行遍歷匹配,得到遍歷過程中的各個(gè)節(jié)點(diǎn)標(biāo)記的第二候選匹配結(jié)果;
21、對所述第二候選匹配結(jié)果進(jìn)行第二相似度計(jì)算,根據(jù)各個(gè)節(jié)點(diǎn)的第二匹配相似度,篩選出所述已過濾語音數(shù)據(jù)對應(yīng)的目標(biāo)匹配結(jié)果。
22、在一實(shí)施方式中,所述根據(jù)各個(gè)節(jié)點(diǎn)的第二匹配相似度,篩選出所述已過濾語音數(shù)據(jù)對應(yīng)的目標(biāo)匹配結(jié)果,包括:
23、從各個(gè)節(jié)點(diǎn)超過預(yù)設(shè)閾值的第二匹配相似度中,篩選出位于第二預(yù)設(shè)排序位置的第二匹配相似度所對應(yīng)的節(jié)點(diǎn)的第二候選匹配結(jié)果作為所述已過濾語音數(shù)據(jù)對應(yīng)的目標(biāo)匹配結(jié)果。
24、本技術(shù)第二方面提供一種智能座艙語音處理裝置,包括:
25、數(shù)據(jù)獲取模塊,用于獲取用戶發(fā)出的語音數(shù)據(jù)和座艙屏幕的場景數(shù)據(jù);
26、第一匹配模塊,用于將所述用戶發(fā)出的語音數(shù)據(jù)與根據(jù)所述場景數(shù)據(jù)生成的匹配樹中的節(jié)點(diǎn)的節(jié)點(diǎn)信息進(jìn)行匹配,得到所述用戶發(fā)出的語音數(shù)據(jù)對應(yīng)的初始節(jié)點(diǎn)信息匹配結(jié)果;
27、過濾處理模塊,用于將所述用戶發(fā)出的語音數(shù)據(jù)按預(yù)設(shè)方式進(jìn)行過濾,得到已過濾語音數(shù)據(jù);
28、第二匹配模塊,用于將所述已過濾語音數(shù)據(jù)與所述初始節(jié)點(diǎn)信息匹配結(jié)果進(jìn)行匹配,得到所述已過濾語音數(shù)據(jù)對應(yīng)的目標(biāo)匹配結(jié)果。
29、在一實(shí)施方式中,所述過濾處理模塊包括:
30、未匹配內(nèi)容獲取子模塊,用于獲取所述用戶發(fā)出的語音數(shù)據(jù)與所述匹配樹中的節(jié)點(diǎn)的節(jié)點(diǎn)信息匹配過程中未匹配到的未匹配內(nèi)容;
31、掩碼處理子模塊,用于將所述未匹配內(nèi)容與預(yù)設(shè)詞庫中的預(yù)設(shè)詞語進(jìn)行匹配,將匹配到的內(nèi)容進(jìn)行掩碼標(biāo)記;
32、過濾子模塊,用于將掩碼標(biāo)記的內(nèi)容進(jìn)行過濾,得到已過濾語音數(shù)據(jù)。
33、本技術(shù)第三方面提供一種智能座艙,包括如上所述的智能座艙語音處理裝置。
34、本技術(shù)第四方面提供一種智能汽車,包括:
35、處理器;以及
36、存儲器,其上存儲有可執(zhí)行代碼,當(dāng)所述可執(zhí)行代碼被所述處理器執(zhí)行時(shí),使所述處理器執(zhí)行如上所述的方法。
37、本技術(shù)第五方面提供一種計(jì)算機(jī)可讀存儲介質(zhì),其上存儲有可執(zhí)行代碼,當(dāng)所述可執(zhí)行代碼被電子設(shè)備的處理器執(zhí)行時(shí),使所述處理器執(zhí)行如上所述的方法。
38、本技術(shù)第六方面提供一種計(jì)算機(jī)程序產(chǎn)品,所述計(jì)算機(jī)程序產(chǎn)品包括計(jì)算機(jī)指令,所述計(jì)算機(jī)指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上所述的方法。
39、本技術(shù)提供的技術(shù)方案可以包括以下有益效果:
40、本技術(shù)技術(shù)方案,可以將用戶發(fā)出的語音數(shù)據(jù)與根據(jù)場景數(shù)據(jù)生成的匹配樹中的節(jié)點(diǎn)的節(jié)點(diǎn)信息進(jìn)行匹配,得到所述用戶發(fā)出的語音數(shù)據(jù)對應(yīng)的初始節(jié)點(diǎn)信息匹配結(jié)果;將所述用戶發(fā)出的語音數(shù)據(jù)按預(yù)設(shè)方式進(jìn)行過濾,得到已過濾語音數(shù)據(jù);將所述已過濾語音數(shù)據(jù)與所述初始節(jié)點(diǎn)信息匹配結(jié)果進(jìn)行匹配,得到所述已過濾語音數(shù)據(jù)對應(yīng)的目標(biāo)匹配結(jié)果。通過上述處理,本技術(shù)能夠在處理客戶端的場景數(shù)據(jù)信息時(shí),在第一次匹配例如初始節(jié)點(diǎn)信息匹配結(jié)果的基礎(chǔ)上,進(jìn)一步將所述用戶發(fā)出的語音數(shù)據(jù)按預(yù)設(shè)方式進(jìn)行過濾,減小一些語音用詞的干擾,然后再將已過濾語音數(shù)據(jù)與初始節(jié)點(diǎn)信息匹配結(jié)果再進(jìn)行匹配,獲得目標(biāo)匹配結(jié)果,就能提高匹配準(zhǔn)確度,能夠更準(zhǔn)確匹配出用戶期望命中的結(jié)果,提高為用戶匹配出期望命中的結(jié)果的成功率。
41、進(jìn)一步的,本技術(shù)技術(shù)方案可以獲取所述用戶發(fā)出的語音數(shù)據(jù)與所述匹配樹中的節(jié)點(diǎn)的節(jié)點(diǎn)信息匹配過程中未匹配到的未匹配內(nèi)容;將所述未匹配內(nèi)容與預(yù)設(shè)詞庫中的預(yù)設(shè)詞語進(jìn)行匹配,將匹配到的內(nèi)容進(jìn)行掩碼標(biāo)記;將掩碼標(biāo)記的內(nèi)容進(jìn)行過濾,得到已過濾語音數(shù)據(jù)。所述預(yù)設(shè)詞語可以包括口語化用詞等。本技術(shù)通過對口語化用詞等的上述處理,就可以實(shí)現(xiàn)對帶有口語化用詞的語音數(shù)據(jù)的兼容,提高對用戶發(fā)出的語音數(shù)據(jù)(語音輸入)的理解的泛化能力,這樣即使用戶發(fā)出的語音數(shù)據(jù)中帶有比較多的口語化用詞時(shí),也能準(zhǔn)確匹配出用戶期望命中的結(jié)果,提高為用戶匹配出期望命中的結(jié)果的成功率。
42、應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不能限制本技術(shù)。