欧美日韩啪啪,最新精品在线,国产ts一区二区,色亚洲一区二区,草草影院国产,久久国产99,欧美日韩四区

智能座艙語音處理方法、裝置、座艙、汽車及存儲介質(zhì)與流程

文檔序號:42325584發(fā)布日期:2025-07-01 19:43閱讀:10來源:國知局

本技術(shù)涉及自動駕駛,尤其涉及一種智能座艙語音處理方法、裝置、座艙、汽車及存儲介質(zhì)和程序產(chǎn)品。


背景技術(shù):

1、隨著自動駕駛技術(shù)及智能車聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,智能汽車中智能座艙提供的功能也更加豐富。智能汽車的智能座艙中,可以為用戶提供可見即可說功能,輔助用戶和屏幕進(jìn)行交互,用戶通過語音可以對智能座艙相關(guān)設(shè)備進(jìn)行操作。

2、智能座艙提供的可見即可說功能,可以采用nlu(natural?languageunderstanding,自然語言理解)算法。nlu算法獲取客戶端上傳的場景數(shù)據(jù),通過場景數(shù)據(jù)中的節(jié)點(diǎn)的label(標(biāo)簽)與用戶發(fā)出的語音數(shù)據(jù)進(jìn)行匹配,從而獲得期望命中的結(jié)果,進(jìn)一步根據(jù)命中結(jié)果執(zhí)行相應(yīng)交互處理。相關(guān)技術(shù)提供的智能座艙語音處理方法,目前只能限于對用戶發(fā)出的語音數(shù)據(jù)與場景數(shù)據(jù)中的label進(jìn)行相似度的匹配。但是,用戶發(fā)出的語音數(shù)據(jù),有可能是不規(guī)范的語音指令,例如帶有一些口語化用詞。這些口語化用詞的存在,影響了用戶發(fā)出的語音數(shù)據(jù)與場景數(shù)據(jù)中的label的匹配的相似度,對成功匹配召回屏幕中的元素帶來一定的干擾,降低了命中結(jié)果的命中成功率。例如圖1中,智能座艙的車機(jī)大屏的屏幕中存在歌曲列表元素,當(dāng)用戶發(fā)出“播放菊花臺”的語音數(shù)據(jù)時(shí),通過相關(guān)技術(shù)可以命中屏幕中的歌曲“菊花臺”;當(dāng)用戶發(fā)出“請幫我播放菊花臺吧”的語音數(shù)據(jù)時(shí),由于用戶發(fā)出的語音數(shù)據(jù)中帶有比較多的語氣詞等口語化用詞的內(nèi)容,降低了整體的語音數(shù)據(jù)與label的匹配度,則無法命中用戶期望命中的元素,導(dǎo)致匹配召回的失敗。

3、因此,相關(guān)技術(shù)中的智能座艙語音處理方法,需要進(jìn)一步提高為用戶匹配出期望命中的結(jié)果的成功率。


技術(shù)實(shí)現(xiàn)思路

1、為解決或部分解決相關(guān)技術(shù)中存在的問題,本技術(shù)提供一種智能座艙語音處理方法、裝置、座艙、汽車及存儲介質(zhì)和程序產(chǎn)品,能夠更準(zhǔn)確匹配出用戶期望命中的結(jié)果,提高為用戶匹配出期望命中的結(jié)果的成功率。

2、本技術(shù)第一方面提供一種智能座艙語音處理方法,包括:

3、獲取用戶發(fā)出的語音數(shù)據(jù)和座艙屏幕的場景數(shù)據(jù);

4、將所述用戶發(fā)出的語音數(shù)據(jù)與根據(jù)所述場景數(shù)據(jù)生成的匹配樹中的節(jié)點(diǎn)的節(jié)點(diǎn)信息進(jìn)行匹配,得到所述用戶發(fā)出的語音數(shù)據(jù)對應(yīng)的初始節(jié)點(diǎn)信息匹配結(jié)果;

5、將所述用戶發(fā)出的語音數(shù)據(jù)按預(yù)設(shè)方式進(jìn)行過濾,得到已過濾語音數(shù)據(jù);

6、將所述已過濾語音數(shù)據(jù)與所述初始節(jié)點(diǎn)信息匹配結(jié)果進(jìn)行匹配,得到所述已過濾語音數(shù)據(jù)對應(yīng)的目標(biāo)匹配結(jié)果。

7、在一實(shí)施方式中,所述將所述用戶發(fā)出的語音數(shù)據(jù)按預(yù)設(shè)方式進(jìn)行過濾,得到已過濾語音數(shù)據(jù),包括:

8、獲取所述用戶發(fā)出的語音數(shù)據(jù)與所述匹配樹中的節(jié)點(diǎn)的節(jié)點(diǎn)信息匹配過程中未匹配到的未匹配內(nèi)容;

9、將所述未匹配內(nèi)容與預(yù)設(shè)詞庫中的預(yù)設(shè)詞語進(jìn)行匹配,將匹配到的內(nèi)容進(jìn)行掩碼標(biāo)記;

10、將掩碼標(biāo)記的內(nèi)容進(jìn)行過濾,得到已過濾語音數(shù)據(jù)。

11、在一實(shí)施方式中,所述將所述未匹配內(nèi)容與預(yù)設(shè)詞庫中的預(yù)設(shè)詞語進(jìn)行匹配,將匹配到的內(nèi)容進(jìn)行掩碼標(biāo)記,包括:

12、將所述用戶發(fā)出的語音數(shù)據(jù)的預(yù)設(shè)位置的所述未匹配內(nèi)容,與預(yù)設(shè)詞庫中的預(yù)設(shè)詞語進(jìn)行匹配;

13、將匹配到的內(nèi)容進(jìn)行掩碼標(biāo)記;

14、其中所述預(yù)設(shè)位置至少包括以下位置之一:前綴位置、后綴位置、中間位置位置。

15、在一實(shí)施方式中,所述預(yù)設(shè)詞語包括口語化用詞。

16、在一實(shí)施方式中,所述將所述用戶發(fā)出的語音數(shù)據(jù)與根據(jù)所述場景數(shù)據(jù)生成的匹配樹中的節(jié)點(diǎn)的節(jié)點(diǎn)信息進(jìn)行匹配,得到所述用戶發(fā)出的語音數(shù)據(jù)對應(yīng)的初始節(jié)點(diǎn)信息匹配結(jié)果,包括:

17、遍歷根據(jù)所述場景數(shù)據(jù)生成的匹配樹,將所述用戶發(fā)出的語音數(shù)據(jù)與所述匹配樹中的非根節(jié)點(diǎn)及所述非根節(jié)點(diǎn)的父節(jié)點(diǎn)的節(jié)點(diǎn)信息進(jìn)行匹配,得到遍歷過程中的各個(gè)節(jié)點(diǎn)標(biāo)記的第一候選匹配結(jié)果;

18、對所述第一候選匹配結(jié)果進(jìn)行第一相似度計(jì)算,根據(jù)各個(gè)節(jié)點(diǎn)的第一匹配相似度,篩選出所述用戶發(fā)出的語音數(shù)據(jù)對應(yīng)的初始節(jié)點(diǎn)信息匹配結(jié)果。

19、在一實(shí)施方式中,所述將所述已過濾語音數(shù)據(jù)與所述初始節(jié)點(diǎn)信息匹配結(jié)果進(jìn)行匹配,得到所述已過濾語音數(shù)據(jù)對應(yīng)的目標(biāo)匹配結(jié)果,包括:

20、將所述已過濾語音數(shù)據(jù)與篩選出的位于第一預(yù)設(shè)排序位置的所述初始節(jié)點(diǎn)信息匹配結(jié)果進(jìn)行遍歷匹配,得到遍歷過程中的各個(gè)節(jié)點(diǎn)標(biāo)記的第二候選匹配結(jié)果;

21、對所述第二候選匹配結(jié)果進(jìn)行第二相似度計(jì)算,根據(jù)各個(gè)節(jié)點(diǎn)的第二匹配相似度,篩選出所述已過濾語音數(shù)據(jù)對應(yīng)的目標(biāo)匹配結(jié)果。

22、在一實(shí)施方式中,所述根據(jù)各個(gè)節(jié)點(diǎn)的第二匹配相似度,篩選出所述已過濾語音數(shù)據(jù)對應(yīng)的目標(biāo)匹配結(jié)果,包括:

23、從各個(gè)節(jié)點(diǎn)超過預(yù)設(shè)閾值的第二匹配相似度中,篩選出位于第二預(yù)設(shè)排序位置的第二匹配相似度所對應(yīng)的節(jié)點(diǎn)的第二候選匹配結(jié)果作為所述已過濾語音數(shù)據(jù)對應(yīng)的目標(biāo)匹配結(jié)果。

24、本技術(shù)第二方面提供一種智能座艙語音處理裝置,包括:

25、數(shù)據(jù)獲取模塊,用于獲取用戶發(fā)出的語音數(shù)據(jù)和座艙屏幕的場景數(shù)據(jù);

26、第一匹配模塊,用于將所述用戶發(fā)出的語音數(shù)據(jù)與根據(jù)所述場景數(shù)據(jù)生成的匹配樹中的節(jié)點(diǎn)的節(jié)點(diǎn)信息進(jìn)行匹配,得到所述用戶發(fā)出的語音數(shù)據(jù)對應(yīng)的初始節(jié)點(diǎn)信息匹配結(jié)果;

27、過濾處理模塊,用于將所述用戶發(fā)出的語音數(shù)據(jù)按預(yù)設(shè)方式進(jìn)行過濾,得到已過濾語音數(shù)據(jù);

28、第二匹配模塊,用于將所述已過濾語音數(shù)據(jù)與所述初始節(jié)點(diǎn)信息匹配結(jié)果進(jìn)行匹配,得到所述已過濾語音數(shù)據(jù)對應(yīng)的目標(biāo)匹配結(jié)果。

29、在一實(shí)施方式中,所述過濾處理模塊包括:

30、未匹配內(nèi)容獲取子模塊,用于獲取所述用戶發(fā)出的語音數(shù)據(jù)與所述匹配樹中的節(jié)點(diǎn)的節(jié)點(diǎn)信息匹配過程中未匹配到的未匹配內(nèi)容;

31、掩碼處理子模塊,用于將所述未匹配內(nèi)容與預(yù)設(shè)詞庫中的預(yù)設(shè)詞語進(jìn)行匹配,將匹配到的內(nèi)容進(jìn)行掩碼標(biāo)記;

32、過濾子模塊,用于將掩碼標(biāo)記的內(nèi)容進(jìn)行過濾,得到已過濾語音數(shù)據(jù)。

33、本技術(shù)第三方面提供一種智能座艙,包括如上所述的智能座艙語音處理裝置。

34、本技術(shù)第四方面提供一種智能汽車,包括:

35、處理器;以及

36、存儲器,其上存儲有可執(zhí)行代碼,當(dāng)所述可執(zhí)行代碼被所述處理器執(zhí)行時(shí),使所述處理器執(zhí)行如上所述的方法。

37、本技術(shù)第五方面提供一種計(jì)算機(jī)可讀存儲介質(zhì),其上存儲有可執(zhí)行代碼,當(dāng)所述可執(zhí)行代碼被電子設(shè)備的處理器執(zhí)行時(shí),使所述處理器執(zhí)行如上所述的方法。

38、本技術(shù)第六方面提供一種計(jì)算機(jī)程序產(chǎn)品,所述計(jì)算機(jī)程序產(chǎn)品包括計(jì)算機(jī)指令,所述計(jì)算機(jī)指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上所述的方法。

39、本技術(shù)提供的技術(shù)方案可以包括以下有益效果:

40、本技術(shù)技術(shù)方案,可以將用戶發(fā)出的語音數(shù)據(jù)與根據(jù)場景數(shù)據(jù)生成的匹配樹中的節(jié)點(diǎn)的節(jié)點(diǎn)信息進(jìn)行匹配,得到所述用戶發(fā)出的語音數(shù)據(jù)對應(yīng)的初始節(jié)點(diǎn)信息匹配結(jié)果;將所述用戶發(fā)出的語音數(shù)據(jù)按預(yù)設(shè)方式進(jìn)行過濾,得到已過濾語音數(shù)據(jù);將所述已過濾語音數(shù)據(jù)與所述初始節(jié)點(diǎn)信息匹配結(jié)果進(jìn)行匹配,得到所述已過濾語音數(shù)據(jù)對應(yīng)的目標(biāo)匹配結(jié)果。通過上述處理,本技術(shù)能夠在處理客戶端的場景數(shù)據(jù)信息時(shí),在第一次匹配例如初始節(jié)點(diǎn)信息匹配結(jié)果的基礎(chǔ)上,進(jìn)一步將所述用戶發(fā)出的語音數(shù)據(jù)按預(yù)設(shè)方式進(jìn)行過濾,減小一些語音用詞的干擾,然后再將已過濾語音數(shù)據(jù)與初始節(jié)點(diǎn)信息匹配結(jié)果再進(jìn)行匹配,獲得目標(biāo)匹配結(jié)果,就能提高匹配準(zhǔn)確度,能夠更準(zhǔn)確匹配出用戶期望命中的結(jié)果,提高為用戶匹配出期望命中的結(jié)果的成功率。

41、進(jìn)一步的,本技術(shù)技術(shù)方案可以獲取所述用戶發(fā)出的語音數(shù)據(jù)與所述匹配樹中的節(jié)點(diǎn)的節(jié)點(diǎn)信息匹配過程中未匹配到的未匹配內(nèi)容;將所述未匹配內(nèi)容與預(yù)設(shè)詞庫中的預(yù)設(shè)詞語進(jìn)行匹配,將匹配到的內(nèi)容進(jìn)行掩碼標(biāo)記;將掩碼標(biāo)記的內(nèi)容進(jìn)行過濾,得到已過濾語音數(shù)據(jù)。所述預(yù)設(shè)詞語可以包括口語化用詞等。本技術(shù)通過對口語化用詞等的上述處理,就可以實(shí)現(xiàn)對帶有口語化用詞的語音數(shù)據(jù)的兼容,提高對用戶發(fā)出的語音數(shù)據(jù)(語音輸入)的理解的泛化能力,這樣即使用戶發(fā)出的語音數(shù)據(jù)中帶有比較多的口語化用詞時(shí),也能準(zhǔn)確匹配出用戶期望命中的結(jié)果,提高為用戶匹配出期望命中的結(jié)果的成功率。

42、應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不能限制本技術(shù)。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1