智能座艙語音處理方法、裝置、座艙、汽車及存儲介質(zhì)與流程

文檔序號：42325584發(fā)布日期：2025-07-01 19:43閱讀：10來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

本技術(shù)涉及自動駕駛，尤其涉及一種智能座艙語音處理方法、裝置、座艙、汽車及存儲介質(zhì)和程序產(chǎn)品。

背景技術(shù)：

1、隨著自動駕駛技術(shù)及智能車聯(lián)網(wǎng)技術(shù)的不斷發(fā)展，智能汽車中智能座艙提供的功能也更加豐富。智能汽車的智能座艙中，可以為用戶提供可見即可說功能，輔助用戶和屏幕進(jìn)行交互，用戶通過語音可以對智能座艙相關(guān)設(shè)備進(jìn)行操作。

2、智能座艙提供的可見即可說功能，可以采用nlu（natural?languageunderstanding，自然語言理解）算法。nlu算法獲取客戶端上傳的場景數(shù)據(jù)，通過場景數(shù)據(jù)中的節(jié)點(diǎn)的label（標(biāo)簽）與用戶發(fā)出的語音數(shù)據(jù)進(jìn)行匹配，從而獲得期望命中的結(jié)果，進(jìn)一步根據(jù)命中結(jié)果執(zhí)行相應(yīng)交互處理。相關(guān)技術(shù)提供的智能座艙語音處理方法，目前只能限于對用戶發(fā)出的語音數(shù)據(jù)與場景數(shù)據(jù)中的label進(jìn)行相似度的匹配。但是，用戶發(fā)出的語音數(shù)據(jù)，有可能是不規(guī)范的語音指令，例如帶有一些口語化用詞。這些口語化用詞的存在，影響了用戶發(fā)出的語音數(shù)據(jù)與場景數(shù)據(jù)中的label的匹配的相似度，對成功匹配召回屏幕中的元素帶來一定的干擾，降低了命中結(jié)果的命中成功率。例如圖1中，智能座艙的車機(jī)大屏的屏幕中存在歌曲列表元素，當(dāng)用戶發(fā)出“播放菊花臺”的語音數(shù)據(jù)時(shí)，通過相關(guān)技術(shù)可以命中屏幕中的歌曲“菊花臺”；當(dāng)用戶發(fā)出“請幫我播放菊花臺吧”的語音數(shù)據(jù)時(shí)，由于用戶發(fā)出的語音數(shù)據(jù)中帶有比較多的語氣詞等口語化用詞的內(nèi)容，降低了整體的語音數(shù)據(jù)與label的匹配度，則無法命中用戶期望命中的元素，導(dǎo)致匹配召回的失敗。

3、因此，相關(guān)技術(shù)中的智能座艙語音處理方法，需要進(jìn)一步提高為用戶匹配出期望命中的結(jié)果的成功率。

技術(shù)實(shí)現(xiàn)思路

1、為解決或部分解決相關(guān)技術(shù)中存在的問題，本技術(shù)提供一種智能座艙語音處理方法、裝置、座艙、汽車及存儲介質(zhì)和程序產(chǎn)品，能夠更準(zhǔn)確匹配出用戶期望命中的結(jié)果，提高為用戶匹配出期望命中的結(jié)果的成功率。

2、本技術(shù)第一方面提供一種智能座艙語音處理方法，包括：

3、獲取用戶發(fā)出的語音數(shù)據(jù)和座艙屏幕的場景數(shù)據(jù)；

4、將所述用戶發(fā)出的語音數(shù)據(jù)與根據(jù)所述場景數(shù)據(jù)生成的匹配樹中的節(jié)點(diǎn)的節(jié)點(diǎn)信息進(jìn)行匹配，得到所述用戶發(fā)出的語音數(shù)據(jù)對應(yīng)的初始節(jié)點(diǎn)信息匹配結(jié)果；

5、將所述用戶發(fā)出的語音數(shù)據(jù)按預(yù)設(shè)方式進(jìn)行過濾，得到已過濾語音數(shù)據(jù)；

6、將所述已過濾語音數(shù)據(jù)與所述初始節(jié)點(diǎn)信息匹配結(jié)果進(jìn)行匹配，得到所述已過濾語音數(shù)據(jù)對應(yīng)的目標(biāo)匹配結(jié)果。

7、在一實(shí)施方式中，所述將所述用戶發(fā)出的語音數(shù)據(jù)按預(yù)設(shè)方式進(jìn)行過濾，得到已過濾語音數(shù)據(jù)，包括：

8、獲取所述用戶發(fā)出的語音數(shù)據(jù)與所述匹配樹中的節(jié)點(diǎn)的節(jié)點(diǎn)信息匹配過程中未匹配到的未匹配內(nèi)容；

9、將所述未匹配內(nèi)容與預(yù)設(shè)詞庫中的預(yù)設(shè)詞語進(jìn)行匹配，將匹配到的內(nèi)容進(jìn)行掩碼標(biāo)記；

10、將掩碼標(biāo)記的內(nèi)容進(jìn)行過濾，得到已過濾語音數(shù)據(jù)。

11、在一實(shí)施方式中，所述將所述未匹配內(nèi)容與預(yù)設(shè)詞庫中的預(yù)設(shè)詞語進(jìn)行匹配，將匹配到的內(nèi)容進(jìn)行掩碼標(biāo)記，包括：

12、將所述用戶發(fā)出的語音數(shù)據(jù)的預(yù)設(shè)位置的所述未匹配內(nèi)容，與預(yù)設(shè)詞庫中的預(yù)設(shè)詞語進(jìn)行匹配；

13、將匹配到的內(nèi)容進(jìn)行掩碼標(biāo)記；

14、其中所述預(yù)設(shè)位置至少包括以下位置之一：前綴位置、后綴位置、中間位置位置。

15、在一實(shí)施方式中，所述預(yù)設(shè)詞語包括口語化用詞。

16、在一實(shí)施方式中，所述將所述用戶發(fā)出的語音數(shù)據(jù)與根據(jù)所述場景數(shù)據(jù)生成的匹配樹中的節(jié)點(diǎn)的節(jié)點(diǎn)信息進(jìn)行匹配，得到所述用戶發(fā)出的語音數(shù)據(jù)對應(yīng)的初始節(jié)點(diǎn)信息匹配結(jié)果，包括：

17、遍歷根據(jù)所述場景數(shù)據(jù)生成的匹配樹，將所述用戶發(fā)出的語音數(shù)據(jù)與所述匹配樹中的非根節(jié)點(diǎn)及所述非根節(jié)點(diǎn)的父節(jié)點(diǎn)的節(jié)點(diǎn)信息進(jìn)行匹配，得到遍歷過程中的各個(gè)節(jié)點(diǎn)標(biāo)記的第一候選匹配結(jié)果；

18、對所述第一候選匹配結(jié)果進(jìn)行第一相似度計(jì)算，根據(jù)各個(gè)節(jié)點(diǎn)的第一匹配相似度，篩選出所述用戶發(fā)出的語音數(shù)據(jù)對應(yīng)的初始節(jié)點(diǎn)信息匹配結(jié)果。

19、在一實(shí)施方式中，所述將所述已過濾語音數(shù)據(jù)與所述初始節(jié)點(diǎn)信息匹配結(jié)果進(jìn)行匹配，得到所述已過濾語音數(shù)據(jù)對應(yīng)的目標(biāo)匹配結(jié)果，包括：

20、將所述已過濾語音數(shù)據(jù)與篩選出的位于第一預(yù)設(shè)排序位置的所述初始節(jié)點(diǎn)信息匹配結(jié)果進(jìn)行遍歷匹配，得到遍歷過程中的各個(gè)節(jié)點(diǎn)標(biāo)記的第二候選匹配結(jié)果；

21、對所述第二候選匹配結(jié)果進(jìn)行第二相似度計(jì)算，根據(jù)各個(gè)節(jié)點(diǎn)的第二匹配相似度，篩選出所述已過濾語音數(shù)據(jù)對應(yīng)的目標(biāo)匹配結(jié)果。

22、在一實(shí)施方式中，所述根據(jù)各個(gè)節(jié)點(diǎn)的第二匹配相似度，篩選出所述已過濾語音數(shù)據(jù)對應(yīng)的目標(biāo)匹配結(jié)果，包括：

23、從各個(gè)節(jié)點(diǎn)超過預(yù)設(shè)閾值的第二匹配相似度中，篩選出位于第二預(yù)設(shè)排序位置的第二匹配相似度所對應(yīng)的節(jié)點(diǎn)的第二候選匹配結(jié)果作為所述已過濾語音數(shù)據(jù)對應(yīng)的目標(biāo)匹配結(jié)果。

24、本技術(shù)第二方面提供一種智能座艙語音處理裝置，包括：

25、數(shù)據(jù)獲取模塊，用于獲取用戶發(fā)出的語音數(shù)據(jù)和座艙屏幕的場景數(shù)據(jù)；

26、第一匹配模塊，用于將所述用戶發(fā)出的語音數(shù)據(jù)與根據(jù)所述場景數(shù)據(jù)生成的匹配樹中的節(jié)點(diǎn)的節(jié)點(diǎn)信息進(jìn)行匹配，得到所述用戶發(fā)出的語音數(shù)據(jù)對應(yīng)的初始節(jié)點(diǎn)信息匹配結(jié)果；

27、過濾處理模塊，用于將所述用戶發(fā)出的語音數(shù)據(jù)按預(yù)設(shè)方式進(jìn)行過濾，得到已過濾語音數(shù)據(jù)；

28、第二匹配模塊，用于將所述已過濾語音數(shù)據(jù)與所述初始節(jié)點(diǎn)信息匹配結(jié)果進(jìn)行匹配，得到所述已過濾語音數(shù)據(jù)對應(yīng)的目標(biāo)匹配結(jié)果。

29、在一實(shí)施方式中，所述過濾處理模塊包括：

30、未匹配內(nèi)容獲取子模塊，用于獲取所述用戶發(fā)出的語音數(shù)據(jù)與所述匹配樹中的節(jié)點(diǎn)的節(jié)點(diǎn)信息匹配過程中未匹配到的未匹配內(nèi)容；

31、掩碼處理子模塊，用于將所述未匹配內(nèi)容與預(yù)設(shè)詞庫中的預(yù)設(shè)詞語進(jìn)行匹配，將匹配到的內(nèi)容進(jìn)行掩碼標(biāo)記；

32、過濾子模塊，用于將掩碼標(biāo)記的內(nèi)容進(jìn)行過濾，得到已過濾語音數(shù)據(jù)。

33、本技術(shù)第三方面提供一種智能座艙，包括如上所述的智能座艙語音處理裝置。

34、本技術(shù)第四方面提供一種智能汽車，包括：

35、處理器；以及

36、存儲器，其上存儲有可執(zhí)行代碼，當(dāng)所述可執(zhí)行代碼被所述處理器執(zhí)行時(shí)，使所述處理器執(zhí)行如上所述的方法。

37、本技術(shù)第五方面提供一種計(jì)算機(jī)可讀存儲介質(zhì)，其上存儲有可執(zhí)行代碼，當(dāng)所述可執(zhí)行代碼被電子設(shè)備的處理器執(zhí)行時(shí)，使所述處理器執(zhí)行如上所述的方法。

38、本技術(shù)第六方面提供一種計(jì)算機(jī)程序產(chǎn)品，所述計(jì)算機(jī)程序產(chǎn)品包括計(jì)算機(jī)指令，所述計(jì)算機(jī)指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上所述的方法。

39、本技術(shù)提供的技術(shù)方案可以包括以下有益效果：

40、本技術(shù)技術(shù)方案，可以將用戶發(fā)出的語音數(shù)據(jù)與根據(jù)場景數(shù)據(jù)生成的匹配樹中的節(jié)點(diǎn)的節(jié)點(diǎn)信息進(jìn)行匹配，得到所述用戶發(fā)出的語音數(shù)據(jù)對應(yīng)的初始節(jié)點(diǎn)信息匹配結(jié)果；將所述用戶發(fā)出的語音數(shù)據(jù)按預(yù)設(shè)方式進(jìn)行過濾，得到已過濾語音數(shù)據(jù)；將所述已過濾語音數(shù)據(jù)與所述初始節(jié)點(diǎn)信息匹配結(jié)果進(jìn)行匹配，得到所述已過濾語音數(shù)據(jù)對應(yīng)的目標(biāo)匹配結(jié)果。通過上述處理，本技術(shù)能夠在處理客戶端的場景數(shù)據(jù)信息時(shí)，在第一次匹配例如初始節(jié)點(diǎn)信息匹配結(jié)果的基礎(chǔ)上，進(jìn)一步將所述用戶發(fā)出的語音數(shù)據(jù)按預(yù)設(shè)方式進(jìn)行過濾，減小一些語音用詞的干擾，然后再將已過濾語音數(shù)據(jù)與初始節(jié)點(diǎn)信息匹配結(jié)果再進(jìn)行匹配，獲得目標(biāo)匹配結(jié)果，就能提高匹配準(zhǔn)確度，能夠更準(zhǔn)確匹配出用戶期望命中的結(jié)果，提高為用戶匹配出期望命中的結(jié)果的成功率。

41、進(jìn)一步的，本技術(shù)技術(shù)方案可以獲取所述用戶發(fā)出的語音數(shù)據(jù)與所述匹配樹中的節(jié)點(diǎn)的節(jié)點(diǎn)信息匹配過程中未匹配到的未匹配內(nèi)容；將所述未匹配內(nèi)容與預(yù)設(shè)詞庫中的預(yù)設(shè)詞語進(jìn)行匹配，將匹配到的內(nèi)容進(jìn)行掩碼標(biāo)記；將掩碼標(biāo)記的內(nèi)容進(jìn)行過濾，得到已過濾語音數(shù)據(jù)。所述預(yù)設(shè)詞語可以包括口語化用詞等。本技術(shù)通過對口語化用詞等的上述處理，就可以實(shí)現(xiàn)對帶有口語化用詞的語音數(shù)據(jù)的兼容，提高對用戶發(fā)出的語音數(shù)據(jù)（語音輸入）的理解的泛化能力，這樣即使用戶發(fā)出的語音數(shù)據(jù)中帶有比較多的口語化用詞時(shí)，也能準(zhǔn)確匹配出用戶期望命中的結(jié)果，提高為用戶匹配出期望命中的結(jié)果的成功率。

42、應(yīng)當(dāng)理解的是，以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的，并不能限制本技術(shù)。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：滿孝增,郭夢雪,王文杰,王伊雪
技術(shù)所有人：廣州小鵬汽車科技有限公司
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

欧美日韩啪啪,最新精品在线,国产ts一区二区,色亚洲一区二区,草草影院国产,久久国产99,欧美日韩四区

智能座艙語音處理方法、裝置、座艙、汽車及存儲介質(zhì)與流程

智能座艙語音處理方法、裝置、座艙、汽車及存儲介質(zhì)與流程