一種基于AI的智能語(yǔ)音客服系統(tǒng)的制作方法

文檔序號(hào)：42321074發(fā)布日期：2025-07-01 19:37閱讀：5來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

本發(fā)明屬于ai與ivr領(lǐng)域，尤其是涉及一種基于ai的智能語(yǔ)音客服系統(tǒng)。

背景技術(shù)：

1、在電話語(yǔ)音客服系統(tǒng)中，人力成本一直是主要的開銷之一，如何把客服系統(tǒng)中的人力成本降低是一個(gè)值得研究的問(wèn)題。近幾年，隨著人工智能技術(shù)的發(fā)展，智能電話客服也逐步應(yīng)用到各個(gè)企業(yè)的客服系統(tǒng)中，用于代替部分人工客服并提高人工客服接聽(tīng)效率，另一方面現(xiàn)有的ai語(yǔ)音客服在ai語(yǔ)音輸出時(shí)無(wú)法及時(shí)響應(yīng)用戶的語(yǔ)音輸入，用戶無(wú)法打斷ai語(yǔ)音輸出，導(dǎo)致用戶體驗(yàn)不佳。

技術(shù)實(shí)現(xiàn)思路

1、本實(shí)施例的目的在于提供一種基于ai的智能語(yǔ)音客服系統(tǒng)，用于提高人工客服接聽(tīng)效率和解決ai語(yǔ)音輸出時(shí)無(wú)法及時(shí)響應(yīng)用戶的語(yǔ)音輸入，用戶無(wú)法打斷ai語(yǔ)音輸出的問(wèn)題。

2、一種基于ai的智能語(yǔ)音客服系統(tǒng)，包括：

3、實(shí)時(shí)語(yǔ)音輸入及實(shí)時(shí)打斷模塊：用于實(shí)時(shí)語(yǔ)音輸入與實(shí)時(shí)語(yǔ)音打斷，其中所述實(shí)時(shí)語(yǔ)音輸入包括接收語(yǔ)音流及執(zhí)行語(yǔ)音檢測(cè)指令，其中所述語(yǔ)音檢測(cè)指令包括活躍性檢測(cè)指令和非活躍性檢測(cè)指令，包括vad模塊檢測(cè)到n個(gè)連續(xù)音頻塊中存在70％以上的音頻塊為活躍語(yǔ)音塊，判定為活躍語(yǔ)音段開始；包括vad模塊檢測(cè)到n個(gè)連續(xù)音頻塊中存在70％以上的音頻塊為非活躍語(yǔ)音塊，判定為非活躍語(yǔ)音段開始；進(jìn)一步還包括執(zhí)行語(yǔ)音段延伸指令，所述語(yǔ)音段延伸指令包括將活躍語(yǔ)音段之前的t個(gè)語(yǔ)音塊和活躍語(yǔ)音塊之后的t個(gè)語(yǔ)音塊與活躍語(yǔ)音段前后連接組成輸入語(yǔ)音段；進(jìn)一步的還包括執(zhí)行網(wǎng)絡(luò)發(fā)送指令將所述輸入語(yǔ)音段發(fā)送tts模塊執(zhí)行語(yǔ)音轉(zhuǎn)文本指令；其中所述實(shí)時(shí)打斷模塊包括語(yǔ)音活躍段開始通知指令，當(dāng)實(shí)時(shí)語(yǔ)音輸入模塊檢測(cè)到活躍語(yǔ)音段開始，則發(fā)指令通知大模型輸出模塊，執(zhí)行大模型輸出停止指令，并發(fā)指令通知ai語(yǔ)音播放模塊，停止ai語(yǔ)音播放；

4、ivr模塊：用于接收用戶電話按鍵操作并解析按鍵數(shù)值，包括：dtmf解析模塊，用于解析dtmf信號(hào)作為用戶按鍵輸入和語(yǔ)音接收模塊，用于通過(guò)語(yǔ)音板卡的語(yǔ)音通道接收用戶語(yǔ)音數(shù)據(jù)；

5、系統(tǒng)狀態(tài)切換模塊：用于語(yǔ)音的vad檢測(cè)和dtmf狀態(tài)切換；

6、大語(yǔ)言模型輸出與實(shí)時(shí)語(yǔ)音合成模塊：用于大語(yǔ)言模型(llm)的輸出文字轉(zhuǎn)換為文字句子并由語(yǔ)音合成模塊逐句執(zhí)行語(yǔ)音合成輸出。

7、進(jìn)一步的，執(zhí)行語(yǔ)音檢測(cè)指令還包括如果先識(shí)別到活躍語(yǔ)音段開始，進(jìn)一步識(shí)別到非活躍語(yǔ)音段開始，則判定為活躍語(yǔ)音段結(jié)束。

8、進(jìn)一步的，t包括5，所述n包括10。

9、進(jìn)一步的，大模型輸出停止指令包括停止接收大模型輸出語(yǔ)句轉(zhuǎn)tts音頻指令和音頻音量強(qiáng)度遞降指令。

10、進(jìn)一步的，音頻音量強(qiáng)度遞降指令包括每次遞減音量為上次音量強(qiáng)度的50％。

11、進(jìn)一步的，vad模塊，包括python場(chǎng)景下的webrtcvad模塊。

12、進(jìn)一步的，ivr模塊還包括響應(yīng)用戶按鍵輸入dtmf字串檢測(cè)到結(jié)束按鍵時(shí)啟動(dòng)vad檢測(cè)線程。

13、進(jìn)一步的，系統(tǒng)狀態(tài)切換模塊還包括檢測(cè)dtmf輸入時(shí)切換接收dtmf延時(shí)解碼器用于執(zhí)行dtmf解碼。

14、進(jìn)一步的，大語(yǔ)言模型輸出還包括執(zhí)行自然語(yǔ)言斷句指令輸出獨(dú)立斷句句子，其中所述自然語(yǔ)言斷句指令包括python場(chǎng)景下的hanlp庫(kù)完成指令執(zhí)行。

15、進(jìn)一步的，實(shí)時(shí)語(yǔ)音合成模塊還包括根據(jù)獨(dú)立斷句句子執(zhí)行語(yǔ)音合成指令生成語(yǔ)音音頻。

16、本發(fā)明提供的一種基于ai的智能語(yǔ)音客服系統(tǒng)，用于解決人工客服接聽(tīng)效率低下及ai語(yǔ)音輸出時(shí)無(wú)法及時(shí)響應(yīng)用戶的語(yǔ)音輸入，用戶無(wú)法打斷ai語(yǔ)音輸出的問(wèn)題。

17、為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能更明顯易懂，下文特舉較佳實(shí)施例，并配合所附附圖，作詳細(xì)說(shuō)明如下。

技術(shù)特征：

1.一種基于ai的智能語(yǔ)音客服系統(tǒng)，其特征在于，包括：

2.根據(jù)權(quán)利要求1所述的ivr場(chǎng)景下的智能語(yǔ)音客服系統(tǒng)，其特征在于，所述執(zhí)行語(yǔ)音檢測(cè)指令還包括如果先識(shí)別到活躍語(yǔ)音段開始，進(jìn)一步識(shí)別到非活躍語(yǔ)音段開始，則判定為活躍語(yǔ)音段結(jié)束。

3.根據(jù)權(quán)利要求1所述的ivr場(chǎng)景下的智能語(yǔ)音客服系統(tǒng)，其特征在于，所述t包括5，所述n包括10。

4.根據(jù)權(quán)利要求1所述的ivr場(chǎng)景下的智能語(yǔ)音客服系統(tǒng)，其特征在于，所述大模型輸出停止指令包括停止接收大模型輸出語(yǔ)句轉(zhuǎn)tts音頻指令和音頻音量強(qiáng)度遞降指令。

5.根據(jù)權(quán)利要求4所述的ivr場(chǎng)景下的智能語(yǔ)音客服系統(tǒng)，其特征在于，所述音頻音量強(qiáng)度遞降指令包括每次遞減音量為上次音量強(qiáng)度的50％。

6.根據(jù)權(quán)利要求1所述的ivr場(chǎng)景下的智能語(yǔ)音客服系統(tǒng)，其特征在于，所述vad模塊，包括python場(chǎng)景下的webrtcvad模塊。

7.根據(jù)權(quán)利要求1所述的ivr場(chǎng)景下的智能語(yǔ)音客服系統(tǒng)，其特征在于，所述ivr模塊還包括響應(yīng)用戶按鍵輸入dtmf字串檢測(cè)到結(jié)束按鍵時(shí)啟動(dòng)vad檢測(cè)線程。

8.根據(jù)權(quán)利要求1所述的ivr場(chǎng)景下的智能語(yǔ)音客服系統(tǒng)，其特征在于，所述系統(tǒng)狀態(tài)切換模塊還包括檢測(cè)dtmf輸入時(shí)切換接收dtmf延時(shí)解碼器用于執(zhí)行dtmf解碼。

9.根據(jù)權(quán)利要求1所述的ivr場(chǎng)景下的智能語(yǔ)音客服系統(tǒng)，其特征在于，所述大語(yǔ)言模型輸出還包括執(zhí)行自然語(yǔ)言斷句指令輸出獨(dú)立斷句句子，其中所述自然語(yǔ)言斷句指令包括python場(chǎng)景下的hanlp庫(kù)完成指令執(zhí)行。

10.根據(jù)權(quán)利要求1和9所述的ivr場(chǎng)景下的智能語(yǔ)音客服系統(tǒng)，其特征在于，所述實(shí)時(shí)語(yǔ)音合成模塊還包括根據(jù)獨(dú)立斷句句子執(zhí)行語(yǔ)音合成指令生成語(yǔ)音音頻。

技術(shù)總結(jié)
本發(fā)明提供一種基于AI的智能語(yǔ)音客服系統(tǒng)，包括：實(shí)時(shí)語(yǔ)音輸入及實(shí)時(shí)打斷模塊：用于實(shí)時(shí)語(yǔ)音輸入與實(shí)時(shí)語(yǔ)音打斷，其中所述實(shí)時(shí)語(yǔ)音輸入包括接收語(yǔ)音流及執(zhí)行語(yǔ)音檢測(cè)指令，其中所述語(yǔ)音檢測(cè)指令包括活躍性檢測(cè)指令和非活躍性檢測(cè)指令，包括VAD模塊檢測(cè)到N個(gè)連續(xù)音頻塊中存在70％以上的音頻塊為活躍語(yǔ)音塊，判定為活躍語(yǔ)音段開始；包括VAD模塊檢測(cè)到N個(gè)連續(xù)音頻塊中存在70％以上的音頻塊為非活躍語(yǔ)音塊，判定為非活躍語(yǔ)音段開始；進(jìn)一步的還包括執(zhí)行網(wǎng)絡(luò)發(fā)送指令將所述輸入語(yǔ)音段發(fā)送TTS模塊執(zhí)行語(yǔ)音轉(zhuǎn)文本指令；其中所述實(shí)時(shí)打斷模塊包括語(yǔ)音活躍段開始通知指令；解決了人工客服接聽(tīng)效率低下及AI客服的AI語(yǔ)音輸出和活躍語(yǔ)音檢測(cè)切換卡頓問(wèn)題。

技術(shù)研發(fā)人員：胡海,李曉鵬
受保護(hù)的技術(shù)使用者：貴陽(yáng)朗瑪信息技術(shù)股份有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2025/6/30

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：胡海,李曉鵬
技術(shù)所有人：貴陽(yáng)朗瑪信息技術(shù)股份有限公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號(hào)處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測(cè)試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

欧美日韩啪啪,最新精品在线,国产ts一区二区,色亚洲一区二区,草草影院国产,久久国产99,欧美日韩四区

一種基于AI的智能語(yǔ)音客服系統(tǒng)的制作方法