欧美日韩啪啪,最新精品在线,国产ts一区二区,色亚洲一区二区,草草影院国产,久久国产99,欧美日韩四区

基于大語言模型和智能語音的口語問答評(píng)測方法及系統(tǒng)

文檔序號(hào):42327007發(fā)布日期:2025-07-01 19:46閱讀:10來源:國知局

本發(fā)明涉及人工智能,特別是涉及一種基于大語言模型和智能語音的口語問答評(píng)測方法及系統(tǒng)。


背景技術(shù):

1、口語是人類最直接也是最常用的交流方式??谡Z表達(dá)能力,無論在工作中還是在日常生活中,都很重要。良好的口語表達(dá)能力,能夠有效地、準(zhǔn)確地傳達(dá)信息,從提高溝通效率。此外,隨著全球化一體化的到來,掌握一種或幾種外語,對(duì)專業(yè)人員而言,也是非常必要的。

2、掌握一種語言不是一件容易的事。一種語言的讀和寫的技能,經(jīng)過較長時(shí)間的學(xué)習(xí),一般能達(dá)到較好的效果。然而,對(duì)于口語表達(dá)能力,提高的過程卻尤為費(fèi)時(shí)費(fèi)力。究其原因,一種語言的讀和寫的學(xué)習(xí),是可以一個(gè)人獨(dú)立完成的;而口語能力的提高,則需要一種交互式的學(xué)習(xí)環(huán)境,比如一對(duì)一的口語指導(dǎo)訓(xùn)練。

3、在當(dāng)前的學(xué)習(xí)環(huán)境和條件下,一種語言的學(xué)習(xí),尤其是外語的學(xué)習(xí),交互式的學(xué)習(xí)環(huán)境主要在課堂上實(shí)現(xiàn);而在課后,一般無法提供交互式的學(xué)習(xí)環(huán)境。交互式的學(xué)習(xí)環(huán)境的缺乏,導(dǎo)致了這樣一種結(jié)果:即使經(jīng)過長時(shí)間的學(xué)習(xí),口語表達(dá)能力仍難有實(shí)質(zhì)性的提高,甚至無法進(jìn)行一些基本的日常交流。

4、跟語言學(xué)習(xí)相關(guān)的現(xiàn)有技術(shù)和方法,多是關(guān)于發(fā)音評(píng)測、糾正、評(píng)分等,并沒有一種用于綜合評(píng)測口語表達(dá)能力的方法和技術(shù),也沒有根據(jù)口語表達(dá)能力的綜合評(píng)測結(jié)果進(jìn)行針對(duì)性地訓(xùn)練和提高的方法和技術(shù)。

5、經(jīng)過近百年的發(fā)展,語音分析和識(shí)別技術(shù)日臻成熟;隨著計(jì)算機(jī)信息技術(shù)和人工智能的迅速發(fā)展,文本文件分析技術(shù)和語音合成技術(shù)也取得了長足的發(fā)展。這些新技術(shù)的突破,使得用于評(píng)測和強(qiáng)化口語表達(dá)能力的交互式的方法和技術(shù)成為可能。

6、現(xiàn)有的口語學(xué)習(xí)系統(tǒng),有的是基于標(biāo)準(zhǔn)作答庫的對(duì)話式口語學(xué)習(xí),根據(jù)學(xué)習(xí)者問話內(nèi)容去標(biāo)準(zhǔn)作答庫中直接匹配作答內(nèi)容,將匹配出的作答內(nèi)容語音輸出,這種對(duì)話方式智能性差,若是在標(biāo)準(zhǔn)作答庫中未匹配到,則無法繼續(xù)進(jìn)行對(duì)話。有的是自由式口語學(xué)習(xí),這種實(shí)現(xiàn)方式無法對(duì)對(duì)話進(jìn)行監(jiān)控,在用戶說不出來時(shí)無法對(duì)用戶進(jìn)行提醒?,F(xiàn)有的口語學(xué)習(xí)系統(tǒng)設(shè)計(jì)粗略,并未考慮到多種情況使得情況不同進(jìn)行不同的作答模式。

7、現(xiàn)有公開了申請(qǐng)?zhí)枮?023105853137、名稱為基于大語言模型的口語學(xué)習(xí)方法、裝置的發(fā)明專利,全稱采用的都是基于大語言模型的自由對(duì)話方式,并未考慮到其他對(duì)話方式的融合,也無法實(shí)現(xiàn)對(duì)整個(gè)對(duì)話過程進(jìn)行監(jiān)控,引導(dǎo)用戶說出對(duì)應(yīng)的對(duì)話。


技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明針對(duì)現(xiàn)有技術(shù)存在的問題和不足,提供一種基于大語言模型和智能語音的口語問答評(píng)測方法及系統(tǒng)。

2、本發(fā)明是通過下述技術(shù)方案來解決上述技術(shù)問題的:

3、本發(fā)明提供一種基于大語言模型和智能語音的口語問答評(píng)測方法,其特點(diǎn)在于,其包括以下步驟:

4、s1、口語評(píng)測者輸入目標(biāo)口語對(duì)話場景及所扮場景角色,調(diào)用目標(biāo)口語對(duì)話場景對(duì)應(yīng)的場景大語言模型作為目標(biāo)場景大語言模型,每個(gè)口語對(duì)話場景均對(duì)應(yīng)一個(gè)場景大語言模型,場景大語言模型為利用相應(yīng)口語對(duì)話場景的口語對(duì)話進(jìn)行深度學(xué)習(xí)而構(gòu)建的大語言模型;

5、s2、對(duì)口語評(píng)測者當(dāng)前輸入的模擬口語語音信號(hào)轉(zhuǎn)換為數(shù)字格式的口語語音信號(hào),并生成原始口語語音文件,利用語音識(shí)別技術(shù)生成原始文本文件;

6、s3、判斷當(dāng)前原始文本文件是否是固定式問答句,若是則進(jìn)入s4,否則進(jìn)入s5;

7、s4、確定虛擬機(jī)器人作答模式為標(biāo)準(zhǔn)作答模式,從標(biāo)準(zhǔn)作答庫中匹配出與當(dāng)前原始文本文件對(duì)應(yīng)的標(biāo)準(zhǔn)作答文本,并利用語音合成技術(shù)生成標(biāo)準(zhǔn)作答語音文件由虛擬機(jī)器人語音輸出,進(jìn)入s8;

8、s5、判斷當(dāng)前原始文本文件是否是初次非固定式問答句,若是則進(jìn)入s6,否則進(jìn)入s7;

9、s6、基于當(dāng)前原始文本文件分析出口語評(píng)測者的口語水平等級(jí),進(jìn)入s7;

10、s7、基于原始文本文件確定作答模式,在確定的作答模式為標(biāo)準(zhǔn)作答模式時(shí),從標(biāo)準(zhǔn)作答庫中匹配出與當(dāng)前原始文本文件對(duì)應(yīng)的口語水平等級(jí)的標(biāo)準(zhǔn)作答文本,并利用語音合成技術(shù)生成標(biāo)準(zhǔn)作答語音文件由虛擬機(jī)器人語音輸出,進(jìn)入s8,在確定的作答模式為調(diào)取作答模式時(shí),調(diào)用目標(biāo)場景大語言模型調(diào)取系統(tǒng)可獲得實(shí)時(shí)作答內(nèi)容并生成對(duì)應(yīng)口語水平等級(jí)的含有實(shí)時(shí)作答內(nèi)容的調(diào)取作答文本,并利用語音合成技術(shù)生成調(diào)取作答語音文件由虛擬機(jī)器人語音輸出,進(jìn)入s8,在確定的作答模式為自由作答模式時(shí),調(diào)用目標(biāo)場景大語言模型針對(duì)當(dāng)前原始文本文件生成對(duì)應(yīng)口語水平等級(jí)的自由作答文本,并利用語音合成技術(shù)生成自由作答語音文件由虛擬機(jī)器人語音輸出,進(jìn)入s8;

11、s8、調(diào)用目標(biāo)場景大語言模型,對(duì)虛擬機(jī)器人和口語評(píng)測者的所有口語問答進(jìn)行監(jiān)控,分析口語問答是否結(jié)束,若否則進(jìn)入s9,若是則進(jìn)入s10;

12、s9、監(jiān)控到口語評(píng)測者下一個(gè)作答則進(jìn)入s2;

13、s10、針對(duì)此次口語問答進(jìn)行評(píng)測,輸出口語評(píng)測者的口語評(píng)測分。

14、本發(fā)明還提供一種基于大語言模型和智能語音的口語問答評(píng)測系統(tǒng),其特點(diǎn)在于,其包括口語輸入模塊、文件生成模塊、第一判斷模塊、第一確定模塊、第二判斷模塊、口語水平分析模塊、第二確定模塊、口語結(jié)束分析模塊、口語監(jiān)控模塊和口語評(píng)測模塊;

15、所述口語輸入模塊用于供口語評(píng)測者輸入目標(biāo)口語對(duì)話場景及所扮場景角色,調(diào)用目標(biāo)口語對(duì)話場景對(duì)應(yīng)的場景大語言模型作為目標(biāo)場景大語言模型,每個(gè)口語對(duì)話場景均對(duì)應(yīng)一個(gè)場景大語言模型,場景大語言模型為利用相應(yīng)口語對(duì)話場景的口語對(duì)話進(jìn)行深度學(xué)習(xí)而構(gòu)建的大語言模型;

16、所述文件生成模塊用于對(duì)口語評(píng)測者當(dāng)前輸入的模擬口語語音信號(hào)轉(zhuǎn)換為數(shù)字格式的口語語音信號(hào),并生成原始口語語音文件,利用語音識(shí)別技術(shù)生成原始文本文件;

17、所述第一判斷模塊用于判斷當(dāng)前原始文本文件是否是固定式問答句,在為是時(shí)調(diào)用第一確定模塊,否則調(diào)用第二判斷模塊;

18、所述第一確定模塊用于確定虛擬機(jī)器人作答模式為標(biāo)準(zhǔn)作答模式,從標(biāo)準(zhǔn)作答庫中匹配出與當(dāng)前原始文本文件對(duì)應(yīng)的標(biāo)準(zhǔn)作答文本,并利用語音合成技術(shù)生成標(biāo)準(zhǔn)作答語音文件由虛擬機(jī)器人語音輸出,調(diào)用口語結(jié)束分析模塊;

19、所述第二判斷模塊用于判斷當(dāng)前原始文本文件是否是初次非固定式問答句,若是則調(diào)用口語水平分析模塊,否則調(diào)用第二確定模塊;

20、所述口語水平分析模塊用于基于當(dāng)前原始文本文件分析出口語評(píng)測者的口語水平等級(jí),調(diào)用第二確定模塊;

21、所述第二確定模塊用于基于原始文本文件確定作答模式,在確定的作答模式為標(biāo)準(zhǔn)作答模式時(shí),從標(biāo)準(zhǔn)作答庫中匹配出與當(dāng)前原始文本文件對(duì)應(yīng)的口語水平等級(jí)的標(biāo)準(zhǔn)作答文本,并利用語音合成技術(shù)生成標(biāo)準(zhǔn)作答語音文件由虛擬機(jī)器人語音輸出,調(diào)用口語結(jié)束分析模塊,在確定的作答模式為調(diào)取作答模式時(shí),調(diào)用目標(biāo)場景大語言模型調(diào)取系統(tǒng)可獲得實(shí)時(shí)作答內(nèi)容并生成對(duì)應(yīng)口語水平等級(jí)的含有實(shí)時(shí)作答內(nèi)容的調(diào)取作答文本,并利用語音合成技術(shù)生成調(diào)取作答語音文件由虛擬機(jī)器人語音輸出,調(diào)用口語結(jié)束分析模塊,在確定的作答模式為自由作答模式時(shí),調(diào)用目標(biāo)場景大語言模型針對(duì)當(dāng)前原始文本文件生成對(duì)應(yīng)口語水平等級(jí)的自由作答文本,并利用語音合成技術(shù)生成自由作答語音文件由虛擬機(jī)器人語音輸出,調(diào)用口語結(jié)束分析模塊;

22、所述口語結(jié)束分析模塊用于調(diào)用目標(biāo)場景大語言模型,對(duì)虛擬機(jī)器人和口語評(píng)測者的所有口語問答進(jìn)行監(jiān)控,分析口語問答是否結(jié)束,若否則調(diào)用口語監(jiān)控模塊,若是則調(diào)用口語評(píng)測模塊;

23、所述口語監(jiān)控模塊用于監(jiān)控到口語評(píng)測者下一個(gè)作答則調(diào)用文件生成模塊;

24、所述口語評(píng)測模塊用于針對(duì)此次口語問答進(jìn)行評(píng)測,輸出口語評(píng)測者的口語評(píng)測分。

25、本發(fā)明的積極進(jìn)步效果在于:

26、本發(fā)明設(shè)計(jì)的基于大語言模型和智能語音的口語問答評(píng)測方法及系統(tǒng),融合了多種口語作答模式,將口語作答模式劃分為三種模式分別為:標(biāo)準(zhǔn)作答模式、調(diào)取作答模式和自由作答模式,根據(jù)口語評(píng)測者輸入的口語內(nèi)容確定進(jìn)入對(duì)應(yīng)的模式,能夠靈活調(diào)用不同的作答模式,更快地輸出對(duì)應(yīng)的作答語音內(nèi)容。

27、本發(fā)明能夠?qū)φ麄€(gè)對(duì)話過程進(jìn)行監(jiān)控,引導(dǎo)口語評(píng)測者說出對(duì)應(yīng)的口語對(duì)話內(nèi)容,從而提高口語評(píng)測者的口語水平。

28、本發(fā)明能夠準(zhǔn)確地分析出口語評(píng)測者的口語水平等級(jí),使得整個(gè)對(duì)話符合口語評(píng)測者的口語水平等級(jí),有利于提高口語評(píng)測者的口語水平。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1