本發(fā)明屬于直播數(shù)據(jù)分析,具體的說是一種觸發(fā)平臺算法預(yù)設(shè)值點位的方法。
背景技術(shù):
1、網(wǎng)絡(luò)直播是現(xiàn)在較為主流的一種媒體表現(xiàn)形式,在直播過程中,可能會存在一些違法行為,進而導致觀眾存在不適;而觀眾參與直播時,會與直播間產(chǎn)生互動,包括發(fā)送彈幕以及連線等,均可能會出現(xiàn)違禁詞或是侵犯他人知識產(chǎn)權(quán)等行為,因此在當前的直播環(huán)境中,需要嚴格規(guī)范直播環(huán)境;觸發(fā)平臺算法可以理解為基于預(yù)設(shè)條件自動執(zhí)行特定操作的算法。
2、現(xiàn)有技術(shù)中,對于違禁詞或違規(guī)行為一般是通過采集直播視頻中的單一模態(tài)特征來與已知的違規(guī)行為來進行比對,從而實現(xiàn)規(guī)范直播環(huán)境的目的,比如電商直播中,主播正在展示一款紅色商品,同時背景中有文字描述;此時,主播無意中說出了一句與違規(guī)詞匯相似但不違規(guī)的句子,按照現(xiàn)有技術(shù)中單模態(tài)特征向量計算,會產(chǎn)生潛在誤判,如下:
3、針對視頻模態(tài),系統(tǒng)提取視頻中的顏色、形狀等特征,生成了視頻特征向量,利用該視頻特征向量與預(yù)設(shè)的違規(guī)畫面特征向量(如違禁品圖案)進行相似度計算,由于商品顏色與某違禁品的顏色特征相似,盡管形狀等其他特征不匹配,但單模態(tài)相似度計算可能因顏色特征的較高權(quán)重而誤判為違規(guī)畫面;針對音頻模態(tài),系統(tǒng)提取了音頻中的頻譜、音調(diào)等特征,生成了音頻特征向量,利用該音頻特征向量與預(yù)設(shè)的違規(guī)音頻特征向量進行相似度計算,主播說出的句子與某違規(guī)詞匯在音調(diào)、時長上相似,盡管具體詞匯不同,但單模態(tài)相似度計算可能因這些相似特征而誤判為違規(guī)音頻;針對文本模態(tài),系統(tǒng)提取了背景文字中的詞頻、情感傾向等特征,生成了文本特征向量,利用該文本特征向量與預(yù)設(shè)的違規(guī)文本特征向量進行相似度計算,背景文字中某些詞匯與違規(guī)文本中的詞匯相似,盡管整體語境不同,但單模態(tài)相似度計算可能因這些相似詞匯而誤判為違規(guī)文本,基于上述,單模態(tài)特征向量僅考慮了某一模態(tài)的信息,忽略了其他模態(tài)的互補信息,導致在特征相似但不完全匹配時容易產(chǎn)生誤判;
4、為此,本發(fā)明提供一種觸發(fā)平臺算法預(yù)設(shè)值點位的方法。
技術(shù)實現(xiàn)思路
1、為了彌補現(xiàn)有技術(shù)的不足,解決背景技術(shù)中所提出的至少一個技術(shù)問題。
2、本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:本發(fā)明所述的一種觸發(fā)平臺算法預(yù)設(shè)值點位的方法,包括以下步驟:
3、s1:根據(jù)直播風險類型設(shè)置差異化規(guī)則庫,所述差異化規(guī)則庫用于存儲對應(yīng)于不同直播風險類型的權(quán)重;
4、s2:數(shù)據(jù)采集及預(yù)處理,包括視頻數(shù)據(jù)、音頻數(shù)據(jù)以及文本數(shù)據(jù)采集及預(yù)處理;
5、s3:特征提取,從預(yù)處理后的視頻數(shù)據(jù)、音頻數(shù)據(jù)以及文本數(shù)據(jù)中分別提取視頻特征、音頻特征以及文本特征;
6、s4:權(quán)重分配,基于差異化規(guī)則庫中存儲的權(quán)重,為視頻、音頻及文本特征分配動態(tài)權(quán)重;
7、s5:多模態(tài)融合,將提取到的視頻、音頻及文本特征表示為特征向量、、,并基于權(quán)重進行加權(quán)融合;
8、s6:算法預(yù)設(shè)點位觸發(fā)判斷,包括:
9、將預(yù)設(shè)點位表示為預(yù)設(shè)特征向量;
10、計算融合特征向量與預(yù)設(shè)特征向量的相似度;
11、設(shè)定第一閾值,若
12、,則觸發(fā)預(yù)設(shè)點位,否則未觸發(fā)。
13、優(yōu)選的,所述視頻數(shù)據(jù)采集及預(yù)處理的方法為:實時采集直播視頻流,按固定幀率提取視頻幀,得到視頻幀序列;對視頻幀的分辨率調(diào)整統(tǒng)一,再對圖像進行去噪處理;
14、所述音頻數(shù)據(jù)采集及預(yù)處理的方法為:同步錄制直播音頻流,獲取連續(xù)的音頻信號;對音頻信號進行去噪,再將音頻信號進行分幀、加窗處理,得到音頻信號序列;
15、所述文本數(shù)據(jù)采集及預(yù)處理的方法為:抓取直播字幕、彈幕文本信息,對文本進行分詞處理,得到詞語單元,并對每個詞語標注詞性,得到文本信息序列。
16、優(yōu)選的,基于所述權(quán)重進行加權(quán)融合的方法為:
17、識別直播風險類型,基于差異化規(guī)則庫獲取差異化權(quán)重分配 、 、;
18、根據(jù)公式:
19、
20、其中,;為任一直播類型;
21、根據(jù)公式,計算得到融合特征向量;
22、計算融合特征向量與預(yù)設(shè)特征向量的相似度的方法為:
23、
24、根據(jù)公式,計算得到融合特征向量與預(yù)設(shè)特征向量的相似度。
25、優(yōu)選的,計算所述相似度的方法還包括:
26、設(shè)定時間窗口;
27、計算時間窗口內(nèi)的累積特征向量,表達為:
28、
29、其中,表示時刻的融合特征向量;
30、更新融合特征向量與預(yù)設(shè)特征向量的相似度計算公式,表達為:
31、
32、基于計算,得到更新后的。
33、優(yōu)選的,所述預(yù)設(shè)特征向量的生成方法為:
34、收集違規(guī)多模態(tài)數(shù)據(jù),提取單模態(tài)特征;
35、基于單模態(tài)特征,融合生成多模態(tài)特征向量;
36、基于多模態(tài)特征向量,構(gòu)建違規(guī)行為數(shù)據(jù)庫,還包括:
37、分類多模態(tài)特征向量及
38、為每個多模態(tài)特征向量標識唯一樣本id。
39、優(yōu)選的,所述差異化規(guī)則庫還用于存儲分級閾值,基于直播風險類型匹配第一閾值,并根據(jù)實時反饋動態(tài)調(diào)整。
40、優(yōu)選的,所述差異化規(guī)則庫還包括反饋機制,所述反饋機制用于根據(jù)實時反饋,動態(tài)調(diào)整分級閾值;
41、所述分級閾值的動態(tài)調(diào)整方法為:
42、實時采集直播過程中的觀眾反饋數(shù)據(jù);
43、基于自然語言技術(shù)對觀眾反饋數(shù)據(jù)進行區(qū)分,統(tǒng)計彈幕消極情感數(shù)量、舉報量以及互動率;
44、基于觀眾反饋數(shù)據(jù),計算分級閾值的調(diào)整幅度,根據(jù)公式:
45、
46、其中,為彈幕情緒影響系數(shù),為舉報影響系數(shù),為總彈幕數(shù)量,為互動影響系數(shù);
47、根據(jù)計算得到的調(diào)整幅度更新第一閾值,表示為:
48、
49、
50、其中,為第二閾值;
51、將計算得到的第二閾值應(yīng)用于更新后的,判斷是否觸發(fā)預(yù)設(shè)點位。
52、優(yōu)選的,所述互動率的計算方法為:
53、統(tǒng)計單位時間內(nèi)用戶點贊數(shù)、分享數(shù)以及評論數(shù);
54、根據(jù)公式:
55、
56、其中,為直播間實時在線人數(shù)。
57、優(yōu)選的,所述時間窗口的長度根據(jù)直播類型動態(tài)調(diào)整,方法為:
58、識別直播風險類型,根據(jù)直播風險類型定義時間窗口的長度,包括:
59、第一時間窗口, s,滿足直播類型為高風險;
60、第二時間窗口, s,滿足直播類型為中風險;
61、第三時間窗口, s,滿足直播類型為低風險;
62、將匹配的時間窗口應(yīng)用至的更新計算中。
63、優(yōu)選的,所述差異化規(guī)則庫還存儲風險等級-第一閾值映射表,所述分級閾值與直播類型風險類型綁定,具體規(guī)則為通過差異化規(guī)則庫中存儲的風險等級-第一閾值映射表,對直播風險類型與第一閾值自動適配。
64、本發(fā)明的有益效果如下:
65、1.本發(fā)明所述的一種觸發(fā)平臺算法預(yù)設(shè)值點位的方法,通過設(shè)置差異化規(guī)則庫,根據(jù)識別到的直播風險類型,可優(yōu)先為不同直播風險類型設(shè)置對應(yīng)的權(quán)重分配,從而在計算多模態(tài)融合特征向量時,即產(chǎn)生差異化,避免相同的權(quán)重分配,導致不同直播類型之間的判罰標準一致,造成誤判及判罰失衡的問題。
66、2.本發(fā)明所述的一種觸發(fā)平臺算法預(yù)設(shè)值點位的方法,通過基于多模態(tài)融合特征,再與已知的或預(yù)設(shè)的違規(guī)行為進行依次相似度計算,獲取相似度,根據(jù)相似度的大小,即將相似度與第一閾值進行比較,從而判斷直播過程中是否違規(guī),且基于根據(jù)預(yù)設(shè)的違規(guī)行為進行依次相似度計算,選取相似度最大值對應(yīng)的違規(guī)行為,即表征該直播間可能存在的違規(guī)行為,基于同一時間軸的多模態(tài)融合特征向量,減少誤判的概率。