本發(fā)明涉及數(shù)據(jù)處理,具體為一種對(duì)不良資產(chǎn)關(guān)聯(lián)案件進(jìn)行智能摘要的方法。
背景技術(shù):
1、隨著不良資產(chǎn)管理行業(yè)的發(fā)展,尤其是金融和法律領(lǐng)域?qū)Σ涣假Y產(chǎn)關(guān)聯(lián)案件的處理需求日益增加,準(zhǔn)確、及時(shí)地對(duì)這些案件進(jìn)行總結(jié)和分析已成為提升資產(chǎn)處置效率、降低風(fēng)險(xiǎn)的重要課題。不良資產(chǎn)關(guān)聯(lián)案件涉及復(fù)雜的多模態(tài)數(shù)據(jù),包括法律文書、財(cái)務(wù)報(bào)表和合同掃描件,其中的關(guān)鍵信息(如債務(wù)人、債務(wù)金額、抵押物等)直接影響案件的處理結(jié)果和風(fēng)險(xiǎn)評(píng)估。然而,現(xiàn)有技術(shù)在不良資產(chǎn)關(guān)聯(lián)案件的智能摘要和風(fēng)險(xiǎn)管理方面仍面臨諸多挑戰(zhàn)。
2、目前,不良資產(chǎn)關(guān)聯(lián)案件的處理和分析主要依賴以下幾種技術(shù)手段:
3、人工審查:傳統(tǒng)方法通過人工閱讀法律文書和財(cái)務(wù)報(bào)表,提取案件關(guān)鍵信息并生成總結(jié)報(bào)告。這種方式依賴于專業(yè)人員的經(jīng)驗(yàn)和主觀判斷,廣泛應(yīng)用于小型案件處理。
4、文本關(guān)鍵詞提取技術(shù):通過簡單的關(guān)鍵詞匹配或正則表達(dá)式,從法律文書和財(cái)務(wù)報(bào)表中提取結(jié)構(gòu)化信息(如案件編號(hào)、債務(wù)金額),并生成初步報(bào)告,適用于標(biāo)準(zhǔn)化數(shù)據(jù)處理。
5、圖像識(shí)別技術(shù):利用光學(xué)字符識(shí)別(ocr)技術(shù)處理合同掃描件圖像,提取文本內(nèi)容,并結(jié)合人工校對(duì),輔助案件信息錄入。
6、數(shù)據(jù)庫查詢與統(tǒng)計(jì)分析:通過關(guān)系型數(shù)據(jù)庫存儲(chǔ)案件數(shù)據(jù),利用sql查詢和基本統(tǒng)計(jì)方法分析債務(wù)人信用或抵押物價(jià)值,支撐風(fēng)險(xiǎn)評(píng)估。
7、盡管這些技術(shù)在不良資產(chǎn)關(guān)聯(lián)案件的處理中起到了一定作用,但仍存在以下顯著不足:
8、問題一:人工審查耗時(shí)長、效率低,且受限于人員經(jīng)驗(yàn)和主觀性,難以覆蓋大規(guī)模案件數(shù)據(jù),導(dǎo)致關(guān)鍵信息遺漏或錯(cuò)誤識(shí)別,難以滿足快速處理的需求。
9、問題二:文本關(guān)鍵詞提取技術(shù)依賴固定的規(guī)則,難以適應(yīng)法律和金融領(lǐng)域的語義復(fù)雜性,準(zhǔn)確性較低,尤其在處理非結(jié)構(gòu)化數(shù)據(jù)(如合同條款)時(shí)表現(xiàn)不佳。此外,ocr圖像識(shí)別受限于掃描質(zhì)量和字體多樣性,維護(hù)成本高且易受環(huán)境影響。
10、問題三:現(xiàn)有技術(shù)多依賴周期性人工審查或批量數(shù)據(jù)處理,缺乏實(shí)時(shí)、動(dòng)態(tài)的案件狀態(tài)更新能力。這種非連續(xù)性導(dǎo)致潛在風(fēng)險(xiǎn)(如擔(dān)保人信用變化)難以及時(shí)發(fā)現(xiàn),錯(cuò)失優(yōu)化處置方案的最佳時(shí)機(jī)。
11、問題四:數(shù)據(jù)庫查詢和統(tǒng)計(jì)分析雖能提供基礎(chǔ)數(shù)據(jù)支持,但缺乏高級(jí)數(shù)據(jù)分析手段(如機(jī)器學(xué)習(xí)或圖譜分析),僅依賴簡單閾值或統(tǒng)計(jì)指標(biāo)進(jìn)行風(fēng)險(xiǎn)評(píng)估,易出現(xiàn)誤報(bào)或漏報(bào),無法準(zhǔn)確反映案件間的復(fù)雜關(guān)系(如擔(dān)保鏈風(fēng)險(xiǎn)),限制了智能化管理水平。
12、所以需要一種對(duì)不良資產(chǎn)關(guān)聯(lián)案件進(jìn)行智能摘要的方法來解決上述問題。
技術(shù)實(shí)現(xiàn)思路
1、解決的技術(shù)問題
2、針對(duì)現(xiàn)有技術(shù)的不足,本發(fā)明提供了一種對(duì)不良資產(chǎn)關(guān)聯(lián)案件進(jìn)行智能摘要的方法,解決了以上背景技術(shù)中的問題。
3、技術(shù)方案
4、為實(shí)現(xiàn)以上目的,本發(fā)明通過以下技術(shù)方案予以實(shí)現(xiàn):一種對(duì)不良資產(chǎn)關(guān)聯(lián)案件進(jìn)行智能摘要的方法,所述方法由多模態(tài)數(shù)據(jù)處理系統(tǒng)執(zhí)行,所述多模態(tài)數(shù)據(jù)處理系統(tǒng)中包括數(shù)據(jù)標(biāo)準(zhǔn)化模塊、加密處理模塊、圖譜構(gòu)建模塊、摘要生成模塊、反饋優(yōu)化模塊、驗(yàn)證模塊和區(qū)塊鏈存儲(chǔ)模塊,所述方法包括以下步驟:
5、sp1、數(shù)據(jù)標(biāo)準(zhǔn)化模塊獲取不良資產(chǎn)關(guān)聯(lián)案件的多模態(tài)數(shù)據(jù),包括法律文書文本、財(cái)務(wù)表格和合同掃描件圖像,通過領(lǐng)域適配模板匹配技術(shù)將文本和表格數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),通過圖像語義提取技術(shù)提取圖像中的文本,生成包含案件編號(hào)、債務(wù)人、債務(wù)金額、抵押物、擔(dān)保人和案件狀態(tài)的結(jié)構(gòu)化數(shù)據(jù),以可擴(kuò)展標(biāo)記語言格式傳輸至加密處理模塊;
6、sp2、加密處理模塊對(duì)結(jié)構(gòu)化數(shù)據(jù)執(zhí)行加密分片算法,分割為加密片段并存儲(chǔ)在本地,通過多方安全聚合協(xié)議計(jì)算統(tǒng)計(jì)信息,加密后傳輸至圖譜構(gòu)建模塊;
7、sp3、圖譜構(gòu)建模塊基于結(jié)構(gòu)化數(shù)據(jù)和統(tǒng)計(jì)信息構(gòu)建動(dòng)態(tài)關(guān)系圖譜,以債務(wù)人、擔(dān)保人、抵押物為節(jié)點(diǎn),擔(dān)保和抵押關(guān)系為邊,通過路徑推理算法生成風(fēng)險(xiǎn)評(píng)估結(jié)果,以鍵值對(duì)格式傳輸至摘要生成模塊;
8、sp4、摘要生成模塊通過領(lǐng)域模板填充和語義優(yōu)先級(jí)提取技術(shù)生成初始摘要,包含案件編號(hào)、債務(wù)人、債務(wù)金額、抵押物、擔(dān)保人、案件狀態(tài)和風(fēng)險(xiǎn)點(diǎn),以文本格式傳輸至反饋優(yōu)化模塊;
9、sp5、反饋優(yōu)化模塊通過用戶交互界面收集反饋,基于內(nèi)容優(yōu)先級(jí)調(diào)整算法優(yōu)化初始摘要,生成個(gè)性化摘要,傳輸至驗(yàn)證模塊;
10、sp6、驗(yàn)證模塊通過形式化規(guī)則和事實(shí)一致性核查技術(shù)驗(yàn)證個(gè)性化摘要,生成驗(yàn)證后的摘要,以加密文本格式傳輸至區(qū)塊鏈存儲(chǔ)模塊;
11、sp7、區(qū)塊鏈存儲(chǔ)模塊將驗(yàn)證后的摘要及元數(shù)據(jù)存儲(chǔ)至私有鏈,通過智能合約觸發(fā)生成和更新,通過分布式賬本共享摘要。
12、優(yōu)選的,所述sp1中所述領(lǐng)域適配模板匹配技術(shù)通過法律和金融領(lǐng)域的預(yù)定義模板匹配法律文書文本數(shù)據(jù)中的案件編號(hào)、債務(wù)人和擔(dān)保人,所述領(lǐng)域適配模板基于不良資產(chǎn)案件的語義特征定制,通過語義相似度匹配算法優(yōu)化模板選擇,所述語義相似度匹配算法基于不良資產(chǎn)案件的法律和金融術(shù)語庫計(jì)算文本數(shù)據(jù)與模板的匹配度,所述圖像語義提取技術(shù)通過圖像分割和語義解析技術(shù)從合同掃描件圖像數(shù)據(jù)中提取關(guān)鍵文本字段,所述結(jié)構(gòu)化數(shù)據(jù)以可擴(kuò)展標(biāo)記語言格式通過內(nèi)部數(shù)據(jù)總線傳輸至加密處理模塊。
13、優(yōu)選的,所述sp2中所述加密分片算法通過多項(xiàng)式插值技術(shù)將結(jié)構(gòu)化數(shù)據(jù)分割為多個(gè)加密片段并存儲(chǔ)在本地節(jié)點(diǎn),所述多方安全聚合協(xié)議通過加權(quán)統(tǒng)計(jì)技術(shù)計(jì)算債務(wù)金額和風(fēng)險(xiǎn)等級(jí)的聚合值,所述加密片段和聚合值通過傳輸層安全協(xié)議加密后傳輸至圖譜構(gòu)建模塊,所述傳輸層安全協(xié)議確保聚合計(jì)算不泄露原始數(shù)據(jù)。
14、優(yōu)選的,所述sp3中所述路徑推理算法通過風(fēng)險(xiǎn)傳播分析技術(shù)識(shí)別動(dòng)態(tài)關(guān)系圖譜中的擔(dān)保鏈風(fēng)險(xiǎn),所述風(fēng)險(xiǎn)傳播分析技術(shù)基于擔(dān)保人和抵押物的信用評(píng)分來對(duì)權(quán)重進(jìn)行動(dòng)態(tài)調(diào)整,所述動(dòng)態(tài)關(guān)系圖譜通過事件監(jiān)聽技術(shù)實(shí)時(shí)更新節(jié)點(diǎn)和邊的狀態(tài),所述風(fēng)險(xiǎn)評(píng)估結(jié)果以鍵值對(duì)格式通過內(nèi)部數(shù)據(jù)總線傳輸至摘要生成模塊。
15、優(yōu)選的,所述sp4中所述語義優(yōu)先級(jí)提取技術(shù)通過句法依存分析和關(guān)鍵詞優(yōu)先級(jí)排序從結(jié)構(gòu)化數(shù)據(jù)中提取關(guān)鍵短語,所述關(guān)鍵詞優(yōu)先級(jí)排序基于不良資產(chǎn)案件的風(fēng)險(xiǎn)權(quán)重,所述領(lǐng)域模板填充技術(shù)通過預(yù)定義的摘要模板生成初始摘要,所述模板根據(jù)案件類型和用戶角色定制,所述初始摘要以文本格式通過內(nèi)部數(shù)據(jù)總線傳輸至反饋優(yōu)化模塊。
16、優(yōu)選的,所述sp5中所述內(nèi)容優(yōu)先級(jí)調(diào)整算法通過用戶反饋數(shù)據(jù)中的評(píng)分和標(biāo)注動(dòng)態(tài)調(diào)整摘要模板的字段優(yōu)先級(jí),所述用戶反饋數(shù)據(jù)以可擴(kuò)展標(biāo)記語言格式存儲(chǔ),優(yōu)化后的個(gè)性化摘要通過用戶交互界面?zhèn)鬏斨劣脩舨⑼ㄟ^內(nèi)部數(shù)據(jù)總線傳輸至驗(yàn)證模塊。
17、優(yōu)選的,所述sp6中所述形式化規(guī)則通過邏輯推理技術(shù)檢查個(gè)性化摘要中債務(wù)金額與抵押物價(jià)值的邏輯關(guān)系,所述事實(shí)一致性核查技術(shù)通過字段匹配技術(shù)驗(yàn)證個(gè)性化摘要與結(jié)構(gòu)化數(shù)據(jù)的字段一致性,所述驗(yàn)證后的摘要以加密文本格式通過內(nèi)部數(shù)據(jù)總線傳輸至區(qū)塊鏈存儲(chǔ)模塊。
18、優(yōu)選的,所述sp7中所述智能合約通過預(yù)定義的事件觸發(fā)條件控制摘要生成和更新,所述事件觸發(fā)條件包括案件狀態(tài)變更和用戶請(qǐng)求,所述分布式賬本技術(shù)通過一致性算法同步已驗(yàn)證的摘要數(shù)據(jù),所述元數(shù)據(jù)包括案件編號(hào)、生成時(shí)間和通過安全哈希算法生成的內(nèi)容哈希。
19、優(yōu)選的,所述sp1中所述多模態(tài)數(shù)據(jù)在進(jìn)入領(lǐng)域適配模板匹配技術(shù)之前,通過數(shù)據(jù)清洗模塊執(zhí)行格式規(guī)范化操作,所述格式規(guī)范化操作去除法律文書文本數(shù)據(jù)中的無關(guān)格式并標(biāo)準(zhǔn)化財(cái)務(wù)表格數(shù)據(jù)中的數(shù)值,清洗后的數(shù)據(jù)以可擴(kuò)展標(biāo)記語言格式通過內(nèi)部數(shù)據(jù)總線傳輸至sp1的后續(xù)操作。
20、優(yōu)選的,所述sp3中所述動(dòng)態(tài)關(guān)系圖譜通過關(guān)系優(yōu)先級(jí)分配技術(shù)增強(qiáng)圖數(shù)據(jù)庫中邊的權(quán)重,所述關(guān)系優(yōu)先級(jí)分配基于擔(dān)保人和抵押物的信用評(píng)分和歷史案件數(shù)據(jù)的統(tǒng)計(jì)分析,所述風(fēng)險(xiǎn)評(píng)估結(jié)果以鍵值對(duì)格式通過內(nèi)部數(shù)據(jù)總線傳輸至摘要生成模塊,sp1中所述領(lǐng)域適配模板匹配技術(shù)通過語義相似度匹配算法優(yōu)化模板選擇,所述語義相似度匹配算法基于不良資產(chǎn)案件的法律和金融術(shù)語庫計(jì)算文本數(shù)據(jù)與模板的匹配度,所述包含案件編號(hào)、債務(wù)人、債務(wù)金額、抵押物、擔(dān)保人和案件狀態(tài)的結(jié)構(gòu)化數(shù)據(jù)以擴(kuò)展標(biāo)記語言格式通過內(nèi)部數(shù)據(jù)總線傳輸至加密處理模塊,sp2中所述多方安全聚合協(xié)議通過分層聚合技術(shù)優(yōu)化計(jì)算效率,所述分層聚合技術(shù)將統(tǒng)計(jì)信息分層計(jì)算以減少通信開銷,所述加密片段和聚合值通過傳輸層安全協(xié)議加密后傳輸至圖譜構(gòu)建模塊,sp4中所述領(lǐng)域模板填充技術(shù)通過動(dòng)態(tài)模板選擇算法根據(jù)用戶角色選擇摘要模板,所述動(dòng)態(tài)模板選擇算法基于用戶的歷史反饋數(shù)據(jù)和案件類型,所述初始摘要以文本格式通過內(nèi)部數(shù)據(jù)總線傳輸至反饋優(yōu)化模塊,
21、整個(gè)方法的控制流設(shè)計(jì)如下:
22、初始化與輸入驗(yàn)證:
23、系統(tǒng)啟動(dòng)時(shí),檢查多模態(tài)數(shù)據(jù)(法律文書文本、財(cái)務(wù)表格、合同掃描件圖像)是否完整,若數(shù)據(jù)缺失或格式錯(cuò)誤,觸發(fā)異常處理模塊,記錄日志并提示用戶補(bǔ)齊數(shù)據(jù),否則進(jìn)入sp1。
24、順序執(zhí)行主流程:
25、步驟sp1(數(shù)據(jù)標(biāo)準(zhǔn)化模塊):接收多模態(tài)數(shù)據(jù),執(zhí)行數(shù)據(jù)清洗、領(lǐng)域適配模板匹配和圖像語義提取,生成結(jié)構(gòu)化數(shù)據(jù)(xml格式)。完成后,檢查結(jié)構(gòu)化數(shù)據(jù)完整性(字段如案件編號(hào)、債務(wù)人等是否齊全),若完整則傳輸至sp2,否則返回異常處理。
26、步驟sp2(加密處理模塊):接收結(jié)構(gòu)化數(shù)據(jù),執(zhí)行秘密分片和多方安全聚合,生成加密片段和統(tǒng)計(jì)信息。加密完成后,驗(yàn)證聚合值是否一致,若一致則傳輸至sp3,否則重試聚合過程最多3次。
27、步驟sp3(圖譜構(gòu)建模塊):接收加密片段和統(tǒng)計(jì)信息,構(gòu)建動(dòng)態(tài)關(guān)系圖譜并生成風(fēng)險(xiǎn)評(píng)估結(jié)果。圖譜更新通過kafka事件監(jiān)聽觸發(fā),若事件處理失敗,記錄錯(cuò)誤并繼續(xù)下步。
28、步驟sp4(摘要生成模塊):接收風(fēng)險(xiǎn)評(píng)估結(jié)果,生成初始摘要。生成后,檢查摘要是否包含所有關(guān)鍵字段(案件編號(hào)、風(fēng)險(xiǎn)點(diǎn)等),若缺失則觸發(fā)模板重新填充。
29、步驟sp5(反饋優(yōu)化模塊):接收初始摘要,收集用戶反饋并優(yōu)化生成個(gè)性化摘要。優(yōu)化完成后,若用戶滿意度評(píng)分低于3分(滿分5分),返回sp4重新生成。
30、步驟sp6(驗(yàn)證模塊):接收個(gè)性化摘要,執(zhí)行邏輯檢查和一致性核查。若驗(yàn)證失?。ㄟ壿嬯P(guān)系錯(cuò)誤或相似度低于90%),返回sp5重新優(yōu)化,否則進(jìn)入sp7。
31、步驟sp7(區(qū)塊鏈存儲(chǔ)模塊):接收驗(yàn)證后摘要,存儲(chǔ)至私有鏈并同步分布式賬本。若存儲(chǔ)失?。ɡ缇W(wǎng)絡(luò)中斷),重試最多5次后記錄日志。
32、異常處理與回滾機(jī)制:
33、各步驟遇異常(如數(shù)據(jù)丟失、加密失敗、驗(yàn)證不通過)時(shí),調(diào)用異常處理模塊,記錄錯(cuò)誤詳情(時(shí)間、模塊、錯(cuò)誤類型)至日志文件,暫停當(dāng)前流程并通知用戶。
34、若連續(xù)3次異常未解決,系統(tǒng)自動(dòng)回滾至上一步,恢復(fù)至最近一次成功狀態(tài),重新執(zhí)行。
35、終止條件:
36、流程在sp7完成區(qū)塊鏈存儲(chǔ)并返回存儲(chǔ)成功確認(rèn)后終止。若用戶請(qǐng)求更新(如案件狀態(tài)變更),通過智能合約觸發(fā),重新從sp3圖譜構(gòu)建模塊開始循環(huán)執(zhí)行。
37、有益效果
38、本發(fā)明提供了一種對(duì)不良資產(chǎn)關(guān)聯(lián)案件進(jìn)行智能摘要的方法。具備以下有益效果:
39、1、本發(fā)明通過多模態(tài)數(shù)據(jù)自動(dòng)化處理和實(shí)時(shí)標(biāo)準(zhǔn)化,能夠及時(shí)提取不良資產(chǎn)關(guān)聯(lián)案件的關(guān)鍵信息,有效避免人工審查的低效與遺漏,提升了案件處理效率與覆蓋范圍。采用bert語義相似度匹配和u-net圖像語義提取技術(shù),準(zhǔn)確率分別達(dá)到95%和90%,相比傳統(tǒng)人工審查的耗時(shí)長和信息遺漏問題,實(shí)現(xiàn)高效、全面的數(shù)據(jù)提取。
40、2、本發(fā)明通過shamir秘密分片和paillier同態(tài)加密技術(shù),確保不良資產(chǎn)關(guān)聯(lián)案件數(shù)據(jù)的隱私安全,同時(shí)通過mapreduce分層聚合優(yōu)化計(jì)算效率,降低了數(shù)據(jù)傳輸?shù)耐ㄐ砰_銷。相比現(xiàn)有ocr和關(guān)鍵詞提取技術(shù)的維護(hù)成本高和環(huán)境適應(yīng)性差,實(shí)驗(yàn)數(shù)據(jù)顯示本發(fā)明錯(cuò)誤率僅為0.5%-2%,并通過tls?1.3協(xié)議傳輸,減少處理時(shí)間,提供了一種低成本、高魯棒性的數(shù)據(jù)保護(hù)方案。
41、3、本發(fā)明通過kafka事件監(jiān)聽和pagerank路徑推理技術(shù),實(shí)現(xiàn)動(dòng)態(tài)關(guān)系圖譜的實(shí)時(shí)更新和風(fēng)險(xiǎn)評(píng)估,能夠及時(shí)發(fā)現(xiàn)擔(dān)保鏈風(fēng)險(xiǎn)(如擔(dān)保人信用變化),彌補(bǔ)現(xiàn)有周期性審查的非連續(xù)性不足。實(shí)驗(yàn)中,事件監(jiān)聽吞吐量達(dá)1000條/秒,風(fēng)險(xiǎn)評(píng)估準(zhǔn)確率達(dá)90%,相比傳統(tǒng)數(shù)據(jù)庫查詢的靜態(tài)分析,提升了風(fēng)險(xiǎn)監(jiān)控的及時(shí)性與動(dòng)態(tài)性。
42、4、本發(fā)明通過hanlp語義優(yōu)先級(jí)提取、q-learning反饋優(yōu)化和drools驗(yàn)證技術(shù),結(jié)合動(dòng)態(tài)模板選擇和復(fù)雜關(guān)系分析,提供精準(zhǔn)的個(gè)性化摘要和風(fēng)險(xiǎn)評(píng)估,克服了現(xiàn)有技術(shù)依賴簡單閾值導(dǎo)致的誤報(bào)與漏報(bào)問題。相比傳統(tǒng)統(tǒng)計(jì)方法的單一指標(biāo)分析,本發(fā)明通過機(jī)器學(xué)習(xí)和圖譜技術(shù)準(zhǔn)確識(shí)別擔(dān)保鏈風(fēng)險(xiǎn),提升了智能化管理水平。