本技術(shù)涉及計算機,尤其涉及一種表格公式處理方法、裝置、電子設(shè)備及存儲介質(zhì)。
背景技術(shù):
1、目前,電子表格軟件(excel)因其強大的數(shù)據(jù)可視化和分析能力,逐漸被人們所使用。其中,表格公式是電子表格軟件中非常強大的工具,可以用于解決各種數(shù)學、統(tǒng)計、邏輯、文本、日期和時間等問題,能夠幫助用戶更好的處理和分析數(shù)據(jù)等。
2、但是,表格公式作為電子表格軟件中非常強大的工具,對于很多用戶來說有一定的使用門檻,比如函數(shù)的選擇,公式語法理解、數(shù)據(jù)引用、函數(shù)嵌套等等,如此表格公式較高的使用門檻,給人們使用表格公式帶來了一定的困難。
3、為此引入了大語言模型,用戶可以輸入自然語言的需求,可以將自然語言的需求轉(zhuǎn)換為對應的表格公式。由于用戶需要輸入自然語言的需求才可以得到表格公式,會降低表格數(shù)據(jù)處理的效率,且由此得到的表格公式具有不確定性和出錯概率,會降低表格數(shù)據(jù)處理的準確性。
技術(shù)實現(xiàn)思路
1、為了解決上述由于用戶需要輸入自然語言的需求才可以得到表格公式,會降低表格數(shù)據(jù)處理的效率,且由此得到的表格公式具有不確定性和出錯概率,會降低表格數(shù)據(jù)處理的準確性的技術(shù)問題,本技術(shù)實施例提供了一種表格公式處理方法、裝置、電子設(shè)備及存儲介質(zhì)。具體技術(shù)方案如下:
2、在本技術(shù)實施例的第一方面,首先提供了一種表格公式處理方法,所述方法包括:
3、獲取目標表格,并確定所述目標表格中目標單元格對應的相鄰單元格;
4、對所述目標表格進行結(jié)構(gòu)化處理,得到所述目標表格對應的結(jié)構(gòu)化數(shù)據(jù);
5、根據(jù)所述目標單元格、所述相鄰單元格以及所述結(jié)構(gòu)化數(shù)據(jù),預測目標表格公式;
6、在所述目標單元格的對應位置中顯示所述目標表格公式。
7、在一個可選的實施方式中,所述相鄰單元格包括上相鄰單元格、下相鄰單元格、左相鄰單元格以及右相鄰單元格;
8、所述確定所述目標表格中目標單元格對應的相鄰單元格,包括:
9、確定所述目標表格中目標單元格上方的第一預設(shè)數(shù)量的所述上相鄰單元格;
10、確定所述目標表格中目標單元格下方的第二預設(shè)數(shù)量的所述下相鄰單元格;
11、確定所述目標表格中目標單元格左方的第三預設(shè)數(shù)量的所述左相鄰單元格;
12、確定所述目標表格中目標單元格右方的第四預設(shè)數(shù)量的所述右相鄰單元格。
13、在一個可選的實施方式中,所述對所述目標表格進行結(jié)構(gòu)化處理,得到所述目標表格對應的結(jié)構(gòu)化數(shù)據(jù),包括:
14、識別所述目標表格中的表頭,并對所述目標表格進行拆分,得到所述表頭、所述目標表格中的每行單元格、所述目標表格中的每列單元格;
15、將所述目標表格中的每行單元格添加至行單元格集合,將所述目標表格中的每列單元格添加至列單元格集合。
16、在一個可選的實施方式中,所述根據(jù)所述目標單元格、所述相鄰單元格以及所述結(jié)構(gòu)化數(shù)據(jù),預測目標表格公式,包括:
17、將所述目標單元格、所述相鄰單元格、所述表頭、所述行單元格集合以及所述列單元格集合輸入至預訓練的神經(jīng)網(wǎng)絡(luò),得到目標函數(shù)和目標參數(shù);
18、對所述目標函數(shù)以及所述目標參數(shù)進行組合,得到目標表格公式。
19、在一個可選的實施方式中,所述預訓練的神經(jīng)網(wǎng)絡(luò)包括預訓練的編碼器、預訓練的解碼器、預訓練的注意力網(wǎng)絡(luò)以及預訓練的大語言模型;
20、所述將所述目標單元格、所述相鄰單元格、所述表頭、所述行單元格集合以及所述列單元格集合輸入至預訓練的神經(jīng)網(wǎng)絡(luò),得到目標函數(shù)和目標參數(shù),包括:
21、利用所述預訓練的編碼器,對所述表頭進行編碼,得到表頭嵌入向量;
22、利用所述預訓練的編碼器,對所述行單元格集合中的所有行單元格進行編碼,得到行嵌入向量;
23、利用所述預訓練的編碼器,對所述列單元格集合中的所有列單元格進行編碼,得到列嵌入向量;
24、將所述目標單元格、所述相鄰單元格、所述行嵌入向量以及所述列嵌入向量輸入至所述預訓練的大語言模型,得到第一輸出結(jié)果;
25、將所述表頭嵌入向量輸入至所述預訓練的注意力網(wǎng)絡(luò),得到第二輸出結(jié)果;
26、利用所述預訓練的解碼器,對所述第一輸出結(jié)果以及所述第二輸出結(jié)果進行解碼,得到目標函數(shù)以及目標參數(shù)。
27、在一個可選的實施方式中,所述將所述目標單元格、所述相鄰單元格、所述行嵌入向量以及所述列嵌入向量輸入至所述預訓練的大語言模型,得到第一輸出結(jié)果,包括:
28、確定所述目標單元格對應的第一坐標以及所述相鄰單元格對應的第二坐標;
29、將所述第一坐標、所述第二坐標、所述行嵌入向量以及所述列嵌入向量輸入至所述預訓練的大語言模型,得到第一輸出結(jié)果。
30、在一個可選的實施方式中,所述確定所述目標單元格對應的第一坐標以及所述相鄰單元格對應的第二坐標,包括:
31、確定所述目標單元格在所述目標表格中的第一位置,將所述第一位置確定為坐標原點,將所述坐標原點確定為所述目標單元格對應的第一坐標;
32、確定所述相鄰單元格在所述目標表格中的第二位置,根據(jù)所述第一位置與所述第二位置之間的位置差,確定所述相鄰單元格對應的第二坐標。
33、在一個可選的實施方式中,所述確定所述目標表格中目標單元格對應的相鄰單元格,包括:
34、響應于針對所述目標表格中目標單元格的填充操作,確定所述目標單元格中填充的第一數(shù)據(jù);
35、在所述第一數(shù)據(jù)為預設(shè)數(shù)據(jù)的情況下,確定所述目標表格中目標單元格對應的相鄰單元格。
36、在一個可選的實施方式中,所述在所述目標單元格的對應位置中顯示所述目標表格公式之后,所述方法還包括:
37、響應于針對所述目標表格中目標單元格的再次填充操作,確定所述目標單元格中再次填充的第二數(shù)據(jù);
38、在所述第二數(shù)據(jù)表征函數(shù)的情況下,在所述目標單元格的對應位置中顯示所述目標函數(shù)。
39、在一個可選的實施方式中,所述在所述目標單元格的對應位置中顯示所述目標函數(shù)之后,所述方法還包括:
40、響應于針對所述目標表格中目標單元格的再次填充操作,確定所述目標單元格中再次填充的第三數(shù)據(jù);
41、在所述第三數(shù)據(jù)表征參數(shù)的情況下,在所述目標單元格的對應位置中顯示所述目標參數(shù)。
42、在一個可選的實施方式中,所述方法還包括:
43、響應于針對所述目標表格中目標列單元格的預設(shè)操作,檢測所述目標列單元格的單元格中是否填充至少兩個相同的表格公式;
44、在所述目標列單元格的單元格中填充至少兩個相同的表格公式的情況下,觸發(fā)表格公式填充提示;
45、所述表格公式填充提示用于提示所述目標列單元格的其余單元格填充所述表格公式。
46、在一個可選的實施方式中,在執(zhí)行所述方法之前,還包括:
47、獲取樣本表格,并確定所述樣本表格中樣本單元格對應的相鄰樣本單元格;
48、識別所述樣本表格中的樣本表頭,并對所述樣本表格進行拆分,得到所述樣本表頭、所述樣本表格中的每行樣本單元格、所述樣本表格中的每列樣本單元格;
49、將所述樣本表格中的每行樣本單元格添加至行樣本單元格集合,將所述樣本表格中的每列樣本單元格添加至列樣本單元格集合;
50、將所述樣本單元格、所述相鄰樣本單元格、所述樣本表頭、所述行樣本單元格集合、所述列樣本單元格集合輸入至神經(jīng)網(wǎng)絡(luò),得到函數(shù)和參數(shù);
51、對所述函數(shù)和所述參數(shù)進行組合,得到表格公式;
52、基于所述表格公式對所述神經(jīng)網(wǎng)絡(luò)進行訓練,并在滿足網(wǎng)絡(luò)訓練終止條件的情況下,停止訓練,得到所述預訓練的神經(jīng)網(wǎng)絡(luò)。
53、在一個可選的實施方式中,所述相鄰樣本單元格包括上相鄰樣本單元格、下相鄰樣本單元格、左相鄰樣本單元格以及右相鄰樣本單元格;
54、所述確定所述樣本表格中樣本單元格對應的相鄰樣本單元格,包括:
55、確定所述樣本表格中樣本單元格上方的第一預設(shè)數(shù)量的所述上相鄰樣本單元格;
56、確定所述樣本表格中樣本單元格下方的第二預設(shè)數(shù)量的所述下相鄰樣本單元格;
57、確定所述樣本表格中樣本單元格左方的第三預設(shè)數(shù)量的所述左相鄰樣本單元格;
58、確定所述樣本表格中樣本單元格右方的第四預設(shè)數(shù)量的所述右相鄰樣本單元格。
59、在一個可選的實施方式中,所述神經(jīng)網(wǎng)絡(luò)包括編碼器、解碼器、注意力網(wǎng)絡(luò)以及大語言模型;
60、所述將所述樣本單元格、所述相鄰樣本單元格、所述樣本表頭、所述行樣本單元格集合、所述列樣本單元格集合輸入至神經(jīng)網(wǎng)絡(luò),得到函數(shù)和參數(shù),包括:
61、利用所述編碼器,對所述樣本表頭進行編碼,得到樣本表頭嵌入向量;
62、利用所述編碼器,對所述行樣本單元格集合中的所有行樣本單元格進行編碼,得到樣本行嵌入向量;
63、利用所述編碼器,對所述列樣本單元格集合中的所有列樣本單元格進行編碼,得到樣本列嵌入向量;
64、將所述樣本單元格、所述相鄰樣本單元格、所述樣本行嵌入向量、所述樣本列嵌入向量輸入至所述大語言模型,得到第一樣本輸出結(jié)果;
65、將所述樣本表頭嵌入向量輸入至所述注意力網(wǎng)絡(luò),得到第二樣本輸出結(jié)果;
66、利用所述解碼器,對所述第一樣本輸出結(jié)果和所述第二樣本輸出結(jié)果進行解碼,得到函數(shù)和參數(shù)。
67、在一個可選的實施方式中,所述將所述樣本單元格、所述相鄰樣本單元格、所述樣本行嵌入向量、所述樣本列嵌入向量輸入至所述大語言模型,得到第一樣本輸出結(jié)果,包括:
68、確定所述樣本單元格對應的第一樣本坐標以及所述相鄰樣本單元格對應的第二樣本坐標;
69、將所述第一樣本坐標、所述第二樣本坐標、所述樣本行嵌入向量、所述樣本列嵌入向量輸入至所述大語言模型,得到第一樣本輸出結(jié)果。
70、在一個可選的實施方式中,所述確定所述樣本單元格對應的第一樣本坐標以及所述相鄰樣本單元格對應的第二樣本坐標,包括:
71、確定所述樣本單元格在所述樣本表格中的第一樣本位置,將所述第一樣本位置確定為樣本坐標原點,將所述樣本坐標原點確定為所述樣本單元格對應的第一樣本坐標;
72、確定所述相鄰樣本單元格在所述樣本表格中的第二樣本位置,根據(jù)所述第一樣本位置與所述第二樣本位置之間的位置差,確定所述相鄰樣本單元格對應的第二樣本坐標。
73、在本技術(shù)實施例的第二方面,還提供了一種表格公式處理裝置,所述裝置包括:
74、表格獲取模塊,用于獲取目標表格;
75、單元格確定模塊,用于確定所述目標表格中目標單元格對應的相鄰單元格;
76、表格結(jié)構(gòu)化處理模塊,用于對所述目標表格進行結(jié)構(gòu)化處理,得到所述目標表格對應的結(jié)構(gòu)化數(shù)據(jù);
77、表格公式預測模塊,用于根據(jù)所述目標單元格、所述相鄰單元格以及所述結(jié)構(gòu)化數(shù)據(jù),預測目標表格公式;
78、表格公式處理模塊,用于在所述目標單元格的對應位置中顯示所述目標表格公式。
79、在一個可選的實施方式中,所述相鄰單元格包括上相鄰單元格、下相鄰單元格、左相鄰單元格以及右相鄰單元格;
80、所述單元格確定模塊具體用于:
81、確定所述目標表格中目標單元格上方的第一預設(shè)數(shù)量的所述上相鄰單元格;
82、確定所述目標表格中目標單元格下方的第二預設(shè)數(shù)量的所述下相鄰單元格;
83、確定所述目標表格中目標單元格左方的第三預設(shè)數(shù)量的所述左相鄰單元格;
84、確定所述目標表格中目標單元格右方的第四預設(shè)數(shù)量的所述右相鄰單元格。
85、在一個可選的實施方式中,所述表格結(jié)構(gòu)化處理模塊具體用于:
86、識別所述目標表格中的表頭,并對所述目標表格進行拆分,得到所述表頭、所述目標表格中的每行單元格、所述目標表格中的每列單元格;
87、將所述目標表格中的每行單元格添加至行單元格集合,將所述目標表格中的每列單元格添加至列單元格集合。
88、在一個可選的實施方式中,所述表格公式預測模塊具體包括:
89、輸入子模塊,用于將所述目標單元格、所述相鄰單元格、所述表頭、所述行單元格集合以及所述列單元格集合輸入至預訓練的神經(jīng)網(wǎng)絡(luò),得到目標函數(shù)和目標參數(shù);
90、目標函數(shù)、目標參數(shù)組合子模塊,用于對所述目標函數(shù)以及所述目標參數(shù)進行組合,得到目標表格公式。
91、在一個可選的實施方式中,所述預訓練的神經(jīng)網(wǎng)絡(luò)包括預訓練的編碼器、預訓練的解碼器、預訓練的注意力網(wǎng)絡(luò)以及預訓練的大語言模型;
92、所述輸入子模塊具體包括:
93、表頭編碼單元,用于利用所述預訓練的編碼器,對所述表頭進行編碼,得到表頭嵌入向量;
94、行單元格編碼單元,用于利用所述預訓練的編碼器,對所述行單元格集合中的所有行單元格進行編碼,得到行嵌入向量;
95、列單元格編碼單元,用于利用所述預訓練的編碼器,對所述列單元格集合中的所有列單元格進行編碼,得到列嵌入向量;
96、第一輸入單元,用于將所述目標單元格、所述相鄰單元格、所述行嵌入向量以及所述列嵌入向量輸入至所述預訓練的大語言模型,得到第一輸出結(jié)果;
97、第二輸入單元,用于將所述表頭嵌入向量輸入至所述預訓練的注意力網(wǎng)絡(luò),得到第二輸出結(jié)果;
98、解碼單元,用于利用所述預訓練的解碼器,對所述第一輸出結(jié)果以及所述第二輸出結(jié)果進行解碼,得到目標函數(shù)以及目標參數(shù)。
99、在一個可選的實施方式中,所述第一輸入單元具體包括:
100、坐標確定子單元,用于確定所述目標單元格對應的第一坐標以及所述相鄰單元格對應的第二坐標;
101、輸入子單元,用于將所述第一坐標、所述第二坐標、所述行嵌入向量以及所述列嵌入向量輸入至所述預訓練的大語言模型,得到第一輸出結(jié)果。
102、在一個可選的實施方式中,所述坐標確定子單元具體用于:
103、確定所述目標單元格在所述目標表格中的第一位置,將所述第一位置確定為坐標原點,將所述坐標原點確定為所述目標單元格對應的第一坐標;
104、確定所述相鄰單元格在所述目標表格中的第二位置,根據(jù)所述第一位置與所述第二位置之間的位置差,確定所述相鄰單元格對應的第二坐標。
105、在一個可選的實施方式中,所述單元格確定模塊具體用于:
106、響應于針對所述目標表格中目標單元格的填充操作,確定所述目標單元格中填充的第一數(shù)據(jù);
107、在所述第一數(shù)據(jù)為預設(shè)數(shù)據(jù)的情況下,確定所述目標表格中目標單元格對應的相鄰單元格。
108、在一個可選的實施方式中,所述在所述目標單元格的對應位置中顯示所述目標表格公式之后,所述裝置還包括:
109、函數(shù)處理模塊,用于響應于針對所述目標表格中目標單元格的再次填充操作,確定所述目標單元格中再次填充的第二數(shù)據(jù);
110、在所述第二數(shù)據(jù)表征函數(shù)的情況下,在所述目標單元格的對應位置中顯示所述目標函數(shù)。
111、在一個可選的實施方式中,所述在所述目標單元格的對應位置中顯示所述目標函數(shù)之后,所述裝置還包括:
112、參數(shù)處理模塊,用于響應于針對所述目標表格中目標單元格的再次填充操作,確定所述目標單元格中再次填充的第三數(shù)據(jù);
113、在所述第三數(shù)據(jù)表征參數(shù)的情況下,在所述目標單元格的對應位置中顯示所述目標參數(shù)。
114、在一個可選的實施方式中,所述裝置還包括:
115、填充提示觸發(fā)模塊,用于響應于針對所述目標表格中目標列單元格的預設(shè)操作,檢測所述目標列單元格的單元格中是否填充至少兩個相同的表格公式;
116、在所述目標列單元格的單元格中填充至少兩個相同的表格公式的情況下,觸發(fā)表格公式填充提示;
117、所述表格公式填充提示用于提示所述目標列單元格的其余單元格填充所述表格公式。
118、在一個可選的實施方式中,所述裝置還包括:
119、樣本表格獲取模塊,用于獲取樣本表格;
120、樣本單元格確定模塊,用于確定所述樣本表格中樣本單元格對應的相鄰樣本單元格;
121、表頭識別模塊,用于識別所述樣本表格中的樣本表頭;
122、表格拆分模塊,用于對所述樣本表格進行拆分,得到所述樣本表頭、所述樣本表格中的每行樣本單元格、所述樣本表格中的每列樣本單元格;
123、行樣本單元格、列樣本單元格添加模塊,用于將所述樣本表格中的每行樣本單元格添加至行樣本單元格集合,將所述樣本表格中的每列樣本單元格添加至列樣本單元格集合;
124、樣本輸入模塊,用于將所述樣本單元格、所述相鄰樣本單元格、所述樣本表頭、所述行樣本單元格集合、所述列樣本單元格集合輸入至神經(jīng)網(wǎng)絡(luò),得到函數(shù)和參數(shù);
125、函數(shù)、參數(shù)組合模塊,用于對所述函數(shù)和所述參數(shù)進行組合,得到表格公式;
126、網(wǎng)絡(luò)訓練模塊,用于基于所述表格公式對所述神經(jīng)網(wǎng)絡(luò)進行訓練,并在滿足網(wǎng)絡(luò)訓練終止條件的情況下,停止訓練,得到所述預訓練的神經(jīng)網(wǎng)絡(luò)。
127、在一個可選的實施方式中,所述相鄰樣本單元格包括上相鄰樣本單元格、下相鄰樣本單元格、左相鄰樣本單元格以及右相鄰樣本單元格;
128、所述樣本單元格確定模塊具體用于:
129、確定所述樣本表格中樣本單元格上方的第一預設(shè)數(shù)量的所述上相鄰樣本單元格;
130、確定所述樣本表格中樣本單元格下方的第二預設(shè)數(shù)量的所述下相鄰樣本單元格;
131、確定所述樣本表格中樣本單元格左方的第三預設(shè)數(shù)量的所述左相鄰樣本單元格;
132、確定所述樣本表格中樣本單元格右方的第四預設(shè)數(shù)量的所述右相鄰樣本單元格。
133、在一個可選的實施方式中,所述神經(jīng)網(wǎng)絡(luò)包括編碼器、解碼器、注意力網(wǎng)絡(luò)以及大語言模型;
134、所述樣本輸入模塊具體包括:
135、樣本表頭編碼子模塊,用于利用所述編碼器,對所述樣本表頭進行編碼,得到樣本表頭嵌入向量;
136、行樣本單元格編碼子模塊,用于利用所述編碼器,對所述行樣本單元格集合中的所有行樣本單元格進行編碼,得到樣本行嵌入向量;
137、列樣本單元格編碼子模塊,用于利用所述編碼器,對所述列樣本單元格集合中的所有列樣本單元格進行編碼,得到樣本列嵌入向量;
138、樣本輸入子模塊,用于將所述樣本單元格、所述相鄰樣本單元格、所述樣本行嵌入向量、所述樣本列嵌入向量輸入至所述大語言模型,得到第一樣本輸出結(jié)果;
139、向量輸入子模塊,用于將所述樣本表頭嵌入向量輸入至所述注意力網(wǎng)絡(luò),得到第二樣本輸出結(jié)果;
140、解碼子模塊,用于利用所述解碼器,對所述第一樣本輸出結(jié)果和所述第二樣本輸出結(jié)果進行解碼,得到函數(shù)和參數(shù)。
141、在一個可選的實施方式中,所述樣本輸入子模塊具體包括:
142、樣本坐標確定單元,用于確定所述樣本單元格對應的第一樣本坐標以及所述相鄰樣本單元格對應的第二樣本坐標;
143、樣本輸入單元,用于將所述第一樣本坐標、所述第二樣本坐標、所述樣本行嵌入向量、所述樣本列嵌入向量輸入至所述大語言模型,得到第一樣本輸出結(jié)果。
144、在一個可選的實施方式中,所述樣本坐標確定單元具體用于:
145、確定所述樣本單元格在所述樣本表格中的第一樣本位置,將所述第一樣本位置確定為樣本坐標原點,將所述樣本坐標原點確定為所述樣本單元格對應的第一樣本坐標;
146、確定所述相鄰樣本單元格在所述樣本表格中的第二樣本位置,根據(jù)所述第一樣本位置與所述第二樣本位置之間的位置差,確定所述相鄰樣本單元格對應的第二樣本坐標。
147、在本技術(shù)實施例的第三方面,還提供了一種電子設(shè)備,包括處理器、通信接口、存儲器和通信總線,其中,處理器,通信接口,存儲器通過通信總線完成相互間的通信;
148、存儲器,用于存放計算機程序;
149、處理器,用于執(zhí)行存儲器上所存放的程序時,實現(xiàn)上述第一方面中任一所述的表格公式處理方法。
150、在本技術(shù)實施例的第四方面,還提供了一種存儲介質(zhì),所述存儲介質(zhì)中存儲有指令,當其在計算機上運行時,使得計算機執(zhí)行上述第一方面中任一所述的表格公式處理方法。
151、在本技術(shù)實施例的第五方面,還提供了一種包含指令的計算機程序產(chǎn)品,當其在計算機上運行時,使得計算機執(zhí)行上述任一所述的表格公式處理方法。
152、本技術(shù)實施例提供的技術(shù)方案,獲取目標表格,并確定目標表格中目標單元格對應的相鄰單元格,對目標表格進行結(jié)構(gòu)化處理,得到目標表格對應的結(jié)構(gòu)化數(shù)據(jù),根據(jù)目標單元格、相鄰單元格以及結(jié)構(gòu)化數(shù)據(jù),預測目標表格公式,在目標單元格的對應位置中顯示目標表格公式。
153、通過確定目標單元格對應的相鄰單元格,并對目標表格進行結(jié)構(gòu)化處理,從而根據(jù)目標單元格、相鄰單元格以及結(jié)構(gòu)化數(shù)據(jù),預測目標表格公式,在目標單元格的對應位置中顯示目標表格公式,如此無需用戶輸入自然語言的需求就可以得到目標表格公式,可以提高表格數(shù)據(jù)處理的效率,且根據(jù)目標單元格、相鄰單元格以及結(jié)構(gòu)化數(shù)據(jù),預測的目標表格公式,可以減少表格公式的不確定性和出錯概率,提高表格數(shù)據(jù)處理的準確性。