本說(shuō)明書(shū)實(shí)施例涉及計(jì)算機(jī),特別涉及一種任務(wù)處理方法、基于任務(wù)處理模型的信息處理方法及任務(wù)平臺(tái)。
背景技術(shù):
1、在人工智能的自動(dòng)任務(wù)處理領(lǐng)域,任務(wù)通常需分解為多個(gè)連續(xù)階段完成,每個(gè)階段的輸出對(duì)后續(xù)步驟至關(guān)重要。特別是在強(qiáng)化學(xué)習(xí)中,這種多階段任務(wù)要求模型不僅理解單個(gè)階段的操作,還需掌握階段間的依賴關(guān)系,以實(shí)現(xiàn)合適的執(zhí)行效果。
2、然而,在多階段任務(wù)的模型訓(xùn)練中,分階段訓(xùn)練可能導(dǎo)致各階段間的一致性和連貫性減弱,因?yàn)閱为?dú)訓(xùn)練難以捕捉全局目標(biāo)。而嘗試整體訓(xùn)練時(shí),又會(huì)遇到如何有效設(shè)置獎(jiǎng)勵(lì)信號(hào)的問(wèn)題,尤其是在確保各階段間依賴關(guān)系得到準(zhǔn)確反映的情況下。這使得訓(xùn)練既高效又能保持階段間協(xié)調(diào)成為難題。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本說(shuō)明書(shū)實(shí)施例提供了一種任務(wù)處理方法。本說(shuō)明書(shū)一個(gè)或者多個(gè)實(shí)施例同時(shí)涉及一種任務(wù)處理模型訓(xùn)練方法,一種基于任務(wù)處理模型的信息處理方法,一種任務(wù)平臺(tái),一種任務(wù)處理裝置,一種任務(wù)處理模型訓(xùn)練裝置,一種計(jì)算設(shè)備,一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)以及一種計(jì)算機(jī)程序產(chǎn)品,以解決現(xiàn)有技術(shù)中存在的技術(shù)缺陷。
2、根據(jù)本說(shuō)明書(shū)實(shí)施例的第一方面,提供了一種任務(wù)處理方法,包括:
3、獲取目標(biāo)任務(wù)的待處理任務(wù)數(shù)據(jù),其中,目標(biāo)任務(wù)包括至少兩個(gè)層級(jí)的層級(jí)任務(wù);
4、將待處理任務(wù)數(shù)據(jù)輸入至任務(wù)處理模型執(zhí)行至少兩個(gè)層級(jí)的層級(jí)任務(wù)中的初始層級(jí)任務(wù),獲得中間結(jié)果,其中,任務(wù)處理模型基于至少兩個(gè)樣本層級(jí)任務(wù)與標(biāo)簽任務(wù)結(jié)果訓(xùn)練得到,所述標(biāo)簽任務(wù)結(jié)果是對(duì)至少兩個(gè)樣本層級(jí)任務(wù)執(zhí)行后,對(duì)預(yù)期得到的結(jié)果進(jìn)行標(biāo)注的信息;
5、將中間結(jié)果輸入至任務(wù)處理模型,迭代執(zhí)行至少兩個(gè)層級(jí)的層級(jí)任務(wù)中除初始層級(jí)任務(wù)之外的其他層級(jí)任務(wù),直至獲得目標(biāo)任務(wù)的任務(wù)處理結(jié)果。
6、根據(jù)本說(shuō)明書(shū)實(shí)施例的第二方面,提供了一種任務(wù)處理模型訓(xùn)練方法,包括:
7、獲取樣本任務(wù)的樣本任務(wù)數(shù)據(jù)與樣本任務(wù)對(duì)應(yīng)的標(biāo)簽任務(wù)結(jié)果,其中,樣本任務(wù)包括至少兩個(gè)層級(jí)的樣本層級(jí)任務(wù);
8、將樣本任務(wù)數(shù)據(jù)輸入至初始處理模型執(zhí)行初始樣本層級(jí)任務(wù),獲得樣本中間結(jié)果;
9、將樣本中間結(jié)果輸入至初始處理模型,迭代執(zhí)行至少兩個(gè)層級(jí)的樣本層級(jí)任務(wù)中除初始樣本層級(jí)任務(wù)之外的其他樣本層級(jí)任務(wù),直至獲得樣本任務(wù)的預(yù)測(cè)處理結(jié)果;
10、基于預(yù)測(cè)處理結(jié)果與標(biāo)簽任務(wù)結(jié)果,訓(xùn)練初始處理模型,獲得任務(wù)處理模型。
11、根據(jù)本說(shuō)明書(shū)實(shí)施例的第三方面,提供了一種基于任務(wù)處理模型的信息處理方法,應(yīng)用于任務(wù)平臺(tái),包括:
12、接收終端設(shè)備發(fā)送的任務(wù)生成請(qǐng)求,其中,任務(wù)生成請(qǐng)求包括請(qǐng)求信息;
13、基于請(qǐng)求信息,獲取任務(wù)處理模型,其中,任務(wù)處理模型用于基于目標(biāo)任務(wù)的待處理任務(wù)數(shù)據(jù)執(zhí)行至少兩個(gè)層級(jí)的層級(jí)任務(wù)中的初始層級(jí)任務(wù),獲得中間結(jié)果,并基于中間結(jié)果迭代執(zhí)行少兩個(gè)層級(jí)的層級(jí)任務(wù)中除初始層級(jí)任務(wù)之外的其他層級(jí)任務(wù),直至獲得目標(biāo)任務(wù)的任務(wù)處理結(jié)果,其中,目標(biāo)任務(wù)包括至少兩個(gè)層級(jí)的層級(jí)任務(wù),任務(wù)處理模型基于至少兩個(gè)樣本層級(jí)任務(wù)與標(biāo)簽任務(wù)結(jié)果訓(xùn)練得到;
14、基于任務(wù)處理模型,生成任務(wù)信息,其中,任務(wù)信息用于終端設(shè)備執(zhí)行目標(biāo)任務(wù)。
15、根據(jù)本說(shuō)明書(shū)實(shí)施例的第四方面,提供了一種任務(wù)平臺(tái),包括請(qǐng)求接口和響應(yīng)單元;
16、請(qǐng)求接口,用于接收終端設(shè)備發(fā)送的任務(wù)生成請(qǐng)求,其中,任務(wù)生成請(qǐng)求包括請(qǐng)求信息;
17、響應(yīng)單元,用于基于請(qǐng)求信息,獲取任務(wù)處理模型,其中,任務(wù)處理模型用于基于目標(biāo)任務(wù)的待處理任務(wù)數(shù)據(jù)執(zhí)行至少兩個(gè)層級(jí)的層級(jí)任務(wù)中的初始層級(jí)任務(wù),獲得中間結(jié)果,并基于中間結(jié)果迭代執(zhí)行少兩個(gè)層級(jí)的層級(jí)任務(wù)中除初始層級(jí)任務(wù)之外的其他層級(jí)任務(wù),直至獲得目標(biāo)任務(wù)的任務(wù)處理結(jié)果,其中,目標(biāo)任務(wù)包括至少兩個(gè)層級(jí)的層級(jí)任務(wù),任務(wù)處理模型基于至少兩個(gè)樣本層級(jí)任務(wù)與標(biāo)簽任務(wù)結(jié)果訓(xùn)練得到。
18、根據(jù)本說(shuō)明書(shū)實(shí)施例的第五方面,提供了一種任務(wù)處理裝置,包括:
19、第一獲取模塊,被配置為獲取目標(biāo)任務(wù)的待處理任務(wù)數(shù)據(jù),其中,目標(biāo)任務(wù)包括至少兩個(gè)層級(jí)的層級(jí)任務(wù);
20、第一任務(wù)執(zhí)行模塊,被配置為將待處理任務(wù)數(shù)據(jù)輸入至任務(wù)處理模型執(zhí)行至少兩個(gè)層級(jí)的層級(jí)任務(wù)中的初始層級(jí)任務(wù),獲得中間結(jié)果,其中,任務(wù)處理模型基于至少兩個(gè)樣本層級(jí)任務(wù)與標(biāo)簽任務(wù)結(jié)果訓(xùn)練得到,所述標(biāo)簽任務(wù)結(jié)果是對(duì)至少兩個(gè)樣本層級(jí)任務(wù)執(zhí)行后,對(duì)預(yù)期得到的結(jié)果進(jìn)行標(biāo)注的信息;
21、第二任務(wù)執(zhí)行模塊,被配置為將中間結(jié)果輸入至任務(wù)處理模型,迭代執(zhí)行至少兩個(gè)層級(jí)的層級(jí)任務(wù)中除初始層級(jí)任務(wù)之外的其他層級(jí)任務(wù),直至獲得目標(biāo)任務(wù)的任務(wù)處理結(jié)果。
22、根據(jù)本說(shuō)明書(shū)實(shí)施例的第六方面,提供了一種任務(wù)處理模型訓(xùn)練裝置,包括:
23、第二獲取模塊,被配置為獲取樣本任務(wù)的樣本任務(wù)數(shù)據(jù)與樣本任務(wù)對(duì)應(yīng)的標(biāo)簽任務(wù)結(jié)果,其中,樣本任務(wù)包括至少兩個(gè)層級(jí)的樣本層級(jí)任務(wù);
24、第三任務(wù)執(zhí)行模塊,被配置為將樣本任務(wù)數(shù)據(jù)輸入至初始處理模型執(zhí)行初始樣本層級(jí)任務(wù),獲得樣本中間結(jié)果;
25、第四任務(wù)執(zhí)行模塊,被配置為將樣本中間結(jié)果輸入至初始處理模型,迭代執(zhí)行至少兩個(gè)層級(jí)的樣本層級(jí)任務(wù)中除初始樣本層級(jí)任務(wù)之外的其他樣本層級(jí)任務(wù),直至獲得樣本任務(wù)的預(yù)測(cè)處理結(jié)果;
26、訓(xùn)練模塊,被配置為基于預(yù)測(cè)處理結(jié)果與標(biāo)簽任務(wù)結(jié)果,訓(xùn)練初始處理模型,獲得任務(wù)處理模型。
27、根據(jù)本說(shuō)明書(shū)實(shí)施例的第七方面,提供了一種計(jì)算設(shè)備,包括:
28、存儲(chǔ)器和處理器;
29、其中,存儲(chǔ)器用于存儲(chǔ)計(jì)算機(jī)程序/指令,處理器用于執(zhí)行計(jì)算機(jī)程序/指令,該計(jì)算機(jī)程序/指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述任務(wù)處理方法、任務(wù)處理模型訓(xùn)練方法、基于任務(wù)處理模型的信息處理方法的步驟。
30、根據(jù)本說(shuō)明書(shū)實(shí)施例的第八方面,提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其存儲(chǔ)有計(jì)算機(jī)程序/指令,該計(jì)算機(jī)程序/指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述任務(wù)處理方法、任務(wù)處理模型訓(xùn)練方法、基于任務(wù)處理模型的信息處理方法的步驟。
31、根據(jù)本說(shuō)明書(shū)實(shí)施例的第九方面,提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序/指令,該計(jì)算機(jī)程序/指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述任務(wù)處理方法、任務(wù)處理模型訓(xùn)練方法、基于任務(wù)處理模型的信息處理方法的步驟。
32、本說(shuō)明書(shū)一個(gè)實(shí)施例實(shí)現(xiàn)了,獲取目標(biāo)任務(wù)的待處理任務(wù)數(shù)據(jù),其中,目標(biāo)任務(wù)包括至少兩個(gè)層級(jí)的層級(jí)任務(wù);將待處理任務(wù)數(shù)據(jù)輸入至任務(wù)處理模型執(zhí)行至少兩個(gè)層級(jí)的層級(jí)任務(wù)中的初始層級(jí)任務(wù),獲得中間結(jié)果,其中,任務(wù)處理模型基于至少兩個(gè)樣本層級(jí)任務(wù)與標(biāo)簽任務(wù)結(jié)果訓(xùn)練得到,所述標(biāo)簽任務(wù)結(jié)果是對(duì)至少兩個(gè)樣本層級(jí)任務(wù)執(zhí)行后,對(duì)預(yù)期得到的結(jié)果進(jìn)行標(biāo)注的信息;將中間結(jié)果輸入至任務(wù)處理模型,迭代執(zhí)行至少兩個(gè)層級(jí)的層級(jí)任務(wù)中除初始層級(jí)任務(wù)之外的其他層級(jí)任務(wù),直至獲得目標(biāo)任務(wù)的任務(wù)處理結(jié)果。通過(guò)使用最終的標(biāo)簽任務(wù)結(jié)果來(lái)反向調(diào)整和優(yōu)化至少兩個(gè)樣本層級(jí)的層級(jí)任務(wù),確保了只有當(dāng)整個(gè)任務(wù)流程達(dá)成預(yù)期目標(biāo)時(shí),各個(gè)樣本層級(jí)任務(wù)才被視為正確。使得任務(wù)處理模型不僅能夠?qū)W習(xí)到單個(gè)層級(jí)內(nèi)部的操作,還能理解并掌握層級(jí)間依賴關(guān)系,從而實(shí)現(xiàn)對(duì)目標(biāo)任務(wù)的整體優(yōu)化。同時(shí),由于各階段的學(xué)習(xí)與調(diào)整均以最終結(jié)果為導(dǎo)向,因此有效簡(jiǎn)化了復(fù)雜獎(jiǎng)勵(lì)信號(hào)的設(shè)計(jì)需求,在保持階段間協(xié)調(diào)性的基礎(chǔ)上顯著提升了任務(wù)處理效率和結(jié)果質(zhì)量。