本發(fā)明屬于列車運(yùn)行優(yōu)化,具體涉及一種面向乘客需求的列車自主決策方法。
背景技術(shù):
1、隨著城市軌道交通網(wǎng)絡(luò)化運(yùn)營(yíng)一方面客流總量不斷攀升,以某地為例,雙節(jié)期間日均客運(yùn)量達(dá)523.52萬人次,較日常周末客流增長(zhǎng)4.20%,9月28日單日客運(yùn)量達(dá)783.92萬人次,突破線網(wǎng)歷史紀(jì)錄,滿載率突破140%。另一方面,潮汐客流特征明顯,常見的“職住分離”現(xiàn)象使銜接郊區(qū)和市區(qū)的地鐵線路具有明顯的潮汐特征。早高峰時(shí)段進(jìn)城方向客流量巨大,出城方向客流量較?。煌砀叻鍎t反之。
2、城市軌道交通是一種有組織、有計(jì)劃的運(yùn)輸方式,內(nèi)在涵義是將有限的“線路資源”合理分配給各輛列車,列車按照既定運(yùn)行圖沿軌道縱向、依次運(yùn)行。而既有高峰時(shí)段行車間隔很小,初始延誤極易傳播至其他列車,造成連帶延誤,導(dǎo)致多輛列車中途停車等待,甚至?xí)绊憣?duì)向列車的正常發(fā)車,造成整條線路列車運(yùn)行秩序紊亂。因此列車運(yùn)行調(diào)整是有必要的,現(xiàn)有關(guān)于城市軌道交通列車運(yùn)行調(diào)整以及車車協(xié)同的研究,主要是基于有預(yù)設(shè)計(jì)劃下進(jìn)行列車時(shí)刻表調(diào)整以及高密度等間隔行車,以降低運(yùn)營(yíng)成本和乘客的等待時(shí)間。然而,由于城軌列車起停頻繁,相鄰列車之間追蹤間隔動(dòng)態(tài)變化,既有協(xié)同研究對(duì)客流時(shí)變影響下的到發(fā)時(shí)刻調(diào)整、運(yùn)行間隔調(diào)整以及滿載率指標(biāo)關(guān)注不足。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的是為了解決現(xiàn)有的協(xié)同研究方法對(duì)客流時(shí)變影響下的列車到發(fā)時(shí)刻調(diào)整、運(yùn)行間隔調(diào)整以及滿載率指標(biāo)關(guān)注不足,無法實(shí)現(xiàn)無預(yù)設(shè)計(jì)劃下的列車自主決策的問題,提出了一種面向乘客需求的列車自主決策方法。
2、本發(fā)明的技術(shù)方案為:一種面向乘客需求的列車自主決策方法,包括以下步驟:
3、基于客流實(shí)時(shí)變化,刻畫未來時(shí)刻內(nèi)站臺(tái)乘客數(shù),構(gòu)建動(dòng)態(tài)客流模型;
4、基于動(dòng)態(tài)客流模型,建立多列車分布式協(xié)同框架,將多列車問題轉(zhuǎn)化為前車和后車的單列車問題,并更新各列車獲取的站臺(tái)客流狀態(tài);
5、分析前車和后車的運(yùn)行關(guān)系,構(gòu)建前后車安全防護(hù)約束模型;
6、基于前后車安全防護(hù)約束模型和各列車獲取的站臺(tái)客流狀態(tài),以列車滿載率均衡和乘客等待時(shí)間最小為目標(biāo),設(shè)計(jì)強(qiáng)化學(xué)習(xí)算法,實(shí)現(xiàn)列車自主決策。
7、作為優(yōu)選,所述基于客流實(shí)時(shí)變化,刻畫未來時(shí)刻內(nèi)站臺(tái)乘客數(shù),構(gòu)建動(dòng)態(tài)客流模型,具體包括以下步驟:
8、根據(jù)客流時(shí)變特征,建立站臺(tái)抵達(dá)客流模型,表示為:
9、
10、其中,為站臺(tái)抵達(dá)客流模型,j為站臺(tái)號(hào),j∈n,n為車站集合;t為離散時(shí)間常數(shù);varrive為乘客抵達(dá)站臺(tái)的速率,其表示為:
11、
12、其中,va,peak為高峰期乘客抵達(dá)站臺(tái)速率,va,offpeak為平峰期乘客抵達(dá)站臺(tái)速率;
13、根據(jù)乘客上下車行為特征,建立站臺(tái)上下車客流模型,表示為:
14、
15、其中,為在t時(shí)刻乘客在第j站臺(tái)的下車人數(shù);m為一個(gè)常數(shù)值;為在t時(shí)刻在第j站臺(tái)的上車人數(shù);dj為列車在第j站臺(tái)的停站時(shí)間;von和voff分別為乘客上車速率和下車速率,其表示為:
16、
17、其中,von,peak和voff,peak分別為高峰期乘客上車速率和下車速率;von,offpeak和voff,offpeak分別為平峰期乘客上車速率和下車速率;
18、根據(jù)站臺(tái)抵達(dá)乘客模型和站臺(tái)上下車客流模型,建立動(dòng)態(tài)客流模型,動(dòng)態(tài)客流模型包括站臺(tái)滯留客流模型和列車車上客流模型,表示為:
19、
20、其中,為在t時(shí)刻,站臺(tái)j的滯留乘客數(shù);為在t時(shí)刻,列車到達(dá)第j站臺(tái)時(shí)車上的乘客數(shù);為在tm時(shí)刻剛抵達(dá)j-1站臺(tái)時(shí)列車上的乘客;為在tm時(shí)刻在j-1站臺(tái)上車的乘客;為在tm時(shí)刻在j-1站臺(tái)下車的乘客;tm為某一離散時(shí)刻,每個(gè)時(shí)刻間隔為1s。
21、作為優(yōu)選,所述基于動(dòng)態(tài)客流模型,建立多列車分布式協(xié)同框架,將多列車問題轉(zhuǎn)化為前車和后車的單列車問題,并更新各列車獲取的站臺(tái)客流狀態(tài),具體包括以下步驟:
22、根據(jù)車車通信原理,構(gòu)建多列車分布式協(xié)同框架,表示為:
23、
24、其中,表示一個(gè)階為m的有向圖;v′={1,2,...,m}表示列車智能體集合,m表示列車智能體總數(shù);表示車車通信路徑的集合;如果從列車ix到列車iy存在通信路徑,那么(ix,iy)∈ε,是的鄰接矩陣,其中r表示實(shí)數(shù)集,為矩陣a′中的元素,如果(ix,iy)∈ε,則否則且有鄰接矩陣a′說明當(dāng)前列車只與前一相鄰列車存在通信路徑,若當(dāng)前列車不為第一列車,則令當(dāng)前列車接收前一相鄰列車計(jì)算后的站臺(tái)客流狀態(tài),并在考慮到前面列車在各個(gè)站臺(tái)已經(jīng)或即將運(yùn)走的乘客后,基于動(dòng)態(tài)客流模型計(jì)算當(dāng)前列車在抵達(dá)各個(gè)站臺(tái)時(shí)的客流狀態(tài),進(jìn)而得到各列車獲取的站臺(tái)客流狀態(tài)為:
25、
26、其中,為列車i在駛離第k′站臺(tái)時(shí),列車i接收到的在第j站臺(tái)的實(shí)際站臺(tái)乘客數(shù),為列車i在駛離第k′站臺(tái)時(shí),列車i計(jì)算得到的在第j站臺(tái)的預(yù)估站臺(tái)乘客數(shù);ti,k′為列車i在駛離第k′站臺(tái)的時(shí)刻,ti,k′∈t;為列車i在ti,k′時(shí)刻駛離k′站臺(tái)后,在第j站臺(tái)滯留的乘客數(shù);為在ti,k時(shí)刻,抵達(dá)j站臺(tái)的乘客數(shù);為列車x在第j站臺(tái)上車的乘客數(shù);為在ti,k′時(shí)刻,列車i在站臺(tái)w的計(jì)劃停站時(shí)間;為在ti,k′時(shí)刻,列車i在站臺(tái)w和站臺(tái)w+1區(qū)間內(nèi)的計(jì)劃運(yùn)行時(shí)間;varrive為乘客抵達(dá)站臺(tái)的速率。
27、作為優(yōu)選,所述分析前車和后車的運(yùn)行關(guān)系,構(gòu)建前后車安全防護(hù)約束模型,具體包括以下步驟:
28、構(gòu)建列車運(yùn)動(dòng)學(xué)模型,表示為:
29、
30、其中,為列車實(shí)時(shí)位置對(duì)時(shí)間的導(dǎo)數(shù),即為列車的運(yùn)行速度v(t);為列車實(shí)時(shí)加速度;ui(t)為列車單位質(zhì)量上的牽引力或制動(dòng)力;g為重力加速度;w0為列車運(yùn)行過程中的阻力,w0=δa′a′+δb′b′vi(t)+δc′c′vi(t)2,a′、b′和c′分別為戴維斯公式的系數(shù),δa′、δb′和δc′分別為a′、b′和c′的變化率;γ為列車回轉(zhuǎn)質(zhì)量系數(shù);d(t)為未知有界擾動(dòng),wi為線路坡道附加阻力,wc為線路曲線附加阻力;
31、基于列車運(yùn)動(dòng)學(xué)模型,以準(zhǔn)點(diǎn)為目標(biāo),設(shè)計(jì)動(dòng)態(tài)規(guī)劃算法,獲取各列車速度曲線;
32、基于前車速度曲線,構(gòu)建前后車安全防護(hù)約束模型,表示為:
33、
34、其中,t為離散時(shí)間常數(shù);為第i+1列車在t時(shí)刻的位置;為第i列車在t時(shí)刻的位置;l0為列車間安全間隔裕量。
35、作為優(yōu)選,所述基于列車運(yùn)動(dòng)學(xué)模型,以準(zhǔn)點(diǎn)為目標(biāo),設(shè)計(jì)動(dòng)態(tài)規(guī)劃算法,獲取各列車速度曲線,具體包括以下步驟:
36、基于列車運(yùn)動(dòng)學(xué)模型,將列車運(yùn)行站間距離按照δx間隔劃分為k+1個(gè)階段,將速度按照δv間隔劃分為n+1個(gè)速度間隔,進(jìn)而得到關(guān)于列車運(yùn)動(dòng)狀態(tài)空間離散化的狀態(tài)格點(diǎn),階段k的列車運(yùn)行位置表示為xk,k∈{1,...,k+1},階段k的列車速度狀態(tài)表示為{vk,1,...,vk,n,...,vk,n+1},vk,n為階段k列車速度狀態(tài);
37、以準(zhǔn)點(diǎn)為目標(biāo),設(shè)計(jì)階段指標(biāo)函數(shù),表示為:
38、
39、其中,ck為階段k至末階段k+1的累計(jì)指標(biāo)值;κ為階段k至末階段k+1中的某個(gè)階段;δx為階段間隔距離;vk為第k階段的速度,vk+1為第k+1階段的速度;
40、基于階段指標(biāo)函數(shù)和離散化的狀態(tài)格點(diǎn),對(duì)各階段列車速度狀態(tài)的最優(yōu)決策變量進(jìn)行計(jì)算,表示為:
41、
42、其中:uk,n為階段k列車速度狀態(tài)vk,n對(duì)應(yīng)的決策變量;為階段k列車速度狀態(tài)vk,n對(duì)應(yīng)的最優(yōu)決策變量;u為允許決策集合;ck,n(vk,n,uk,n)為階段k列車速度狀態(tài)vk,n采用uk,n決策對(duì)應(yīng)的指標(biāo);為階段k+1列車速度狀態(tài)vk+1,n′對(duì)應(yīng)的最優(yōu)指標(biāo)函數(shù),n表示確定的某個(gè)列車速度狀態(tài),n′表示不確定的某個(gè)列車速度狀態(tài),其隨著最優(yōu)目標(biāo)值的變化而變化,表示計(jì)算出的最優(yōu)指標(biāo)目標(biāo)函數(shù)所對(duì)應(yīng)的uk,n最優(yōu)決策變量值;
43、將各階段列車速度狀態(tài)的最優(yōu)決策變量進(jìn)行聯(lián)合,得到列車速度曲線。
44、作為優(yōu)選,所述基于前后車安全防護(hù)約束模型和各列車獲取的站臺(tái)客流狀態(tài),以列車滿載率均衡和乘客等待時(shí)間最小為目標(biāo),設(shè)計(jì)強(qiáng)化學(xué)習(xí)算法,實(shí)現(xiàn)列車自主決策,具體包括以下步驟:
45、基于各列車獲取的站臺(tái)客流狀態(tài)以及前后車安全防護(hù)約束模型,設(shè)計(jì)強(qiáng)化學(xué)習(xí)算法,計(jì)算當(dāng)前列車在剩余各區(qū)間的最優(yōu)運(yùn)行時(shí)間和剩余各站臺(tái)的最優(yōu)停站時(shí)間;
46、基于當(dāng)前列車在剩余各區(qū)間的最優(yōu)運(yùn)行時(shí)間,獲取列車速度曲線;
47、滾動(dòng)更新時(shí)刻,列車獲取每個(gè)時(shí)間步長(zhǎng)下的速度指令,按照列車速度曲線運(yùn)行,若列車抵達(dá)站臺(tái),則列車按照最優(yōu)停站時(shí)間停車,同時(shí)更新站臺(tái)乘客信息以及剩余站臺(tái)信息,直至列車抵達(dá)終點(diǎn)站臺(tái),結(jié)束運(yùn)行,實(shí)現(xiàn)列車自主決策。
48、作為優(yōu)選,所述基于各列車獲取的站臺(tái)客流狀態(tài)以及前后車安全防護(hù)約束模型,設(shè)計(jì)強(qiáng)化學(xué)習(xí)算法,計(jì)算當(dāng)前列車在剩余各區(qū)間的最優(yōu)運(yùn)行時(shí)間和剩余各站臺(tái)的最優(yōu)停站時(shí)間,具體包括以下步驟:
49、在滿足前后車安全防護(hù)約束的條件下,以乘客等待時(shí)間最小和列車滿載率均衡為目標(biāo),設(shè)置獎(jiǎng)勵(lì)函數(shù),表示為:
50、
51、其中:sj表示列車在第j站臺(tái)的位置狀態(tài);為在列車位置狀態(tài)sj下的獎(jiǎng)勵(lì)函數(shù);twait,i,j為第i列車在到達(dá)第j站臺(tái)后計(jì)算的所有后續(xù)站臺(tái)乘客等待時(shí)間;rload,i,j為第i列車到達(dá)第j站臺(tái)后計(jì)算的后續(xù)所有站間列車滿載率;γ1和γ2分別為乘客等待時(shí)間和滿載率均衡的權(quán)重系數(shù);
52、乘客等待時(shí)間表示為:
53、
54、其中:ti,j為第i列車到達(dá)第j站臺(tái)的時(shí)間;為第i列車在第χ+1站上車人數(shù);為第i列車獲取的第χ+1站的站臺(tái)乘客數(shù);為第i列車在第β站臺(tái)的預(yù)計(jì)停站時(shí)間;為第i列車在第β站臺(tái)到第β+1站臺(tái)的預(yù)計(jì)運(yùn)行時(shí)間,n為車站集合;
55、列車滿載率均衡表示為:
56、
57、其中:為第i列車在第χ站臺(tái)時(shí)車上的人數(shù);c為列車最大容納能力;||·||表示二范數(shù);
58、基于獎(jiǎng)勵(lì)函數(shù),計(jì)算各列車位置狀態(tài)下選擇最優(yōu)動(dòng)作的最優(yōu)q值,得到最優(yōu)q值表:
59、q*={q′(s1,a),...,q′(sj,a),...,q′(sn,a)}
60、其中:q*為最優(yōu)q值表;q′(sj,a)為在sj狀態(tài)下選擇最優(yōu)動(dòng)作a對(duì)應(yīng)的最優(yōu)q值;
61、計(jì)算最優(yōu)q值表對(duì)應(yīng)的區(qū)間運(yùn)行時(shí)間以及停站時(shí)間,表示為:
62、rtobj={rt1',...,rt′j,...,rt′n}
63、stobj={st1',...,st′j,...,st′n}
64、其中:rtobj和stobj分別為q*映射的各個(gè)區(qū)間的最優(yōu)運(yùn)行時(shí)間和各個(gè)站臺(tái)的最優(yōu)停站時(shí)間,rt′j和st′j分別表示列車從第j站臺(tái)到第j+1站臺(tái)的最優(yōu)運(yùn)行時(shí)間和在第j站臺(tái)的最優(yōu)停站時(shí)間,q*→{rtobj,stobj}。
65、作為優(yōu)選,所述基于獎(jiǎng)勵(lì)函數(shù),計(jì)算各列車位置狀態(tài)下選擇最優(yōu)動(dòng)作的最優(yōu)q值,具體包括以下步驟:
66、設(shè)置最大迭代步長(zhǎng),并隨機(jī)初始化列車位置狀態(tài)sj;
67、基于列車位置狀態(tài)sj隨機(jī)選擇動(dòng)作或選擇q值最大的動(dòng)作,表示為:
68、
69、其中:a為在列車當(dāng)前位置狀態(tài)sj選擇的動(dòng)作;sj+1為列車下一位置狀態(tài);aw為列車下一位置狀態(tài)sj+1可以選擇的動(dòng)作;表示求q值最大時(shí)對(duì)應(yīng)的動(dòng)作aw,q(sj+1,aw)為列車下一位置狀態(tài)sj+1選擇動(dòng)作aw對(duì)應(yīng)的q值;ar為隨機(jī)動(dòng)作;pr為隨機(jī)概率,pr∈[0,1];
70、基于獎(jiǎng)勵(lì)函數(shù),更新列車當(dāng)前狀態(tài)選擇的動(dòng)作對(duì)應(yīng)的q值;
71、
72、其中:q′(sj,a)表示更新后列車在位置狀態(tài)sj選擇的動(dòng)作a對(duì)應(yīng)的q值,q(sj,a)表示更新前列車在位置狀態(tài)sj選擇的動(dòng)作a對(duì)應(yīng)的q值,α為學(xué)習(xí)率,γ′為懲罰因子,α和γ′為自定義常數(shù);為獎(jiǎng)勵(lì)函數(shù);
73、更新列車下一位置狀態(tài),直至到達(dá)終點(diǎn)位置,跳出當(dāng)前迭代,重復(fù)初始化列車位置狀態(tài),選擇動(dòng)作,并計(jì)算更新動(dòng)作的q值,直至達(dá)到最大迭代步長(zhǎng),輸出最優(yōu)q值表及其對(duì)應(yīng)的區(qū)間運(yùn)行時(shí)間以及停站時(shí)間。
74、本發(fā)明的有益效果是:
75、本發(fā)明考慮了客流的實(shí)時(shí)變化以及無預(yù)設(shè)計(jì)劃下的列車運(yùn)行,能保證列車運(yùn)行安全性的前提下,減少站臺(tái)所有乘客的平均等待時(shí)間,實(shí)現(xiàn)滿載率均衡提高乘客舒適度以及減少運(yùn)力浪費(fèi)。