區(qū)域航空客流量預(yù)測研究

時(shí)間:2022-12-21 11:21:57

導(dǎo)語:區(qū)域航空客流量預(yù)測研究一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

區(qū)域航空客流量預(yù)測研究

摘要:鑒于在航空運(yùn)輸領(lǐng)域中應(yīng)用經(jīng)濟(jì)計(jì)量模型預(yù)測航空客流量存在一定的局限性,為此本文運(yùn)用粗糙集理論分析區(qū)域航空客流量。在選擇影響區(qū)域航空客流量因素的基礎(chǔ)上,形成了我國31個(gè)地區(qū)航空客流量的決策表,進(jìn)而對決策表運(yùn)用粗糙集的有關(guān)方法得出了我國31個(gè)地區(qū)的航空客流量生成規(guī)則,最后采用這些規(guī)則對區(qū)域航空客流量進(jìn)行預(yù)測,取得比較好的預(yù)測結(jié)果。

關(guān)鍵詞:粗糙集;航空客流量;連續(xù)值離散化;屬性

為了識別航空客流量與其決定因素之間的關(guān)系并對前者進(jìn)行預(yù)測,目前最常見的方法是建立經(jīng)濟(jì)計(jì)量模型。這些傳統(tǒng)模型建立在各種統(tǒng)計(jì)假設(shè)的基礎(chǔ)上,因此當(dāng)變量之間相互依存、變量的概率分布未知時(shí),那么這些模型就無法得出比較準(zhǔn)確的結(jié)果。為此本文試圖探討一種基于粗糙集理論的航空客流量預(yù)測模型。作為計(jì)算智能方法之一的粗糙集理論(Roughsetstheo-ry,簡稱RS)是波蘭數(shù)學(xué)家ZdzislawPawlak于1982年首次提出的。粗集理論誕生的30多年來,已成功地在許多領(lǐng)域中得到應(yīng)用,然而在航空運(yùn)輸領(lǐng)域中還沒有見到關(guān)于粗集理論的應(yīng)用文獻(xiàn)。因此,本文在這方面作一個(gè)嘗試,并通過實(shí)例闡明粗集理論在航空客流量方面的應(yīng)用是適合的。

1.基于粗糙集理論的方法

粗糙集理論中的知識表達(dá)方式一般采用信息表或稱為信息系統(tǒng)的形式,信息系統(tǒng)可用四元有序組K=(U,A,V,ρ),在該式中,U是一個(gè)非空有限的對象集合,U={X}1,X2⋯Xn稱為論域;A是一個(gè)非空有限的屬性集合,A={a}1,a2⋯an;V=∪a∈AVa是屬性A所構(gòu)成的值域集合,Va是屬性a的值域;U中任一元素取屬性a在V中有唯一確定值。ρ:U×A→V被稱為信息函數(shù),ρ:A→V,x∈U,反映了對象x在K中的完全信息,其中ρ(a)=ρ(x,a)。如果A=C∪D且C∩D=ф則信息系統(tǒng)又可稱為決策表,其中C為條件屬性集,D為決策屬性集,常記為(U,C∪D,V,ρ)。在決策表中,不同的條件屬性具有不同的重要程度,一些屬性提供了豐富的信息,對產(chǎn)生決策起到至關(guān)重要的作用,而其他一些屬性卻似乎是可有可無的。因此,在保證決策表具有正確分類能力的同時(shí),對條件屬性進(jìn)行簡約,去掉不必要的屬性。為了度量屬性集合的不確定程度,引入精度和覆蓋度兩個(gè)概念,且定義為:dR(X)i=card()-aprXi/card()---aprXi(1)dR(F)=∑card()-aprXi∑card()---aprXi(2)d'R(X)i=card()---aprXi/card(U)i(3)d'R(F)=∑card()---aprXi/card(U)(4)式(1)和(2)分別為屬性集合Xi的分類精度和覆蓋度,式(3)和(4)分別為所有屬性集合的總分類精度和總分類覆蓋度。

2.粗糙集在區(qū)域航空客流量中的應(yīng)用

2.1航空客流量影響因素分析。分析我國航空運(yùn)輸業(yè)特點(diǎn),并結(jié)合相關(guān)已有的研究,本文采用六個(gè)影響因素來預(yù)測各地區(qū)航空客流量:人均GDP、人口、第一產(chǎn)業(yè)就業(yè)人員的比重、城市人口、國際旅游人數(shù)、與航空樞紐的距離等。這六個(gè)因素就是六個(gè)條件屬性,而決策屬性就是各地區(qū)的航空客流量,研究對象則是我國大陸的31個(gè)省、直轄市、自治區(qū)。每個(gè)對象由一個(gè)多值屬性(即條件屬性和決策屬性)的集合來描述,從而形成一個(gè)二維表格,即決策表,表格的“行”與對象相對應(yīng),表格的“列”對應(yīng)于對象的屬性,表中為具體的屬性值。條件屬性中的“人均GDP”“人口數(shù)”和“第一產(chǎn)業(yè)人員比重”均為傳統(tǒng)需求模型中所常用的經(jīng)濟(jì)變量?!俺鞘腥丝跀?shù)”的選取主要是考慮城市規(guī)模對航空客流量的影響?!皣H旅游人數(shù)”的選取主要是考慮該屬性能間接反映某地區(qū)旅游資源的多少,它能解釋對于當(dāng)?shù)亟?jīng)濟(jì)并不發(fā)達(dá)的地區(qū)(如云南)卻有較多的航空客流量。關(guān)于“與航空樞紐的距離”這個(gè)屬性,從我國航空運(yùn)輸格局來看,北京、上海和廣州是三大航空樞紐,因此這三個(gè)地區(qū)的該屬性值為“0”;天津離北京很近,而北京又處于河北的中心,所以天津和河北的該屬性值均為“1”,表示“特近”的含義;另外,由于江蘇的常州、無錫、蘇州、昆山等經(jīng)濟(jì)重心緊靠著上海,所以其“與航空樞紐的距離”屬性為“2”,表示“近”的含義;其余地區(qū)類推,數(shù)字越大的地區(qū)表示該地區(qū)與航空樞紐的距離越遠(yuǎn)。在決策時(shí),把決策屬性“地區(qū)航空客流量”分成若干等級,運(yùn)用粗糙集理論得出每個(gè)“地區(qū)航空客流量”等級所對應(yīng)的生成規(guī)則。2.2數(shù)據(jù)離散化。在應(yīng)用粗糙集理論對實(shí)際數(shù)據(jù)進(jìn)行分析和獲取知識時(shí),一般要求由實(shí)際數(shù)據(jù)構(gòu)成的決策表中各個(gè)屬性值必須用離散值表達(dá)。如果某些條件屬性或決策屬性的值域?yàn)檫B續(xù)的,則在處理前必須經(jīng)過離散化。所以對于下表1中的連續(xù)型數(shù)據(jù)需再進(jìn)一步離散化成分類數(shù)據(jù)值以適用于粗糙集的方法。對粗糙集連續(xù)屬性離散化的方法一般是采用其他領(lǐng)域已有的離散化方法,本文采用熵方法對連續(xù)型數(shù)據(jù)進(jìn)行離散化。設(shè)P⊆A,U/P={C}1,C2,⋯Ct,則U中對象x屬于等價(jià)類Ci的概率為pi=||Ci/||U,I=1,2,…,t,于是定義P對U的劃分得到的熵為:2.3決策規(guī)則。本文使用2012年至2015年四年共124個(gè)對象(共868個(gè)觀測值),使用其中60%的對象作為訓(xùn)練規(guī)則用,去發(fā)現(xiàn)決策規(guī)則,其余的40%的對象(即50個(gè))作為預(yù)測用,以驗(yàn)證規(guī)則的有效性。在使用粗糙集方法后得出了表2中的航空客流量決策規(guī)則的主要部分。第一條規(guī)則的含義是:如果某地區(qū)人均GDP小于7198元且人口數(shù)小于2642萬人且第一產(chǎn)業(yè)就業(yè)人員比重大于等于50.5%且國際旅游人數(shù)小于44.5萬人,那么該地區(qū)航空客流量就小于200萬人次,其余的規(guī)則含義類推。該規(guī)則把航空客流量影響因素的定性和定量兩方面很好結(jié)合在一起,另外,同樣的航空客流量可以由多條規(guī)則產(chǎn)生,這符合實(shí)際情況。從規(guī)則中各屬性出現(xiàn)的頻次可得出各屬性的重要程度,從多到少依次是“第一產(chǎn)業(yè)就業(yè)人員比重”“人均GDP”“人口數(shù)”“國際旅游人數(shù)”和“與航空樞紐的距離”,而“200萬人口以上城市數(shù)”被約簡,從未出現(xiàn)過。運(yùn)用上述公式,對用于測試的50個(gè)地區(qū)進(jìn)行擬合,得出表3中的預(yù)測結(jié)果。在被測試地區(qū)總數(shù)中,等級4的上近似集合中地區(qū)實(shí)際個(gè)數(shù)是12個(gè),被正確預(yù)測的為10個(gè),預(yù)測精度為83%;等級3的上近似集合中地區(qū)實(shí)際個(gè)數(shù)是19個(gè),被正確預(yù)測的為17個(gè),預(yù)測精度為90%;等級2的上近似集合中地區(qū)實(shí)際個(gè)數(shù)是10個(gè),被正確預(yù)測的為8個(gè),預(yù)測精度為80%;等級1的上近似集合中地區(qū)實(shí)際個(gè)數(shù)是8個(gè),被正確預(yù)測的為8個(gè),預(yù)測精度為100%;全部等級的總體精度為88%。另外,等級3中有一個(gè)地區(qū)的覆蓋度為95%,從而使總體覆蓋度為98%,因此粗糙集理論應(yīng)用在航空客流量預(yù)測中是可行的。

本文論述應(yīng)用粗糙集理論及其模型對我我國區(qū)域航空客流量進(jìn)行預(yù)測,得出了一些預(yù)測規(guī)則,其預(yù)測精度較高。與許多傳統(tǒng)模型需要建立各種統(tǒng)計(jì)假設(shè)基礎(chǔ)不同,該方法僅需對屬性值進(jìn)行分類。區(qū)別于復(fù)雜的數(shù)學(xué)公式,該方法的分析的結(jié)果以規(guī)則形式進(jìn)行描述,直觀并容易理解。此外粗糙集能夠使用定性數(shù)據(jù),無須轉(zhuǎn)換成數(shù)值,因此可以有效地防止信息失真。當(dāng)然,針對不同時(shí)間段的航空客流量數(shù)據(jù)進(jìn)行動(dòng)態(tài)規(guī)則的形成是有待進(jìn)一步解決的問題。

參考文獻(xiàn):

[1]張文修,吳偉志,梁吉業(yè)等.粗糙集理論與方法[M].北京:科學(xué)出版社,2001.

[2]張永莉,張曉全.我國城市間航空客運(yùn)量影響因素的實(shí)證分析[J].經(jīng)濟(jì)地理,2007,4:20-24.

[3]中國民用航空局發(fā)展計(jì)劃司.從統(tǒng)計(jì)看民航[M].北京:中國民航出版社,2012-2015.

[4]中華人民共和國統(tǒng)計(jì)局編.中國統(tǒng)計(jì)年鑒[M].北京:中國統(tǒng)計(jì)出版社,2012-2016.

作者:劉曉明 單位:南京工業(yè)職業(yè)技術(shù)學(xué)院