- 相關(guān)推薦
提升交通管理能力數據策略論文
1、研究背景及意義

目前,“大數據”一詞成為熱點(diǎn)關(guān)鍵詞之一,預示著(zhù)大數據時(shí)代的到來(lái)。大數據分析已經(jīng)不僅僅是信息革命的新階段,更關(guān)系到諸多實(shí)體企業(yè)在電子商務(wù)、公共服務(wù)及安全上的應用,企業(yè)的發(fā)展革新已經(jīng)離不開(kāi)大數據的應用。如今,企業(yè)對于大數據已經(jīng)不再局限于了解大數據是什么階段,大數據已經(jīng)開(kāi)始切實(shí)運用于實(shí)際。云計算和大數據將攜手,共同掀起生產(chǎn)力大解放,與以蒸汽機的使用和電氣的使用為代表的第一次工業(yè)革命和第二次工業(yè)革命不同的是,這次是以數據為材料,計算為能源。未來(lái)國家的發(fā)展戰略將會(huì )以數據儲備及數據分析為核心。城市交通已面臨諸多嚴重問(wèn)題,必須采取更有效的措施,保證城市交通系統有效運行。為了應對城市交通運行困境,第一屆智能交通大會(huì )于1994年在巴黎召開(kāi),從此,智能交通日益成為人們熱衷探討的話(huà)題,隨著(zhù)時(shí)間流逝,智能交通研究與應用在美、歐、日三國取得了長(cháng)足發(fā)展,這三個(gè)國家及地區也成為了世界智能交通研究應用的主要基地。同時(shí),一些發(fā)達國家及地區例如新加坡、香港、澳大利亞等在此方面的研究也取得了相當的成果。我國近年來(lái)也一直在充分利用物聯(lián)網(wǎng)、云計算、大數據、移動(dòng)互聯(lián)等技術(shù),大力推進(jìn)我國交通運輸領(lǐng)域的信息化。目前,云計算、大數據、移動(dòng)互聯(lián)等新技術(shù)已被廣泛運用到車(chē)路協(xié)同系統、公眾出行便捷服務(wù)、車(chē)聯(lián)網(wǎng)等領(lǐng)域的研究和實(shí)踐中。隨著(zhù)大數據技術(shù)的廣泛研究及應用,智能交通上已經(jīng)可以運用大數據手段,對交通運輸的需求進(jìn)行分析,得出精確的需求數據,在這樣的形勢之下,交通網(wǎng)絡(luò )優(yōu)化、智能化出行服務(wù)以及交通應急保障等方面將形成巨大的市場(chǎng),大數據技術(shù)將成為市場(chǎng)新趨勢。
2、研究?jì)热?/strong>
借助大數據技術(shù),可以對多源、異構、海量、時(shí)變的海量交通數據進(jìn)行分析和處理,挖掘其隱含的時(shí)空知識,為交通管理部門(mén)和出行者提供有利于公共系統調度和車(chē)主出行的決策信息,以便主動(dòng)干預各類(lèi)可能的交通問(wèn)題,而不再被動(dòng)接受,主要內容包括以下內容。
2.1構建交通大數據的時(shí)空模型,對交通流狀態(tài)分析和趨勢預測
利用聚類(lèi)分析方法,構建交通流大數據時(shí)空模型。利用對海量交通數據(包括靜態(tài)和動(dòng)態(tài)數據:交通基礎設施數據是相對靜態(tài)的,如橋梁、城市道路、立交、軌道網(wǎng)、停車(chē)場(chǎng)等。各類(lèi)動(dòng)態(tài)交通運行信息即為動(dòng)態(tài)交通數據,包括交通事故、施工占道、道路實(shí)時(shí)車(chē)速、流量、停車(chē)位使用等)。進(jìn)行空間聚類(lèi)分析,根據道路節點(diǎn)收集的數據,將數據內部隱含的信息特征找出來(lái),將這些相似度高、關(guān)聯(lián)性大的數據聚合。運用這一聚類(lèi)分析方法,人們可以發(fā)現數據中交通網(wǎng)絡(luò )的分布模式,從數據結果出發(fā),實(shí)現交通流狀態(tài)的分析及預測。道路網(wǎng)通達性對于交通流量序列有著(zhù)極大影響,處于同一時(shí)空之內的道路之間,必然存在時(shí)間差異關(guān)系極大的流量序列。所以,各個(gè)流量序列之間的時(shí)間相關(guān)性,可以通過(guò)空間權重矩陣和時(shí)間延遲做出明確的表達,按照相關(guān)系數,將預測相關(guān)因子選取出來(lái),以多種算法模型為手段,對交通流趨勢進(jìn)行預測。
2.2基于交通流大數據時(shí)空模型,分析交通路網(wǎng)擁堵?tīng)顟B(tài)的趨勢和成因
交通擁堵趨勢及成因可以通過(guò)分析擁堵?tīng)顟B(tài)的數據、時(shí)空特征、語(yǔ)義,以時(shí)空關(guān)聯(lián)性為基本方法,采用時(shí)空關(guān)聯(lián)規則做出分析。在這一過(guò)程中,還應該提高時(shí)空關(guān)聯(lián)規則的獲取效率,可以通過(guò)過(guò)濾無(wú)效數據,降低時(shí)間空間雜亂數據的干擾。按照這種思路,首先可以對頻繁項集產(chǎn)生過(guò)程中的時(shí)空數據進(jìn)行時(shí)間、空間段上的劃分,分析時(shí)間與空間的有效性及關(guān)聯(lián)性,在形成事務(wù)表之后,鏈接時(shí)空規則之間的項集,以擁堵?tīng)顟B(tài)的時(shí)空關(guān)聯(lián)規則為基礎,分析交通網(wǎng)的擁堵趨勢。
2.3基于復雜網(wǎng)絡(luò )的各公共交通子網(wǎng)之間級聯(lián)關(guān)系的研究
公共交通是城市交通管理的主要對象,利用大數據手段分析公共交通數據(公交車(chē)、地鐵等數據),探尋交通運行規律,研究各公共交通子網(wǎng)之間的級聯(lián)關(guān)系。
3關(guān)鍵問(wèn)題
3.1大數據平臺的搭建
交通信息數據具有海量異構的特征,需要采用大數據手段、搭建大數據平臺,本項目擬搭建HADOOP大數據環(huán)境,既需要對HADOOP環(huán)境本身的調試和配置,也需要對海量異構的交通數據進(jìn)行分類(lèi)梳理。因此,搭建HADOOP大數據環(huán)境需要解決描述數據之間的連接關(guān)系及其相互影響,以及在分布式條件下數據的分類(lèi)、聚合及其參數的設定。因此,解決了這一問(wèn)題,將為后續大數據算法模型的運行提供基礎環(huán)境。
3.2多目標多因素算法和模型建立和優(yōu)化方法
城市交通運行特性異常復雜,尤其是在擁堵情況下,受到的約束條件更多(如地鐵客流、公交車(chē)客流等),因此,需要在課題建立的模型基礎上制定適應多目標多時(shí)間尺度的協(xié)調優(yōu)化方法。
3.3交通復雜網(wǎng)絡(luò )拓撲
城市交通運行涉及交通路網(wǎng)、地鐵、公交、出租等復雜數據,這些數據各自成網(wǎng),又相互作用。因此,建立交通復雜網(wǎng)絡(luò )拓撲結構,對模擬現實(shí)交通運行狀況,探尋交通運行規律至關(guān)重要。
4、研究步驟
可以采用理論分析、數值計算和試驗相結合的方法,取得研究效果。
4.1清洗數據
交通數據的組成包括動(dòng)態(tài)數據以及基礎設施數據,運用大數據手段來(lái)提升交通運行效率,就要對數據進(jìn)行清洗。首先,動(dòng)態(tài)交通數據的采集可以通過(guò)移動(dòng)通信、視頻、波頻等方式進(jìn)行。例如,路口交通流量數據的收集,可以通過(guò)固定的視頻監控、感應線(xiàn)圈等方式進(jìn)行;車(chē)輛行駛軌跡以及車(chē)輛型號、流量、車(chē)速等信息可以采用RFID技術(shù),從而獲得關(guān)鍵斷面的相關(guān)信息;車(chē)輛位置、速度、行程軌跡等信息可以通過(guò)GPS等移動(dòng)定位設備收集;此外,用戶(hù)線(xiàn)路、速度信息的收集還可以采用手機信令手段。動(dòng)態(tài)交通數據的收集離不開(kāi)基礎設備,合理使用這些設備,可以將交通數據動(dòng)態(tài)表現出來(lái),有著(zhù)很強的優(yōu)越性,能夠為交通運行實(shí)時(shí)監控以及動(dòng)態(tài)分析提供必要的數據基礎。但是,這些數據在收集過(guò)程中必然存在極大的復雜性,龐大的數據量以及噪聲數據會(huì )嚴重影響到數據質(zhì)量,直接收集的數據必然無(wú)法為交通數據分析的數據基礎,因此,有必要對這些直接數據進(jìn)行清洗,清洗方法主要有以下幾種:①數據清洗首先要確定干擾在哪里,干擾作用的地方。團隊可以運用已有的大數據分析方法,對交通基礎數據做出針對性分析,基于數據屬性以及分析目的,從數據中獲取需要的元數據,找出質(zhì)量問(wèn)題。②數據清洗需要以規范的手段為保障,進(jìn)行數據清洗必須定義清洗轉換規則。通過(guò)上一步工作,團隊可以獲得相應的元數據,獲得存在的質(zhì)量問(wèn)題,針對這些問(wèn)題,團隊可以定義轉換規則以及工作流。③在數據收集之后,要對數據進(jìn)行標準化處理,從而獲得標準化的直觀(guān)數據?梢赃\用統計方法、聚類(lèi)方法、關(guān)聯(lián)規則等。④用清洗數據替換源數據。
4.2提取并分析數據
要對動(dòng)態(tài)交通流以及交通網(wǎng)絡(luò )擁堵?tīng)顩r進(jìn)行分析,必須對交通數據進(jìn)行有效組織,然后對交通數據進(jìn)行提取分析。首先,數據分析應該以交管部門(mén)以及用戶(hù)需求為出發(fā)點(diǎn),且工作必須具有相當時(shí)效性。在這一過(guò)程中,工作團隊可以將交通流以及擁堵?tīng)顟B(tài)為工作導向,結合數據的時(shí)空特征,運用聚類(lèi)、預測、異常檢測等方法,深入分析數據之間的關(guān)聯(lián)性,實(shí)現多維度、多粒度特征分析,最后運用降維技術(shù)進(jìn)行數據處理。
4.3基于大數據分析的智能交通模型
4.3.1預測模型1(L1正則化模型)
對線(xiàn)性回歸進(jìn)行1范數的正則化,在經(jīng)驗風(fēng)險上加上一個(gè)正則化項(regularizer)或罰項(penaltyterm)。正則化一般是模型復雜度的單調遞增函數,模型越復雜,正則化值就越大。比如,正則化項可以是模型參數向量的范數。正則化一般具有如下形式:min1Ni=1NL(yi,fxi+λJ(f))其中,第1項是經(jīng)驗風(fēng)險,第二項是正則化項,λ≥0是為調整兩者之間關(guān)系的系數;貧w問(wèn)題中,損失函數是平方損失,正則化項可以是參數向量L1范數:L(w)=1Ni=1N(fxi;w-yi)2+λw1這里,w1表示參數向量w的L1范數。第1項的經(jīng)驗風(fēng)險較小的模型可能較復雜(有多個(gè)非零參數),這時(shí),第2項的模型復雜度會(huì )較大。正則化的作用是選擇經(jīng)驗風(fēng)險與模型復雜度同時(shí)較小的模型。
4.3.2預測模型2(L2正則化模型)
對線(xiàn)性回歸進(jìn)行L2正則化。正則化一般具有如下形式:min1Ni=1NL(yi,fxi+λJ(f))其中,第1項是經(jīng)驗風(fēng)險,第二項是正則化項,λ≥0是為調整兩者之間關(guān)系的系數;貧w問(wèn)題中,損失函數是平方損失,正則化項可以是參數向量L2范數:L(w)=1Ni=1N(fxi;w-yi)2+λw2其中,w2表示參數向量w的L2范數。
4.3.3預測模型3(M5P模型)
M5P模型,是指利用系統變量分析特定變量值的預測模型,這種模型所運用的思想主要為決策樹(shù)思想。首先,工作者需要將變量分布的特征分析出來(lái),按照變量分布特征,將樣本空間劃分為平行的長(cháng)方形區域,然后利用剪枝、平滑的方法,將每一個(gè)分區確立對應的回歸模型,這樣按照不同數據特征建立的模型合理性將更大。在這個(gè)模型中,決策樹(shù)構建的思想十分直接,只需按照決策樹(shù)生成算法構建樹(shù),然后以最大化信息增益為節點(diǎn)分支準則即可。在M5P之中,由于模型使用的是最小化子集屬性差異,因此引入剪枝策略,剪枝策略包括構造時(shí)的預剪枝、構造后的后剪枝。一般情況之下,預剪枝一般在最小樣本數上進(jìn)行,后剪枝一般在估計誤差置信水平上進(jìn)行。特殊的,如果存在節點(diǎn)子樹(shù)性能低于內部節點(diǎn)性能的情況,可以講內部節點(diǎn)轉換為葉節點(diǎn)。決策樹(shù)的分類(lèi)一般分為兩個(gè)步驟。①數據中知識獲取,進(jìn)行機器學(xué)習,這個(gè)過(guò)程就是決策樹(shù)模型建立,一般以訓練集為基礎。②利用已經(jīng)生成的決策樹(shù),對數據進(jìn)行分類(lèi)。這種分類(lèi)應該首先龔根節點(diǎn)開(kāi)始,應該對數據對象的屬性進(jìn)行逐步測試,測算得出相應的值,然后按照決策樹(shù)分支往下走,以葉節點(diǎn)為終點(diǎn),形成相應分類(lèi)。值得注意的是,在對給定數據集進(jìn)行計算時(shí),普通典型的線(xiàn)性回歸算法只能給出單一的回歸等式,無(wú)法將樣本空間劃分為平行空間,無(wú)法確定相應空間回歸模型,在這種情況之下,工作者就可以采用決策樹(shù)方法。本研究將原始樣本按8:2的比例分別劃分為訓練集、測試集,并對全體樣本利用上述預測模型進(jìn)行多時(shí)段的預測,然后對比預測效果。
4.4模型評估
在本文中,給出方案的評價(jià)指標采用預測準確度,在這里,我們可以引用平均絕對誤差(MeanAbsoluteError,簡(jiǎn)稱(chēng)MAE),以此將預測與實(shí)際流量之間的相似度表示出來(lái)。其中C代表預測次數、預測流量、實(shí)際流量。采用MAE有兩個(gè)優(yōu)點(diǎn):①這一方法的計算方法較為簡(jiǎn)單,且計算結果便于理解;②由于在計算中,絕對平均誤差的值是唯一的,系統之間不存在多個(gè)誤差值,因此,這種方式能夠很好地區分系統絕對平均誤差的差異。
4.5基于復雜網(wǎng)絡(luò )理論研究各公共交通子網(wǎng)級聯(lián)關(guān)系
基于復雜網(wǎng)絡(luò )理論分析各公共交通子網(wǎng)的運行規律和機理。在此基礎上,研究各公共子網(wǎng)之間的級聯(lián)關(guān)系,探究各子網(wǎng)之間的相關(guān)關(guān)系和影響機理。
作者:李曉 單位:成都師范學(xué)院
【提升交通管理能力數據策略論文】相關(guān)文章:
保險營(yíng)銷(xiāo)管理存在的問(wèn)題與成效提升策略論文02-06
高中物理實(shí)驗競賽訓練質(zhì)量提升策略的論文12-08
探討提升初中英語(yǔ)寫(xiě)作教學(xué)策略的論文07-29
數據建模論文格式06-29
數據新聞畢業(yè)論文12-05
論文寫(xiě)作和發(fā)表的策略12-10
推銷(xiāo)策略與藝術(shù)論文11-29
學(xué)校管理策略論文03-30