摘要:公共交通乘客出行鏈構建是公共交通出行需求分析的基礎,也是推進城市公共交通系統融合發展和可持續運營的關鍵。現有研究大多關注單一模式出行鏈,較少考慮多源數據環境下多模式公共交通出行鏈構建,無法進行各模式之間的轉移和換乘客流特征的分析。基于軌道交通、BRT 和公共汽車三網融合數據進行乘客出行鏈構建,數據類型主要有公交 IC 卡、車載 GPS 等。具體方法包括基于時間匹配的上車站點推算、基于出行鏈假設的下車站點匹配和基于換乘規則的個體出行鏈推算。最后,使用廈門市公共交通數據驗證了該方法的有效性,同時討論了匹配閾值對匹配精度的影響。
本文源自張懿木; 陳田; 王俊; 李哲; 李健, 城市交通 發表時間:2021-06-08
關鍵詞:城市公共交通;多源數據融合;多模式公共交通出行鏈;出行特征分析;運營管理
0 引言
公交優先戰略是城市交通可持續發展的必然選擇,而公共交通乘客出行鏈特征分析是精準把握公共交通出行需求,切實有效推進公交優先戰略的關鍵。傳統獲取公共交通個體出行鏈數據通常采用人工抽樣調查[1]以及反推模型計算[2]的方法。隨著公交 IC 卡系統、車載 GPS 設備的廣泛應用,基于多源數據的大規模公共交通乘客個體出行鏈構建和特征規律挖掘成為可能[3]。國內外相關研究側重公共汽車、軌道交通等單一模式的公共交通乘客出行鏈構建和特征規律的挖掘,主要集中在乘客上、下車站點的匹配,以及通過設置換乘時空閾值進行公共交通出行鏈推斷。由于各國城市公共交通數據結構有所不同,部分城市公共交通乘客上車數據包含卡號、時間、線路地點等信息[5];對于不包含站點信息的數據,文獻[6]基于巴西圣保羅市 IC 卡刷卡數據、GPS 數據以及線路站點數據構建時空匹配算法,實現了公共交通乘客上車站點的識別。國內研究中,文獻[7]較早闡述了 IC 卡與 GPS 數據融合推算上車站點的原理,文獻[8]以北京市單日單條公共交通線路的 IC 卡和 GPS 數據驗證了該方法的可行性。其他相關研究從公共交通模式[9]、時間跨度[10]等方面對該方法的應用場景進行了拓展。在下車站點推斷方面,文獻[11]基于出行鏈假設對倫敦公共交通乘客下車站點進行推算,并結合實際出行調查數據驗證了推算方法的有效性。針對單日僅一次出行數據下車站點識別的問題,有研究利用歷史多日出行[12]特征進行下車站點推算。近年來,基于下車站點、下車時間推算結果,通過設置換乘時間[13]、換乘距離[14]等換乘約束,可以實現乘客出行鏈的構建。
從現有研究來看,基于 IC 卡、GPS 等多源數據的單模式公共交通乘客出行鏈構建方法已較為成熟,但對多模式公共交通乘客出行鏈構建研究較少。隨著中國城市公共交通系統的不斷發展,特別是在大城市快速公交(BRT)、軌道交通網絡規模不斷增加的情況下,如何有效推進公共交通系統內部不同模式之間的融合發展,提升城市公共交通系統的可持續運營能力,是最為緊迫的問題。通過多源數據構建多模式公共交通出行鏈,進而對不同公共交通模式的運行特征和換乘行為進行研究,是推進公共交通系統多模式融合發展的關鍵。
本文基于軌道交通、BRT、公共汽車系統的 IC 卡和 GPS 數據等多源數據,提出公共交通乘客多模式出行鏈推算方法。以廈門市公共交通系統為例進行了方法驗證,并對匹配率的變化、匹配閾值的合理性和數據采集方式的局限性進行了討論。
1 數據基礎
數據來源于公共交通系統三網數據,包括公共汽車系統、BRT 系統以及軌道交通系統數據,各公共交通方式數據屬性如表 1 所示。
公共汽車系統數據包括設備連接表、IC 卡刷卡數據、GPS 數據、發車班次數據、線路站點 GIS 數據。刷卡數據記錄乘客上車時 IC 卡刷卡信息,每次刷卡均會在設備中產生一條刷卡記錄。GPS 數據記錄公共汽車行駛過程中的時空間狀態信息。發車班次數據為公共汽車離開起點和進入終點站的到發時刻表。線路站點 GIS 數據記錄當月公共汽車開行線路及途經站點順序、位置信息。
軌道交通數據與 BRT 數據結構類似,包括閘機驗票數據和線路站點數據。閘機數據在乘客每次進站或出站驗票時產生,記錄乘客進出站活動信息。線路站點數據記錄了 BRT 線路站點的詳細信息,作為乘客進出站信息的補充。
2 多模式公共交通出行鏈構建
軌道交通與 BRT 采用閘機進出站方式,易于匹配進出站信息。具體步驟包括:1)基于刷卡站點編號字段連接閘機數據與站點數據,為原始數據添加具體的站點名稱及經緯度等信息;2)將一天中同一卡號的刷卡記錄按刷卡時間進行排序,連接兩條相鄰刷卡記錄,若第一條進出站類型為進站,第二條為出站,即可組成一次出行記錄。至此完成軌道交通與 BRT 乘客的出行信息匹配。公共汽車的出行信息匹配則涉及上車站點、下車站點以及下車時間多個階段的推算。
2.1 基于時間匹配的上車站點推算
對于上車站點推算,采用基于時間的匹配算法,其基本原理是利用時間屬性關聯 IC 卡與 GPS 數據,從而匹配獲得刷卡數據的空間信息。首先根據車輛到發時間,匹配 GPS 數據與 IC 卡數據對應的線路班次信息。在此基礎上,按時間最近原則匹配 GPS 時間與刷卡時間獲得刷卡時的空間位置信息。之后,對比線路站點空間位置確定乘客上車站點信息。算法匹配流程如圖 1 所示。
公共汽車上車站點的匹配主要包括以下三部分。
1)基于路單信息的車次匹配。
為了減少計算量,提高查詢效率,同時便于下車時間的匹配處理,本文利用發車班次信息匹配 IC 卡數據和 GPS 數據對應的車次。對于某一條線路,一輛公共汽車在相鄰兩趟發車之間存在一定的休息時間。考慮到乘客在車輛發車前提前上車刷卡的情況,將公共汽車上一班次的到站時間至下一班次的發車時間作為乘客在首站上車的時間范圍。利用到站時間和發車時間的區間匹配 IC 卡數據及 GPS 數據對應的車輛班次。
2)基于 GPS 數據的刷卡位置匹配。
利用 GPS 數據與 IC 卡數據的最近時間差進行匹配,尋找刷卡記錄對應的最近 GPS 空間位置。考慮乘客可能存在先上車后刷卡行為,實際上車刷卡時間與上車時的 GPS 空間位置可能不一致,因此采用近似匹配 GPS 時間與刷卡時間。基于路單匹配結果,通過“車輛編號”“線路”“班次”字段進行關聯,選擇與刷卡數據時間最為接近的 GPS 點作為當條刷卡記錄產生時的 GPS 數據,從而確定每一條刷卡記錄的 GPS 空間位置(見圖 2)。
理論上每一條刷卡數據均能獲得對應 GPS 位置信息,為了保證匹配結果的準確性,需要設置一定的時間差閾值避免數據時間間隔過大的錯誤匹配。考慮到站點位于某相鄰 GPS 點集的必然性,時間閾值
式中:
論文指導 >
SCI期刊推薦 >
論文常見問題 >
SCI常見問題 >