众所周知,城市交通是城市活动的重要组成部分,犹如人体的动脉,维系着整个城市的正常运转。随着人口的增多、科技 的进步和城市规模的扩大,交通方式由原来简单的车马舟船,演变为现在的火车、汽车、地铁、飞机等各种综合型的运输 方式。交通作为现代城市的重要体现和标志 ,见证着每一个城市的历史与文明、发展与兴衰。城市交通不仅仅是一个市政 工程问题或交通技术问题,而且是一个综合性的社会问题。
然而,随着城市化进程的不断加快,我国的城市交通面临越来越大的压力,甚至一度成为亟待解决的民生问题。造成城市 交通问题的原因众多,举例来说,大城市对上部空间的进一步开发,高层、超高层楼群大规模的兴建,导致人流、车流在 上、下班高峰期的集中非常突出;随着我国加入WTO,家庭轿车的价格大幅下降,汽车拥有量逐年增长,路面已趋于饱 和。据了解,2013年我国私人汽车拥有量首次突破1亿辆,2014年、2015年持续增长。至2015年末,我国私人汽车拥有 量实现722767.87万辆,相比于2014年末同比增长了14.3% 【1】 。凡此种种,举不胜举,更是造成多骨诺牌效应地出现, 交通阻塞加剧、停车问题突出、人们的出行变得越来越困难、出行时间所占用的比例越来越大……这一切都显现出了我国 城市交通的非可持续性。
【1】摘自前瞻产业研究院的《中国汽车行业市场前瞻与投资分析报告》,参考网址http://bg.qianzhan.com/report/detail/459/170410-97512c98.html。
“大”数据与城市交通的“大问题”
大数据以及人工智能创新技术的不断涌现为解决城市交通难题带来了希望。但是交 通相关的数据来源非常多,日常生活中参与的主体更是繁多。譬如,最重要的交通管 理部门中的交通规划、交通管理,汽车、公交、轨道,以及所有的参与个体。如此庞大 的数据量如何加以利用并进行分析?分析出来的结论是否真的能够提供一些深刻 的洞察?基于这些结论可以采取哪些措施呢?
大数据赋能,IBM巧解多源数据融合
针对上述问题,需要对某城市的交通情况调查工作的现状和需求进行梳理,分析交 通行业多源数据采集的内容和每一类数据源,可以形成的交通指标,设计公路交通 情况调查多元化采集体系,提出多源数据融合的框架,融合之后再基于要解决的某 个问题对整理过的数据进行建模、分析、验证、规划、部署。
数据的梳理
鉴于交通数据的复杂性,及根据以往制定解决方案的经验,建议把交通相关的数 据,梳理后分为四类。
交通运营数据
这部分数据主要分为三大类。其一,卡口数据,也就是路上经常看到的摄像头拍 的数据,这些数据会做后续的处理,做成结构化数据。其二,RFID数据,在城市 关键的路口或者特定的地点,所有的车辆经过都会有一个信号。其三,车联网数 据,比如说百度、高德等,还有基于政府机构的车辆网络信息。另外,还有轨道 交通、GPS、手机信令等方面的信息都可以作为交通参与的主体的基础数据,对 做交通分析有很大的帮助。
交通设施数据
这些是静态的数据,这些数据也随着时间的推移在变化,只是这些变化不是实时 的。比如说轨道、公交、道路的会合、分岔等,也是对交通非常有用的信息。
交通规划数据
缘何路越修越多,反而却越来越堵呢?事实上,根源的问题在于规划。关于规划,包括 道路的规划用途、地块儿的规划用途对交通的影响非常大,如果能够提前拿到这些信 息,帮规划部门做一些分析,甚至利用以前的历史规划和历史的交通状态做分析,便能 够从中分析现状的优劣势,对将来的规划会有很大的帮助。
交通地理数据
这部分数据主要包含电子政务地图、卫星(航拍)影像图、地形图、地名数据。
数据的融合和统一
交通数据种类和来源繁杂而众多,必然存在着一系列的问题。譬如,在数据质量上, GPS 样本量偏少容易出现异常,如果遇到隧道、轨道、地铁等基本无法得到实时的数 据;在覆盖范围上,RFID 路网分布间隙大,GPS 不覆盖隧道,卡口路网分布密度大; 而且各数据源有不同程度的缺失值。
显然,要想解决这一系列问题,数据来源的融合非常重要,多源的数据能够按需所取, 优势互补,会让整个形势,或者全局的势头更清晰。通过对数据进行清洗、整理和融合, 不仅可以实现数据互补,提高样本量,减少缺失值。
就交通数据来说,如果将机动车辆作为交通参与的主体,还需要基于路段来进行指标 刻画,用车辆的平均行驶时间、平均速度、低速里程占比、低速时间占比、拥堵区间长 度、拥堵点位置、路段拥堵状态等情况来全面描述刻画主体。基于这样统一的融合数据 做了处理之后,就可以开始下一步的分析和建模。
模型开发和设计架构
基于对拥堵趋势、拥堵模式长短时预测的分析,在 IBM 大数据分析平台上,构建了 交通预测分析算法及模型(Traffic Predictive Models),本模型里包括了交通异常 检测、拥堵趋势预测、拥堵模式发现的应用。在这套智能交通指标体系里,系统能 够识别拥堵事件并进行刻画,分析常发拥堵模式及其原因并进行预测报警。
其中,IBM SPSS Modeler 是全球领先的数据挖掘、预测分析平台软件,拥有简单 的图形界面和高级分析能力,使得企业分析师和业务人员快速上手,获得前所未有 的深入了解和预测。IBM Data Science Experience 提供了一套与专有的 IBM 技 术相集成的数据科学工具。 它还与RStudio,Spark,Jupyter笔记本技术无缝集成 , 其直观的用户界面为团队和个人提供了一个协作的项目空间,大大提高了工作效 率,解决数据挑战。IBM Machine Learning 提供整个机器学习工作流程中的端到 端管理和自动化。它的数据科学家认知助手会根据数据样本自动选择最佳算法。
亮点
包含智能交通方案的专业知识、先进的大数据 分析技术和探索将数据转化为生产力以解决 实际交通问题的方法和路径。
智能识别常发拥堵路段、堵点识别及其扩散规 律、分析拥堵趋势,并能够挖掘拥堵模式及成 因分析。
- 建立了完善的数据利用体系
可以实现自动检测交通异常并报警,指导大众 出行,帮助交管配置优化出警资源,从交通拥 堵模式及规律中形成洞察,以辅助交通规划决 策,提升整个城市交通综合服务水平。
- 全方位、深入地数据分析辅助决策
可以实现自动检测交通异常并报警,指导大众 出行,帮助交管配置优化出警资源,从交通拥 堵模式及规律中形成洞察,以辅助交通规划决 策,提升整个城市交通综合服务水平。
- 辅助决策,提升服务水平
可以实现自动检测交通异常并报警,指导大众 出行,帮助交管配置优化出警资源,从交通拥 堵模式及规律中形成洞察,以辅助交通规划决 策,提升整个城市交通综合服务水平。
实际业务成果
在国内某省会城市,通过四个月历史数据进行探索,得到以下结论,这些结论为下一步 道路规划提供有力依据。
- 异常监控预警
可 24 小时实时监控城市路网交通运 行状态,检测出异常拥堵并预测出持 续时间,还可预报未来半小时可能出 现的异常拥堵。
- 7日路况预报
可查询未来 7 天内任意一天的城市路 网交通运行状况,提前获知重点防控 区域,还可结合天气数据、重大活动安 排等,预测未来交通路况。
- 常发拥堵查询
可识别出整个城市路网中经常发生拥 堵的道路,可查询在历史上经常发生 拥堵的道路信息,并以严重程度细分 出 3 个类别。
- 拥堵趋势查询
可 24 小时实时监控城市路网交通运 行状态,检测出异常拥堵并预测出持 续时间,还可预报未来半小时可能出 现的异常拥堵。
此项目还通过实时路况预报、拥堵对比查询、拥堵事件查询、拥堵模式查询、路网堵 点查询等探索成果,使该城市数据收集分析更加精准,推动了城市交通数字化智能化 转型。
IBM解决方案的优势与特点
BM为交通院构建时空大数据预测模型,这是一个具有强大机器学习的预测模型。 应用了 Event base time series(事件驱动的时间序列)和Spatial Temporal Prediction(时空预测模型),利用大数据对交通进行画像,并依此提供一套交通 指标体系。
IBM针对影响交通的多源数据进行整合分析,比如极端气候下交通如何变化,交 通流量与速度的关联,流量和路段的关联,拥堵事件的关联等,最终给出更加准 确的预测和最佳交通解决方案。
另外,该方案有助于城市污染治理,因为汽车尾气污染是城市严重问题。汽车尾 气污染主要来自低速行驶。该方案能给出相应的建议,例如汽车行驶超过一定运 行速度,可实现排污降低,有利环保。
为什么选择IBM?
- IBM 在大数据分析领域拥有着领先的地位,能够基于认知计算的行业解决方案为业 务决策者提供变革性的洞察。
- IBM 提供完整的大数据和分析解决方案组合,推动企业往认知商业的发展,帮助企 业运用数据发现新的模式,形成突破性的构想。
- IBM 在银行、保险、零售、消费品、电信、政府、媒体娱乐、交通运输等八大行业具有应 用大数据分析、解决业务难题方面的成功经验。
为什么选择慧都大数据?
- 慧都与全球包括IBM、Apple、Microsoft等超过400家优秀厂商建立了紧密的合作关系,通过慧都行业专家资源和专业技术研发团队累计服务超过10000家跨行业企业,慧都大数据结合企业现状,定制基于大数据基础平台的数据集成、数据管理和业务分析等关键功能,形成解决方案。
- 慧都拥有自主研发的大数据基础平台DateForce是企业大数据解决方案的重要组成部分,除了提供完整的大数据功能组件,我们还提供组件自定义搭配,为企业选择满足方案需要的大数据功能组件,使您的大数据解决方案成本降到最低,从而高品质的解决您的大数据需求问题。
- 慧都还为企业提供大数据培训,更有来自IBM、cloudera、重庆邮电大学、慧都大数据等来自大数据厂商、高校的大数据研发专家,为企业提供大数据专业技术及实施培训、行业认证培训,让企业团队真正建立大数据思维,做出数据驱动的运营决策。
发表评论