人工智能新突破:时空多模态助力真实交通预测实现新飞跃
发布日期:2024-09-05 

本文刊登于Big Data Mining and Analytics(《大数据挖掘与分析(英文)》)。



背景介绍

近年来,汽车产业经历了显著增长,导致车辆生产和拥有量大幅增加。根据中国汽车工业协会的年度报告,2022年新能源汽车生产量同比增长了90.5%。截至2023年,中国机动车总量已达到4.3亿辆,持有驾照的人数达到5.2亿。私家车保有量的增加伴随着快速的城市化进程,城市区域内对高效交通网络的需求也不断上升,导致道路交通流量增加,城市交通拥堵问题日益严重。
此外,交通速度预测在智能交通系统(ITS)、智慧城市计划和智能驾驶系统中起着至关重要的作用。通过利用实时交通数据,城市可以优化交通基础设施、改善公共交通服务并减少环境影响。


成果简介

本文提出了一种创新方法,用于帮助提升在真实场景下的交通速度预测。与之前只考虑空间信息或时间信息的研究不同,我们融合了时空多模态数据,大幅提升了预测精度。我们整合了包括社交媒体、房地产、兴趣点和交通速度在内的多种信息,提供了全面的交通预测解决方案。
论文的主要贡献如下:
多模态数据融合:通过整合时空数据,我们的方法在现实世界的交通预测中表现很出色,它能够处理更多元更多维度的信息,提高了预测的实用性。
创新框架:我们开发了一个大规模时空多模态融合框架,能够捕捉复杂的时空关系。该框架利用先进技术,如循环神经网络和融合编码器,显著提高了预测的准确性和鲁棒性。
实证验证:在真实的大规模地图数据集上的实验结果表明,我们的方法在预测精度上优于其他现有方法,证明了其在实际交通规划和管理中的有效性。
研究为交通速度预测提供了新的视角,展示了多模态数据融合在解决城市交通问题中的巨大潜力。



作者简介


周博东:2019年毕业于华东理工大学,获得学士学位,2021年于美国东北大学硅谷校区完成硕士学位。目前,他正在创业公司EchoBlend AI担任首席技术官。他的研究兴趣包括LLM、多模态学习、扩散模型,特别是在视频生成方向的应用。曾与诺贝尔奖得主Eric Betzig共事于他的初创生物科技公司。21年成为Himylink Ltd的联合创始人,担任CTO一职,负责领导40+人的技术团队研发互联网产品。后担任复旦某集团GPT大模型研究负责人。曾担任 IEEE DSAA审稿人的职务。在自然语言处理、深度学习、多模态等领域的学术会议和期刊上发表多篇学术论文。23年兼任法国SKEMA学院客座讲师。
刘家辉:2019年毕业于华东理工大学,获得学士学位,2020年毕业于英国谢菲尔德大学,获得硕士学位。目前是香港大学的博士研究生,研究方向包括表示学习和计算机视觉。
赵雅萍:2018年在赵吉昌教授的指导下完成了北京航空航天大学学士学位,2021年在方璐教授的指导下完成了清华大学硕士学位,并在袁鑫教授的指导下到西湖大学交流数月。现在,她正在林彦民(Edmund Y. Lam)教授的指导下攻读香港大学博士学位。她的研究兴趣广泛,尽管这篇论文与她的主要研究方向不同,她仍被其学术潜力和应用前景所吸引,并很感谢共同作者周博东、刘家辉、崔颂懿,以及期刊编辑赵琳、徐萍萍。
崔颂懿:2020年毕业于北京工业大学,获得交通工程学士学位,2021年毕业于香港大学,获得工业工程与物流管理硕士学位。目前是香港大学工业及制造系统工程系的博士研究生,研究方向包括交通优化、交通模拟以及深度学习在交通系统中的应用。
本文所使用数据集:H4M 数据集是一个异构的、多源、多模态、多视角、多分布的数据集,专为北京地区的社会经济分析而设计。https://indigopurple.github.io/H4M/index.html
本文作者周博东和他的初创团队目前专注于AI图像和视频生成领域。团队正在广泛招募有才之士,同时欢迎有兴趣的个人或企业洽谈合作。若有意向,请联系我们。Email: luckkyzhou@gmail.com 微信:Luckky_Zhou


文章来源


B. Zhou, J. Liu, S. Cui and Y. Zhao, "A Large-Scale Spatio-Temporal Multimodal Fusion Framework for Traffic Prediction," in Big Data Mining and Analytics, vol. 7, no. 3, pp. 621-636, September 2024.
文章来源:THU信息科学期刊