当前位置: 首页 > news >正文

数据挖掘顶会ICDM 2024论文分享┆MetaSTC:一种基于聚类和元学习的时空预测框架

第24届IEEE国际数据挖掘会议(IEEE International Conference on Data Mining,ICDM)将于2024年12月9日至12日在阿拉伯联合酋长国首都阿布扎比隆重举行。ICDM是世界数据挖掘研究顶级会议,创办于2001年,每年举办一届,会议主题涵盖了有关数据挖掘的算法和智能系统等。ICDM为中国人工智能学会(CAAI)B类会议,中国计算机学会(CCF)B类会议。

本推文详细介绍了上海交通大学先进网络实验室(Advanced Network Laboratory,ANL)的最新论文成果《MetaSTC: A Backbone Agnostic Spatio-Temporal Framework for Traffic Forecasting》,该论文已被第24届IEEE国际数据挖掘会议接收,论文的作者包括:上海交通大学先进网络实验室的学生许可欣、高宇岑、余哲梦,老师高晓沨教授、陈贵海教授;滴滴国际的方君、张凇健。论文提出了一种轻量流量预测框架MetaSTC。针对交通数据集周期性特点和地理特征,MetaSTC设计了基于门控机制的时空表征。并且结合了聚类、元学习等技术,轻量化时空预测模型。通过在交通流量大规模公开数据集LargeST以及滴滴公司的真实路网数据集上的实验比较,验证了MetaSTC能够更加准确的预测交通流量,并且在时间效率上大幅提升。

1.研究背景及主要贡献

交通流预测问题是交通管理与控制领域的一项重要任务。交通流预测能够帮助交通管理部门提前掌握交通流运行情况,从而提前制定管控措施。对于驾驶者和乘客来说,准确的交通流量预测可以提供更可靠的出行建议,帮助他们避开拥堵路段,减少行程时间,提高出行的舒适度和满意度。多年来,交通流量预测领域的研究一直是研究热点,涵盖了统计方法、传统机器学习技术和深度学习模型等多种方法。

由于交通预测问题与现实场景之间密不可分的关系,考虑模型设计应用于真实场景大规模数据集的可行性和有效性十分关键。深度学习具有复杂的网络结构,在实际应用时往往受到有限计算资源的约束。同时,模型对于分布差异的数据中趋向预测数据的平均值,这使得模型的性能随着数据量的增加而降低。模型如何应对大规模交通流量数据复杂的时间依赖性,空间差异性,同时降低预测的成本开销成为非常关键的挑战。针对大规模数据集的场景,论文提出了一种轻量化时空预测框架MetaSTC。论文的贡献可以概括为:

(1)论文提出一种轻量级时空预测框架,该框架由时空聚类模块和元学习模块组成。论文在真实世界的交通流数据集上进行了大量实验,MetaSTC 模型显示出很高的准确性和计算效率。

(2)论文提出了一种新的编码方法来提取时空特征,基于时空特征聚类拆分大规模数据集。

(3)引入了一种基于时空聚类的元学习器,可实现更准确、更高效的预测。

(4)论文提出的轻量化交通预测框架展现了深度学习模型在实际交通场景的可能性,该框架能够为城市规划者提供未来交通需求的预测,对于城市交通的规划具有重要意义。

2.方法

图1 MetaSTC的整体架构

MetaSTC的整体架构如图1所示。在主干框架由时空表征聚类和元学习两部分组成。其中,时空表征模块由时间编码、空间编码、门控机制和聚类组成。为了有效提取交通数据中丰富的特征,该模块分别对其道路的时序规律(流量)和非时序特征(宽度、长度、车道数等)设计编码器,并利门控机制调整时间空间的特征权重。通过K-means++算法,将大规模数据集中相似时空特征的道路进行聚类。在元学习模块中,MetaSTC沿用聚类得到的结果,将具有相似时空特征的数据分在同一个元任务下进行训练。元学习的设计使得模型可以迅速在子任务上收敛,从而达到更高的准确性和效率。

3.实验

(1)实施细节

实验运行在48GB内存的A40上。实验使用Adam优化器,设置初始学习率为 0.001,训练轮数为 1000。参数选择上,实验批次大小设为 64,表示维度设置为 12,K-means++算法的距离函数设为欧氏函数,元学习的网络层数设置为 3。

(2)实验结果

论文使用来自滴滴全球的两个不同城市的真实交通数据集和两个公共数据集PeMS04和LargeST进行实验,实验数据按照 8:2的比例划分训练集和测试集。论文将MetaSTC与最新最先进的时空预测模型进行比较,其中包括FiLM,TimesNet和DLinear等,使用的指标包括平均绝对误差(Mean Absolute Error,简称MAE)和平均平方误差(Mean Squared Error,简称MSE)。如表1所示,在预测准确性方面,MetaSTC 模型在与先进的深度学习模型 FiLM 结合使用时取得了最佳性能。

表1 MetaSTC与最先进的流量预测模型的比较

如表2所示,论文对完整的 MetaSTC 模型和两个消融版本进行了比较。基于聚类的模型优于直接预测模型,其 MAE 误差降低了 48.2%。元学习的加入同样对模型的性能产生了显著的积极影响,使 MAE 误差降低了 32.9%。

​​​​​​​2 MetaSTC主要模块消融实验

4.总结与展望

交通流量预测是提供便捷高效的城市交通服务的重要任务之一。论文分析了以往方法在预测准确性和运行效率方面无法达到原大规模数据集效果的缺点,提出了一种基于聚类和元学习的时空框架MetaSTC,能够快速训练并提高预测精度。该模型在包含数千条道路的真实世界数据集上进行了实验,结果优于基线模型。消融实验证明了框架两个主要模块聚类模块和元学习模块的重要性,它们能带来巨大的性能提升。论文提出的MetaSTC框架为加速和轻量级流量预测模型提供了一个有效而强大的接口。通过快速预测交通流量变化, MetaSTC框架能够帮助帮助相关部门及时调整交通管理策略,对于公共交通的规划和交通基础设施的建设都具有重要的意义。

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • JS获取页面中video标签视频的封面和时长
  • ctfshow-命令执行
  • nacos 安装 centos7 docker
  • Pytorch深度学习快速入门笔记【小土堆】
  • Linux基础环境搭建(CentOS7)- 虚拟机准备_搭建hadoop能使用桥接模式吗
  • HTML5中`<area>`标签深入全面解析
  • HS光流法原理与实现
  • 在职研生活学习--20240907
  • Verilog FPGA 仿真 控制任务
  • 开发中ostringstream,格式化输出的问题
  • 7.测试用例设计方法 + Bug
  • 系统性能分析工具sysstat之sar命令以及nginx中打开gzip使用配置gzip_http_version值为1.0和1.1时遇到的结果乱码问题
  • 创游系列开心娱乐完整组件
  • Gmtracker_深度学习驱动的图匹配多目标跟踪项目启动与算法流程
  • 解锁精准电商营销新纪元:深度剖析京东商品详情API数据驱动的营销策略
  • Django 博客开发教程 16 - 统计文章阅读量
  • echarts的各种常用效果展示
  • JavaScript类型识别
  • Javascript设计模式学习之Observer(观察者)模式
  • Java编程基础24——递归练习
  • MaxCompute访问TableStore(OTS) 数据
  • PHP 7 修改了什么呢 -- 2
  • Unix命令
  • Vue官网教程学习过程中值得记录的一些事情
  • 阿里云ubuntu14.04 Nginx反向代理Nodejs
  • 多线程事务回滚
  • 前端存储 - localStorage
  • 区块链分支循环
  • 用Python写一份独特的元宵节祝福
  • 中文输入法与React文本输入框的问题与解决方案
  • 哈罗单车融资几十亿元,蚂蚁金服与春华资本加持 ...
  • 微龛半导体获数千万Pre-A轮融资,投资方为国中创投 ...
  • ​RecSys 2022 | 面向人岗匹配的双向选择偏好建模
  • !!java web学习笔记(一到五)
  • (2024最新)CentOS 7上在线安装MySQL 5.7|喂饭级教程
  • (function(){})()的分步解析
  • (SpringBoot)第七章:SpringBoot日志文件
  • (void) (_x == _y)的作用
  • (笔记)Kotlin——Android封装ViewBinding之二 优化
  • (二)斐波那契Fabonacci函数
  • (附源码)python房屋租赁管理系统 毕业设计 745613
  • (回溯) LeetCode 46. 全排列
  • (九)One-Wire总线-DS18B20
  • (每日持续更新)信息系统项目管理(第四版)(高级项目管理)考试重点整理第3章 信息系统治理(一)
  • (面试必看!)锁策略
  • (深入.Net平台的软件系统分层开发).第一章.上机练习.20170424
  • .chm格式文件如何阅读
  • .mat 文件的加载与创建 矩阵变图像? ∈ Matlab 使用笔记
  • .NET Core MongoDB数据仓储和工作单元模式封装
  • .NET Core WebAPI中使用Log4net 日志级别分类并记录到数据库
  • .NET MVC之AOP
  • .NET 中 GetHashCode 的哈希值有多大概率会相同(哈希碰撞)
  • .net 桌面开发 运行一阵子就自动关闭_聊城旋转门家用价格大约是多少,全自动旋转门,期待合作...
  • .NET(C#、VB)APP开发——Smobiler平台控件介绍:Bluetooth组件
  • .NET版Word处理控件Aspose.words功能演示:在ASP.NET MVC中创建MS Word编辑器