当前位置: 首页 > news >正文

强化学习——day35 读论文:基于深度强化学习的网约车动态路径规划

基于深度强化学习的网约车动态路径规划

  • 资源下载地址
  • chap2
    • 2.1 问题叙述
    • 2.2 ST-GCSL 框架
    • 2.3 Markov 决策过程的构建
      • 2.3.1 具体描述
      • 2.3.2 关键元素
  • chap3 供需感知的深度强化学习算法
    • 3.1 动作空间的确定
    • 3.2 AC模型
    • 3.3 动作采样策略
    • 3.4 AS-AC 算法
  • chap4 实验与结果
    • 4.1 数据集(表2)
    • 4.2 度量标准
    • 4.3 实验结果(表3)
    • 4.4 采用排序优先级的优越性
  • chap5 主要贡献

资源下载地址

点击下载

chap2


o

2.1 问题叙述

o
网约车队 X、请求 Ω、调度中心、拒绝率 RR
o
o

2.2 ST-GCSL 框架

o
o

o
网约车、乘客在调度中心下的交互
o
o

2.3 Markov 决策过程的构建

o

2.3.1 具体描述


将网约车视为与外部环境交互的智能体,并将每次路线规划看作是一次决策. 采用六边形网格划分空间对动作空间进行离散化.

2.3.2 关键元素


1)状态st ∈S
2)动作at ∈A
3)奖励r
4)回合
5)策略π(a|s)
6)状态—动作价值函数Qπ (s,a)

chap3 供需感知的深度强化学习算法


o

3.1 动作空间的确定

o

1)地理邻居网格:.为了确保合理的调度距离, 选择当前网格的邻居网格.


2)全局热门网格:.在下一个时间片中预测请求 数量最多的少数网格

o

3.2 AC模型

o


算法1.AC算法.

o

3.3 动作采样策略

o

基于排序的优先级

o

3.4 AS-AC 算法

o

输入:当前状态st;
输出:一个调度动作at
① 计算源动作价值Q
② 初始化动作空间A为地理邻居和全局热门 网格;
③ 从A移除无效的动作;
④ 初始化大小为|G|的数组F,并设置Fi =l , ∀ai∈A;
⑤ 通过状态—动作价值Q x F 对动作ai进行排序,并计算对应优先级
⑥ 根据式(12)采样一个动作 at
⑦ return at

chap4 实验与结果


o

4.1 数据集(表2)

o
数据集统计信息(纽约&海口)
o
o

4.2 度量标准

o
1)拒绝率 RR
2)巡航时间 CT
3)等待时间 WT
o


拒绝率

o

4.3 实验结果(表3)

o
除了在网约车数量为1 000的海口数据集 上,提出的 AS-AC算法在所有度量标准上均实现了最佳的效果,提升程度最大
o
o

4.4 采用排序优先级的优越性

o

chap5 主要贡献


o
1)提出了一个基于实时供需状态的动态网约 车路径规划框架,实现高效的大规模空闲网约车 调度,通过包含实时的供需信息来适应动态变化的 环境。
o
o
2)设计了一种带有动作采样的AS-AC算法来 选择可行的动作,增加了动作选择的随机性,从而有 效地防止竞争。
o
o
3)使用真实的网约车订单数据进行了大量实 验,实验结果表明提出的方法相比对比方法有着更 低的请求拒绝率。
o

相关文章:

  • 【408计算机组成原理】—原码、反码、补码、移码(六)
  • Vue入门【九】-- 动态路由和嵌套路由
  • Python数据类型:序列(列表list、元组tuple)
  • [ vulhub漏洞复现篇 ] ThinkPHP 5.0.23-Rce
  • 算法分析与设计:10 大排序算法大汇总(Java)
  • 【斯坦福大学公开课CS224W——图机器学习】六、图神经网络1:GNN模型
  • Google Earth Engine(GEE)——GEE错误结果没有变化?
  • 《Improved Techniques for Training GANs》-论文阅读笔记
  • 十一假期,分享几个好玩儿的GitHub项目
  • AcWing 第71场周赛
  • Redis实战 - 02 Redis 保存短信验证码实现用户注册
  • AcWing——第 71 场周赛
  • 利用Vulhub复现log4j漏洞CVE-2021-44228
  • 【学生网页设计作业源码】基于html+css保护海豚主题网页设计与制作(7页)
  • 频率响应说明
  • 《Java8实战》-第四章读书笔记(引入流Stream)
  • 【腾讯Bugly干货分享】从0到1打造直播 App
  • 【跃迁之路】【463天】刻意练习系列222(2018.05.14)
  • ABAP的include关键字,Java的import, C的include和C4C ABSL 的import比较
  • Hibernate【inverse和cascade属性】知识要点
  • Quartz实现数据同步 | 从0开始构建SpringCloud微服务(3)
  • Redis在Web项目中的应用与实践
  • SAP云平台里Global Account和Sub Account的关系
  • Spring Boot快速入门(一):Hello Spring Boot
  • vue--为什么data属性必须是一个函数
  • 初识MongoDB分片
  • 回顾2016
  • 前端每日实战:61# 视频演示如何用纯 CSS 创作一只咖啡壶
  • 使用权重正则化较少模型过拟合
  • 原生 js 实现移动端 Touch 滑动反弹
  • 你学不懂C语言,是因为不懂编写C程序的7个步骤 ...
  • ​【原创】基于SSM的酒店预约管理系统(酒店管理系统毕业设计)
  • #Z0458. 树的中心2
  • $var=htmlencode(“‘);alert(‘2“); 的个人理解
  • (007)XHTML文档之标题——h1~h6
  • (3)(3.2) MAVLink2数据包签名(安全)
  • (delphi11最新学习资料) Object Pascal 学习笔记---第8章第2节(共同的基类)
  • (PWM呼吸灯)合泰开发板HT66F2390-----点灯大师
  • (Redis使用系列) Springboot 实现Redis消息的订阅与分布 四
  • (笔试题)分解质因式
  • (二)PySpark3:SparkSQL编程
  • (区间dp) (经典例题) 石子合并
  • (详细版)Vary: Scaling up the Vision Vocabulary for Large Vision-Language Models
  • (转)用.Net的File控件上传文件的解决方案
  • (转载)VS2010/MFC编程入门之三十四(菜单:VS2010菜单资源详解)
  • .Net FrameWork总结
  • .NET Standard 的管理策略
  • .NET 设计模式—适配器模式(Adapter Pattern)
  • .NET/C# 在代码中测量代码执行耗时的建议(比较系统性能计数器和系统时间)...
  • .net访问oracle数据库性能问题
  • .NET下的多线程编程—1-线程机制概述
  • .sys文件乱码_python vscode输出乱码
  • ::before和::after 常见的用法
  • @Tag和@Operation标签失效问题。SpringDoc 2.2.0(OpenApi 3)和Spring Boot 3.1.1集成
  • [C#]科学计数法(scientific notation)显示为正常数字