当前位置: 首页 > news >正文

(论文阅读笔记)Network planning with deep reinforcement learning

[1] ZHU, Hang, et al. Network planning with deep reinforcement learning. In: Proceedings of the 2021 ACM SIGCOMM 2021 Conference. 2021. p. 258-271. Citation: 25

文章目录

  • Q1 论文试图解决什么问题?
  • Q2 这是否是一个新的问题?
  • Q4 有哪些相关研究?如何归类?谁是这一课题在领域内值得关注的研究员?
    • 1. 网络优化问题
    • 2. 强化学习解决的优化问题
  • Q5 论文中提到的解决方案之关键是什么?
  • Q6 论文中的实验是如何设计的?
  • Q9 这篇论文到底有什么贡献?

Q1 论文试图解决什么问题?

本论文解决网络规划的问题。网络规划涉及IP层和光层的跨层决策,cross-layer scheduling是一个很有挑战性的问题。

Q2 这是否是一个新的问题?

这不是一个新问题,早在1994年的论文Genetic algorithms in optimal multistage distribution network planning提出用遗传算法进行对网络的规划。规划的网络必须满足运营商指定的某些服务期望,其中包括性能要求(例如,为给定的流量矩阵提供足够的带宽)和可靠性要求(例如,对故障的稳健性)。

下图描述了网络规划问题:在三种单光纤故障中的任何一种情况下,满足从A到D的100Gbps流量的网络规划实例。(a) 短期规划使用两条IP链路A-B-C-D和A-E-F-D。(b) 长期规划增加一条新的光纤B-F,并使用两条IP链路A-B-C-D和A-B-F-D。

在这里插入图片描述

Q4 有哪些相关研究?如何归类?谁是这一课题在领域内值得关注的研究员?

可主要按照以下两类来分:

1. 网络优化问题

[15] O. Gerstel, C. Filsfils, T. Telkamp, M. Gunkel, M. Horneffer, V. Lopez, and A. Mayoral. Multi-layer capacity planning for ip-optical networks. IEEE Communications Magazine, 2014.
[20] R. Hartert, S. Vissicchio, P. Schaus, O. Bonaventure, C. Filsfils, T. Telkamp, and P. Francois. A declarative and expressive approach to control forwarding paths in carrier-grade networks. In ACM SIGCOMM, 2015.
[23] S. Jain, A. Kumar, S. Mandal, J. Ong, L. Poutievski, A. Singh, S. Venkata, J. Wanderer, J. Zhou, M. Zhu, et al. B4: Experie

2. 强化学习解决的优化问题

[4] I. Bello, H. Pham, Q. V. Le, M. Norouzi, and S. Bengio. Neural combinatorial optimization with reinforcement learning. arXiv preprint arXiv:1611.09940, 2016.
[5] Y. Bengio, A. Lodi, and A. Prouvost. Machine learning for combinatorial optimization: a methodological tour d’horizon. European Journal of Operational Research, 2020.
[7] Q. Cappart, T. Moisan, L.-M. Rousseau, I. Prémont-Schwarz, and A. Cire. Combining reinforcement learning and constraint programming for combinatorial optimization. arXiv preprint arXiv:2006.01610, 2020.
[10] X. Chen and Y. Tian. Learning to perform local rewriting for combinatorial optimization. Advances in Neural Information Processing Systems, 2019.

Q5 论文中提到的解决方案之关键是什么?

提出强化学习算法(NeuroPlan)在IP层和光层做出多项决策,从而进行网络规划。
1)使用图神经网络来编码网络拓扑,解决动态网络给DRL带来的挑战
2)结合ILP的方法,来解决最佳性和可操作性的矛盾
在这里插入图片描述

Q6 论文中的实验是如何设计的?

实验选取的baseline包括ILP和ILP-heur。Metrics包括Optimality(运行时间)和Scalability(是否适用于大规模的网络拓扑)。

Q9 这篇论文到底有什么贡献?

相比于传统的启发式解决方案,该论文是首个提出了用强化学习的方法来解决网络规划问题,并针对强化学习难以面对动态网络环境的问题使用GNN解决。但相比于启发式方法,强化学习存在很多问题,比如训练时间和成本长,收敛慢。

相关文章:

  • 培养出最多亿万富翁的美国大学TOP10榜单
  • 蓝桥杯嵌入式AD采样解析
  • 数据结构和算法——基于Java——4.1栈(数组实现栈、链表实现栈)
  • 怎么看网站域名有没有收录 收录情况怎么样 网站收录查询
  • 信号发生器不会用?一篇文章教会你
  • Java+JSP+MySQL基于SSM的医院挂号就诊系统-计算机毕业设计
  • 今年十八,喜欢ctf-web
  • AI加速(九): 深度理解吞吐量和延时
  • java毕业设计的滑雪场学具租赁管理系统mybatis+源码+调试部署+系统+数据库+lw
  • redis5.0集群搭建(两台服务器)
  • [操作系统笔记]基本分页存储管理
  • 容器运行时与k8s概述
  • [ Linux ] Linux信号概述 信号的产生
  • 终极版Facebook广告管理工具新手教程!赶紧收藏!(下篇)
  • 计算机组成原理习题课第四章-2(唐朔飞)
  • 【Leetcode】101. 对称二叉树
  • 002-读书笔记-JavaScript高级程序设计 在HTML中使用JavaScript
  • 2017 前端面试准备 - 收藏集 - 掘金
  • 2018天猫双11|这就是阿里云!不止有新技术,更有温暖的社会力量
  • C++类的相互关联
  • gulp 教程
  • Java教程_软件开发基础
  • Java新版本的开发已正式进入轨道,版本号18.3
  • JSDuck 与 AngularJS 融合技巧
  • Linux编程学习笔记 | Linux多线程学习[2] - 线程的同步
  • PHP 的 SAPI 是个什么东西
  • PHP的类修饰符与访问修饰符
  • Python中eval与exec的使用及区别
  • Redis 中的布隆过滤器
  • Vue--数据传输
  • 阿里云应用高可用服务公测发布
  • 基于OpenResty的Lua Web框架lor0.0.2预览版发布
  • 记录:CentOS7.2配置LNMP环境记录
  • 开源地图数据可视化库——mapnik
  • 每天一个设计模式之命令模式
  • 爬虫模拟登陆 SegmentFault
  • 树莓派 - 使用须知
  • 数据科学 第 3 章 11 字符串处理
  • 我的zsh配置, 2019最新方案
  • 小程序开发中的那些坑
  • 【运维趟坑回忆录 开篇】初入初创, 一脸懵
  • Salesforce和SAP Netweaver里数据库表的元数据设计
  • ​软考-高级-系统架构设计师教程(清华第2版)【第15章 面向服务架构设计理论与实践(P527~554)-思维导图】​
  • $.ajax中的eval及dataType
  • (42)STM32——LCD显示屏实验笔记
  • (C++)栈的链式存储结构(出栈、入栈、判空、遍历、销毁)(数据结构与算法)
  • (附源码)ssm基于微信小程序的疫苗管理系统 毕业设计 092354
  • (十六)串口UART
  • (四)linux文件内容查看
  • (转)德国人的记事本
  • .net CHARTING图表控件下载地址
  • .NET6 开发一个检查某些状态持续多长时间的类
  • .netcore 如何获取系统中所有session_如何把百度推广中获取的线索(基木鱼,电话,百度商桥等)同步到企业微信或者企业CRM等企业营销系统中...
  • .NET中两种OCR方式对比
  • .pub是什么文件_Rust 模块和文件 - 「译」