当前位置: 首页 > news >正文

【学习笔记】决策单调性优化DP

背景

GDCPC还在发力,清华出题组出的牛客还是 4 题。
这次没有min25筛,不然我能5题(bushi

除了一道用 prufer 序列的恶心 DP 外,还有一道DP题是一个状态难想,并且还需要决策单调性优化的DP,被认为是偏简单的银牌题。

先来看个相对简单的问题

鸡蛋掉落

在这里插入图片描述
在这里插入图片描述

这是一道非常经典的面试题。本博客不会介绍这题的最优方法(时间复杂度 O ( n ) O(\sqrt n) O(n )

暴力DP

f i , j f_{i,j} fi,j 为还剩 i i i 个鸡蛋,楼高 j j j 层,需要的最少实验次数。
显然有转移:
f i , j = min ⁡ { max ⁡ ( f i − 1 , w − 1 + 1 , f i , j − w + 1 ) } , 1 ≤ w ≤ j f_{i,j} = \min\{\max (f_{i-1,w-1}+1,f_{i,j-w}+1)\}, 1 \leq w \leq j fi,j=min{max(fi1,w1+1,fi,jw+1)},1wj
我们称这种问题为 m i n m a x minmax minmax 问题
时间复杂度 O ( k n log ⁡ n ) O(kn\log n) O(knlogn)

优化1

显然,如果鸡蛋足够多,我们可以直接二分出高度。所以当 k > log ⁡ n k>\log n k>logn 时可以令 k = log ⁡ n k = \log n k=logn

优化2

考虑决策单调性。
一个很显然的结论:

  • i i i 相同时, j j j 越小, f f f 越小

也就是说:

  1. f i − 1 , w − 1 f_{i-1,w-1} fi1,w1 关于 w w w 单调递增
  2. f i , j − w f_{i,j-w} fi,jw 关于 w w w 单调递减

所以两个函数值的关系如图:
在这里插入图片描述

我们的最优决策点在红色点那里。显然,这玩意可以二分。
时间复杂度 O ( n log ⁡ 2 n ) O(n \log ^2 n) O(nlog2n)

class Solution {
public:int superEggDrop(int k, int n) {vector dp(k+1,vector<int>(n+1));for(int i=1; i<=n; i++){dp[1][i]=i;}for(int i=2; i<=k; i++){for(int j=1; j<=n; j++){int l=1,r=j,pos=-1;while(l<=r){int mid=l+r>>1;int x=dp[i-1][mid-1],y=dp[i][j-mid];if(x==y){pos=mid;break;}else if(x<y)l=mid+1;elser=mid-1;}if(pos!=-1)dp[i][j]=max(dp[i-1][pos-1],dp[i][j-pos]);else{dp[i][j]=1e9;pos=l;if(pos>0&&pos<=j) dp[i][j]=max(dp[i-1][pos-1],dp[i][j-pos]);pos=r;if(pos>0) dp[i][j]=min(dp[i][j],max(dp[i-1][pos-1],dp[i][j-pos]));}dp[i][j]++;}}return dp[k][n];// cout<<dp[k][n]<<"\n";}
};

优化3

回到DP式子
f i , j = min ⁡ { max ⁡ ( f i − 1 , w − 1 + 1 , f i , j − w + 1 ) } , 1 ≤ w ≤ j f_{i,j} = \min\{\max (f_{i-1,w-1}+1,f_{i,j-w}+1)\}, 1 \leq w \leq j fi,j=min{max(fi1,w1+1,fi,jw+1)},1wj
j j j 增加的时候,最优决策点会发生什么变化?
显然, f i − 1 , w − 1 f_{i-1,w-1} fi1,w1 不会变,但是 f i , j − w f_{i,j-w} fi,jw 是关于 j j j 单调递增的。
不难想象,那个红色的点就会往右边走。也就说,最优决策点也满足单调性,当 j j j 右移时,最优的 w w w 也右移。
所以我们可以用双指针代替二分。

时间复杂度 O ( n log ⁡ n ) O(n\log n) O(nlogn)


class Solution {
public:int superEggDrop(int k, int n) {vector dp(k+1,vector<int>(n+1));for(int i=1; i<=n; i++){dp[1][i]=i;}for(int i=2; i<=k; i++){int w=1;for(int j=1; j<=n; j++){while(w<j&&dp[i-1][w-1]<dp[i][j-w]){w++;}dp[i][j]=max(dp[i-1][w-1],dp[i][j-w]);if(w>1)dp[i][j]=min(dp[i][j],max(dp[i-1][w-2],dp[i][j-w+1]));dp[i][j]++;}}return dp[k][n];// cout<<dp[k][n]<<"\n";}
};

其实还有一种很好的写法是:

  • 先用当前决策点更新 d p dp dp
  • 如果决策点右移可以使 d p dp dp 值更优就继续往右移并更新 d p dp dp
  • 否则就 b r e a k break break

2024牛客暑期多校训练营5 K

在这里插入图片描述

暴力

最暴力的想法是区间DP,设 d p l , r dp_{l,r} dpl,r 为已经把答案范围缩小到 [ a l , a r ] [a_l,a_r] [al,ar],还需要多少代价才能确定答案。
但你很快会发现没办法直接区间DP,因为你根本不知道 x x x 在哪。
但是如果我们知道之前我左边问过多少次,右边问过多少次,就可以计算区间扩展产生的代价。
所以我们可以设 d p i , j , x , y dp_{i,j,x,y} dpi,j,x,y 代表已经把答案范围缩小到 [ a l , a r ] [a_l,a_r] [al,ar],之前在区间左边问了 x x x 次,右边问了 y y y 次还需要多少代价。

转移就可以枚举中间点 k k k,令分割点为 p p p,那么转移就是
d p l , r , x , y = min ⁡ { max ⁡ ( d p l , p , x , y + 1 + k − a p + ( a r − a p ) × y , d p p + 1 , r , x + 1 , y + ( a p + 1 − a l ) × x + a p + 1 − k ) } dp_{l,r,x,y} = \min\{\max(dp_{l,p,x,y+1}+k-a_p+(a_r- a_p)\times y, dp_{p+1,r,x+1,y}+(a_{p+1}-a_l)\times x+a_{p+1}-k)\} dpl,r,x,y=min{max(dpl,p,x,y+1+kap+(arap)×y,dpp+1,r,x+1,y+(ap+1al)×x+ap+1k)}
时间复杂度 O ( n 4 × 值域 ) O(n^4\times值域) O(n4×值域)

优化1

思考一下,我们真的需要知道两边各询问了多少次吗?
假设 x > y x>y x>y 那么询问代价就是 x − y x-y xy,否则就是 y − x y-x yx
y y y 的代价可以在DP转移的时候直接记录
x x x 的代价当 x x x 确定下来的时候可以通过 左边询问次数 - 右边询问次数 来计算
所以其实我们只需记录三四维的差值就行。

d p l , r , c dp_{l,r,c} dpl,r,c 代表已经把答案范围缩小到 [ a l , a r ] [a_l,a_r] [al,ar],之前在区间左边和右边询问次数之差为 c c c 次, x x x 的全局代价计算 + 还需要的代价。
显然初始化为 d p i , i , c = a i × c dp_{i,i,c} = a_i\times c dpi,i,c=ai×c

同样的,转移就可以枚举中间点 k k k,令分割点为 p p p,那么转移就是
d p l , r , c = min ⁡ { max ⁡ ( d p l , p , c − 1 + k , d p p + 1 , r , c + 1 − k ) } dp_{l,r,c} = \min\{\max(dp_{l,p,c-1}+k, dp_{p+1,r,c+1}-k)\} dpl,r,c=min{max(dpl,p,c1+k,dpp+1,r,c+1k)}
时间复杂度 O ( n 3 × 值域 ) O(n^3\times 值域) O(n3×值域)

优化2

可证明, c c c 不会超过 O ( log ⁡ n ) O(\log n) O(logn) 个,我不会证()
时间复杂度 O ( n 2 log ⁡ n × 值域 ) O(n^2\log n\times 值域) O(n2logn×值域)

优化3

首先,值域那玩意大的离谱。但是从 d p dp dp 式子很容易看出来,一个 + k +k +k 一个 − k -k k,显然是有单调性的, k k k 的决策点可以 O ( 1 ) O(1) O(1)

int get(int l,int r,int pos,int c)
{int L=a[pos]+1,R=a[pos+1];int x=dp[l][pos][c-1]+L,y=dp[pos+1][r][c+1]-L;if(x>=y) return x;int mx=min(R-L,(y-x)>>1);return max(x+mx,y-mx);
}

时间复杂度 O ( n 3 log ⁡ n ) O(n^3\log n) O(n3logn)

优化4

现在时间复杂度的瓶颈在于枚举 p p p,怎么把这玩意优化掉呢?
当区间左端点不动,右端点增加的时候,显然方程的第一项是不变的,第二项是单调递减的。这个时候把 p p p 往右移动可以让第一项减小,第二项增大。所以最优决策点 p p p 会关于 r r r 单调递增,我们同样可以用双指针来处理决策点。
时间复杂度 O ( n 2 log ⁡ n ) O(n^2\log n) O(n2logn)

代码

#include<bits/stdc++.h>
#define int long long
using namespace std;
const int N=1e6+7,inf=1e18,C=60,base=30;
vector<vector<vector<int>>> dp,p;
vector<int> a;
int get(int l,int r,int pos,int c)
{int L=a[pos]+1,R=a[pos+1];int x=dp[l][pos][c-1]+L,y=dp[pos+1][r][c+1]-L;if(x>=y) return x;int mx=min(R-L,(y-x)>>1);return max(x+mx,y-mx);
}
void O_o()
{int n;cin>>n;a.assign(n,0);for(int i=1; i<=n; i++) cin>>a[i];dp.assign(n+1,vector<vector<int>>(n+1,vector<int>(C+1,inf)));p.assign(n+1,vector<vector<int>>(n+1,vector<int>(C+1,0)));for(int len=1; len<=n; len++){for(int l=1; l<=n-len+1; l++){int r=l+len-1;for(int c=1; c<C; c++){if(l==r){dp[l][r][c]=a[l]*(c-base);p[l][r][c]=l;}else{int pos=p[l][r-1][c];dp[l][r][c]=get(l,r,pos,c);while(pos<r-1){int v=get(l,r,pos+1,c);if(v<dp[l][r][c]){pos++;dp[l][r][c]=v;}elsebreak;}p[l][r][c]=pos;}}}}cout<<dp[1][n][base]<<"\n";
}
signed main()
{ios::sync_with_stdio(false); cin.tie(0); cout.tie(0);cout<<fixed<<setprecision(12);int T=1;
//	cin>>T;while(T--){O_o();}
}

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 抖音上传视频模糊怎么办?模糊视频怎么变高清?
  • 【华为战报】2024年7月 HCIA-HCIP-HCIE考试,通过率100%
  • Vue3实战案例 知识点全面 推荐收藏 超详细 及附知识点解读
  • 教你轻松搞定磁盘分区
  • 端口及对应服务
  • 【单片机毕业设计选题24095】-基于手机端的电池电压采集系统
  • 【一对一模型讲解】SABO-Transformer-LSTM多变量回归预测(减法平均算法)
  • LeetCode题练习与总结:第N高的薪水--177
  • 蓝桥杯 Python 研究生组-2023-省赛-工作时长
  • 【传输层协议】UDP和TCP协议
  • 3年亏11亿元,博泰车联网没沾上汽车智能化的光?
  • 互联网医院系统源码与医保购药APP开发的完整技术指南
  • 常见离线语音识别模块功能说明——天问ASR;机芯智能;海凌科;轻语音
  • 【AI绘画】fal/AuraFlow-v0.2出现 delete the irrelevant ones 错误
  • Javaweb项目|ssm基于web的健身中心管理系统的的设计与实现jsp
  • 【MySQL经典案例分析】 Waiting for table metadata lock
  • 【干货分享】SpringCloud微服务架构分布式组件如何共享session对象
  • angular2开源库收集
  • HTML中设置input等文本框为不可操作
  • PhantomJS 安装
  • Quartz初级教程
  • 利用阿里云 OSS 搭建私有 Docker 仓库
  • 前端技术周刊 2018-12-10:前端自动化测试
  • 推荐一个React的管理后台框架
  • 一、python与pycharm的安装
  • 移动端 h5开发相关内容总结(三)
  • JavaScript 新语法详解:Class 的私有属性与私有方法 ...
  • MPAndroidChart 教程:Y轴 YAxis
  • 昨天1024程序员节,我故意写了个死循环~
  • #基础#使用Jupyter进行Notebook的转换 .ipynb文件导出为.md文件
  • (2.2w字)前端单元测试之Jest详解篇
  • (3) cmake编译多个cpp文件
  • (42)STM32——LCD显示屏实验笔记
  • (Redis使用系列) SpringBoot 中对应2.0.x版本的Redis配置 一
  • (笔记)M1使用hombrew安装qemu
  • (附源码)springboot青少年公共卫生教育平台 毕业设计 643214
  • (六)Hibernate的二级缓存
  • (三) diretfbrc详解
  • (生成器)yield与(迭代器)generator
  • (四)软件性能测试
  • .[hudsonL@cock.li].mkp勒索加密数据库完美恢复---惜分飞
  • .md即markdown文件的基本常用编写语法
  • .net core IResultFilter 的 OnResultExecuted和OnResultExecuting的区别
  • .Net Core与存储过程(一)
  • .NET/C# 使用反射注册事件
  • .net经典笔试题
  • ::什么意思
  • :如何用SQL脚本保存存储过程返回的结果集
  • ??myeclipse+tomcat
  • @Bean有哪些属性
  • [AIGC] 如何建立和优化你的工作流?
  • [Asp.net mvc]国际化
  • [Bug]使用gradio创建应用提示AttributeError: module ‘gradio‘ has no attribute ‘inputs‘
  • [BZOJ1089][SCOI2003]严格n元树(递推+高精度)
  • [C/C++]数据结构 栈和队列()