nefu暑假集训5 KMP 个人模板+例题汇总
前言:
KMP算法用于匹配字符串,假设长字符串为s,需要匹配的字符串是p。KMP算法的基础思想是利用一个next[n]数组:next[i]对应的是:以下标i为结尾的连续子串,与以第一个字符开始的子串,相等的最大长度。该数组的作用是,当某一个下标的元素没有匹配成功时,可以通过该长度跳转到与 匹配成功的部分字符串的最后一个,开始下一次匹配。以下是我写的一些题目。
正文:
链接:nefu-KMP - Virtual Judge (vjudge.net)
题目:
A - 剪花布条:
#include<bits/stdc++.h>
using namespace std;
string s,p;
int main(){while(cin>>s&&s!="#"){cin>>p;long long ans=0;while(s.find(p)!=-1) s.erase(s.find(p),p.length()),ans++;cout<<ans<<endl;}
}
这题好像根本用不上KMP,直接用string的find函数就能写出来。
B - Power Strings:
#include<bits/stdc++.h>
using namespace std;
int nxt[1000100];
char s[1000100];
int main(){while(~scanf("%s",s+1)&&s[1]!='.') {int n=strlen(s+1);nxt[1]=0;for(int i=2,j=0;i<=n;i++){while(j>0&&(j==n||s[i]!=s[j+1])) j=nxt[j];if(s[i]==s[j+1]) j++;nxt[i]=j;}if(n%(n-nxt[n])==0&&nxt[n]) printf("%d\n",n/(n-nxt[n]));else puts("1");}return 0;
}
这题实际上就是求字符串最大循环节问题,我们这边直接找到next数组中的next[n],n-next[n]就是他的最小循环子串,但是得判断一下是否可以由该字串直接完美构成(也就是n%(n=next[n])得是0)。
C - KMP:
#include<bits/stdc++.h>
using namespace std;
const int N=1e6+5;
char s1[N],s2[N];
int ne[N];
int main(){cin>>s1+1>>s2+1;int n=strlen(s1+1),m=strlen(s2+1);//cout<<strlen(s1+1)<<" "<<strlen(s2+1)<<endl;for(int i=2,j=0;i<=m;i++){while(j&&s2[i]!=s2[j+1])j=ne[j];if(s2[i]==s2[j+1])j++;ne[i]=j;}for(int i=1,j=0;i<=n;i++){while(j&&s1[i]!=s2[j+1])j=ne[j];if(s1[i]==s2[j+1])j++;if(j==m){printf("%d\n",i-m+1);j=ne[j];}}for(int i=1;i<=m;i++){cout<<ne[i]<<" ";}return 0;
}
模板题。
D - Radio Transmission:
#include<bits/stdc++.h>
using namespace std;
const int N=1e6+5;
char s[N];
int ne[N];
int main(){int l;cin>>l>>s+1;for(int i=2,j=0;i<=l;i++){while(j&&s[i]!=s[j+1])j=ne[j];if(s[i]==s[j+1])j++;ne[i]=j;}cout<<l-ne[l]<<endl;return 0;
}
最小循环子串=l-ne[l],证明可以上网搜搜。
E - OKR-Periods of Words:
这题就是再求最短前缀,我们只需要在求完next数组后直接不断往前循环让next[i]=即可
F - 似乎在梦中见过的样子:
#include<bits/stdc++.h>
using namespace std;
const int N=150005;
char w[N];
int k,n,ans,ne[N],f[N];
int main(){scanf("%s%d",w+1,&k);int n=strlen(w+1);for(int i=1;i<=n;i++){int l=i-1;ne[i]=i-1;f[i]=i;for(int j=i+1;j<=n;j++){while(l!=i-1&&w[l+1]!=w[j])l=ne[l];if(w[l+1]==w[j])ne[j]=++l;else ne[j]=i-1;if(l<i+k-1)f[j]=j;else f[j]=f[l];ans+=(f[j]<((i+j)>>1));}}cout<<ans<<endl;return 0;
}
第一层循环枚举初始位置,第二层循环从每个位置开始做KMP,然后找到满足ABA且A>k的情况。
G - Censoring:
#include <bits/stdc++.h>
using namespace std;
const int N=1e6+5;
char s1[N],s2[N];
int ne[N],top,pos[N],stk[N];
int main(){cin>>s1+1>>s2+1;int n=strlen(s1+1),m=strlen(s2+1);for(int i=2,j=0;i<=m;i++){while(j&&s2[i]!=s2[j+1])j=ne[j];if(s2[i]==s2[j+1])j++;ne[i]=j;}for(int i=1,j=0;i<=n;i++){stk[++top]=i;while(j&&s1[i]!=s2[j+1])j=ne[j];if(s1[i]==s2[j+1])j++;pos[i]=j;if(j==m){top-=m;j=pos[stk[top]];}}for(int i=1;i<=top;i++){cout<<s1[stk[i]];}return 0;
}
用另外一个数组来模拟删除的过程,其中通过top来模拟数组的最后一位。
H - Compress Words:
#include <bits/stdc++.h>
using namespace std;
typedef long long ll;
const ll maxn=1000010;
ll n,len,anslen,top,minn,kmp[maxn];
char c[maxn],ans[maxn];
int main(){ cin>>n;for(int i=1;i<=n;i++){scanf("%s",c+1);len=strlen(c+1);minn=min(anslen,len);top=len;c[++top]='#';for(int j=1;j<=minn;j++)c[++top]=ans[anslen-(minn-j)];for(int j=1;j<top;j++){ll k=kmp[j];while(k&&c[k+1]!=c[j+1])k=kmp[k];if(c[k+1]==c[j+1])k++;kmp[j+1]=k;}for(int j=kmp[top]+1;j<=len;j++)ans[++anslen]=c[j];}for(int i=1;i<=anslen;i++)cout<<ans[i];return 0;
}
I - 动物园:
#include<bits/stdc++.h>
using namespace std;
const int N=1e6+5;
const int mod=1e9+7;
typedef long long ll;
int ne[N],ans[N];
int main(){int t;cin>>t;while(t--){ll res=1;memset(ne,0,sizeof(ne));string s;cin>>s;int n=s.size();ans[0]=0;ans[1]=1;for(int i=1,j=0;i<=n;i++){while(j&&s[i]!=s[j])j=ne[j];if(s[i]==s[j])j++;ne[i+1]=j;ans[i+1]=ans[j]+1; }for(int i=1,j=0;i<=n;i++){while(j&&s[i]!=s[j])j=ne[j];if(s[i]==s[j])j++;while(2*j>(i+1))j=ne[j];res=(res*(ll)(ans[j]+1)%mod);}cout<<res<<endl;}return 0;
}
J - Sza-Template:(待补)
后记:
KMP还是十分考察思维的算法啊。明天要分方向比赛了,好好写点题吧。