当前位置: 首页 > news >正文

BZOJ 3172 Tjoi2013 单词 后缀数组

题目大意:给定一个n个单词的文章,求每一个单词在文章中的出现次数

文章长度<=10^6(不是单词长度<=10^6,不然读入直接超时)

首先将全部单词用空格连接成一个字符串。记录每一个单词的起始位置和长度

然后求后缀数组,对于每一个单词后缀数组中一定有连续一段后缀以这个单词开头,我们通过一開始记录的起始位置找到这个单词的后缀,然后左右端点二分答案,满足左右端点之间的后缀与原单词的LCP都当与等于原单词长度就可以

时间复杂度O(nlogn)

#include<cstdio>
#include<cstring>
#include<iostream>
#include<algorithm>
#define M 1001001
using namespace std;
int n,m;
char s[M];
int st[210],len[210];
int rank[M],sa[M],height[M],X[M],Y[M];
int sum[M],cnt[M],temp[M],tot;
int min_num[M][21],log2[M];
void Get_Rank()
{
	int i;
	for(i=1;i<=m;i++)
		sum[s[i]]++;
	for(i=1;i<=127;i++)
		sum[i]+=sum[i-1];
	for(i=1;i<=m;i++)
		sa[ sum[s[i]-1]+ ++cnt[s[i]] ]=i;
	for(i=1;i<=m;i++)
	{
		if(i==1||s[sa[i]]!=s[sa[i-1]])
			++tot;
		rank[sa[i]]=tot;
	}
}
void Radix_Sort(int key[],int order[])
{
	int i;
	for(i=0;i<=m;i++)
		sum[i]=cnt[i]=0;
	for(i=1;i<=m;i++)
		sum[key[i]]++;
	for(i=1;i<=m;i++)
		sum[i]+=sum[i-1];
	for(i=1;i<=m;i++)
		temp[ sum[key[order[i]]-1]+ ++cnt[key[order[i]]] ]=order[i];
	for(i=1;i<=m;i++)
		order[i]=temp[i];
}
void Get_Height()
{
	int i,j,k;
	for(i=1;i<=m;i++)
	{
		if(rank[i]==1) continue;
		j=max(height[rank[i-1]]-1,0);k=sa[rank[i]-1];
		while(s[i+j]==s[k+j]) j++;
		height[rank[i]]=j;
	}
}
void Prefix_Doubling()
{
	int i,j;
	Get_Rank();
	for(j=1;j<=m;j<<=1)
	{
		for(i=1;i<=m;i++)
		{
			X[i]=rank[i];
			Y[i]=i+j>m?

0:rank[i+j]; sa[i]=i; } Radix_Sort(Y,sa); Radix_Sort(X,sa); for(i=1,tot=0;i<=m;i++) { if( i==1 || X[sa[i]]!=X[sa[i-1]] || Y[sa[i]]!=Y[sa[i-1]] ) ++tot; rank[sa[i]]=tot; } } Get_Height(); } void Input() { int i; char *p=s+1; for(i=1;i<=n;i++) { scanf("%s",p); st[i]=p-s; len[i]=strlen(p); *(p+=len[i],p++)=' '; } *(--p)=0; m=p-s-1; } inline int Min(int x,int y) { if(x>y) return 0x3f3f3f3f; return min( min_num[x][log2[y-x+1] ] , min_num[y-(1<<log2[y-x+1])+1][log2[y-x+1] ] ); } int Left_Bisection(int i) { int l=1,r=rank[st[i]]; while(l+1<r) { int mid=l+r>>1; if( Min(mid+1,rank[st[i]])>=len[i] ) r=mid; else l=mid; } if( Min(l+1,rank[st[i]])>=len[i] ) return l; return r; } int Right_Bisection(int i) { int l=rank[st[i]],r=m; while(l+1<r) { int mid=l+r>>1; if( Min(rank[st[i]]+1,mid)>=len[i] ) l=mid; else r=mid; } if( Min(rank[st[i]]+1,r)>=len[i] ) return r; return l; } int main() { int i,j; cin>>n; Input(); Prefix_Doubling(); log2[0]=-1; for(i=1;i<=m;i++) log2[i]=log2[i>>1]+1; for(i=1;i<=m;i++) min_num[i][0]=height[i]; for(j=1;j<=log2[m];j++) for(i=1;i+(1<<j)-1<=m;i++) min_num[i][j]=min( min_num[i][j-1] , min_num[i+(1<<j-1)][j-1] ); for(i=1;i<=n;i++) { int l=Left_Bisection(i); int r=Right_Bisection(i); printf("%d\n",r-l+1); } }



相关文章:

  • C#基础_MD5
  • Protobuf3 语法指南
  • Oracle数据库服务器IO高的分析方案和案例探讨
  • yii2清空模态框表单的数据,每次点击开始之前让数据清空
  • 依赖类型语言Idris发布1.0版本
  • asp.net请求处理过程
  • 查看符号
  • 教主泡嫦娥[有趣的dp状态设计]
  • Android popupwindow 演示样例程序一
  • 我的朗科运维第七课
  • 正则表达式 re.findall 用法
  • Python中文件操作
  • 云计算与虚拟化的区别
  • JMM-java内存模型
  • 代码托管
  • “寒冬”下的金三银四跳槽季来了,帮你客观分析一下局面
  • - C#编程大幅提高OUTLOOK的邮件搜索能力!
  • java正则表式的使用
  • Python 基础起步 (十) 什么叫函数?
  • Rancher如何对接Ceph-RBD块存储
  • SSH 免密登录
  • Travix是如何部署应用程序到Kubernetes上的
  • vue-loader 源码解析系列之 selector
  • Yeoman_Bower_Grunt
  • 笨办法学C 练习34:动态数组
  • 动态规划入门(以爬楼梯为例)
  • 关于使用markdown的方法(引自CSDN教程)
  • 记一次和乔布斯合作最难忘的经历
  • 今年的LC3大会没了?
  • 猫头鹰的深夜翻译:Java 2D Graphics, 简单的仿射变换
  • 推荐一个React的管理后台框架
  • 学习使用ExpressJS 4.0中的新Router
  • ​Kaggle X光肺炎检测比赛第二名方案解析 | CVPR 2020 Workshop
  • # 日期待t_最值得等的SUV奥迪Q9:空间比MPV还大,或搭4.0T,香
  • # 透过事物看本质的能力怎么培养?
  • ###51单片机学习(2)-----如何通过C语言运用延时函数设计LED流水灯
  • (11)MATLAB PCA+SVM 人脸识别
  • (23)Linux的软硬连接
  • (4)STL算法之比较
  • (env: Windows,mp,1.06.2308310; lib: 3.2.4) uniapp微信小程序
  • (java)关于Thread的挂起和恢复
  • (pojstep1.3.1)1017(构造法模拟)
  • (八)Spring源码解析:Spring MVC
  • (三) diretfbrc详解
  • (原创)Stanford Machine Learning (by Andrew NG) --- (week 9) Anomaly DetectionRecommender Systems...
  • (转)利用PHP的debug_backtrace函数,实现PHP文件权限管理、动态加载 【反射】...
  • (转载)从 Java 代码到 Java 堆
  • .net MySql
  • .net 发送邮件
  • .NET 命令行参数包含应用程序路径吗?
  • .NET简谈互操作(五:基础知识之Dynamic平台调用)
  • .net实现客户区延伸至至非客户区
  • @html.ActionLink的几种参数格式
  • [ vulhub漏洞复现篇 ] Grafana任意文件读取漏洞CVE-2021-43798
  • []error LNK2001: unresolved external symbol _m