当前位置: 首页 > news >正文

51NOD 1565:模糊搜索——题解

http://www.51nod.com/onlineJudge/questionCode.html#problemId=1565&noticeId=445588

有两个基因串S和T,他们只包含AGCT四种字符。现在你要找出T在S中出现了几次。

有一个门限值k≥0。T在S的第i(1≤i≤|S|-|T|+1)个位置中出现的条件如下:把T的开头和S的第i个字符对齐,然后T中的每一个字符能够在S中找到一样的,且位置偏差不超过k的,那么就认为T在S的第i个位置中出现。也就是说对于所有的 j (1≤j≤|T|),存在一个 p (1≤p≤|S|),使得|(i+j-1)-p|≤k 和[p]=T[j]都成立。

例如,根据这样的定义"ACAT"出现在"AGCAATTCAT"的第2,3和6的位置。

如果k=0,那么这个就是经典的字符串匹配问题。

现在给定门限和两个基因串S,T,求出T在S中出现的次数。

参考:https://www.cnblogs.com/ivorysi/p/9185805.html

首先用差分/线段树处理出每个位置是否能够匹配A/T/C/G,令$a[i][j]$存之,表示$i$这个字符在$j$这个位置是否能被匹配上。

然后我们处理模式串,令$b[i][j]$表示$i$这个字符在$j$这个位置是否存在。

然后就是套路了:BZOJ4259:残缺的字符串对大部分模糊匹配都是一个套路。

我们将模式串倒置然后末尾补0,令:

$f[k][i]=\sum_{j=0}^i(b[k][j]-a[k][i-j])b[k][j]$,当$f[k][j]==0$时说明我们只看$k$字符时模式串能被以$i$为终点的字符串所匹配上。

(我们后面多乘的那个是为了防止该位置不存在$k$字符所设置的。)

展开得到:

$f[k][i]=\sum_{j=0}^ib[k][j]^2-\sum_{j=0}^ia[k][i-j]b[k][j]$

后者是一个卷积,可以直接FFT,前者的2次方其实也可以直接拿掉(因为$1^2=1,0^2=0$)

显然当所有的字符情况下均满足$f[i]==0$的时候$i$就是一个合法位点了。

#include<map>
#include<cmath>
#include<stack>
#include<queue>
#include<cstdio>
#include<cctype>
#include<vector>
#include<cstdlib>
#include<cstring>
#include<iostream>
#include<algorithm>
using namespace std;
typedef long long ll;
typedef double dl;
const int N=4e5+5;
const dl pi=acos(-1.0);
const int INF=4;
struct complex{
    dl x,y;
    complex(dl xx=0.0,dl yy=0.0){
    x=xx,y=yy;
    }
    complex operator +(const complex &b)const{
    return complex(x+b.x,y+b.y);
    }
    complex operator -(const complex &b)const{
    return complex(x-b.x,y-b.y);
    }
    complex operator *(const complex &b)const{
    return complex(x*b.x-y*b.y,x*b.y+y*b.x);
    }
};
void FFT(complex a[],int n,int on){
    for(int i=1,j=n>>1;i<n-1;i++){
    if(i<j)swap(a[i],a[j]);
    int k=n>>1;
    while(j>=k){j-=k;k>>=1;}
    if(j<k)j+=k;
    }
    for(int i=2;i<=n;i<<=1){
    complex res(cos(-2*pi*on/i),sin(-2*pi*on/i));
    for(int j=0;j<n;j+=i){
        complex w(1,0);
        for(int k=j;k<j+i/2;k++){
        complex u=a[k],t=w*a[k+i/2];
        a[k]=u+t;a[k+i/2]=u-t;
        w=w*res;
        }
    }
    }
    if(on==-1)
    for(int i=0;i<n;i++)a[i].x/=n;
}
inline int turn(char ch){
    if(ch=='A')return 0;
    if(ch=='G')return 1;
    if(ch=='C')return 2;
    return 3;
}
char s1[N],s2[N];
int n,m,k,t[N][4];
int a[4][N],b[4][N],ans[N];
complex A[N],B[N];
bool can[N];
int main(){
    scanf("%d%d%d",&n,&m,&k);
    scanf("%s%s",s1,s2);
    for(int i=0;i<n;i++){
    int w=turn(s1[i]);
    int l=max(0,i-k),r=min(n-1,i+k);
    t[l][w]++;t[r+1][w]--;
    }
    for(int i=0;i<n;i++)
    for(int j=0;j<4;j++){
        if(i)t[i][j]+=t[i-1][j];
        if(t[i][j]>0)a[j][i]=1;
    }
    for(int i=0;i<m;i++)b[turn(s2[m-i-1])][i]=1;
    
    int len=1;
    while(len<n)len<<=1;
    for(int i=0;i<4;i++){
    for(int j=0;j<n;j++)
        ans[j]=(j?ans[j-1]:0)+b[i][j];

    for(int j=0;j<len;j++){
        A[j]=complex(a[i][j],0);
        B[j]=complex(b[i][j],0);
    }
    FFT(A,len,1);FFT(B,len,1);
    for(int j=0;j<len;j++)A[j]=A[j]*B[j];
    FFT(A,len,-1);
    for(int j=0;j<n;j++)ans[j]-=(int)(A[j].x+0.5);

    for(int j=0;j<n;j++)if(ans[j])can[j]=1;
    }
    int cnt=0;
    for(int i=m-1;i<n;i++)if(!can[i])cnt++;
    printf("%d\n",cnt);
    return 0;
}

+++++++++++++++++++++++++++++++++++++++++++

 +本文作者:luyouqi233。               +

 +欢迎访问我的博客:http://www.cnblogs.com/luyouqi233/+

+++++++++++++++++++++++++++++++++++++++++++

转载于:https://www.cnblogs.com/luyouqi233/p/9203719.html

相关文章:

  • STL priority实例
  • Severless SQL on OSS 实验(DataLakeAnalytics on OSS)
  • MYSQL下对远程用户进行连接授权
  • php中mysqli 处理查询结果集的几个方法
  • python常用模块
  • windows mysql 8
  • 云计算大数据,知识体系
  • 瓜脸识别神器让标签看得见,看ET农业大脑是如何将生鲜品牌化?
  • Jenkins+pipeline+参数构建+人工干预确定
  • sql -- 移除数据中的换行符和回车符
  • 总结http get和post的区别
  • SpringBoot案例中关于添加的方式
  • WORD文档怎么转换成EXCEL
  • Java基础学习总结(24)——Java单元测试之JUnit4详解
  • 软件工程:第三章作业
  • @jsonView过滤属性
  • 【Under-the-hood-ReactJS-Part0】React源码解读
  • 002-读书笔记-JavaScript高级程序设计 在HTML中使用JavaScript
  • Bootstrap JS插件Alert源码分析
  • Java IO学习笔记一
  • Javascript弹出层-初探
  • js对象的深浅拷贝
  • js如何打印object对象
  • MobX
  • Odoo domain写法及运用
  • PHP那些事儿
  • 初识 webpack
  • 多线程 start 和 run 方法到底有什么区别?
  • 官方解决所有 npm 全局安装权限问题
  • 你不可错过的前端面试题(一)
  • 前言-如何学习区块链
  • 项目管理碎碎念系列之一:干系人管理
  • 移动端解决方案学习记录
  • 智能合约Solidity教程-事件和日志(一)
  • Android开发者必备:推荐一款助力开发的开源APP
  • 好程序员web前端教程分享CSS不同元素margin的计算 ...
  • 如何在招聘中考核.NET架构师
  • #define用法
  • #绘制圆心_R语言——绘制一个诚意满满的圆 祝你2021圆圆满满
  • #我与Java虚拟机的故事#连载19:等我技术变强了,我会去看你的 ​
  • $().each和$.each的区别
  • (3)nginx 配置(nginx.conf)
  • (4)logging(日志模块)
  • (c语言)strcpy函数用法
  • (M)unity2D敌人的创建、人物属性设置,遇敌掉血
  • (附源码)spring boot儿童教育管理系统 毕业设计 281442
  • (附源码)ssm基于jsp的在线点餐系统 毕业设计 111016
  • (附源码)ssm经济信息门户网站 毕业设计 141634
  • (官网安装) 基于CentOS 7安装MangoDB和MangoDB Shell
  • (原創) 如何解决make kernel时『clock skew detected』的warning? (OS) (Linux)
  • .NET Core 和 .NET Framework 中的 MEF2
  • .NET 中使用 Mutex 进行跨越进程边界的同步
  • .NET6 命令行启动及发布单个Exe文件
  • .Net程序帮助文档制作
  • .net之微信企业号开发(一) 所使用的环境与工具以及准备工作