当前位置: 首页 > news >正文

关于KMP算法理解(快速字符串匹配)

参考:http://www.ruanyifeng.com/blog/2013/05/Knuth%E2%80%93Morris%E2%80%93Pratt_algorithm.html

2016-08-22

前言:自己看《算法导论》中关于KMP算法的讲解,文字描述+插图+伪代码,但最终还是云里雾里。之后借助于上面提到的博客才有所体会。感谢博主。

对于其最核心的部分---当模板字符串中前面q个字符和源字符串中的某个子串匹配时,如果继续往下匹配,发现两个字符并不相同,那该如何移动模板字符串进行比较呢?

1. 最简单的方法当然是,将模板字符串向后移动一位,继续从头开始比较每一个字符。很明显,这样做虽然可行,但是效率很差,因为你要把"搜索位置"移到已经比较过的位置,重比一遍。

2. 就是利用KMP算法,设法利用前面已经比较过的q位字符串信息,不要把"搜索位置"移回已经比较过的位置,继续把它向后移,这样就提高了效率。

 

 

那么KMP算法的移动方法是什么呢?

答案是:借助一个next数组(也称为部分匹配表)来计算下次字符串移动的位数应该是多少。

如下图所示:

下面介绍部分匹配表是如何产生的:

"部分匹配值"就是"前缀"和"后缀"的最长的共有元素的长度。以"ABCDABD"为例,(这只是相对于模板字符串而言,与源字符串无关)

首先,要了解两个概念:"前缀"和"后缀"。 "前缀"指除了最后一个字符以外,一个字符串的全部头部组合;"后缀"指除了第一个字符以外,一个字符串的全部尾部组合。

例如:

       - "A"的前缀和后缀都为空集,共有元素的长度为0;         q=1

  - "AB"的前缀为[A],后缀为[B],共有元素的长度为0;              q=2

  - "ABC"的前缀为[A, AB],后缀为[BC, C],共有元素的长度0;          q=3

  - "ABCD"的前缀为[A, AB, ABC],后缀为[BCD, CD, D],共有元素的长度为0;   q=4

  - "ABCDA"的前缀为[A, AB, ABC, ABCD],后缀为[BCDA, CDA, DA, A],共有元素为"A",长度为1;   q=5

  - "ABCDAB"的前缀为[A, AB, ABC, ABCD, ABCDA],后缀为[BCDAB, CDAB, DAB, AB, B],共有元素为"AB",长度为2;    q=6

  - "ABCDABD"的前缀为[A, AB, ABC, ABCD, ABCDA, ABCDAB],后缀为[BCDABD, CDABD, DABD, ABD, BD, D],共有元素的长度为0。  q=7

最后,模板字符串移动的位数 = q - 部分匹配值。(其中q表示已经匹配的字符的个数。)

 

 

" 部分匹配"的实质是,有时候,字符串头部和尾部会有重复。比如,"ABCDAB"之中有两个"AB",那么它的"部分匹配值"就是2("AB"的长 度)。搜索词移动的时候,第一个"AB"向后移动4位(字符串长度(q) - 部分匹配值),就可以来到第二个"AB"的位置。

 

 

所以,通过避免一些不必要的比较,这样就可以提高算法效率,时间复杂度为O(m+n),而一般方法复杂度为O(m×n)。

 

算法理解,到此就清楚了,实现代码如下:

 

 

 

 

 

简单匹配算法的时间复杂度为O(m*n),KMP匹配算法,可以证明它的时间复杂度为O(m+n).

.简单匹配算法

 

相关文章:

  • uva 10370 Above Average
  • linux下部署tomcat指定JDK版本编译并运行javaWEB应用
  • 个人视频发布汇总——教育改变人生
  • springmvc项目提交post表单参数乱码解决办法
  • MongoDB常用操作命令大全
  • I.MX6 android 4.2 源码下载
  • wait和waitpid详解
  • 使用WSAIoctl获取AcceptEx函数指针 [转]
  • esxi报错There is no more space for virtual disk--逻辑卷缩减!
  • Delphi 7使用自定义图标关联文件类型
  • NServiceBus---最流行的开源企业服务总线 for .Net
  • Struts2 - 常用的constant总结
  • EF-CodeFirst 继承关系TPH、TPT、TPC
  • 洛谷 P1313 计算系数 Label:杨辉三角形 多项式计算
  • Oracle存储过程基本语法介绍
  • ES6指北【2】—— 箭头函数
  • 分享的文章《人生如棋》
  • [分享]iOS开发 - 实现UITableView Plain SectionView和table不停留一起滑动
  • [译]CSS 居中(Center)方法大合集
  • 《深入 React 技术栈》
  • CentOS6 编译安装 redis-3.2.3
  • extract-text-webpack-plugin用法
  • java中的hashCode
  • spring boot下thymeleaf全局静态变量配置
  • Terraform入门 - 1. 安装Terraform
  • 警报:线上事故之CountDownLatch的威力
  • 项目实战-Api的解决方案
  • 一起来学SpringBoot | 第十篇:使用Spring Cache集成Redis
  • 异常机制详解
  • 用Python写一份独特的元宵节祝福
  • 用quicker-worker.js轻松跑一个大数据遍历
  • mysql面试题分组并合并列
  • ​软考-高级-系统架构设计师教程(清华第2版)【第15章 面向服务架构设计理论与实践(P527~554)-思维导图】​
  • # 飞书APP集成平台-数字化落地
  • #include
  • #数学建模# 线性规划问题的Matlab求解
  • $.ajax()
  • $Django python中使用redis, django中使用(封装了),redis开启事务(管道)
  • (bean配置类的注解开发)学习Spring的第十三天
  • (ZT)一个美国文科博士的YardLife
  • (二) Windows 下 Sublime Text 3 安装离线插件 Anaconda
  • (二十一)devops持续集成开发——使用jenkins的Docker Pipeline插件完成docker项目的pipeline流水线发布
  • (附源码)计算机毕业设计SSM疫情下的学生出入管理系统
  • (含react-draggable库以及相关BUG如何解决)固定在左上方某盒子内(如按钮)添加可拖动功能,使用react hook语法实现
  • (亲测)设​置​m​y​e​c​l​i​p​s​e​打​开​默​认​工​作​空​间...
  • (三)docker:Dockerfile构建容器运行jar包
  • (算法)前K大的和
  • (转)大型网站架构演变和知识体系
  • (自用)learnOpenGL学习总结-高级OpenGL-抗锯齿
  • ******之网络***——物理***
  • *_zh_CN.properties 国际化资源文件 struts 防乱码等
  • .Net Attribute详解(上)-Attribute本质以及一个简单示例
  • .NET Reactor简单使用教程
  • .Net 知识杂记
  • .Net(C#)自定义WinForm控件之小结篇