详解KMP算法以及python如何实现

 更新时间:2020年09月18日 16:11:20   作者:MrDoghead  
这篇文章主要介绍了KMP算法的相关知识以及python如何实现,帮助大家更好的进行数据分析,感兴趣的朋友可以了解下

算法思路

Knuth-Morris-Pratt(KMP)算法是解决字符串匹配问题的经典算法,下面通过一个例子来演示一下:

给定字符串"BBC ABCDAB ABCDABCDABDE",检查里面是否包含另一个字符串"ABCDABD"。

1.从头开始依次匹配字符,如果不匹配就跳到下一个字符

2.直到发现匹配字符,然后经过一个内循环严查字符串是否匹配

 

3.发现最后一个D不匹配,下面就该思考应该把字符串向右移动多少个位置呢?传统做法可能是移动一格,KMP算法就创新在这里。KMP算法通过查询一个Partial Match Table(表内存有字符串信息),然后计算出需要移动的步数,这个表后面会介绍怎么来的。

这里我们看到D前面是B,查表得到第二个B对应的是2,所以 移动数 = 已匹配字符数 - 查表所得数 也就是 6 - 2 = 4, 需要向右移动四格。

下面也是重复这个步骤

直到发现匹配或者字符长度超出(未发现匹配)。

Partial Match Table

那么这个查询的表是怎么来的呢?仍然以"ABCDABD"为例

- "A"的前缀和后缀都为空集,共有元素的长度为0;

- "AB"的前缀为[A],后缀为[B],共有元素的长度为0;

- "ABC"的前缀为[A, AB],后缀为[BC, C],共有元素的长度0;

- "ABCD"的前缀为[A, AB, ABC],后缀为[BCD, CD, D],共有元素的长度为0;

- "ABCDA"的前缀为[A, AB, ABC, ABCD],后缀为[BCDA, CDA, DA, A],共有元素为"A",长度为1;

- "ABCDAB"的前缀为[A, AB, ABC, ABCD, ABCDA],后缀为[BCDAB, CDAB, DAB, AB, B],共有元素为"AB",长度为2;

- "ABCDABD"的前缀为[A, AB, ABC, ABCD, ABCDA, ABCDAB],后缀为[BCDABD, CDABD, DABD, ABD, BD, D],共有元素的长度为0。

python实现

def partial_table(p):
  '''''partial_table("ABCDABD") -> [0, 0, 0, 0, 1, 2, 0]'''
  prefix = set()
  res = [0]
  for i in range(1, len(p)):
    prefix.add(p[:i])
    postfix = {p[j:i + 1] for j in range(1, i + 1)}
    #print(p[:i+1],prefix,postfix,prefix & postfix or {''})
    res.append(len((prefix & postfix or {''}).pop()))
  return res

def kmp_match(s, p):
  m = len(s);
  n = len(p)
  cur = 0 # 起始指针cur
  table = partial_table(p)
  while cur <= m - n:   #只去匹配前m-n个
    for i in range(n):
      if s[i + cur] != p[i]:
        cur += max(i - table[i - 1], 1) # 有了部分匹配表,我们不只是单纯的1位1位往右移,可以一次移动多位
        break
    else:    
      return True # loop从 break 中退出时,else 部分不执行。
  return False

print partial_table1("ABCDABD")
print kmp_match("BBC ABCDAB ABCDABCDABDE", "ABCDABD")

以上就是详解KMP算法以及python如何实现的详细内容,更多关于python实现KMP算法的资料请关注脚本之家其它相关文章!

相关文章

  • 利用Python中unittest实现简单的单元测试实例详解

    利用Python中unittest实现简单的单元测试实例详解

    如果项目复杂,进行单元测试是保证降低出错率的好方法,Python提供的unittest可以很方便的实现单元测试,从而可以替换掉繁琐杂乱的main函数测试的方法,将测试用例、测试方法进行统一的管理和维护。本文主要介绍了利用Python中unittest实现简单的单元测试。
    2017-01-01
  • Python实现简单的文件操作合集

    Python实现简单的文件操作合集

    这篇文章主要为大家详细介绍了Python实现的一些简单的文件操作合集,例如:文件的打开,关闭;文件的写入等,感兴趣的小伙伴可以了解一下
    2022-09-09
  • python networkx 根据图的权重画图实现

    python networkx 根据图的权重画图实现

    这篇文章主要介绍了python networkx 根据图的权重画图实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-07-07
  • Python中apply函数的用法实例教程

    Python中apply函数的用法实例教程

    这篇文章主要介绍了Python中apply函数的用法,配合实例解说,可加深读者对apply函数的理解,需要的朋友可以参考下
    2014-07-07
  • 利用PyWebIO库10分钟搭建一个漂亮的Python Web应用

    利用PyWebIO库10分钟搭建一个漂亮的Python Web应用

    这篇文章主要介绍了PyWebIO是一个用于在浏览器上获取输入和进行输出的Python工具库,它能让我们零前端知识,纯Python代码构建Web应用,文中通过代码介绍的非常详细,需要的朋友可以参考下
    2025-01-01
  • python 简单备份文件脚本v1.0的实例

    python 简单备份文件脚本v1.0的实例

    下面小编就为大家带来一篇python 简单备份文件脚本v1.0的实例。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧,希望对大家有所帮助
    2017-11-11
  • Python编程使用matplotlib绘制动态圆锥曲线示例

    Python编程使用matplotlib绘制动态圆锥曲线示例

    这篇文章主要介绍了Python使用matplotlib绘制动态的圆锥曲线示例实现代码,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步
    2021-10-10
  • Python函数递归调用实现原理实例解析

    Python函数递归调用实现原理实例解析

    这篇文章主要介绍了Python函数递归调用实现原理过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-08-08
  • python BeautifulSoup库的安装与使用

    python BeautifulSoup库的安装与使用

    这篇文章主要介绍了python BeautifulSoup库的安装与使用,帮助大家更好的理解和使用python,感兴趣的朋友可以了解下
    2020-12-12
  • 单利模式及python实现方式详解

    单利模式及python实现方式详解

    单例模式(Singleton Pattern)是一种常用的软件设计模式,该模式的主要目的是确保 某一个类只有一个实例存在.这篇文章主要介绍了单利模式及python实现方式及Python单例模式的4种实现方法,需要的朋友可以参考下
    2018-03-03

最新评论