Python实现统计给定字符串中重复模式最高子串功能示例

 更新时间:2018年05月16日 08:48:37   作者:Together_CZ  
这篇文章主要介绍了Python实现统计给定字符串中重复模式最高子串功能,涉及Python针对字符串的遍历、排序、切片、运算等相关操作技巧,需要的朋友可以参考下

本文实例讲述了Python实现统计给定字符串中重复模式最高子串功能。分享给大家供大家参考,具体如下:

给定一个字符串,如何得到其中重复模式最高的子字符串,我采用的方法是使用滑窗机制,对给定的字符串切分,窗口的大小从1增加到字符串长度减1,将所有的得到的切片统计结果,在这里不考虑单个字符的重复模式,好了,很简单看具体实现:

#!usr/binenv python
#encoding:utf-8
'''''
__Author__:沂水寒城
统计一个给定字符串中重复模式数量得到最高重复模式串
'''
def slice(num_str,w):
 '''''
 对输入的字符串滑窗切片返回结果列表
 '''
 result_list=[]
 for i in range(len(num_str)-w+1):
 result_list.append(num_str[i:i+w])
 return result_list
def get_repeat_num_seq(num_str):
 '''''
 统计重复模式串数量
 '''
 result_dict={}
 result_list=[]
 for i in range(2,len(num_str)):
 one_list=slice(num_str, i)
 result_list+=one_list
 for i in range(len(result_list)):
 if result_list[i] in result_dict:
  result_dict[result_list[i]]+=1
 else:
  result_dict[result_list[i]]=1
 sorted_result_dict=sorted(result_dict.items(), key=lambda e:e[1], reverse=True)
 return sorted_result_dict[0:10]
if __name__ == '__main__':
 num_list=get_repeat_num_seq('4513785645121214545454545457894')
 print num_list

结果如下:

[('45', 8), ('4545', 5), ('454', 5), ('545', 5), ('54', 5), ('5454', 4), ('454545', 4), ('45454', 4), ('54545', 4), ('545454', 3)]
[Finished in 0.5s]

结果列表中第一个即为所求,当然,基于此还可以继续改进有很多别的需求。

PS:这里再为大家推荐2款非常方便的统计工具供大家参考使用:

在线字数统计工具:
http://tools.jb51.net/code/zishutongji

在线字符统计与编辑工具:
http://tools.jb51.net/code/char_tongji

更多关于Python相关内容感兴趣的读者可查看本站专题:《Python字符串操作技巧汇总》、《Python数据结构与算法教程》、《Python函数使用技巧总结》及《Python入门与进阶经典教程

希望本文所述对大家Python程序设计有所帮助。

相关文章

  • 详解如何管理多个Python版本和虚拟环境

    详解如何管理多个Python版本和虚拟环境

    这篇文章主要介绍了详解如何管理多个Python版本和虚拟环境,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2019-05-05
  • Pandas DataFrame操作数据增删查改

    Pandas DataFrame操作数据增删查改

    我们在用 pandas 处理数据的时候,经常会遇到用其中一列数据替换另一列数据的场景。这一类的需求估计很多人都遇到,当然还有其它更复杂的。解决这类需求的办法有很多,这里我们来推荐几个,这篇文章主要介绍了Pandas DataFrame操作数据的增删查改
    2022-10-10
  • Python的Django框架中的表单处理示例

    Python的Django框架中的表单处理示例

    这篇文章主要介绍了Python的Django框架中的表单处理示例,表单处理是Django中的基础操作,需要的朋友可以参考下
    2015-07-07
  • Python numpy二维数组如何删除指定行和列

    Python numpy二维数组如何删除指定行和列

    本文展示了如何对数组进行行列删除操作,包括删除单行、单列、多行和多列的方法,通过具体的运行结果展示,读者可以清晰地了解到如何在不同情况下进行数据处理,文章内容实用,适合需要进行数据处理的读者参考学习
    2024-09-09
  • Python THREADING模块中的JOIN()方法深入理解

    Python THREADING模块中的JOIN()方法深入理解

    这篇文章主要介绍了Python THREADING模块中的JOIN()方法深入理解,本文用简洁易懂的语言总结了对JOIN()方法的理解,不同于其它文章,需要的朋友可以参考下
    2015-02-02
  • Python判断对象是否相等及eq函数的讲解

    Python判断对象是否相等及eq函数的讲解

    今天小编就为大家分享一篇关于Python判断对象是否相等及eq函数的讲解,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧
    2019-02-02
  • tensorflow 自定义损失函数示例代码

    tensorflow 自定义损失函数示例代码

    这篇文章主要介绍了tensorflow 自定义损失函数示例,代码简单易懂,非常不错,具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-02-02
  • Python统计字符内容的占比的实现

    Python统计字符内容的占比的实现

    本文介绍了如何使用Python统计字符占比,包括字符串中字母、数字、空格等字符的占比,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-08-08
  • 从pandas一个单元格的字符串中提取字符串方式

    从pandas一个单元格的字符串中提取字符串方式

    今天小编就为大家分享一篇从pandas一个单元格的字符串中提取字符串方式,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-12-12
  • python交互式图形编程实例(二)

    python交互式图形编程实例(二)

    这篇文章主要为大家详细介绍了python交互式图形编程实例,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2017-11-11

最新评论