java实现字符串匹配求两个字符串的最大公共子串

 更新时间:2016年10月25日 10:16:48   作者:xiaojimanman  
这篇文章主要介绍了java实现求两个字符串最大公共子串的方法,详细的描述了两个字符串的最大公共子串算法的实现,需要的朋友可以参考下

本文实例讲述了java实现求两个字符串最大公共子串的方法。分享给大家供大家参考,具体如下:

最近在项目工作中有一个关于文本对比的需求,经过这段时间的学习,总结了这篇博客内容:求两个字符串的最大公共子串。

算法思想:基于图计算两字符串的公共子串。具体算法思想参照下图:

输入字符串S1:achmacmh    输入字符串S2:macham

  1. 第a步,是将字符串s1,s2分别按字节拆分,构成一个二维数组;
  2. 二维数组中的值如b所示,比如第一行第一列的值表示字符串s2和s1的第一个字节是否相等,若相等就是1,否则就是0,最终产生b所示的二维数组;
  3. 分别求二维数组中斜线上的公共因子(斜线为元素a右下角值,即a[i][j]的下一个元素是a[i+1][j+1];公共因子为1所在的位置构成的字符串);
  4. 对所有公共因子排序,返回最大的公共因子的值。

具体的实现代码如下所示:

package cn.lulei.compare; 
 
import java.util.ArrayList; 
import java.util.Collections; 
import java.util.Comparator; 
import java.util.List; 
 
public class StringCompare { 
  private int a; 
  private int b; 
   
  public String getMaxLengthCommonString(String s1, String s2) { 
    if (s1 == null || s2 == null) { 
      return null; 
    } 
    a = s1.length();//s1长度做行 
    b = s2.length();//s2长度做列 
    if(a== 0 || b == 0) { 
      return ""; 
    } 
    //设置匹配矩阵 
    boolean [][] array = new boolean[a][b]; 
    for (int i = 0; i < a; i++) { 
      char c1 = s1.charAt(i); 
      for (int j = 0; j < b; j++) { 
        char c2 = s2.charAt(j); 
        if (c1 == c2) { 
          array[i][j] = true; 
        } else { 
          array[i][j] = false; 
        } 
      } 
    } 
    //求所有公因子字符串,保存信息为相对第二个字符串的起始位置和长度 
    List<ChildString> childStrings = new ArrayList<ChildString>(); 
    for (int i = 0; i < a; i++) { 
      getMaxSort(i, 0, array, childStrings); 
    } 
    for (int i = 1; i < b; i++) { 
      getMaxSort(0, i, array, childStrings); 
    } 
    //排序 
    sort(childStrings); 
    if (childStrings.size() < 1) { 
      return ""; 
    } 
    //返回最大公因子字符串 
    int max = childStrings.get(0).maxLength; 
    StringBuffer sb = new StringBuffer(); 
    for (ChildString s: childStrings) { 
      if (max != s.maxLength) { 
        break; 
      } 
      sb.append(s2.substring(s.maxStart, s.maxStart + s.maxLength)); 
      sb.append("\n"); 
    } 
    return sb.toString(); 
  } 
   
  //排序,倒叙 
  private void sort(List<ChildString> list) { 
    Collections.sort(list, new Comparator<ChildString>(){ 
      public int compare(ChildString o1, ChildString o2) { 
        return o2.maxLength - o1.maxLength; 
      } 
    }); 
  } 
   
  //求一条斜线上的公因子字符串 
  private void getMaxSort(int i, int j, boolean [][] array, List<ChildString> sortBean) { 
    int length = 0; 
    int start = j; 
    for (; i < a && j < b; i++,j++) { 
      if (array[i][j]) { 
        length++; 
      } else { 
        sortBean.add(new ChildString(length, start)); 
        length = 0; 
        start = j + 1; 
      } 
      if (i == a-1 || j == b-1) { 
        sortBean.add(new ChildString(length, start)); 
      } 
    } 
  } 
   
  //公因子类 
  class ChildString { 
    int maxLength; 
    int maxStart; 
     
    ChildString(int maxLength, int maxStart){ 
      this.maxLength = maxLength; 
      this.maxStart = maxStart; 
    } 
  } 
 
  /** 
   * @param args 
   */ 
  public static void main(String[] args) { 
    // TODO Auto-generated method stub 
    System.out.println(new StringCompare().getMaxLengthCommonString("achmacmh", "macham")); 
  } 
} 

程序最终执行结果是:

对于两个文件的比对个人认为可以参照这种算法思想(自己现在并为实现),在日后的博客中将会写到。

上述实现过程中,用数组保存了所有的公共子串信息,然后排序取最大的子串,这种做法如果只是求最大子串的话,算法就不是很合理,因此做了如下修改,List只保存当前计算中最大的子串,具体实现如下:

/**  
 *@Description: 字符串比较  
 */  
package com.lulei.test; 
 
import java.util.ArrayList; 
import java.util.List; 
 
public class StringCompare { 
  private int a; 
  private int b; 
  private int maxLength = -1; 
   
  public String getMaxLengthCommonString(String s1, String s2) { 
    if (s1 == null || s2 == null) { 
      return null; 
    } 
    a = s1.length();//s1长度做行 
    b = s2.length();//s2长度做列 
    if(a== 0 || b == 0) { 
      return ""; 
    } 
    //设置匹配矩阵 
    boolean [][] array = new boolean[a][b]; 
    for (int i = 0; i < a; i++) { 
      char c1 = s1.charAt(i); 
      for (int j = 0; j < b; j++) { 
        char c2 = s2.charAt(j); 
        if (c1 == c2) { 
          array[i][j] = true; 
        } else { 
          array[i][j] = false; 
        } 
      } 
    } 
    //求所有公因子字符串,保存信息为相对第二个字符串的起始位置和长度 
    List<ChildString> childStrings = new ArrayList<ChildString>(); 
    for (int i = 0; i < a; i++) { 
      getMaxSort(i, 0, array, childStrings); 
    } 
    for (int i = 1; i < b; i++) { 
      getMaxSort(0, i, array, childStrings); 
    } 
    StringBuffer sb = new StringBuffer(); 
    for (ChildString s: childStrings) { 
      sb.append(s2.substring(s.maxStart, s.maxStart + s.maxLength)); 
      sb.append("\n"); 
    } 
    return sb.toString(); 
  } 
   
  //求一条斜线上的公因子字符串 
  private void getMaxSort(int i, int j, boolean [][] array, List<ChildString> sortBean) { 
    int length = 0; 
    int start = j; 
    for (; i < a && j < b; i++,j++) { 
      if (array[i][j]) { 
        length++; 
      } else { 
        //直接add,保存所有子串,下面的判断,只保存当前最大的子串 
        //sortBean.add(new ChildString(length, start)); 
        if (length == maxLength) { 
          sortBean.add(new ChildString(length, start)); 
        } else if (length > maxLength) { 
          sortBean.clear(); 
          maxLength = length; 
          sortBean.add(new ChildString(length, start)); 
        } 
        length = 0; 
        start = j + 1; 
      } 
      if (i == a-1 || j == b-1) { 
        //直接add,保存所有子串,下面的判断,只保存当前最大的子串 
        //sortBean.add(new ChildString(length, start)); 
        if (length == maxLength) { 
          sortBean.add(new ChildString(length, start)); 
        } else if (length > maxLength) { 
          sortBean.clear(); 
          maxLength = length; 
          sortBean.add(new ChildString(length, start)); 
        } 
      } 
    } 
  } 
   
  //公因子类 
  class ChildString { 
    int maxLength; 
    int maxStart; 
     
    ChildString(int maxLength, int maxStart){ 
      this.maxLength = maxLength; 
      this.maxStart = maxStart; 
    } 
  } 
 
  /** 
   * @param args 
   */ 
  public static void main(String[] args) { 
    // TODO Auto-generated method stub 
    System.out.println(new StringCompare().getMaxLengthCommonString("abcdef", "defabc")); 
  } 
} 

感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!

相关文章

  • Java生成中间logo的二维码的示例代码

    Java生成中间logo的二维码的示例代码

    这篇文章主要介绍了Java如何生成中间logo的二维码,文中讲解非常细致,代码帮助大家更好的理解和学习,感兴趣的朋友可以了解下
    2020-07-07
  • SpringBoot实现加载yml文件中字典数据

    SpringBoot实现加载yml文件中字典数据

    这篇文章主要为大家详细介绍了SpringBoot如何实现加载yml文件中字典数据,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起了解一下
    2023-04-04
  • java内部类的那些事儿_让你一看就弄明白

    java内部类的那些事儿_让你一看就弄明白

    本篇文章介绍了,java内部类的那些事儿。需要的朋友参考下
    2013-05-05
  • Java如何使用逆波兰式(后缀表达式)计算表达式的值

    Java如何使用逆波兰式(后缀表达式)计算表达式的值

    这篇文章主要介绍了Java如何使用逆波兰式(后缀表达式)计算表达式的值,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2024-06-06
  • Java创建线程的两种方式

    Java创建线程的两种方式

    这篇文章主要介绍了Java创建线程的两种方式,针对Java创建线程的两种方式进行比较,感兴趣的小伙伴们可以参考一下
    2016-10-10
  • gRPC在Java中的实现与应用详解

    gRPC在Java中的实现与应用详解

    gRPC是由Google开发的高性能、开源的通用远程过程调用(RPC)框架,本文将详细介绍如何在Java中使用gRPC,包括服务定义、服务器端实现、客户端调用以及一些高级特性,我们将通过代码示例来帮助理解gRPC的工作原理,需要的朋友可以参考下
    2024-06-06
  • SpringCloud通过Feign传递List类型参数方式

    SpringCloud通过Feign传递List类型参数方式

    这篇文章主要介绍了SpringCloud通过Feign传递List类型参数方式,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-03-03
  • 教你用java实现学生成绩管理系统(附详细代码)

    教你用java实现学生成绩管理系统(附详细代码)

    教学管理系统很适合初学者对于所学语言的练习,下面这篇文章主要给大家介绍了关于如何用java实现学生成绩管理系统的相关资料,文中给出了详细的实例代码,需要的朋友可以参考下
    2023-06-06
  • Java 如何将前端传来的数字转化为日期

    Java 如何将前端传来的数字转化为日期

    这篇文章主要介绍了Java 如何将前端传来的数字转化为日期,本文通过示例代码给大家介绍的非常详细,需要的朋友可以参考下
    2023-06-06
  • Java stringBuilder的使用方法及实例解析

    Java stringBuilder的使用方法及实例解析

    这篇文章主要介绍了Java stringBuilder的使用方法及实例解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-09-09

最新评论