Java String源码contains题解重复叠加字符串匹配

 更新时间:2022年11月11日 17:02:28   作者:CodeLuweir  
这篇文章主要为大家介绍了Java String源码contains题解重复叠加字符串匹配示例详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪

原题

重复叠加字符串匹配

解题思路

解题思路已经写在代码中了;

class Solution {
public:
	bool contain(string &a, string &b, long long hash_b)
	{
		for (int i = 0; i <= a.size() - b.size(); i++)
		{
			int k = 0;
			long long hash_a = 0;
			while (k < b.size())
			{
				hash_a = (hash_a * 26 + a[i + k] - 'a') % INT32_MAX;
				k++;
			}
			if (hash_b == hash_a)
				return true;
		}
		return false;
	}
	int repeatedStringMatch(string a, string b)
	{
		// 1、统计a每个字符出现次数、b每个字符出现次数,如果b有某字符而a没有,返回-1
		vector<int> rec_a(30, 0);
		vector<int> rec_b(30, 0);
		for (char c : a)
		{
			rec_a[c - 'a']++;
		}
		long long hash_b = 0;
		int i = 0;
		for (char c : b)
		{
			hash_b = (hash_b * 26 + c - 'a') % INT32_MAX;
			rec_b[c - 'a']++;
		}
		for (int i = 0; i < 30; i++)
		{
			if (rec_b[i] > 0 && rec_a[i] == 0)
			{
				return -1;
			}
		}
		// 2.1 本身b就是a的字串,用hash
		if (a.size() >= b.size() && contain(a, b, hash_b))
		{
			return 1;
		}
		// 2.2 最大重叠不超过Bsize/Asize + 2
		string aa = a;
		for (int i = 2; i <= b.size() / a.size() + 2; i++)
		{
			aa += a;
			if (aa.size() < b.size())
				continue;
			if (contain(aa, b, hash_b))
			{
				return i;
			}
		}
		return -1;
	}
};

但是C++毕竟没有类似Java的contains函数,所以检查a字符串是否包含b就没有那么方便,我这里自己实现的是利用hash来检测,其实可以优化一下:

  • 先计算前面b.size()个字符的hash值;
  • 比较是否等于目标hash值
  • 如果不等于,(当前hash值-(当前窗口首字符-'a')*26^k)*26 + 窗口右移新加进来的字符-'a'
  • 这样只用完整的遍历一遍 字符串a 就能够知道它 有没有包含 子串b,复杂度为 O(n);但是涉及到之前的取余操作,又要额外考虑下,当前窗口的hash值是不是取过余;
  • 而如果每次都一个个字符比,那么复杂度达到O(nm);

Java String contains 函数

于是对 Java String 里面的 contains 函数很好奇,它内部怎么实现的,就翻了下源码,如下:

// String.contails(String s):
// 返回this字符串是否包含 子串s
public boolean contains(CharSequence s) {
    return this.indexOf(s.toString()) >= 0;
}
// String.indexOf(String s)
// 返回this字符串中子串s的首字符索引
........
// 中间的几个函数就省略了,都是一些特殊情况(比如this字符串的长度小于s字符串的长度,直接返回-1这种),
// 最后实现是在这个函数里
public static int indexOfLatin1Unsafe(byte[] src, int srcCount, byte[] tgt, int tgtCount, int fromIndex) {
    assert fromIndex >= 0;
    assert tgtCount > 0;
    assert tgtCount <= tgt.length;
    assert srcCount >= tgtCount;
    // 目标字符串的第一个字符
    char first = (char)(tgt[0] & 255);
    // 最多找max次
    int max = srcCount - tgtCount;
	// 从fromIndex处开始找
    for(int i = fromIndex; i <= max; ++i) {
    	// 如果该字符不等于first,接着i++,直到找到与first字符相等
        if (getChar(src, i) != first) {
            do {
                ++i;
            } while(i <= max && getChar(src, i) != first);
        }
        if (i <= max) {
            int j = i + 1;
            int end = j + tgtCount - 1;
			// 一个个字符逐个比较
            for(int k = 1; j < end && getChar(src, j) == (tgt[k] & 255); ++k) {
                ++j;
            }
			// 如果j==end 说明全部遍历完都符合条件,返回首字符位置i
            if (j == end) {
                return i;
            }
        }
    }
    return -1;
}

可以看出 Java String 的 contains 方法 原理还是用的逐个字符比较,没有用别的效果稍微高但很复杂的方法;

以上就是Java String源码contains题解重复叠加字符串匹配的详细内容,更多关于Java String源码contains的资料请关注脚本之家其它相关文章!

相关文章

  • Java 如何使用正则表达式去除前导0

    Java 如何使用正则表达式去除前导0

    这篇文章主要介绍了Java 使用正则表达式去除前导0的操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-04-04
  • JAVA字符串反转的三种方法

    JAVA字符串反转的三种方法

    这篇文章主要介绍了JAVA字符串反转的三种方法,帮助大家更好的理解和学习Java,感兴趣的朋友可以了解下
    2020-09-09
  • HashSet如何保证元素不重复(面试必问)

    HashSet如何保证元素不重复(面试必问)

    HashSet 不保证集合的迭代顺序,但允许插入 null 值,也就是说它可以将集合中的重复元素自动过滤掉,保证存储在 HashSet 中的元素都是唯一的,这篇文章主要介绍了HashSet如何保证元素不重复(面试必问),需要的朋友可以参考下
    2021-12-12
  • 详解SpringBoot基础之banner玩法解析

    详解SpringBoot基础之banner玩法解析

    SpringBoot项目启动时会在控制台打印一个默认的启动图案,这个图案就是我们要讲的banner,这篇文章主要介绍了SpringBoot基础之banner玩法解析,感兴趣的小伙伴们可以参考一下
    2019-04-04
  • Java面向对象基础知识之委托和lambda

    Java面向对象基础知识之委托和lambda

    这篇文章主要介绍了Java面向对象的之委托和 lambda,文中有非常详细的代码示例,对正在学习java基础的小伙伴们有很好的帮助,需要的朋友可以参考下
    2021-11-11
  • Java Springboot异步执行事件监听和处理实例

    Java Springboot异步执行事件监听和处理实例

    Java SpringBoot中,监听和处理事件是一种常见的模式,它允许不同的组件之间通过事件进行通信,事件监听和处理通常通过Spring的事件发布-订阅模型来实现,一个简单的Spring Boot应用程序示例,其中将包括事件的定义、事件的发布以及事件的监听
    2024-07-07
  • Java线程池ThreadPoolExecutor的使用及其原理详细解读

    Java线程池ThreadPoolExecutor的使用及其原理详细解读

    这篇文章主要介绍了Java线程池ThreadPoolExecutor的使用及其原理详细解读,线程池是一种多线程处理形式,处理过程中将任务添加到队列,然后在创建线程后自动启动这些任务,线程池线程都是后台线程,需要的朋友可以参考下
    2023-12-12
  • 解决HashMap多线程操作导致死循环问题

    解决HashMap多线程操作导致死循环问题

    文章主要讲述了在多线程环境下,HashMap的并发操作可能导致的死循环问题,包括链表/红黑树结构破坏、扩容过程中的混乱以及读写不一致等,为了解决这些问题,文章建议使用线程安全的ConcurrentHashMap替代HashMap,并介绍了其分段锁机制和优化方案
    2025-01-01
  • Spring MVC各种参数进行封装的方法实例

    Spring MVC各种参数进行封装的方法实例

    这篇文章主要给大家介绍了关于Spring MVC各种参数进行封装的相关资料,SpringMVC内置多种数据类型转换器,可以根据请求中的参数与后端控制器方法的参数的关系为我们实现简单的数据封装,需要的朋友可以参考下
    2023-06-06
  • JAVA内存模型(JMM)详解

    JAVA内存模型(JMM)详解

    这篇文章主要介绍了JAVA内存模型(JMM)详解的相关资料,需要的朋友可以参考下
    2022-12-12

最新评论