Go Java算法重复的DNA序列详解

 更新时间:2022年08月15日 10:26:33   作者:黄丫丫  
这篇文章主要为大家介绍了Go Java算法之重复的DNA序列的示例详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪

重复的DNA序列

DNA序列 由一系列核苷酸组成,缩写为 'A', 'C', 'G' 和 'T'.。

例如,"ACGAATTCCG" 是一个 DNA序列 。

在研究 DNA 时,识别 DNA 中的重复序列非常有用。

给定一个表示 DNA序列 的字符串 s ,返回所有在 DNA 分子中出现不止一次的 长度为 10 的序列(子字符串)。你可以按 任意顺序 返回答案。

  • 示例 1:

输入:s = "AAAAACCCCCAAAAACCCCCCAAAAAGGGTTT"

输出:["AAAAACCCCC","CCCCCAAAAA"]

  • 示例 2:

输入:s = "AAAAAAAAAAAAA"

输出:["AAAAAAAAAA"]  

提示:

0 <= s.length <= 105

s[i]=='A'、'C'、'G' or 'T'

方法一:哈希表(Java)

我们可以用一个哈希表统计 ss 所有长度为 1010 的子串的出现次数,返回所有出现次数超过 1010 的子串。

代码实现时,可以一边遍历子串一边记录答案,为了不重复记录答案,我们只统计当前出现次数为 22 的子串。

思路:用map存储子串出现的次数,循环dna序列,每次截取长度为10的子串,加入map中 并更新出现的次数,次数超过2,加入ans

能做两个优化:

  • 统计字符串的时候,可以通过位运算来压缩hashmap的key的大小。由于只用了 'A' 'C' 'G' 'T' 四个字符,我们可以用两位二进制来标记每种类型。长度为10的字符串一共需要20位二进制表示,用一个int即可标记出来。
  • 滑动窗口,不用从每个位置开始往后数十个位置来统计字符串。由于前面已经用了位运算映射字符串到int,我们可以直接通过<<和|操作即可实现窗口内字符串映射的改变。
class Solution {
    static final int L = 10;
    public List<String> findRepeatedDnaSequences(String s) {
        List<String> ans = new ArrayList<String>();
        Map<String, Integer> cnt = new HashMap<String, Integer>();
        int n = s.length();
        for (int i = 0; i <= n - L; ++i) {
            String sub = s.substring(i, i + L);
            cnt.put(sub, cnt.getOrDefault(sub, 0) + 1);
            if (cnt.get(sub) == 2) {
                ans.add(sub);
            }
        }
        return ans;
    }
}

其中 N 是字符串 s 的长度,L=10 即目标子串的长度。

时间复杂度:O(N*L)

空间复杂度:O(N*L)

方法二:哈希表——优化(Go)

具体的方法思路已经在上文中表述,该方法为哈希表的优化方法。

由于 ss 中只含有 44 种字符,我们可以将每个字符用 22 个比特表示,即:

A 表示为二进制 00;

C 表示为二进制 01;

G 表示为二进制 10;

T 表示为二进制 11。

如此一来,一个长为 10 的字符串就可以用 20 个比特表示,而一个 int 整数有 32 个比特,足够容纳该字符串,因此我们可以将 ss 的每个长为 10 的子串用一个 int 整数表示(只用低 20 位)。

注意到上述字符串到整数的映射是一一映射,每个整数都对应着一个唯一的字符串,因此我们可以将方法一中的哈希表改为存储每个长为 10 的子串的整数表示。

方法思路:

  • 滑动窗口向右移动一位:x = x << 2,由于每个字符用 2 个比特表示,所以要左移 2 位;
  • 一个新的字符 ch 进入窗口:x = x | bin[ch],这里 bin[ch] 为字符 ch 的对应二进制;
  • 窗口最左边的字符离开窗口:x = x & ((1 << 20) - 1),由于我们只考虑 x 的低 20 位比特,需要将其余位置零,即与上 (1 << 20) - 1。
const L = 10
var bin = map[byte]int{'A': 0, 'C': 1, 'G': 2, 'T': 3}
func findRepeatedDnaSequences(s string) (ans []string) {
    n := len(s)
    if n <= L {
        return
    }
    x := 0
    for _, ch := range s[:L-1] {
        x = x<<2 | bin[byte(ch)]
    }
    cnt := map[int]int{}
    for i := 0; i <= n-L; i++ {
        x = (x<<2 | bin[s[i+L-1]]) & (1<<(L*2) - 1)
        cnt[x]++
        if cnt[x] == 2 {
            ans = append(ans, s[i:i+L])
        }
    }
    return ans
}

以上就是Go Java算法重复的DNA序列详解的详细内容,更多关于Go Java算法重复DNA序列的资料请关注脚本之家其它相关文章!

相关文章

  • JavaFX实现石头剪刀布小游戏

    JavaFX实现石头剪刀布小游戏

    这篇文章主要为大家详细介绍了JavaFX实现石头剪刀布小游戏,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-05-05
  • Java通过XPath获取XML文件中符合特定条件的节点

    Java通过XPath获取XML文件中符合特定条件的节点

    今天小编就为大家分享一篇关于Java通过XPath获取XML文件中符合特定条件的节点,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧
    2019-01-01
  • Kafka producer端开发代码实例

    Kafka producer端开发代码实例

    这篇文章主要介绍了Kafka producer端开发代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-11-11
  • springboot配置mybatis和事务管理方式

    springboot配置mybatis和事务管理方式

    这篇文章主要介绍了springboot配置mybatis和事务管理方式,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-04-04
  • Java foreach相关原理及用法解析

    Java foreach相关原理及用法解析

    这篇文章主要介绍了Java foreach相关原理及用法解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-07-07
  • Struts2配置文件中使用通配符的方法(三种形式)

    Struts2配置文件中使用通配符的方法(三种形式)

    Struts2是一个基于MVC设计模式的Web应用框架,它本质上相当于一个servlet,在MVC设计模式中,Struts2作为控制器(Controller)来建立模型与视图的数据交互。这篇文章主要介绍了Struts2配置文件中使用通配符的相关知识,需要的朋友可以参考下
    2019-11-11
  • SpringBoot整合BootStrap实战

    SpringBoot整合BootStrap实战

    这篇文章主要介绍了SpringBoot整合BootStrap实战,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2021-09-09
  • Linux系统卸载重装JDK的完整流程

    Linux系统卸载重装JDK的完整流程

    Linux系统有时候会默认使用OpenJDK版本,需要卸载后重新安装自己需要的JDK版本,下面这篇文章主要给大家介绍了关于Linux系统卸载重装JDK的完整流程,需要的朋友可以参考下
    2024-02-02
  • Java web含验证码及权限登录实例代码

    Java web含验证码及权限登录实例代码

    这篇文章主要介绍了Java web含验证码及权限登录实例代码,所用到的开发工具为myeclipse10,MySQL数据库,具体实现代码大家参考下本文吧
    2017-03-03
  • Spring Security基于数据库的ABAC属性权限模型实战开发教程

    Spring Security基于数据库的ABAC属性权限模型实战开发教程

    这篇文章主要介绍了Spring Security基于数据库的ABAC属性权限模型实战开发教程,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2025-04-04

最新评论