Java Stream去重常见的多种方法及示例

 更新时间:2025年04月12日 10:59:42   作者:码农界赵子龙  
这篇文章主要介绍了Java Stream中实现去重的多种方法,包括使用distinct()、Collectors.toMap、filter和groupingBy等,详细说明了每种方法的应用场景和示例代码,文中通过代码介绍的非常详细,需要的朋友可以参考下

在Java Stream中实现去重有多种方法,具体取决于需求和场景。以下是常见的几种方法及示例:

1. 使用 distinct() 方法

适用于对象已正确实现 equals() 和 hashCode(),基于对象整体去重并保留顺序:

List<Person> uniquePersons = persons.stream()
                                    .distinct()
                                    .collect(Collectors.toList());

2. 根据对象的属性去重

方法一:使用 Collectors.toMap

根据属性作为键,保留第一个或最后一个元素,支持顺序(使用 LinkedHashMap):

// 保留第一个出现的元素
List<Person> uniqueByName = persons.stream()
    .collect(Collectors.toMap(
        Person::getName,
        Function.identity(),
        (oldP, newP) -> oldP, // 保留旧值(第一个)
        LinkedHashMap::new    // 保持插入顺序
    ))
    .values().stream()
    .collect(Collectors.toList());

// 保留最后一个出现的元素
List<Person> uniqueByNameLast = persons.stream()
    .collect(Collectors.toMap(
        Person::getName,
        Function.identity(),
        (oldP, newP) -> newP  // 保留新值(最后一个)
    ))
    .values().stream()
    .collect(Collectors.toList());

方法二:使用 filter 和线程安全的 Set

适用于并行流,但可能不保留顺序:

// 并行流去重(不保证顺序)
Set<String> seen = ConcurrentHashMap.newKeySet();
List<Person> uniqueByName = persons.parallelStream()
    .filter(p -> seen.add(p.getName()))
    .collect(Collectors.toList());

// 顺序流去重(保留顺序)
Set<String> seenOrdered = new HashSet<>();
List<Person> uniqueByNameOrdered = persons.stream()
    .filter(p -> seenOrdered.add(p.getName()))
    .collect(Collectors.toList());

方法三:使用 groupingBy

分组后取每组的第一个元素,保持顺序:

List<Person> uniqueByName = persons.stream()
    .collect(Collectors.groupingBy(
        Person::getName,
        LinkedHashMap::new,    // 保持插入顺序
        Collectors.toList()
    ))
    .values().stream()
    .map(group -> group.get(0)) // 取第一个元素
    .collect(Collectors.toList());

3. 根据字符串长度去重示例

List<String> words = Arrays.asList("apple", "banana", "orange", "grape", "kiwi");
List<String> uniqueByLength = words.stream()
    .collect(Collectors.toMap(
        String::length,
        Function.identity(),
        (oldVal, newVal) -> oldVal,
        LinkedHashMap::new
    ))
    .values().stream()
    .collect(Collectors.toList());
// 结果: ["apple", "banana", "kiwi"](保留顺序)

4. 自定义去重借助Filter 实现:

自定义一个 Predicate 函数,用一个 Set 来记录已经出现过的元素,然后过滤掉重复的元素。

//定义一个Predicate函数
private static <T> Predicate<T> distinctByKey(Function<? super T, ?> keyExtractor) {
    Set<Object> sets = ConcurrentHashMap.newKeySet();
    return t -> sets.add(keyExtractor.apply(t));
}

//根据age属性去重
list.stream().filter(distinctByKey(s -> s.getAge()))
        .forEach(System.out::println);

附:java中使用stream流根据对象中的某一字段进行去重

在开发中经常会遇到数据去重的,单个基本类型的集合去重比较容易,比如String、Integer,直接使用流中的distinct方法去重即可。但是遇到对象集合,需要使用对象中的某个字段去重就不能使用这个方法了。可以在流式编程中加入TreeSet,TreeSet是一个有序且不重复的有序集合。以用户User数据位列:

List<User> list = userService.list();
        list.stream().collect(Collectors.collectingAndThen(Collectors.toCollection(() -> new TreeSet<>(Comparator.comparing( f -> f.getDeptName()+":"+f.getStatus()))),ArrayList::new));

这里是根据用户的部门以及用户的状态进行数据去重,将用户的部门以及状态拼接位一个字符串进行去重,这样stream内部会将整个user集合数据组装成这样进行整体去重,这样去重下来的数据就是,每一个部门中只会存在一个状态的部门人员数据,这里是举个例子,在实际环境中,你可以将User换成自己想要去重的实体集合。

总结

  • distinct():简单高效,适用于对象整体去重。
  • toMap 或 groupingBy:灵活,支持按属性去重,可控制保留顺序。
  • filter + Set:适合并行流,但需注意线程安全和顺序问题。

根据具体场景选择最合适的方法,确保代码简洁且性能良好。

到此这篇关于Java Stream去重常见的多种方法及示例的文章就介绍到这了,更多相关Java Stream去重方法内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Spring中的@ConditionalOnProperty注解使用详解

    Spring中的@ConditionalOnProperty注解使用详解

    这篇文章主要介绍了Spring中的@ConditionalOnProperty注解使用详解,在 spring boot 中有时候需要控制配置类是否生效,可以使用 @ConditionalOnProperty 注解来控制 @Configuration 是否生效,需要的朋友可以参考下
    2024-01-01
  • IDEA运行SSM项目的超详细图解教程

    IDEA运行SSM项目的超详细图解教程

    SSM项目部署其实很简单,下面这篇文章主要给大家介绍了关于IDEA运行SSM项目的超详细图解教程,文中通过图文介绍的非常详细,需要的朋友可以参考下
    2023-10-10
  • SpringMVC框架实现图片上传与下载

    SpringMVC框架实现图片上传与下载

    这篇文章主要为大家详细介绍了SpringMVC框架实现图片上传与下载,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-08-08
  • Java 中的 clone( ) 和 new哪个效率更高

    Java 中的 clone( ) 和 new哪个效率更高

    很多朋友不太清楚clone()和new那个更快?针对这个问题我百度了好多资料,最终小编总结下关于Java 中的 clone( ) 和 new哪个效率更高的问题,感兴趣的朋友跟随小编一起看看吧
    2021-12-12
  • Java实现批量查找与替换Excel文本的思路详解

    Java实现批量查找与替换Excel文本的思路详解

    在 Java 中,可以通过find和replace的方法来查找和替换单元格的数据,下面小编将以Excel文件为例为大家介绍如何实现Excel文件内容的批量替换,感兴趣的朋友跟随小编一起看看吧
    2023-10-10
  • Java的Struts2框架配合Ext JS处理JSON数据的使用示例

    Java的Struts2框架配合Ext JS处理JSON数据的使用示例

    这篇文章主要介绍了Java的Struts2框架配合Ext JS处理JSON数据的使用示例,包括将Ext JS中的JSON数据解析为列表的方法,需要的朋友可以参考下
    2016-03-03
  • sharding-jdbc中的事务详细解读

    sharding-jdbc中的事务详细解读

    这篇文章主要介绍了sharding-jdbc中的事务详细解读,sharding-jdbc在分库分表方面提供了很大的便利性,在使用DB的时候,通常都会涉及到事务这个概念,而在分库分表的环境上再加上事务,就会使事情变得复杂起来,需要的朋友可以参考下
    2023-12-12
  • SpringBoot中忽略实体类中的某个属性不返回给前端的方法(示例详解)

    SpringBoot中忽略实体类中的某个属性不返回给前端的方法(示例详解)

    本文介绍了在Spring Boot中使用Jackson和Fastjson忽略实体类属性不返回给前端的方法,在Jackson中,同时使用@JsonProperty和@JsonIgnore时,@JsonIgnore可能失效,Fastjson中可以使用@JSONField(serialize=false)来实现,本文结合实例代码介绍的非常详细,需要的朋友参考下吧
    2024-11-11
  • MyBatis新增数据时自增id的两种写法小结

    MyBatis新增数据时自增id的两种写法小结

    本文介绍了在MyBatis中配置自增ID的两种方法:一种是通过在Mapper文件中设置useGeneratedKeys和keyProperty,另一种是使用selectKey标签,批量插入时,同样采用useGeneratedKeys标签,感兴趣的可以了解一下
    2024-09-09
  • 关于springboot加载yml配置文件的no字段自动转义问题

    关于springboot加载yml配置文件的no字段自动转义问题

    这篇文章主要介绍了关于springboot加载yml配置文件的no字段自动转义问题,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-02-02

最新评论