用Java8 stream处理数据

 更新时间:2021年11月04日 14:38:45   作者:banq  
这篇文章主要介绍了用Java8 stream处理数据,Java 8 API的设计者重新提出了一个新的抽象称为流Stream,可以让我们以一种声明的方式处理数据,此外,数据流可以充分利用多核架构而无需编写多线程的一行代码,下面我们一起来看看文章详细介绍

1、stream处理数据介绍

  如果没有集合Collection你如何处理数据?几乎所有的Java应用程序都要使用Collection处理数据。他们是十分重要的编程工作:例如,您可能想要创建银行交易的集合Collection,这个集合代表客户的状态。然后,你可能要处理整个集合来找出的顾客花了多少钱。尽管集合如此重要,但是在Java中处理集合的技术还远远不够完善。

首先,对集合的典型处理模式是类似SQL操作,比如"finding"(例如,找到具有最高价的交易)或"grouping" (例如,将相关的杂物所有交易合并组) 。大多数数据库让您这样的声明方式指定的操作。例如,下面的SQL查询可以让您找到交易ID最高值: "SELECT id, MAX(value) from transactions" 。

正如你所看到的,我们并不需要实现如何具体计算最大值(例如,使用循环和一个变量来跟踪的最高值) 。我们只能表达我们所期望的要求(获得最大值)。只要我们显式发出这样的查询,数据库就会为我们去处理。可是为什么我们不能在集合Collection中实现类似的东西?多少次,你会发现自己使用循环一遍又一遍的反复遍历集合?(如:for Object o: myLists{ ..})

其次,如何才能有效地处理真正的大数据集合?在理想的情况下,你想利用多核架构加快处理,。然而,编写并行代码很难而且容易出错。

Java 8 API的设计者重新提出了一个新的抽象称为流Stream,可以让你以一种声明的方式处理数据。此外,数据流可以充分利用多核架构而无需编写多线程的一行代码。这听起来不错,不是吗?

首先,我们看看在Java 7中,如何发现typegrocery 的所有交易,然后返回以交易值降序排序好的交易ID集合?

List<Transaction> groceryTransactions = new Arraylist<>();

for(Transaction t: transactions){

  if(t.getType() == Transaction.GROCERY){

    groceryTransactions.add(t);

  }

}

Collections.sort(groceryTransactions, new Comparator(){

  public int compare(Transaction t1, Transaction t2){

    return t2.getValue().compareTo(t1.getValue());

  }

});

List<Integer> transactionIds = new ArrayList<>();

for(Transaction t: groceryTransactions){

  transactionsIds.add(t.getId());

}

而在Java 8使用Stream:

List<Integer> transactionsIds =

    transactions.stream()

                .filter(t -> t.getType() == Transaction.GROCERY)

                .sorted(comparing(Transaction::getValue).reversed())

                .map(Transaction::getId)

                .collect(toList());

我们首先从交易数据列表中获得一个stream对象,这是通过使用Liststream()方法实现的,下一步几个操作 (filter, sorted, map, collect)是以链式排列成一个管道,形成对数据的查询操作。

那么这段代码如何并行操作呢?那么只要更换transactions.stream()transaction.parallelStream()即可,请注意lambda表达式(t-> t.getCategory() == Transaction.GROCERY)和方法引用(Transaction::getId)将在下一章详细讲解。

2、Stream起步

首先,定义一下StreamStream是一个来自支持聚合操作源的元素的序列。

如下特点:

  1. 1. 所谓元素的序列,一个Stream向外提供了一个这样的接口:特定元素类型的值的序列,但是Stream并不实际持有也就是存储这些元素,它们是在有需求时才会被计算。
  2. 2. 源:以提供Stream进行计算消费的源,这些源有Collection集合 Array数组或I/O资源等。
  3. 3.聚合操作:Stream支持类似SQL操作和函数式编程的大部分操作,比如:filter, map, reduce, find, match, sorted。

此外,Stream操作不同于Collection操作有两个根本的地方:

  • 1.管道Pipelining: 许多流Stream操作返回流Stream自身,这就允许对其操作可以像链条一样排列,变成一个管道,这其中也会激活比如懒加载和short-circuiting操作。
  • 2.内部迭代:相比于集合Collection是显式迭代(需要我们编码完成迭代),Stream操作是在其内部完成迭代操作。

下面我们看看前面Stream代码的内部工作流程:

我们首先从交易transactions这个列表中获得Stream对象,数据源就是交易列表,其中提供了一系列元素集合,这些元素都是供Stream操作的,下一步,我们使用了一系列对这个Stream的聚合操作,包括过滤filter (用我们指定的谓词条件predicate过滤元素,也就是代码t -> t.getType() == Transaction.GROCERY), 排序(用指定的比较器comparator对元素进行排序), 以及 map (为了释放获取信息). 所有这些操作除了最后的collect操作,都是返回一个Stream对象,这样就能被前后链接在一起变成一个长的管道,可以看成是基于源数据集合的一个查询操作。如同SQL基于数据表的有条件查询语句一样。

最后到collect被调用操作, collect操作开始处理这个管道以返回一个结果,不再是一个结果流了,这里一个结果是List一个对象,我们看到collect接受一个recipe输入函数然后累计Stream中元素到一个汇总结果,这里输入函数是toList(),它是一个将将Stream转换为List对象。

3、Stream与Collection比较

StreamCollection集合有什么区别?Collection是关于静止的数据结构,而Stream是有关动词算法和计算的。前者是主要面向内存,存储在内存中,后者主要是面向CPU,通过CPU实现计算的。

举例将一个影片存储在DVD盘上,这是一个集合,因为它包含整个电影的字节数据结构,而这个影片被放在互联网上,我们通过视频软件去观看它时,它实际是被流化了,它变成了一个字节流,流是与时间有关的概念,而数据结构是与时间无关,不会随着时间变化变化,流正好相反,随着时间不断地动态变化,如同水流一样潺潺不断。

所以,集合与流的主要区别是是否需要被计算,集合是一个内存数据结构,集合中每个元素在加入到集合之前已经被计算了,相反,流是在即时要求即时计算。

使用集合需要开发者主动去遍历,使用一个遍历循环,这称为外部遍历。

而使用一个流库使用内部遍历,它自己为你遍历元素,然后将结果保存在某处,你只要提供一个函数,它就会用这个函数对元素处理完成。内外遍历的区别如下代码:

List<String> transactionIds = new ArrayList<>();

for(Transaction t: transactions){

    transactionIds.add(t.getId()); //外部遍历

}

 

List<Integer> transactionIds =

    transactions.stream()

                .map(Transaction::getId) //内部遍历

                .collect(toList());

到此这篇关于用Java8 stream处理数据的文章就介绍到这了,更多相关 stream处理数据内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Spring maven filtering使用方法详解

    Spring maven filtering使用方法详解

    这篇文章主要介绍了Spring maven filtering使用方法详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-09-09
  • 使用Jenkins Pipeline自动化构建发布Java项目的方法

    使用Jenkins Pipeline自动化构建发布Java项目的方法

    这篇文章主要介绍了使用Jenkins Pipeline自动化构建发布Java项目的方法,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2019-04-04
  • Spring P标签的使用详解

    Spring P标签的使用详解

    这篇文章主要介绍了Spring P标签的使用详解,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2021-08-08
  • spring boot启动后直接关闭了的问题解决

    spring boot启动后直接关闭了的问题解决

    本文主要介绍了spring boot启动后直接关闭了的问题解决,SpringBoot项目启动后自动关闭的原因是未引入web依赖,导致以普通Java项目运行,下面就来介绍一下解决方法,感兴趣的可以了解一下
    2025-02-02
  • Java进阶核心之InputStream流深入讲解

    Java进阶核心之InputStream流深入讲解

    这篇文章主要给大家介绍了关于Java进阶核心之InputStream流的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-02-02
  • Java使用String类格式化当前日期实现代码

    Java使用String类格式化当前日期实现代码

    这篇文章主要介绍了Java使用String类格式化当前日期实现代码,需要的朋友可以参考下
    2014-02-02
  • 图解Java经典算法快速排序的原理与实现

    图解Java经典算法快速排序的原理与实现

    快速排序是基于二分的思想,对冒泡排序的一种改进。主要思想是确立一个基数,将小于基数的数放到基数左边,大于基数的数字放到基数的右边,然后在对这两部分进一步排序,从而实现对数组的排序
    2022-09-09
  • druid连接池的参数配置示例全面解析

    druid连接池的参数配置示例全面解析

    这篇文章主要为大家介绍了druid连接池的参数配置示例全面解析,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-09-09
  • Java基于Google zxing生成带logo的二维码图片

    Java基于Google zxing生成带logo的二维码图片

    zxing是一个开放源码的,用java实现的多种格式的1D/2D条码图像处理库,本文主要介绍了Java基于Google zxing生成带logo的二维码图片,具有一定的参考价值,感兴趣的可以了解一下
    2023-10-10
  • 基于SpringBoot和PostGIS的某国基地可视化实战

    基于SpringBoot和PostGIS的某国基地可视化实战

    本文以Java开发语言为例,使用SpringBoot框架来进行后台开发,详细讲解如何使用Leaflet对PostGIS的全球基地信息进行Web可视化,最后分享Web可视化结果,感兴趣的朋友跟随小编一起看看吧
    2024-08-08

最新评论