当前位置: 首页 > news >正文

求求你们了,别再乱用 parallelStream 了,速度竟然比 Stream 还要慢!!

parallelStream 一定更快吗?

大家都知道 Stream 分为顺序流和并行流:

  • stream(顺序流)

  • parallelStream(并行流)

它们最大的区别就是 parallelStream 支持并行化处理,所以效率较 stream(顺序流)肯定是要更快的。这篇不会介绍 Stream 基础,Stream 系列我之前写过一个专题了,不懂的关注公众号Java技术栈,然后在公众号 Java 教程菜单中阅读。

然而你确定 parallelStream 一定要更快吗?

栈长写了一段排序的示例,分别用 stream 和 parallelStream,对 100 ~ 10000000 条数据的集合进行排序,来看下执行效率究竟如何!

顺序流排序:

/**
 * 顺序流排序
 * @author: 栈长
 * @from: 公众号Java技术栈
 */
private static void streamSort() {
    long start = System.currentTimeMillis();
    List<SortTest.User> list = new ArrayList<>(LIST);

    list.stream().sorted(SortTest.User::compareAge).collect(Collectors.toList());

    System.out.println("\nList size: " + list.size() + " Stream.sorted: " + (System.currentTimeMillis() - start));
}

并行流排序:

/**
 * 并行流排序
 * @author: 栈长
 * @from: 公众号Java技术栈
 */
private static void parallelStreamSort() {
    long start = System.currentTimeMillis();
    List<SortTest.User> list = new ArrayList<>(LIST);

    list.parallelStream().sorted(SortTest.User::compareAge).collect(Collectors.toList());

    System.out.println("List size: " + list.size() + " ParallelStream.sorted: " + (System.currentTimeMillis() - start));
}

本文所有完整示例源代码已经上传:

https://github.com/javastacks/javastack

执行结果如下:

List size: 10000000 Stream.sorted: 202 List size: 10000000 ParallelStream.sorted: 402

List size: 1000000 Stream.sorted: 53 List size: 1000000 ParallelStream.sorted: 15

List size: 100000 Stream.sorted: 1 List size: 100000 ParallelStream.sorted: 2

List size: 10000 Stream.sorted: 0 List size: 10000 ParallelStream.sorted: 1

List size: 1000 Stream.sorted: 0 List size: 1000 ParallelStream.sorted: 1

List size: 100 Stream.sorted: 0 List size: 100 ParallelStream.sorted: 0

在 100000 以下是没什么区别的;

在 1000000 左右 ParallelStream 虽然领先 Stream,但也不是绝对每次都领先,经过不断测试,这个数据量区间的测试两者会互相领先;

在 10000000 左右就很稳定了,ParallelStream 几乎比 Stream 慢了 2 倍!

现在你可能会有疑问了,为什么会这样?

栈长起初也有疑问,并行流(ParallelStream)怎么会比顺序流(Stream)还要慢。。

其实我后面想想也就明白了,并行流(ParallelStream)的背后其实是 Java7 开始支持的Fork/Join,即把一个大任务拆分成 N 个小任务,然后最终合并各个子任务的结果,所以对于子任务线程的拆分、创建、结果合并等操作都需要不少的开销,特别是线程的创建。

所以这种不耗时的简单排序操作事实上是不适用于并行流(ParallelStream)的,它所带来的线程创建的损耗可能还会比顺序流(Stream)还要更慢。

最新 Java 8+ 面试题也都整理好了,点击Java面试库小程序在线刷题。

什么时候用 ParallelStream?

既然使用 Fork/Join 是会有损耗的,那对于单条数据的处理的时间最好是理论上要超过用并行流(ParallelStream)本身的损耗,这种情况下就比较合适。

也就是说,如果对于流中的每条数据的处理比较费时间,并且没有顺序要求,这种场景下用并行流(ParallelStream)会更快,更合适。

来看下面这个示例:

顺序流数据处理:

/**
 * 顺序流数据处理
 * @author: 栈长
 * @from: 公众号Java技术栈
 */
private static void streamProcess() {
    long start = System.currentTimeMillis();
    List<SortTest.User> list = new ArrayList<>(LIST);

    list.stream().map(StreamSpeedTest::process).collect(Collectors.toList());

    System.out.println("\nList size: " + list.size() + " Stream process: " + (System.currentTimeMillis() - start));
}

并行流数据处理:

/**
 * 并行流数据处理
 * @author: 栈长
 * @from: 公众号Java技术栈
 */
private static void parallelStreamProcess() {
    long start = System.currentTimeMillis();
    List<SortTest.User> list = new ArrayList<>(LIST);

    list.parallelStream().map(StreamSpeedTest::process).collect(Collectors.toList());

    System.out.println("List size: " + list.size() + " ParallelStream process: " + (System.currentTimeMillis() - start));
}

数据处理:

/**
 * 数据处理
 * @author: 栈长
 * @from: 公众号Java技术栈
 */
private static SortTest.User process(SortTest.User user) {
    try {
        user.setName(user.getName() + ": process");
        Thread.sleep(5);
    } catch (InterruptedException e) {
        e.printStackTrace();
    }
    return user;
}

注意: 这里加了个休眠 5 毫秒,为了体现真实的处理数据耗时。

本文所有完整示例源代码已经上传:

https://github.com/javastacks/javastack

并行流排序:

List size: 1000 Stream process: 5750 List size: 1000 ParallelStream process: 745

List size: 100 Stream process: 566 List size: 100 ParallelStream process: 77

结果很明显了,不管测试多少次,并行流(ParallelStream)的处理速度都要比顺序流(Stream)要快几倍!!我这里只测试了 100 和 1000 条数据,因为 10000 条以上的数据用顺序流(Stream)可能要等非常久。

而且我程序中的处理逻辑只休眠了 5 毫秒,如果实际处理单条数据的耗时要比这个更长,那并行流(ParallelStream)的处理效率还会更明显。

总结

稍微总结下:

  • stream: 适用于避免线程安全问题、要求顺序执行、数据处理简单不耗时的任务;

  • parallelStream: 适用于不存在线程安全问题、不需要顺序性执行、数据处理比较耗时的任务;

所以,你学废了吗?赶紧发给身边的同事看看吧,别再乱用 parallelStream 了!用的不好,存在线程安全问题不说,效率上可能还会适得其反。

大家如果对 Java 8 新增的知识点(Lambda、Stream、函数式接口等)还不会用的可以关注公众号:Java技术栈,在 Java 教程菜单中阅读,Java 8+ 系列教程我都写了一堆了。

本文所有完整示例源代码已经上传:

https://github.com/javastacks/javastack

相关文章:

  • 【机器学习】算法改进——小批量和软更新
  • JMX概念及实际开发应用【实现IP黑名单】
  • flask-sqlalchemy连接数据库
  • 在设计测试用例前你应该考虑的重点在哪里?
  • 5.Nodejs中的包、npm、第三方模块、package.json以及cnpm
  • 如何使用Google Analytics跟踪WordPress网站的用户参与度
  • 大型医院his系统源码 医院信息管理系统源码 C/S架构
  • EN 16069建筑物用隔热产品.工厂制造的聚乙烯泡沫(PEF)产品—CE认证
  • UE4 源码解析----引擎初始化流程
  • 叶酸PEG衍生物​DBCO-PEG-Folate,DBCO-PEG-FA,二苯基环辛炔-聚乙二醇-叶酸
  • 【dll】windows下使用vs编译动态链接库dll与使用
  • 2022年ios证书最新申请流程
  • 普冉 PY32F003 资料和入坑方法
  • springboot+微信小程序健康饮食系统毕业设计源码280920
  • 介绍日本日置IM7583阻抗分析仪
  • (十五)java多线程之并发集合ArrayBlockingQueue
  • 《用数据讲故事》作者Cole N. Knaflic:消除一切无效的图表
  • 【comparator, comparable】小总结
  • 【vuex入门系列02】mutation接收单个参数和多个参数
  • 【跃迁之路】【444天】程序员高效学习方法论探索系列(实验阶段201-2018.04.25)...
  • CEF与代理
  • CentOS 7 修改主机名
  • CSS 提示工具(Tooltip)
  • ECS应用管理最佳实践
  • GDB 调试 Mysql 实战(三)优先队列排序算法中的行记录长度统计是怎么来的(上)...
  • JavaScript 是如何工作的:WebRTC 和对等网络的机制!
  • JS实现简单的MVC模式开发小游戏
  • js中的正则表达式入门
  • LeetCode算法系列_0891_子序列宽度之和
  • Terraform入门 - 3. 变更基础设施
  • 阿里云ubuntu14.04 Nginx反向代理Nodejs
  • 对话 CTO〡听神策数据 CTO 曹犟描绘数据分析行业的无限可能
  • 机器学习中为什么要做归一化normalization
  • 盘点那些不知名却常用的 Git 操作
  • 以太坊客户端Geth命令参数详解
  • 策略 : 一文教你成为人工智能(AI)领域专家
  • 从如何停掉 Promise 链说起
  • 格斗健身潮牌24KiCK获近千万Pre-A轮融资,用户留存高达9个月 ...
  • ​渐进式Web应用PWA的未来
  • ### Error querying database. Cause: com.mysql.jdbc.exceptions.jdbc4.CommunicationsException
  • %3cli%3e连接html页面,html+canvas实现屏幕截取
  • (c语言版)滑动窗口 给定一个字符串,只包含字母和数字,按要求找出字符串中的最长(连续)子串的长度
  • (Redis使用系列) Springboot 使用redis实现接口幂等性拦截 十一
  • (附源码)springboot美食分享系统 毕业设计 612231
  • (附源码)小程序儿童艺术培训机构教育管理小程序 毕业设计 201740
  • (简单有案例)前端实现主题切换、动态换肤的两种简单方式
  • (教学思路 C#之类三)方法参数类型(ref、out、parmas)
  • (十二)python网络爬虫(理论+实战)——实战:使用BeautfulSoup解析baidu热搜新闻数据
  • (转)大型网站的系统架构
  • .h头文件 .lib动态链接库文件 .dll 动态链接库
  • .NET CORE 2.0发布后没有 VIEWS视图页面文件
  • .net framework profiles /.net framework 配置
  • .NET Standard / dotnet-core / net472 —— .NET 究竟应该如何大小写?
  • .net Stream篇(六)
  • .NET/MSBuild 中的发布路径在哪里呢?如何在扩展编译的时候修改发布路径中的文件呢?