Java 8 新特性之并行流与串行流

Reading time ~1 minute

1. 概述

1.1 简介

并行流就是把一个内容分成多个数据块,并用不同的线程分别处理每个数据块的流

Java 8 中将并行进行了优化,我们可以很容易的对数据进行并行操作,Stream API 可以声明性地通过 parallel()sequential() 在并行流与顺序流之间进行切换。

1.2 了解 Fork/Join 框架

Fork/Join 框架就是在必要的情况下,将一个大任务,进行拆分(fork)成若干个小任务(拆到不可再拆是),再将一个个的小任务运算的结果进行 join 汇总

Java 8

1.3 Fork/Join 框架与传统线程池的区别

采用“工作窃取”模式(work-stealing) : 当执行新的任务时它可以将其拆分分成更小的任务执行,并将小任务加到线程队列中,然后再从一个随机线程的队列中偷一个并把它放在自己的队列中。

相对于一般的线程池实现,Fork/Join 框架的优势体现在对其中包含的任务的处理方式上。在一般的线程池中,如果一个线程正在执行的任务由于某些原因无法继续运行,那么该线程会处于等待状态。而在 Fork/Join 框架实现中,如果某个子问题由于等待另外一个子问题的完成而无法继续运行。那么处理该子问题的线程会主动寻找其他尚未运行的子问题来执行。这种方式减少了线程的等待时间,提高了性能。

2. Fork/Join 使用

这里我们的需求是对 0 到一亿进行累加操作,下面是 Fork/Join 的处理方法

public class ForkJoinCalculate extends RecursiveTask<Long> {

    private long start;
    private long end;

    private static final long THRESHOLD = 10000L; //临界值

    public ForkJoinCalculate(long start, long end) {
        this.start = start;
        this.end = end;
    }

    @Override
    protected Long compute() {
        long length = end - start;

        if (length <= THRESHOLD) {
            long sum = 0;

            for (long i = start; i <= end; i++) {
                sum += i;
            }

            return sum;
        } else {
            long middle = (start + end) / 2;

            ForkJoinCalculate left = new ForkJoinCalculate(start, middle);
            left.fork(); //拆分,并将该子任务压入线程队列

            ForkJoinCalculate right = new ForkJoinCalculate(middle + 1, end);
            right.fork();

            return left.join() + right.join();
        }
    }
}

测试方法

@Test
public void test1(){
    long start = System.currentTimeMillis();

    ForkJoinPool pool = new ForkJoinPool();
    ForkJoinTask<Long> task = new ForkJoinCalculate(0L, 100000000L);

    long sum = pool.invoke(task);
    System.out.println(sum);

    long end = System.currentTimeMillis();

    System.out.println("耗费的时间为: " + (end - start));
}

3. Java 8 使用并行流

其实 Java 8 的并行流底层使用的就是 Fork/Join 框架,但是它帮我们简化了操作

@Test
public void test3(){
    long start = System.currentTimeMillis();

    Long sum = LongStream.rangeClosed(0L, 100000000L)
            .parallel()
            .sum();

    System.out.println(sum);

    long end = System.currentTimeMillis();

    System.out.println("耗费的时间为: " + (end - start));
}

4. 并行流线程安全问题

Java8 并行流 ParallelStreamStream 的区别就是支持并行执行,提高程序运行效率。但是如果使用不当可能会发生线程安全的问题。Demo如下:

@Test
public void t21() {
    List<Integer> list = new ArrayList<>();
    list.add(1);
    list.add(7);
    list.add(8);
    list.add(2);
    list.add(9);
    list.add(5);
    list.add(10);
    list.add(13);
    list.add(3);
    list.add(12);
    list.add(6);
    list.add(4);
    list.add(11);

    System.out.print("串行流执行结果 : ");
    list.stream().sorted().forEach(x -> System.out.print(x + " "));
    System.out.println("");
    
    System.out.print("并行流执行结果 : ");
    list.parallelStream().sorted().forEach(x -> System.out.print(x + " "));
}

结果如下 :

串行流执行结果 : 1 2 3 4 5 6 7 8 9 10 11 12 13 
并行流执行结果 : 4 2 3 1 6 5 11 10 12 13 7 9 8 

并行流输出的结果并不是我们期待输出的结果,这是由于在并行情况下,会出现线程安全问题

可以使用最后调用 collect(Collectors.toList()) 的方式,这种收集起来所有元素到新集合是线程安全的。

List<Integer> collect = list.parallelStream().sorted().collect(Collectors.toList());
System.out.print("并行流toList执行结果 : ");
collect.forEach(x -> System.out.print(x + " "));

转载请注明出处:
文章地址:Java 8 新特性之并行流与串行流
文章作者:凌风
原始连接:https://huangxubo.me/blog/java/java8-parallel/
许可协议:转载请注明原文链接及作者。

CentOS 7 中搭建PPTP、L2TP、IPSec 服务

VPN(Virtual Private Network,即“虚拟私人网络”)是一种通过在数据传输过程中加密的方式来保障数据传输安全的通信方式,L2TP是其中的一种加密方式。 Continue reading

Cnet OS 安装 Shadowscoks-libev 客户端

Published on December 21, 2019

OpenResty 编译安装

Published on December 20, 2019