深入理解collectors.groupingBy

发布时间:2023-05-21

一、基础概念

Java 8的Stream API提供了丰富的中间操作,其中collect方法可以将流转化为另一种数据结构。collect方法接受一个Collector类型的参数,Collector是一个很重要的类,它定义了将流转化为集合或Map的方法。 Collectors.groupingBy()Collector类中的一个静态方法,它接受一个分类函数和一个可选的结果转换函数,返回一个将输入元素分组的Map。

二、使用groupingBy方法分类

使用groupingBy方法可以把一组元素分为多个组。下面使用一个简单的例子演示:

List<Person> people = Arrays.asList(
        new Person("Alice", 20),
        new Person("Bob", 35),
        new Person("Charlie", 50),
        new Person("David", 20),
        new Person("Eric", 35),
        new Person("Frank", 50)
);
Map<Integer, List<Person>> peopleByAge = 
    people.stream().collect(Collectors.groupingBy(Person::getAge));

其中Person类定义如下:

class Person {
    private final String name;
    private final int age;
    public Person(String name, int age) {
        this.name = name;
        this.age = age;
    }
    public String getName() {
        return name;
    }
    public int getAge() {
        return age;
    }
    public String toString() {
        return name + " (" + age + ")";
    }
}

运行结果:

{50=[Charlie (50), Frank (50)], 35=[Bob (35), Eric (35)], 20=[Alice (20), David (20)]}

这里使用Person类的getAge()方法,将Person对象按照年龄分为三组,并且以年龄作为Map的Key。

三、使用groupingBy方法进一步分类

groupingBy方法还可以进一步分类,例如将年龄相同的人按照名字字母顺序排序。

Map<Integer, List<Person>> peopleByAge = 
    people.stream().collect(Collectors.groupingBy(Person::getAge, TreeMap::new, Collectors.toList()));
Map<Integer, Map<String, List<Person>>> peopleByAgeAndName = people.stream()
        .collect(Collectors.groupingBy(Person::getAge, TreeMap::new, 
                 Collectors.groupingBy(p -> p.getName().substring(0, 1), TreeMap::new, Collectors.toList())));

这里将输入元素Person分成了两个层次,第一层是年龄,第二层是以名字首字母开头的字母表顺序。这里使用了一个额外的TreeMap来存储分组的结果,以保证结果的顺序。运行结果如下:

{
 20={
   A=[Alice (20)],
   D=[David (20)]
  },
 35={
   B=[Bob (35)],
   E=[Eric (35)]
  },
 50={
   C=[Charlie (50)],
   F=[Frank (50)]
  }
}

四、使用groupingBy方法对元素进行统计

groupingBy方法还可以结合另一个方法Collectors.counting(),将每个分组中的元素统计出个数。下面使用一个例子说明:

Map<Integer, Long> peopleCountByAge =
    people.stream().collect(Collectors.groupingBy(Person::getAge, Collectors.counting()));

这里将Person对象按照年龄分组,并且使用counting()方法对每个分组中的元素进行统计,最终得到一个以年龄为Key,以该年龄对应的Person对象数量为Value的Map。运行结果如下:

{20=2, 35=2, 50=2}

五、结语

本文深入介绍了使用Collectors.groupingBy()方法对流元素进行分类和统计。可以看出,在Java 8的Stream API中,collect方法和Collector类是非常重要的组成部分,尤其是在处理大数据时,使用Stream和Collector可以帮助我们更加方便和高效地进行数据处理。