一、基础概念
Java 8的Stream API提供了丰富的中间操作,其中collect方法可以将流转化为另一种数据结构。collect方法接受一个Collector类型的参数,Collector
是一个很重要的类,它定义了将流转化为集合或Map的方法。
Collectors.groupingBy()
是Collector
类中的一个静态方法,它接受一个分类函数和一个可选的结果转换函数,返回一个将输入元素分组的Map。
二、使用groupingBy方法分类
使用groupingBy
方法可以把一组元素分为多个组。下面使用一个简单的例子演示:
List<Person> people = Arrays.asList(
new Person("Alice", 20),
new Person("Bob", 35),
new Person("Charlie", 50),
new Person("David", 20),
new Person("Eric", 35),
new Person("Frank", 50)
);
Map<Integer, List<Person>> peopleByAge =
people.stream().collect(Collectors.groupingBy(Person::getAge));
其中Person类定义如下:
class Person {
private final String name;
private final int age;
public Person(String name, int age) {
this.name = name;
this.age = age;
}
public String getName() {
return name;
}
public int getAge() {
return age;
}
public String toString() {
return name + " (" + age + ")";
}
}
运行结果:
{50=[Charlie (50), Frank (50)], 35=[Bob (35), Eric (35)], 20=[Alice (20), David (20)]}
这里使用Person类的getAge()
方法,将Person对象按照年龄分为三组,并且以年龄作为Map的Key。
三、使用groupingBy方法进一步分类
groupingBy
方法还可以进一步分类,例如将年龄相同的人按照名字字母顺序排序。
Map<Integer, List<Person>> peopleByAge =
people.stream().collect(Collectors.groupingBy(Person::getAge, TreeMap::new, Collectors.toList()));
Map<Integer, Map<String, List<Person>>> peopleByAgeAndName = people.stream()
.collect(Collectors.groupingBy(Person::getAge, TreeMap::new,
Collectors.groupingBy(p -> p.getName().substring(0, 1), TreeMap::new, Collectors.toList())));
这里将输入元素Person分成了两个层次,第一层是年龄,第二层是以名字首字母开头的字母表顺序。这里使用了一个额外的TreeMap
来存储分组的结果,以保证结果的顺序。运行结果如下:
{
20={
A=[Alice (20)],
D=[David (20)]
},
35={
B=[Bob (35)],
E=[Eric (35)]
},
50={
C=[Charlie (50)],
F=[Frank (50)]
}
}
四、使用groupingBy方法对元素进行统计
groupingBy
方法还可以结合另一个方法Collectors.counting()
,将每个分组中的元素统计出个数。下面使用一个例子说明:
Map<Integer, Long> peopleCountByAge =
people.stream().collect(Collectors.groupingBy(Person::getAge, Collectors.counting()));
这里将Person对象按照年龄分组,并且使用counting()
方法对每个分组中的元素进行统计,最终得到一个以年龄为Key,以该年龄对应的Person对象数量为Value的Map。运行结果如下:
{20=2, 35=2, 50=2}
五、结语
本文深入介绍了使用Collectors.groupingBy()
方法对流元素进行分类和统计。可以看出,在Java 8的Stream API中,collect方法和Collector类是非常重要的组成部分,尤其是在处理大数据时,使用Stream和Collector可以帮助我们更加方便和高效地进行数据处理。