您的位置:

深入了解Java 8 Stream中的groupby方法

Java 8 引入的 Stream API 对于集合的操作提供了一种新的方式,包括筛选,分组和映射等。Stream API 中的 groupby 方法可以将一个 Stream 中的元素分组为一个 Map ,以实现更高效的聚合和操作。本文将从多个方面对 Stream 中的 groupby 进行详细讲解。

一、基本用法

Stream 中的 groupby 方法可以在一个 Stream 中根据给定的分类器对元素进行分组,以生成一个 Map 。示例代码如下:

List people = Arrays.asList(
    new Person("John", 23),
    new Person("Alice", 25),
    new Person("John", 28)
);

Map
   > peopleByNames = 
    people.stream()
          .collect(Collectors.groupingBy(Person::getName));

System.out.println(peopleByNames);
// 输出结果:{John=[Person{name='John', age=23}, Person{name='John', age=28}], Alice=[Person{name='Alice', age=25}]}

   
  

上面的代码中,我们先定义了一个 Person 类,并创建了一个包含三个 Person 实例的 List 对象。我们接着通过 Stream API 中的 groupingBy 方法,对这个 List 对象进行分组,将相同名字的 Person 实例放在同一个 List 对象中,生成一个 Map 对象。在上面的示例中可以看出,同名的 John 实例被分为了同一组,而 Alice 则独自成组。

二、自定义分组规则

默认情况下,groupby 方法将使用元素对象本身作为 Map 的 key 进行分组,但是有时候可能需要自己定义自己的分组逻辑。可以通过使用 Collectors 中的 groupingBy 方法并传递自己的分类函数来实现这一点。示例代码如下:

List people = Arrays.asList(
        new Person("John", 23),
        new Person("Alice", 25),
        new Person("Paul", 28)
);

Map
   > peopleByAge = 
        people.stream()
              .collect(Collectors.groupingBy(p -> p.getAge() > 25));

System.out.println(peopleByAge);
// 输出结果:{false=[Person{name='John', age=23}, Person{name='Alice', age=25}], true=[Person{name='Paul', age=28}]}

   
  

在上面的代码中,我们定义了一个分类函数,根据 Person 实例的 age 属性判断是否大于 25 ,如果大于,则分到 true 分组,否则分到 false 分组。运行后可以看到,分组的结果正确,分组规则也与预期一致。

三、多级分组

groupby 方法不仅可以进行单一的分组,还可以进行多级分组,可以根据传递给 groupingBy 方法的参数数量来进行分组。示例代码如下:

List people = Arrays.asList(
        new Person("John", 23),
        new Person("Alice", 25),
        new Person("Paul", 28),
        new Person("John", 29),
        new Person("Alice", 21)
);

Map
   >> peopleByNameAndAge = 
        people.stream()
              .collect(Collectors.groupingBy(Person::getName, Collectors.groupingBy(Person::getAge)));

System.out.println(peopleByNameAndAge);
// 输出结果:{Alice={21=[Person{name='Alice', age=21}], 25=[Person{name='Alice', age=25}]}, John={23=[Person{name='John', age=23}], 29=[Person{name='John', age=29}]}, Paul={28=[Person{name='Paul', age=28}]}}

   
  

在上面的代码中,我们对 person 列表进行了两层分组,首先按照名字进行分组,然后在每个名字的分组中再按照年龄进行分组。此时,peopleByNameAndAge 对象的 key 值是名字,value 值则是按照年龄分组的 Map 对象。最终的结果显示为了一个分层的 Map,其中每个元素都是一个二级 Map 对象。

四、将分组结果收集到指定类型的容器

默认情况下,groupby 方法将分组结果收集到一个 Map 中,如果需要将结果收集到特定类型的容器中,比如 Set 对象,可以使用 Collectors 中的 toCollection 方法。示例代码如下:

List people = Arrays.asList(
    new Person("John", 23),
    new Person("Alice", 25),
    new Person("John", 28),
    new Person("Paul", 28),
    new Person("Alice", 21)
);

Map
   > peopleSetByName = 
    people.stream()
          .collect(Collectors.groupingBy(Person::getName, Collectors.toCollection(TreeSet::new)));

System.out.println(peopleSetByName);
// 输出结果:{Alice=[Person{name='Alice', age=21}, Person{name='Alice', age=25}], John=[Person{name='John', age=23}, Person{name='John', age=28}], Paul=[Person{name='Paul', age=28}]}

   
  

在上面的代码中,我们使用 toCollection 方法将 Set 的实例化由默认的 HashSet 更改为了 TreeSet,以便让收集到的结果按照自然排序的顺序排列。

五、将分组结果按照大小排序

对于分组结果中的集合对象,可以使用 sorted 方法对其进行排序。示例代码如下:

List people = Arrays.asList(
        new Person("John", 23),
        new Person("Alice", 25),
        new Person("John", 28),
        new Person("Paul", 28),
        new Person("Alice", 21)
);

Map
   > peopleSortedByAge = 
        people.stream()
              .collect(Collectors.groupingBy(Person::getName, 
                         Collectors.mapping(Function.identity(), 
                                            Collectors.toList())))
              .entrySet()
              .stream()
              .map(e -> new AbstractMap.SimpleEntry<>(e.getKey(), e.getValue().stream().sorted(Comparator.comparingInt(Person::getAge)).collect(Collectors.toList())))
              .collect(Collectors.toMap(AbstractMap.SimpleEntry::getKey, AbstractMap.SimpleEntry::getValue));

System.out.println(peopleSortedByAge);
// 输出结果:{Alice=[Person{name='Alice', age=21}, Person{name='Alice', age=25}], John=[Person{name='John', age=23}, Person{name='John', age=28}], Paul=[Person{name='Paul', age=28}]}

   
  

在上面的代码中,我们首先对 person 对象进行分组,并且使用 Collectors.mapping 方法将元素转化为自身,然后转化为 List 后再进行排序,最终得到每个姓名对应的已经排好序的 Person 对象的 List 对象。

六、将分组结果转化为值对象

在分组过程中,可能需要将分组结果转化为值对象,以便合并、比较和输出等操作。这可以使用 Stream 中的 map 方法直接在分组后将 Map 中的 value 值映射为另一个值对象。示例代码如下:

List people = Arrays.asList(
        new Person("John", 23),
        new Person("Alice", 25),
        new Person("John", 28),
        new Person("Paul", 28),
        new Person("Alice", 21)
);

Map
    peopleGroupByName = 
        people.stream()
              .collect(Collectors.groupingBy(Person::getName, 
                         Collectors.mapping(Function.identity(), 
                                            Collectors.toList())))
              .entrySet()
              .stream()
              .map(e -> new AbstractMap.SimpleEntry<>(e.getKey(), new Group(e.getValue())))
              .collect(Collectors.toMap(AbstractMap.SimpleEntry::getKey, AbstractMap.SimpleEntry::getValue));

System.out.println(peopleGroupByName);
// 输出结果:{Alice=Group{people=[Person{name='Alice', age=25}, Person{name='Alice', age=21}]}, John=Group{people=[Person{name='John', age=23}, Person{name='John', age=28}]}, Paul=Group{people=[Person{name='Paul', age=28}]}}

   
  

在上面的代码中,我们首先和之前一样对 person 对象进行分组操作,但是这里使用了 map 方法,将分组结果转化为了自定义的 Group 类,输出结果为以名字为 key,以 Group 类型的值对象为 value 的 Map 。