如何使用Java的Stream.distinct去重集合元素

distinct()可对集合去重,简单类型直接使用,自定义对象需重写equals和hashCode,按字段去重可用toMap收集器实现。

Java 中的 Stream.distinct() 方法可以很方便地对集合中的元素进行去重操作。它会返回一个由原流中不重复元素组成的新的流,从而避免修改原始数据。

1. 基本用法:去重简单类型

对于基本类型的包装类(如 String、Integer),distinct() 可以直接使用,因为这些类已经重写了 equals()hashCode() 方法。

示例:去除字符串列表中的重复项

List list = Arrays.asList("apple", "banana", "apple", "orange", "banana");
List distinctList = list.stream()
                                 .distinct()
                                 .collect(Collectors.toList());
System.out.println(distinctList); // 输出: [apple, banana, orange]

2. 对象去重:需要重写 equals 和 hashCode

如果要对自定义对象去重,必须确保该类正确实现了 equals()hashCode() 方法,否则 distinct() 无法识别两个对象是否相等。

例如,有一个 Person 类:

class Person {
    private String name;
    private int age;

    public Person(String name, int age) {
        this.name = name;
        this.age = age;
    }

    @Override
    public boolean equals(Object o) {
        if (this == o) return true;
        if (!(o instanceof Person)) return false;
        Person person = (Person) o;
        return age == person.age && Objects.equals(name, person.name);
    }

    @Override
    public int hashCode() {
        return Objects.hash(name, age);
    }

    // getter 和 toString 方法省略
}

使用 distinct() 去除重复的 Person 对象:

List people = Arrays.asList(
    new Person("张三", 25),
    new Person("李四", 30),
    new Person("张三", 25)
);

List distinctPeople = people.stream()
                                      .distinct()
                                      .collect(Collectors.toList());

distinctPeople.forEach(System.out::println); // 只输出两个对象,重复的被去除

3. 按特定字段去重(进阶技巧)

有时我们只想根据某个字段(如 id 或 name)去重,而不是整个对象完全一致。这时不能直接用 distinct(),但可以通过 Collectors.toMap() 或中间映射实现。

方法一:使用 toMap 保留唯一 key 的对象

List uniqueByName = people.stream()
    .collect(Collectors.toMap(
        Person::getName,      // 以 name 为 key
        p -> p,               // value 是对象本身
        (existing, replacement) -> existing  // 如果重复,保留第一个
    ))
    .values()
    .stream()
    .collect(Collectors.toList());

这样就实现了按姓名去重,只保留每个名字的第一个 Person 对象。

基本上就这些。只要记住:简单类型直接用,对象记得重写 equals 和 hashCode,特殊去重要借助 map 收集策略。使用 distinct() 配合 Stream API,代码简洁又高效。