如何正确比较 Java 中的 int 数组集合以实现内容去重

java 中 `int[]` 默认使用引用相等,无法直接用于 `hashset` 内容去重;需封装为自定义类型并重写 `equals()` 和 `hashcode()`,使用 `arrays.equals()` 和 `arrays.hashcode()` 实现基于元素值的语义比较。

在处理二维整数数组(如矩阵)的等价性判定时,一个常见误区是直接将 int[] 放入 HashSet 并期望 contains() 基于数组内容进行判断。但 Java 中数组继承自 Object,其 equals() 和 hashCode() 方法未被重写,因此 int[] 的 equals() 仅比较内存地址(即引用相等),而非元素内容。这导致即使两个 int[] 元素完全相同,set.contains(otherArray) 仍返回 false——正是您观察到“四个数组全被保留”的根本原因。

要解决此问题,核心思路是:将原始数组包装为支持值语义的不可变容器类。推荐使用 Java 14+ 的 record(简洁安全),并显式委托 Arrays.equals() 和 Arrays.hashCode():

record Row(int[] row) {
    @Override
    public boolean equals(Object o) {
        if (this == o) return true;
        if (o == null || getClass() != o.getClass()) return false;
        Row row1 = (Row) o;
        return Arrays.equals(row, row1.row); // ✅ 按元素逐个比较
    }

    @Override
    public int hashCode() {
        return Arrays.hashCode(row); // ✅ 基于内容生成哈希码
    }
}

关键点说明:

  • Arrays.equals(int[], int[]) 执行深度比较:先校验长度,再逐元素比对;
  • Arrays.hashCode(int[]) 生成与 Arrays.equals() 语义一致的哈希值,满足哈希契约(相等对象必须有相同哈希

    码);
  • 使用 record 自动提供 final 字段、构造器和 toString(),避免可变状态引发的并发或逻辑错误。

在主逻辑中,需将 HashSet 替换为 HashSet,并将所有数组操作转为 Row 实例:

private static final Set registeredM = new HashSet<>();

static int count_different_matrices(int[][] matrices) {
    registeredM.clear(); // ⚠️ 注意:静态集合需重置,避免多次调用污染
    Arrays.stream(matrices)
          .forEach(m -> {
              List variants = unwrapPossibleMatrices(m);
              if (variants.stream().noneMatch(registeredM::contains)) {
                  registeredM.add(new Row(m));
              }
          });
    return registeredM.size();
}

static List unwrapPossibleMatrices(int[] m) {
    return List.of(
        new Row(m),
        new Row(new int[]{m[2], m[0], m[3], m[1]}),
        new Row(new int[]{m[3], m[2], m[1], m[0]}),
        new Row(new int[]{m[1], m[3], m[0], m[2]})
    );
}

⚠️ 注意事项

  • 避免静态集合状态残留:count_different_matrices() 是纯函数,应确保每次调用前清空 registeredM(如示例中的 clear());
  • 不要复用原始数组引用:unwrapPossibleMatrices 中每个新数组都需 new int[]{...} 创建,防止 Row 封装同一数组对象导致意外共享;
  • 若需兼容 Java 8–13,可用普通 class 替代 record,但须手动实现 final 字段、构造器及 equals/hashCode。

通过此方案,输入 {{1,2,3,4}, {3,1,4,2}, {4,3,2,1}, {2,4,1,3}} 将正确识别所有 4 种旋转等价形式均属于同一等价类,最终输出 1 —— 符合题目“统计不同矩阵数量”的语义要求。