Java集合框架中的集合排序与Comparator接口

Arrays.sort()用于数组,Collections.sort()用于List,二者均基于TimSort,时间复杂度O(n log n)且稳定;传参类型不同,不可混用。

Arrays.sort() 和 Collections.sort() 用哪个?

看数据类型:数组用 Arrays.sort(),List 用 Collections.sort()。两者底层都调用同一套 TimSort 实现,稳定性、时间复杂度(O(n log n))一致,但传参方式不同。

常见错误是把 List 直接传给 Arrays.sort() —— 编译不通过,因为该方法只接受 Object[] 或基本类型数组。

  • Collections.sort(list, comparator) 要求 list 是可变的(如 ArrayList),对 Collections.unmodifiableList() 调用会抛 UnsupportedOperationException
  • 若 list 元素本身实现了 Comparable,可不传 Comparator;否则必须提供,否则编译失败
  • 排序会直接修改原集合,不是返回新集合 —— 这点和 Python 的 sorted() 不同

写一个安全的 Comparator:null 值怎么处理?

Java 8 之前手动判 null 容易出错;Java 8+ 推荐用 Comparator.nullsFirst()Comparator.nullsLast() 组合已有比较器,避免 NPE。

比如按字符串字段排序,该字段可能为 null:

Comparator byName = Comparator.comparing(
    Person::getName, 
    Comparator.nullsLast(String::compareToIgnoreCase)
);
  • 别用 a.getName().compareTo(b.getName()) 直接比较 —— 任一为 null 就抛 NullPointerException
  • Compar

    ator.nullsFirst()
    把 null 排最前,nullsLast() 排最后,语义清晰
  • 如果字段是基本类型包装类(如 Integer),也适用 —— Comparator.nullsLast(Integer::compareTo)

Stream.sorted() 和传统 sort() 有什么实际区别?

核心区别在于是否改变原数据:Stream.sorted() 返回新流,不修改源集合;而 Collections.sort() 是就地排序。

性能上,Stream 版本有额外开销(创建流、装箱/拆箱、中间操作),小数据量无感,大数据量建议用传统方式。

  • 链式调用友好:list.stream().sorted(comparator).filter(...).collect(...)
  • 并行流慎用:parallelStream().sorted() 虽能多线程,但排序本身无法真正并行化,反而增加调度成本
  • 返回类型是 Stream,不能直接赋值给 List —— 必须显式 .collect(Collectors.toList())

Comparator 链式比较多个字段怎么写才不易错?

thenComparing() 方法链,比手写 if-else 判定更安全、可读性更高,且天然支持 null 处理。

例如先按年龄升序,年龄相同时按姓名降序:

Comparator multi = Comparator.comparing(Person::getAge)
    .thenComparing(Person::getName, String::compareToIgnoreCase);
// 如果姓名可能为 null:
Comparator safeMulti = Comparator.comparing(Person::getAge)
    .thenComparing(Person::getName, Comparator.nullsLast(String::compareToIgnoreCase));
  • 避免用 int compare(...) { ... return ageCmp != 0 ? ageCmp : nameCmp; } 手动拼接 —— 易漏边界、难维护
  • thenComparingInt() / thenComparingDouble() 等专用方法可避免自动装箱
  • 链越长,越要检查每个字段的 null 安全性 —— 一个没处理,整个 comparator 就可能崩

复合排序逻辑一旦涉及 null、空字符串、时区、本地化规则,就不再是语法问题,而是业务契约问题。写 comparator 前,先想清楚“null 算最大还是最小”“空字符串排在哪”“大小写是否敏感”,这些决定比代码本身更重要。