c++中如何使用std::unique去重_c++配合sort实现向量去重

std::unique仅移除相邻重复元素并返回新逻辑结尾迭代器,不改变容器大小;需先排序、再unique、最后erase才能真正去重。

std::unique 本身不会真正删除元素

std::unique 只是把重复元素“挤到后面”,并返回一个指向新逻辑结尾的迭代器;它不改变容器大小,也不会自动调用 erase。如果你只调用 std::unique 而不配合 erase,向量长度和内容看起来都没变。

  • 必须先对容器排序(否则 unique 只能去除**相邻重复项**)
  • 必须用返回的迭代器配合 erase 才算真正删掉重复元素
  • std::vector 操作时,典型写法是:vec.erase(std::unique(vec.begin(), vec.end()), vec.end())

为什么必须先 sort 再 unique

std::unique 只比较相邻元素:它从头开始遍历,跳过与前一个相同的元素。如果原始数据是 {3, 1, 3, 2, 1},不排序直接 unique 得到的是 {3, 1, 3, 2, 1}(无变化),因为没一对相邻元素相等。

  • 排序后变成 {1, 1, 2, 3, 3},这时 unique 才能把相邻重复项合并为 {1, 2, 3, ?, ?}
  • 如果不关心原始顺序,sort + unique + erase 是最常用组合
  • 如果要保序去重(如按首次出现顺序),就不能用 sort,得换哈希表辅助,unique 不适用

完整可运行示例(C++11 及以上)

std::vector v = {5, 1, 3, 1, 5, 2, 3};
std::sort(v.begin(), v.end());                    // → {1, 1, 2, 3, 3, 5, 5}
auto last = std::unique(v.begin(), v.end());     // → {1, 2, 3, 5, ?, ?, ?},last 指向第5个元素
v.erase(last, v.end());                           // 真正截断,v 变成 {1, 2, 3, 5}

注意自定义类型去重的陷阱

structclass 使用 std::unique,前提是已定义好 operator==;若用 std::sort,还必须提供 operator 或传入比较函数。否则编译失败。

  • 比如 std::vector<:string> 没问题,因为标准库已重载
  • std::vector 需要你手动实现 bool operator==(const MyPoint& a, const MyPoint& b)
  • 如果比较逻辑复杂(如浮点近似相等),不能直接用 ==,得传自定义谓词给 uniquesort
真正起作用的是 sort + unique 这个组合动作,单独看任何一个都没法完成“去重”目标;最容易漏掉的是 erase 这一步,或者误以为 unique 能处理非相邻重复。