C++ vector去重方法_C++ unique函数去除重复元素

先排序使相同元素相邻,再用std::unique合并连续重复项并配合erase删除多余元素。示例代码展示完整去重流程:包含头文件后定义vector,调用sort排序,再通过unique和erase移除重复值,最终输出有序无重结果。注意std::unique仅对连续重复元素有效,故排序必不可少;可自定义比较函数实现特殊去重逻辑,但需保证相应排序规则;时间复杂度O(n log n),适用于常规场景,若需保持原序应选用set或unordered_set辅助处理。该方法高效常用,核心是先排序再去重。

在C++中,使用vector存储数据时,经常会遇到需要去除重复元素的情况。结合标准库中的std::unique函数和排序操作,可以高效实现去重。下面介绍具体用法和注意事项。

使用 std::unique 去除重复元素的基本步骤

std::unique并不会真正删除元素,而是将相邻的重复元素“移到”容器末尾,并返回一个指向新逻辑末尾的迭代器。因此,必须配合erase方法才能真正删除这些元素。

基本流程如下:

  • 先对vector进行排序,使相同元素相邻
  • 使用std::unique合并连续重复项
  • 调用erase删除多余元素
注意:如果不排序,std::unique只会去除连续重复的元素,无法处理所有重复值。

代码示例:完整去重操作

以下是一个完整的例子:

#include 
#include 
#include 

int main() {
    std::vector vec = {5, 2, 8, 2, 1, 5, 3};

    // 步骤1:排序
    std::sort(vec.begin(), vec.end());

    // 步骤2:去重并删除
    vec.erase(std::unique(vec.begin(), vec.end()), vec.end());

    // 输出结果
    for (int n : vec) {
        std::cout << n << " ";
    }
    // 输出:1 2 3 5 8
    return 0;
}

自定义去重条件(高级用法)

std::unique支持传入自定义比较函数,用于定义“相等”的含义。例如,若想认为绝对值相同的数为重复项:

vec.erase(std::unique(vec.begin(), vec.end(),
    [](int a, int b) { return abs(a) == abs(b); }
), vec.end());

但这种情况下仍需确保数据按自定义规则有序,否则结果可能不完整。

性能与适用场景

该方法时间复杂度主要由排序决定,为 O(n log n),适合大多数常规去重需求。如果数据量小或已接近有序,效率较高。若要求保持原始顺序,此方法会破坏原有顺序,需考虑其他方式如使用std::setstd::unordered_set辅助记录已出现元素。

基本上就这些,掌握sort + unique + erase组合是C++中处理vector去重的常用技巧。不复杂但容易忽略排序前提。