c++如何分割字符串 按指定分隔符分割的多种实现方法【实用技巧】

C++中字符串分割需手动实现,常用方法有:std::stringstream(适合空白分隔)、手写find/substr循环(通用推荐)、std::regex_token_iterator(正则分隔)、第三方库如absl::StrSplit(工程级应用)。

在C++中没有内置的字符串分割函数,但有多种可靠、实用的方式实现按指定分隔符分割字符串。关键在于选择适合场景的方法:兼顾简洁性、可读性、性能以及是否需要保留空字段。

使用 std::stringstream(适合简单空格/空白分割)

当分隔符是空白字符(空格、制表符、换行等)时,std::stringstream最简洁直观:

  • 自动跳过连续空白,不保留空字段
  • 无需额外头文件(仅需
  • 代码短小,适合快速拆分单词或数字

示例:

std::string s = "apple banana cherry";
std::vector<:string> tokens;
std::stringstream ss(s);
std::string token;
while (ss >> token) {
  tokens.push_back(token);
}

手写循环 + find / substr(通用、可控、推荐)

这是最常用且灵活的方式,适用于任意单字符或字符串分隔符,支持保留空字段、处理边界情况:

  • std::string::find() 定位分隔符位置
  • std::string::substr() 提取子串
  • 手动控制起始位置和结束条件,逻辑清晰

示例(按 ',' 分割,保留空字段):

std::string s = "a,,c,d";
std::vector<:string> tokens;
size_t start = 0, end = 0;
while ((end = s.find(',', start)) != std::string::npos) {
  tokens.push_back(s.substr(start, end - start));
  start = end + 1;
}
tokens.push_back(s.substr(start)); // 添加最后一段

使用 std::regex_token_iterator(支持正则分隔符)

当分隔符规则复杂(如“一个或多个空白”、“非字母数字字符”等),可用正则表达式:

  • 需要 头文件
  • 支持多字符、模式化分隔(如 "\\s+"、"[;,]")
  • 性能略低,但表达力强,适合解析格式化文本

示例(按逗号或分号分割):

std::string s = "x,y;z";
std::regex re("[;,]");
std::sregex_token_iterator it(s.begin(), s.end(), re, -1);
std::sregex_token_iterator end;
std::vector<:string> tokens(it, end);

借助第三方库(如 abseil 或 boost)

若项目已引入成熟工具库,可直接调用现成函数,减少出错可能:

  • abseil 的 absl::StrSplit():语义清晰,支持多种选项(如跳过空、限定分割次数)
  • Boost.Tokenizer:功能完整,支持自定义分隔策略
  • 适合大型工程,提升一致性与可维护性

abseil 示例:

#include "absl/strings/str_split.h"
std::string s = "a::b:::c";
auto tokens = absl::StrSplit(s, "::"); // 按 "::" 分割