C++怎么读写Excel C++操作CSV模拟Excel数据处理【实战】

C++ 无法直接读写 Excel 文件,必须依赖第三方库;CSV 可用标准库处理,但模拟 Excel 操作需二维表抽象;.xlsx 是 ZIP 封装的 XML 结构,fstream 无法解析;推荐 xlnt(读写)和 libxlsxwriter(仅写)。

直接说结论:C++ 本身没有内置 Excel 文件读写能力,Excel(.xlsx/.xls)是二进制或 XML 封装格式,必须依赖第三方库;而 CSV 是纯文本,C++ 标准库完全能处理,但「模拟 Excel 数据处理」的关键不在文件格式,而在内存中的二维表抽象和常见操作(如按列筛选、求和、排序)是否顺手。

为什么不能用 fstream 直接读写 .xlsx?

因为 .xlsx 实质是 ZIP 压缩包,里面包含 [Content_Types].xmlxl/workbook.xmlxl/worksheets/sheet1.xml 等结构化文件。用 std::ifstream 打开只能看到乱码或 ZIP 头部字节,无法直接解析单元格值。

  • 试图用 std::getline 逐行读 .xlsx 文件 → 读到的是二进制垃圾,不是表格内容
  • libzip 手动解压再解析 XML → 工程量大、易出错、不支持公式/样式/合并单元格
  • 真正可行的路径只有:选一个成熟封装库,让它替你处理 ZIP + XML + 类型推断

推荐两个轻量级 C++ Excel 库(非 COM / 非 Python 绑定)

避开重量级方案(如 Qt 的 QAxObject 调 Windows COM,或 pybind11 调 pandas),专注纯 C++ 原生集成:

  • libxlsxwriter(只写不读):适合生成报表,API 清晰,头文件少,编译快;不支持读取已有文件
  • xlnt(读写都支持):基于 C++14,仅依赖 zlibminizip,支持 .xlsx 读写、单元格样式、日期类型;注意它不解析公式结果,只读存储值

示例:用 xlnt 读第一列姓名并打印

立即学习“C++免费学习笔记(深入)”;

#include 
#include 

int main() {
    xlnt::workbook wb;
    wb.load("data.xlsx");
    auto ws = wb.active_sheet();
    for (size_t i = 1; i <= ws.max_row(); ++i) {
        auto cell = ws.cell(xlnt::cell_reference(1, i)); // A1, A2, ...
        if (!cell.is_empty()) {
            std::cout << cell.value() << "\n";
        }
    }
}

CSV 用标准库就够了,但要注意这三点

CSV 不是“简单分割逗号”就能搞定的——真实数据含引号包裹字段、换行符、逗号在字符串内等情况。C++ 标准库没提供 CSV 解析器,必须自己处理边界逻辑。

  • 别用 std::getline(file, line)std::stringstream + std::getline(ss, field, ','):遇到 "Smith, Jr.",25 会错误切分为三段
  • 必须识别双引号对:字段以 " 开头则一直读到匹配的结束 ",中间的 "" 视为一个 "
  • 性能敏感时避免反复 std::string::substr 和内存拷贝,可改用视图(std::string_view)+ 迭代器扫描

简易健壮 CSV 行解析示意(跳过空行和注释):

std::vector parse_csv_line(const std::string& line) {
    std::vector fields;
    std::string field;
    bool in_quotes = false;
    size_t i = 0;
    while (i < line.size()) {
        char c = line[i];
    

if (c == '"') { in_quotes = !in_quotes; } else if (c == ',' && !in_quotes) { fields.push_back(std::move(field)); field.clear(); } else if (c != '\r' && c != '\n') { field += c; } ++i; } fields.push_back(std::move(field)); return fields; }

「模拟 Excel 数据处理」的核心其实是内存表结构设计

无论读 CSV 还是 XLSX,最终都要映射成程序内的二维数据容器。这里容易踩坑的是类型混用和索引混乱:

  • 别用 std::vector<:vector>> 存所有数据:无法区分数字/日期/布尔,后续求和、排序要反复 std::stod,且列对齐靠人工维护
  • 建议分层:底层用 std::vector<:any> 或枚举类型联合体存异构值;上层封装 Table 类,提供 filter_by_col("age", >=, 18)sum_col("salary") 等方法
  • 列名处理要统一:CSV 头行可能含空格或特殊字符("User ID"),入库前建议转为合法标识符(如 user_id),避免后续用点号访问出错

真正难的不是读文件,而是让 Table::sort_by("price", descending=true) 这种调用背后不崩溃、不出错、不丢精度——这需要你在类型擦除、比较函数、NaN 处理上做足功课。