C++联合体基础讲解_C++ union内存共享机制解析

union是共享内存的特殊结构,大小等于最大成员(含对齐),仅能安全访问最后写入的活跃成员;不可含非平凡类型,C++17起推荐用std::variant替代。

联合体(union)在C++中是一种特殊的数据结构,它的所有成员共享同一块内存空间。这意味着同一时刻,union只能安全地保存其中一个成员的值;对一个成员赋值会覆盖其他成员的原有数据。

union的内存布局:所有成员从同一地址开始

union的大小等于其最大成员的大小(考虑对齐后)。编译器不会为每个成员分配独立空间,而是让所有成员的起始地址完全相同。例如:

struct { int a; char b; }; // 占用至少8字节(含对齐)

union { int a; char b; }; // 通常只占4字节(int大小,char不增加总长)

访问b时读的是a的低字节;修改b会直接改写a的低位——这是内存共享的直接体现。

不能有非平凡构造/析构函数的成员

C++要求union的每个成员必须是“可平凡复制”(trivially copyable)类型。像std::string、std::vector这类带有构造函数、析构函数或拷贝控制的类,不能直接作为union成员,否则编译失败。

如果确实需要管理资源,可手动控制生命周期,比如用placement new构造,显式调用析构函数;但需程序员严格保证逻辑正确,容易出错。

活跃成员(active member)规则与安全访问

union中任何时候只有一个成员是“活跃的”——即最后被写入的那个。读取非活跃成员属于未定义行为(UB)。

  • 写入a后再读a:安全
  • 写入a后再写b,再读b:安全
  • 写入a后再读b:结果取决于内存布局,但语义上是UB(即使看起来“能读出来”)

实际项目中常配合枚举使用,手动跟踪当前活跃成员,形成“标记联合”(tagged union),如:

enum class Type { INT, FLOAT };
struct Variant { Type tag; union { int i; float f; }; };

C++17起推荐用std::variant替代手写union

std::variant是类型安全的联合体实现,自动记录活跃类型、禁止非法访问、支持访问者模式(std::visit),且能容纳非平凡类型。

它底层仍可能用union优化内存,但把复杂性封装起来了。除非追求极致控制或嵌入式场景限制,日常开发优先选std::variant。

基本上就这些。union本质简单,但用错后果隐蔽;理解内存共享和活跃成员规则,是安全使用的前提。