Python深拷贝与浅拷贝详解_对象引用与内存管理解析

浅拷贝只复制一层,嵌套对象仍共享引用;深拷贝递归复制所有层级,彻底隔离对象;不可变对象拷贝无区别;自定义类需实现__deepcopy__方法支持深拷贝。

浅拷贝只复制一层,嵌套对象仍共享引用

浅拷贝(copy.copy())会创建新对象,但仅对最外层结构做复制,内部嵌套的可变对象(如列表中的子列表、字典中的值是列表等)依然指向原对象的同一内存地址。这意味着修改嵌套内容会影响原对象。

例如:

>>> import copy
>> a = [[1, 2], [3, 4]]
>> b = copy.copy(a)
>> b[0].append(3)
>> print(a) # 输出 [[1, 2, 3], [3, 4]] —— 原列表被改了

深拷贝递归复制所有层级,彻底隔离对象

深拷贝(copy.deepcopy())会递归遍历整个对象结构,为每一层嵌套的可变对象都分配新的内存空间,确保新旧对象完全独立。修改拷贝后的任意层级,都不会影响原始对象。

继续上面的例子:

>>> c = copy.deepcopy(a)
>> c[0].append(99)
>> print(a) # 输出 [[1, 2, 3], [3, 4]] —— 不变
>> print(c) # 输出 [[1, 2, 3, 99], [3, 4]]

不可变对象在拷贝中表现一致,无需深浅区分

对于 intstrtuple(且其元素也全不可变)这类不可变对象,浅拷贝和深拷贝效果相同——它们本身不能被原地修改,每次“修改”实际是新建对象并重新绑定变量名。因此无论哪种拷贝,变量都只是获得一个新引用,不影响原值。

常见误区:以为对字符串调用 copy.copy("hello") 会产生特殊行为,其实它返回的仍是原字符串对象的引用(CPython 中还可能触发字符串驻留优化)。

自定义类需主动支持深拷贝,否则可能出错

如果类中包含文件句柄、线程锁、数据库连接等无法序列化的资源,直接调用 deepcopy 会抛出 TypeError。此时可通过实现 __deepcopy__ 方法控制拷贝逻辑:

  • 在方法中手动构造新实例
  • 对需要深拷的属性调用 memo 参数传递的拷贝上下文
  • 跳过不可拷贝字段(如设为 None 或忽略)

未定义 __deepcopy__ 时,deepcopy 默认尝试通过 __reduce_ex____getstate__ 序列化,失败即报错。