Python GC 什么时候会触发?

Python垃圾回收有五类触发时机:引用计数归零时立即回收;分代回收在阈值达成时启动(默认700,10,10);内存不足或退出时强制全量回收;手动调用gc.collect()可指定代数触发。

Python 的垃圾回收(GC)不是固定时间点运行的,而是由多种机制按条件触发。最核心的时机有三类:引用计数归零、分代回收阈值达成、内存压力紧急回收。

引用计数为 0 时立即回收

这是最基础、最频繁的回收方式。每个对象内部维护一个计数器,记录有多少变

量或结构正指向它。只要这个数字降到 0,对象就立刻被释放,不等待任何其他机制。

常见导致计数归零的操作包括:

  • 使用 del 显式删除变量
  • 变量被重新赋值(如 a = [1,2] 后又执行 a = "hello"
  • 函数退出,局部变量自动失效
  • 容器被销毁或移除其中的对象(如 list.pop()del list[0]

注意:整数、字符串等小对象可能因对象池机制不被真正释放,但逻辑上已脱离引用链。

分代回收在阈值达到时自动启动

CPython 把对象按存活时间分为三代(0、1、2),并用三个阈值控制回收频率,默认是 (700, 10, 10)

触发逻辑如下:

  • 第 0 代:新对象都放在这里;当「新增对象数 − 已回收对象数」≥ 700,立即扫描 0 代
  • 第 1 代:每完成 10 次 0 代回收,就触发一次 1 代回收(扫描 0+1 代)
  • 第 2 代:每完成 10 次 1 代回收,就触发一次 2 代回收(全量扫描)

这个机制专门处理循环引用——引用计数无法解决的问题,比如两个类实例互相持有对方引用。

内存不足或程序退出时强制回收

当 Python 向系统申请内存失败,会立刻启动一次完整的 GC(扫描所有三代),尝试腾出空间,防止 OOM。

另外,程序正常退出前,解释器也会做一次最终清理,回收大部分剩余对象(但不保证全部,尤其含 __del__ 方法的对象可能跳过)。

手动调用 gc.collect() 可随时触发

导入 gc 模块后,直接调用 gc.collect() 就能立即启动回收。可传参指定代数,例如 gc.collect(0) 只扫第 0 代。

适合场景:

  • 批量数据处理完成后主动清理临时对象
  • 长期运行服务中定期释放内存(如 Web 服务每处理完一批请求)
  • 调试内存泄漏时配合 gc.get_objects()objgraph 分析