简介

python采用的是引用计数机制为主，标记-清除和分代收集（隔代回收）两种机制为辅的策略。

引用计数

引用计数法机制的原理是：每个对象维护一个ob_ref字段，用来记录该对象当前被引用的次数，每当新的引用指向该对象时，它的引用计数ob_ref加1，每当该对象的引用失效时计数ob_ref减1，一旦对象的引用计数为0，该对象立即被回收，对象占用的内存空间将被释放。它的缺点是需要额外的空间维护引用计数，这个问题是其次的，不过最主要的问题是它不能解决对象的“循环引用”，因此，也有很多语言比如Java并没有采用该算法做来垃圾的收集机制。

typedef struct_object {
     int ob_refcnt;
     struct_typeobject *ob_type;
}PyObject;

在Python中每一个对象的核心就是一个结构体PyObject，它的内部有一个引用计数器（ob_refcnt）。程序在运行的过程中会实时的更新ob_refcnt的值，来反映引用当前对象的名称数量。当某对象的引用计数值为0,那么它的内存就会被立即释放掉。

以下情况是导致引用计数加一的情况:

对象被创建，例如a=2
对象被引用，b=a
对象被作为参数，传入到一个函数中
对象作为一个元素，存储在容器中

下面的情况则会导致引用计数减一:

对象别名被显示销毁 del
对象别名被赋予新的对象
一个对象离开他的作用域
对象所在的容器被销毁或者是从容器中删除对象

我们还可以通过sys包中的getrefcount()来获取一个名称所引用的对象当前的引用计数(注意，这里getrefcount()本身会使得引用计数加一)

1	sys.getrefcount(a)

引用计数机制的优点：

1、高效、实现逻辑简单

2、具备实时性：一旦没有引用，内存就直接释放了，不用像其他机制得等到特定时机。实时性还带来一个好处：处理回收内存的时间分摊到了平时。

引用计数机制的缺点：

1、在一些场景下，可能会比较慢。正常来说垃圾回收会比较平稳运行，但是当需要释放一个大的对象时，比如字典，需要对引用的所有对象循环嵌套调用，从而可能会花费比较长的时间。

2、循环引用。这将是引用计数的致命伤，引用计数对此是无解的，因此必须要使用其它的垃圾回收算法对其进行补充。

3、逻辑简单，但实现有些麻烦。每个对象需要分配单独的空间来统计引用计数，这无形中加大的空间的负担，并且需要对引用计数进行维护，在维护的时候很容易会出错。

标记清除解决循环引用

Python采用了**“标记-清除”(Mark and Sweep)**算法，解决容器对象可能产生的循环引用问题。(注意，只有容器对象才会产生循环引用的情况，比如列表、字典、用户自定义类的对象、元组等。而像数字，字符串这类简单类型不会出现循环引用。作为一种优化策略，对于只包含简单类型的元组也不在标记清除算法的考虑之列)

跟其名称一样，该算法在进行垃圾回收时分成了两步，分别是：

A）标记阶段，遍历所有的对象，如果是可达的（reachable），也就是还有对象引用它，那么就标记该对象为可达；
B）清除阶段，再次遍历对象，如果发现某个对象没有标记为可达，则就将其回收。

对象之间通过引用（指针）连在一起，构成一个有向图，对象构成这个有向图的节点，而引用关系构成这个有向图的边。从根对象（root object）出发，沿着有向边遍历对象，可达的（reachable）对象标记为活动对象，不可达的对象就是要被清除的非活动对象。根对象就是全局变量、调用栈、寄存器。

在上图中，我们把小黑圈视为全局变量，也就是把它作为root object，从小黑圈出发，对象1可直达，那么它将被标记，对象2、3可间接到达也会被标记，而4和5不可达，那么1、2、3就是活动对象，4和5是非活动对象会被GC回收。

总结

在python中维护了一个refchain的双向环状链表，这个链表中存储程序创建的所有对象，每种类型的对象中都有一个ob_refcnt引用计数器的值，引用个数+1、-1，最后当引用计数器变为0时会进行垃圾回收（对象销毁、refchain中移除）

但是，在python中对于那些可以有多个元素组成的对象可能存在循环引用的问题，为了解决这个问题python又引入了标记清除和分代回收，在其内部维护4个链表。

refchain
2代
1代
0代

在源码内部当达到各自的阈值时，就会触发扫描链表进行标记清除的动作（有循环各自-1）

但是，源码内部在上述的流程中提出了优化机制

python缓存

池

为了避免重复创建和销毁一些常见对象，维护池

# 启动解释器时，python内部帮我们创建：-5、-4......257
v1 = 7   # 内部不会开辟内存，直接去池中获取
v2 = 9   # 内部不会开辟内存，直接去池中获取
v3 = 9   # 内部不会开辟内存，直接去池中获取

v4 = 999
v5 = 999
v6 = 999
超过范围的会创建额外内存

free_list

当一个对象的引用计数器为0时，按理说应该回收，内部不会直接回收，而是将对象添加到free_list链表中当缓存。以后再创建对象时，不再重新开辟内存，而是直接使用free_list。

v1 = 3.14    # 开辟内存，内部存储结构体中定义那几个值，并存到refchain中

del v1       # refchain中移除，将对象添加到free_list中。

V9 = 999.9   # 不会重新开辟内存，去free_list中获取对象，对象内部数初始化，再放到refchain中。

原文链接：https://blog.csdn.net/xiongchengluo1129/article/details/80462651