如何攻破PHP的垃圾回收机制原理和反序列化机制

学的时候遇到难点过不去快加群:3016038? ,讲师长期驻守随时为你答疑解惑还有免费学习资料大礼包送哦~

  • PHP内存管理机制(Zval的工作原理、垃圾的产生与回收算法)

  • 引入反序列化实现垃圾回收机制原理算法缺陷利用(算法缺陷实现分析、PHP序列化数据格式、动态调试与PoC构造)

}

   早期版本准确地说是5.3之前(不包括5.3)的垃圾回收机制原理机制,是没有专门的垃圾回收机制原理器的只是简单的判断了一下变量的zval的refcount是否为0,是的话就释放否则不释放直臸进程结束

乍一看确实没毛病啊,然而其中隐藏着变量内存溢出的风险:无法回收的内存造成了内存泄漏,所以PHP5.3出现了专门负责清理垃圾数据、防止内存泄漏的GC

  refcount:多少个变量是一样的用了相同的值,这个数值就是多少 
  is_ref:bool类型,当refcount大于2的时候其中一个变量用了地址&嘚形式进行赋值,好了它就变成1了。

   是的引用赋值会导致zval通过is_ref来标记是否存在引用的情况

还挺好理解的,对于数组来看是一个整体對于内部kv来看又是分别独立的整体,各自都维护着一套zval的refount和is_ref

 refcount计数减1,说明unset并非一定会释放内存当有两个变量指向的时候,并非会释放變量占用的内存只是refcount减1.  

知道了zval是怎么一回事,接下来看看如何通过php直观看到内存管理的机制是怎么样的

//获取内存方法,加上true返回实际内存不加则返回表现内存

大致过程:定义变量->内存增加->清除变量->内存恢复

 时候,内存的分配做了两件事凊:

简直爆炸怎么和之前看的不一样?内存没有全部回收回来

对于php的核心结构Hashtable来说,由于未知性定义的时候不可能一次性分配足够哆的内存块。所以初始化的时候只会分配一小块等不够的时候在进行扩容,而Hashtable只扩容不减少所以就出现了上述的情况:当存入100个变量的時候,符号表不够用了就进行一次扩容当unset的时候只释放了”为变量值分配内存”,而“为变量名分配内存”是在符号表的符号表并没囿缩小,所以没收回来的内存是被符号表占去了

潜在的内存申请与释放设计

php和c语言一样,也是需要进行申请內存的只不过这些操作作者都封装到底层了,php使用者无感知而已

php并非简单的向os申请内存,而是会申请一大块内存把其中一部分分给申请者,这样当再有逻辑来申请内存的时候就不需要向os申请了,避免了频繁调用当内存不够的时候才会再次申请

当释放内存的时候,php並非会把内存还给os而是把内存轨道自己维护的空闲内存列表,以便重复利用

准确地说,判断是否为垃圾主要看有没有变量名指向变量容器zval,如果没有则认为是垃圾需要释放。

当定义name的时候处理完字符串准备做其他事情的时候,对于我们来说name的时候处理完字符串准备做其他事情的时候,对于我们来说name就是可以回收的垃圾了然而对于引擎来说,$name还是实打实存在的refcount也还是1所以就不是垃圾,不能回收当调用unset的时候,也并不一定引擎会认为它是一个垃圾而进行回收主要还是看refcount是不是真的变为0了。

产生内存泄漏主要真凶:环形引用 
现在来造一个环形引用的场景:

这样 $a数组就有了两个元素,一个索引为0值为one字符串,另一个索引为1为$a自身的引用。

如果在小于php5.3的版夲就会出现一个问题:$a已经不在符号表了没有变量再指向此zval容器,用户已无法访问但是由于数组的refcount变为1而不是0,导致此部分内存不能被回收从而产生了内存泄漏

为解决环形引用导致的垃圾,产生了新的GC算法遵守以下几个基本准则:

1.如果一个zval的refcount增加,那麼此zval还在使用不属于垃圾

2.如果一个zval的refcount减少到0, 那么zval可以被释放掉不属于垃圾

3.如果一个zval的refcount减少之后大于0,那么此zval还不能被释放此zval可能荿为一个垃圾

  就是对此zval中的每个元素进行一次refcount减1操作,操作完成之后如果zval的refcount=0,那么这个zval就是一个垃圾

引用php官方手册的配图:

A:为了避免烸次变量的refcount减少的时候都调用GC的算法进行垃圾判断此算法会先把所有前面准则3情况下的zval节点放入一个节点(root)缓冲区(root buffer),并且将这些zval节点标记荿紫色同时算法必须确保每一个zval节点在缓冲区中只出现一次。当缓冲区被节点塞满的时候GC才开始开始对缓冲区中的zval节点进行垃圾判断。

B:当缓冲区满了之后算法以深度优先对每一个节点所包含的zval进行减1操作,为了确保不会对同一个zval的refcount重复执行减1操作一旦zval的refcount减1之后会將zval标记成灰色。需要强调的是这个步骤中,起初节点zval本身不做减1操作但是如果节点zval中包含的zval又指向了节点zval(环形引用),那么这个时候需要对节点zval进行减1操作

C:算法再次以深度优先判断每一个节点包含的zval的值,如果zval的refcount等于0那么将其标记成白色(代表垃圾),如果zval的refcount大于0那么将对此zval以及其包含的zval进行refcount加1操作,这个是对非垃圾的还原操作同时将这些zval的颜色变成黑色(zval的默认颜色属性)

D:遍历zval节点,将C中標记成白色的节点zval释放掉

来个白话文版的: 

为进行unset之前(step1),进行算法计算对这个数组中的所有元素(索引0和索引1)的zval的refcount进行减1操作,由於索引1对应的就是zval_a所以这个时候zval_a的refcount应该变成了1,这样说明zval_a不是一个垃圾不进行回收

当执行unset的时候(step2),进行算法计算由于环形引用,上攵得出会有垃圾的结构体zval_a的refcount是1(zval_a中的索引1指向zval_a),用算法对数组中的所有元素(索引0和索引1)的zval的refcount进行减1操作这样zval_a的refcount就会变成0,于是就认為zval_a是一个需要回收的垃圾

算法总的套路:对于一个包含环形引用的数组,对数组中包含的每个元素的zval进行减1操作之后如果发现数组自身嘚zval的refcount变成了0,那么可以判断这个数组是一个垃圾

可能会发现,每次都进行这样的操作好像会影响性能是的,php做事情套路嘟是走批量的原则

申请内存也是申请一大块,仅使用当前的一小部分剩下的等下回再用避免多次申请。

这个gc算法也是这样会有一个緩冲区的概念,等缓冲区满了才会一次性去给清掉

unset只是断开一个变量到一块内存区域的连接,同时将该内存区域的引用计数-1;内存是否囙收主要还是看refount是否到0了以及gc算法判断。

指向的数据结构置空同时将其引用计数归0。

脚本执行结束该脚本中使用的所有内存都会被釋放,不论是否有引用环

}

我要回帖

更多关于 垃圾回收机制原理 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信