php内存管理垃圾回收 php的垃圾回收机制是怎样的

很多站长朋友们都不太清楚php内存管理垃圾回收，今天小编就来给大家整理php内存管理垃圾回收，希望对各位有所帮助，具体内容如下：

本文目录一览： 1、为什么很多人觉得学习PHP很简单？ 2、解析PHP中的内存管理,PHP动态分配和释放内存 3、 PHP的性能探讨和测试 4、 php 数组用完之后是否需要手动清理？ 5、 PHP命令执行PHP脚本，结束之前，内存会回收吗 6、 PHP中高级面试题 – 第二天为什么很多人觉得学习PHP很简单？

本身php的入门难度就不高，稍为认真学习一下，新手估计一两天就可能把语法函数等学个遍。但难就难在于php的精通很难，需要有若干项目的经验后，实战之后，才能对php有一个全新的理解，那才是phper的价值含金量所在。

1）内置API很完备

基本不要去找第三方库，这对初学者来说，方便很多，效率高很多，毕竟找个第三方库要熟悉、要研究，总归不放心，语言直接就有了，很多人都是直接google一下API然后拿来就用，我开始也是这样的。

Java ？我们一个项目有100多个第三方包。。。。。，而且这100多个第三方包还是从几百个包中挑出来的，可以脑补一下初学者自己去选第三方包！

2）编程简单

初学者拿个php写个面向过程的脚本，只需要查查API就可以了，30分钟搞定；能快速搞定一个事情，能让人产生成就感，这个非常重要；至于面向对象么，后面慢慢学也不迟呀。

C++和Java的面向对象对于初学者来说简直就是噩梦，对象都没有你跟我谈面向对象？

如果用C或者C++写面向过程呢？嗯，除非你写hello world，否则请先好好看看《UNIX环境高级编程》《Linux系统编程》。不懂操作系统，你就别想写C和C++程序，到一边写hello world或者冒泡链表这类简单和数据结构玩去吧：）

3）并发和内存管理简单

（注：以下经验来源于PHP 5.3，现在是不是这样不清楚）

并发：nginx + php-fpm，完美的解决了大部分的并发问题，程序员只要关注写业务逻辑即可，PHP中要用线程或者进程，要么是很特殊的情况，要么是闲的蛋疼；

Java 和 C++ ？写并发写的吐血，线程、锁、可见性、异步IO、Reactor模式......搞清楚这一堆你才能玩，一不小心出个问题都不知道怎么查。

内存管理：JVM的垃圾回收没问题一切都好，有问题定位和调优就蛋疼了，平均一年有3 ~ 5次搞这个，24G内存怎么dump？dump后怎么从生产服务器传到开发服务器？传下来后用MAT打开耗费3个小时怎么办？。。。。。。不要问我，我也不知道怎么办！

C和C++ ？碰上内存问题你就死菜了：1年都定位不出来，然后只能另外写个脚本定时每月重启，这样的事情我不会告诉你是在哪家公司遇到的，因为我怕被打！

而我们的PHP业务运行了3年，内存泄漏内存爆掉都发生过，很容易就定位出来了，但从来没有说要调优。

但写好PHP并不容易，事实上用PHP把业务写完很容易，但用PHP把业务写好的话，需要非常扎实的基本功，要求写代码的人逻辑非常严谨：

1）变量名本来是report，结果写成了reprot，运行OK，结果就是不对，面对一屏花花绿绿的代码，你要是能一眼看出那就是天才！

2）==和===，不说了，新手100%必中，高手80%踩中！

3）isset vs empty，和上一个类似

你以为这几个问题看起来都是小问题？图样图森破，这些问题原理很简单，但是导致的业务问题就千奇百怪了：有的用户正确有的用户不正确，有的用户早上正确但下午不正确，有的用户用 Chrome正确但用Firefox就不正确！

定位出来问题后，要么你想打自己三个耳光，要么你想打写代码的三个耳光！所以我认为PHP是最快上手的语言，但PHP同时也是对严谨性要求很高的语言！

当然，对初学者来说，PHP确实是世界上最好的语言！

解析PHP中的内存管理,PHP动态分配和释放内存

本篇文章是对PHP中的内存管理 PHP动态分配和释放内存进行了详细的分析介绍需要的朋友参考下

摘要内存管理对于长期运行的程序例如服务器守护程序是相当重要的影响因此理解PHP是如何分配与释放内存的对于创建这类程序极为重要本文将重点探讨PHP的内存管理问题

一内存在PHP中填充一个字符串变量相当简单这只需要一个语句"＜?php $str = hello world ; ?＞"即可并且该字符串能够被自由地修改拷贝和移动而在C语言中尽管你能够编写例如"char *str = "hello world ";"这样的一个简单的静态字符串但是却不能修改该字符串因为它生存于程序空间内为了创建一个可操纵的字符串你必须分配一个内存块并且通过一个函数（例如strdup()）来复制其内容

复制代码代码如下: { char *str; str = strdup("hello world"); if (!str) { fprintf(stderr "Unable to allocate memory!"); } }

由于后面我们将分析的各种原因传统型内存管理函数（例如malloc() free() strdup() realloc() calloc() 等等）几乎都不能直接为PHP源代码所使用

二释放内存在几乎所有的平台上内存管理都是通过一种请求和释放模式实现的首先一个应用程序请求它下面的层(通常指"操作系统") "我想使用一些内存空间" 如果存在可用的空间操作系统就会把它提供给该程序并且打上一个标记以便不会再把这部分内存分配给其它程序当应用程序使用完这部分内存它应该被返回到OS 这样以来它就能够被继续分配给其它程序如果该程序不返回这部分内存那么OS无法知道是否这块内存不再使用并进而再分配给另一个进程如果一个内存块没有释放并且所有者应用程序丢失了它那么我们就说此应用程序"存在漏洞" 因为这部分内存无法再为其它程序可用在一个典型的客户端应用程序中较小的不太经常的内存泄漏有时能够为OS所"容忍" 因为在这个进程稍后结束时该泄漏内存会被隐式返回到OS 这并没有什么因为OS知道它把该内存分配给了哪个程序并且它能够确信当该程序终止时不再需要该内存而对于长时间运行的服务器守护程序包括象Apache这样的web服务器和扩展php模块来说进程往往被设计为相当长时间一直运行因为OS不能清理内存使用所以任何程序的泄漏无论是多么小都将导致重复操作并最终耗尽所有的系统资源现在我们不妨考虑用户空间内的stristr()函数为了使用大小写不敏感的搜索来查找一个字符串它实际上创建了两个串的各自的一个小型副本然后执行一个更传统型的大小写敏感的搜索来查找相对的偏移量然而在定位该字符串的偏移量之后它不再使用这些小写版本的字符串如果它不释放这些副本那么每一个使用stristr()的脚本在每次调用它时都将泄漏一些内存最后 web服务器进程将拥有所有的系统内存但却不能够使用它你可以理直气壮地说理想的解决方案就是编写良好干净的一致的代码这当然不错但是在一个象PHP解释器这样的环境中这种观点仅对了一半

三错误处理为了实现"跳出"对用户空间脚本及其依赖的扩展函数的一个活动请求需要使用一种方法来完全"跳出"一个活动请求这是在Zend引擎内实现的在一个请求的开始设置一个"跳出"地址然后在任何die()或exit()调用或在遇到任何关键错误(E_ERROR)时执行一个longjmp()以跳转到该"跳出"地址尽管这个"跳出"进程能够简化程序执行的流程但是在绝大多数情况下这会意味着将会跳过资源清除代码部分(例如free()调用)并最终导致出现内存漏洞现在让我们来考虑下面这个简化版本的处理函数调用的引擎代码

复制代码代码如下: void call_function(const char *fname int fname_len TSRMLS_DC){ zend_function *fe; char *lcase_fname; /* PHP函数名是大小写不敏感的 *为了简化在函数表中对它们的定位 *所有函数名都隐含地翻译为小写的 */ lcase_fname = estrndup(fname fname_len); zend_str_tolower(lcase_fname fname_len); if (zend_hash_find(EG(function_table) lcase_fname fname_len + (void **)fe) == FAILURE) { zend_execute(fe ＞op_array TSRMLS_CC); } else { php_error_docref(NULL TSRMLS_CC E_ERROR "Call to undefined function: %s()" fname); } efree(lcase_fname); }

当执行到php_error_docref()这一行时内部错误处理器就会明白该错误级别是critical 并相应地调用longjmp()来中断当前程序流程并离开call_function()函数甚至根本不会执行到efree(lcase_fname)这一行你可能想把efree()代码行移动到zend_error()代码行的上面但是调用这个call_function()例程的代码行会怎么样呢？fname本身很可能就是一个分配的字符串并且在它被错误消息处理使用完之前你根本不能释放它注意这个php_error_docref()函数是trigger_error()函数的一个内部等价实现它的第一个参数是一个将被添加到docref的可选的文档引用第三个参数可以是任何我们熟悉的E_*家族常量用于指示错误的严重程度第四个参数（最后一个）遵循printf()风格的格式化和变量参数列表式样四 Zend内存管理器在上面的"跳出"请求期间解决内存泄漏的方案之一是使用Zend内存管理(ZendMM)层引擎的这一部分非常类似于操作系统的内存管理行为分配内存给调用程序区别在于它处于进程空间中非常低的位置而且是"请求感知"的这样以来当一个请求结束时它能够执行与OS在一个进程终止时相同的行为也就是说它会隐式地释放所有的为该请求所占用的内存图展示了ZendMM与OS以及PHP进程之间的关系图 Zend内存管理器代替系统调用来实现针对每一种请求的内存分配除了提供隐式内存清除功能之外 ZendMM还能够根据php ini中memory_limit的设置控制每一种内存请求的用法如果一个脚本试图请求比系统中可用内存更多的内存或大于它每次应该请求的最大量那么 ZendMM将自动地发出一个E_ERROR消息并且启动相应的"跳出"进程这种方法的一个额外优点在于大多数内存分配调用的返回值并不需要检查因为如果失败的话将会导致立即跳转到引擎的退出部分把PHP内部代码和 OS的实际的内存管理层"钩"在一起的原理并不复杂所有内部分配的内存都要使用一组特定的可选函数实现例如 PHP代码不是使用malloc( ) 来分配一个字节内存块而是使用了emalloc( ) 除了实现实际的内存分配任务外 ZendMM还会使用相应的绑定请求类型来标志该内存块这样以来当一个请求"跳出"时 ZendMM可以隐式地释放它经常情况下内存一般都需要被分配比单个请求持续时间更长的一段时间这种类型的分配（因其在一次请求结束之后仍然存在而被称为"永久性分配"）可以使用传统型内存分配器来实现因为这些分配并不会添加ZendMM使用的那些额外的相应于每种请求的信息然而有时直到运行时刻才会确定是否一个特定的分配需要永久性分配因此ZendMM导出了一组帮助宏其行为类似于其它的内存分配函数但是使用最后一个额外参数来指示是否为永久性分配如果你确实想实现一个永久性分配那么这个参数应该被设置为在这种情况下请求是通过传统型malloc()分配器家族进行传递的然而如果运行时刻逻辑认为这个块不需要永久性分配那么这个参数可以被设置为零并且调用将会被调整到针对每种请求的内存分配器函数例如 pemalloc(buffer_len )将映射到malloc(buffer_len) 而pemalloc(buffer_len )将被使用下列语句映射到emalloc(buffer_len) #define in Zend/zend_alloc h: #define pemalloc(size persistent) ((persistent)?malloc(size): emalloc(size)) 所有这些在ZendMM中提供的分配器函数都能够从下表中找到其更传统的对应实现表格展示了ZendMM支持下的每一个分配器函数以及它们的e/pe对应实现表格传统型相对于PHP特定的分配器

分配器函数 e/pe对应实现 void *malloc(size_t count); void *emalloc(size_t count);void *pemalloc(size_t count char persistent); void *calloc(size_t count); void *ecalloc(size_t count);void *pecalloc(size_t count char persistent); void *realloc(void *ptr size_t count); void *erealloc(void *ptr size_t count); void *perealloc(void *ptr size_t count char persistent); void *strdup(void *ptr); void *estrdup(void *ptr);void *pestrdup(void *ptr char persistent); void free(void *ptr); void efree(void *ptr); void pefree(void *ptr char persistent);

你可能会注意到即使是pefree()函数也要求使用永久性标志这是因为在调用pefree()时它实际上并不知道是否ptr是一种永久性分配针对一个非永久性分配调用free()能够导致双倍的空间释放而针对一种永久性分配调用efree()有可能会导致一个段错误因为内存管理器会试图查找并不存在的管理信息因此你的代码需要记住它分配的数据结构是否是永久性的除了分配器函数核心部分外还存在其它一些非常方便的ZendMM特定的函数例如 void *estrndup(void *ptr int len); 该函数能够分配len+ 个字节的内存并且从ptr处复制len个字节到最新分配的块这个estrndup()函数的行为可以大致描述如下

复制代码代码如下: void *estrndup(void *ptr int len) { char *dst = emalloc(len + ); memcpy(dst ptr len); dst[len] = ; return dst; }

在此被隐式放置在缓冲区最后的NULL字节可以确保任何使用estrndup()实现字符串复制操作的函数都不需要担心会把结果缓冲区传递给一个例如 printf()这样的希望以为NULL为结束符的函数当使用estrndup()来复制非字符串数据时最后一个字节实质上都浪费了但其中的利明显大于弊 void *safe_emalloc(size_t size size_t count size_t addtl); void *safe_pemalloc(size_t size size_t count size_t addtl char persistent); 这些函数分配的内存空间最终大小是((size*count)+addtl) 你可以会问 "为什么还要提供额外函数呢？为什么不使用一个 emalloc/pemalloc呢？"原因很简单为了安全尽管有时候可能性相当小但是正是这一"可能性相当小"的结果导致宿主平台的内存溢出这可能会导致分配负数个数的字节空间或更有甚者会导致分配一个小于调用程序要求大小的字节空间而safe_emalloc()能够避免这种类型的陷井通过检查整数溢出并且在发生这样的溢出时显式地预以结束注意并不是所有的内存分配例程都有一个相应的p*对等实现例如不存在pestrndup() 并且在PHP 版本前也不存在safe_pemalloc()

五引用计数慎重的内存分配与释放对于PHP（它是一种多请求进程）的长期性能有极其重大的影响但是这还仅是问题的一半为了使一个每秒处理上千次点击的服务器高效地运行每一次请求都需要使用尽可能少的内存并且要尽可能减少不必要的数据复制操作请考虑下列PHP代码片断

复制代码代码如下: ＜?php $a = Hello World ; $b = $a; unset($a); ?＞

在第一次调用之后只有一个变量被创建并且一个字节的内存块指派给它以便存储字符串"Hello World" 还包括一个结尾处的NULL字符现在让我们来观察后面的两行 $b被置为与变量$a相同的值然后变量$a被释放如果PHP因每次变量赋值都要复制变量内容的话那么对于上例中要复制的字符串还需要复制额外的个字节并且在数据复制期间还要进行另外的处理器加载这一行为乍看起来有点荒谬因为当第三行代码出现时原始变量被释放从而使得整个数据复制显得完全不必要其实我们不妨再远一层考虑让我们设想当一个 MB大小的文件的内容被装载到两个变量中时会发生什么这将会占用 MB的空间此时已经足够了引擎会把那么多的时间和内存浪费在这样一种无用的努力上吗？你应该知道 PHP的设计者早已深谙此理记住在引擎中变量名和它们的值实际上是两个不同的概念值本身是一个无名的zval*存储体（在本例中是一个字符串值）它被通过zend_hash_add()赋给变量$a 如果两个变量名都指向同一个值会发生什么呢？

复制代码代码如下: { zval *helloval; MAKE_STD_ZVAL(helloval); ZVAL_STRING(helloval "Hello World" ); zend_hash_add(EG(active_symbol_table) "a" sizeof("a") helloval sizeof(zval*) NULL); zend_hash_add(EG(active_symbol_table) "b" sizeof("b") helloval sizeof(zval*) NULL); }

此时你可以实际地观察$a或$b 并且会看到它们都包含字符串"Hello World" 遗憾的是接下来你继续执行第三行代码"unset($a);" 此时 unset()并不知道$a变量指向的数据还被另一个变量所使用因此它只是盲目地释放掉该内存任何随后的对变量$b的存取都将被分析为已经释放的内存空间并因此导致引擎崩溃这个问题可以借助于 zval（它有好几种形式）的第四个成员refcount加以解决当一个变量被首次创建并赋值时它的refcount被初始化为因为它被假定仅由最初创建它时相应的变量所使用当你的代码片断开始把helloval赋给$b时它需要把refcount的值增加为这样以来现在该值被两个变量所引用

复制代码代码如下: { zval *helloval; MAKE_STD_ZVAL(helloval); ZVAL_STRING(helloval "Hello World" ); zend_hash_add(EG(active_symbol_table) "a" sizeof("a") helloval sizeof(zval*) NULL); ZVAL_ADDREF(helloval); zend_hash_add(EG(active_symbol_table) "b" sizeof("b") helloval sizeof(zval*) NULL); }

现在当unset()删除原变量的$a相应的副本时它就能够从refcount参数中看到还有另外其他人对该数据感兴趣因此它应该只是减少refcount的计数值然后不再管它

六写复制（Copy on Write）通过refcounting来节约内存的确是不错的主意但是当你仅想改变其中一个变量的值时情况会如何呢？为此请考虑下面的代码片断

复制代码代码如下: ＜?php $a = ; $b = $a; $b += ; ?＞

通过上面的逻辑流程你当然知道$a的值仍然等于而$b的值最后将是并且此时你还知道 Zend在尽力节省内存通过使$a和$b都引用相同的zval（见第二行代码）那么当执行到第三行并且必须改变$b变量的值时会发生什么情况呢？回答是 Zend要查看refcount的值并且确保在它的值大于时对之进行分离在Zend引擎中分离是破坏一个引用对的过程正好与你刚才看到的过程相反

复制代码代码如下: zval *get_var_and_separate(char *varname int varname_len TSRMLS_DC) { zval **varval *varcopy; if (zend_hash_find(EG(active_symbol_table) varname varname_len + (void**)varval) == FAILURE) { /* 变量根本并不存在失败而导致退出*/ return NULL; } if ((*varval) ＞refcount ＜ ) { /* varname是唯一的实际引用 *不需要进行分离 */ return *varval; } /* 否则再复制一份zval*的值*/ MAKE_STD_ZVAL(varcopy); varcopy = *varval; /* 复制任何在zval*内的已分配的结构*/ zval_copy_ctor(varcopy); /*删除旧版本的varname *这将减少该过程中varval的refcount的值 */ zend_hash_del(EG(active_symbol_table) varname varname_len + ); /*初始化新创建的值的引用计数并把它依附到 * varname变量 */ varcopy ＞refcount = ; varcopy ＞is_ref = ; zend_hash_add(EG(active_symbol_table) varname varname_len + varcopy sizeof(zval*) NULL); /*返回新的zval* */ return varcopy; }

现在既然引擎有一个仅为变量$b所拥有的zval*（引擎能知道这一点）所以它能够把这个值转换成一个long型值并根据脚本的请求给它增加

七写改变（change on write）引用计数概念的引入还导致了一个新的数据操作可能性其形式从用户空间脚本管理器看来与"引用"有一定关系请考虑下列的用户空间代码片断

复制代码代码如下: ＜?php $a = ; $b = $a; $b += ; ?＞

在上面的PHP代码中你能看出$a的值现在为尽管它一开始为并且从未(直接)发生变化之所以会发生这种情况是因为当引擎开始把$b的值增加时它注意到$b是一个对$a的引用并且认为"我可以改变该值而不必分离它因为我想使所有的引用变量都能看到这一改变" 但是引擎是如何知道的呢？很简单它只要查看一下zval结构的第四个和最后一个元素（is_ref）即可这是一个简单的开/关位它定义了该值是否实际上是一个用户空间风格引用集的一部分在前面的代码片断中当执行第一行时为$a创建的值得到一个refcount为还有一个is_ref值为因为它仅为一个变量($a)所拥有并且没有其它变量对它产生写引用改变在第二行这个值的refcount元素被增加为除了这次is_ref元素被置为之外（因为脚本中包含了一个""符号以指示是完全引用）最后在第三行引擎再一次取出与变量$b相关的值并且检查是否有必要进行分离这一次该值没有被分离因为前面没有包括一个检查下面是get_var_and_separate()函数中与refcount检查有关的部分代码

复制代码代码如下: if ((*varval) ＞is_ref || (*varval) ＞refcount ＜ ) { /* varname是唯一的实际引用 * 或者它是对其它变量的一个完全引用 *任何一种方式都没有进行分离 */ return *varval; }

这一次尽管refcount为却没有实现分离因为这个值是一个完全引用引擎能够自由地修改它而不必关心其它变量值的变化

八分离问题尽管已经存在上面讨论到的复制和引用技术但是还存在一些不能通过is_ref和refcount操作来解决的问题请考虑下面这个PHP代码块

复制代码代码如下: ＜?php $a = ; $b = $a; $c = $a; ?＞

在此你有一个需要与三个不同的变量相关联的值其中两个变量是使用了"change on write"完全引用方式而第三个变量处于一种可分离的"copy on write"（写复制）上下文中如果仅使用is_ref和refcount来描述这种关系有哪些值能够工作呢？回答是没有一个能工作在这种情况下这个值必须被复制到两个分离的zval*中尽管两者都包含完全相同的数据(见图 )

图引用时强制分离

同样下列代码块将引起相同的冲突并且强迫该值分离出一个副本(见图 )

图复制时强制分离

复制代码代码如下: ＜?php $a = ; $b = $a; $c = $a; ?＞ lishixinzhi/Article/program/PHP/201311/20951

PHP的性能探讨和测试

缘起

关于PHP 很多人的直观感觉是PHP是一种灵活的脚本语言库类丰富使用简单安全非常适合WEB开发但性能低下 PHP的性能是否真的就如同大家的感觉一样的差呢？本文就是围绕这么一个话题来进行探讨的从源码应用场景基准性能对比分析等几个方面深入分析PHP之性能问题并通过真实的数据来说话

从原理分析PHP性能

从原理分析PHP的性能主要从以下几个方面内存管理变量函数运行机制来进行分析

内存管理

类似Nginx的内存管理方式 PHP在内部也是基于内存池并且引入内存池的生命周期概念在内存池方面 PHP对PHP脚本和扩展的所有内存相关操作都进行了托管对大内存和小内存的管理采用了不同的实现方式和优化具体可以参考以下文档在内存分配和回收的生命周期内 PHP采用一次初始化申请+动态扩容+内存标识回收机制并且在每次请求结束后直接对内存池进行重新mask

变量

总所周知 PHP是一种弱变量类型的语言所以在PHP内部所有的PHP变量都对应成一种类型Zval 其中具体定义如下

图一PHP变量

在变量方面 PHP做了大量的优化工作比如说Reference counting和copy on writer机制这样能够保证内存使用上的优化并且减少内存拷贝次数（请参考）在数组方面 PHP内部采用高效的hashtable来实现

函数

在PHP内部所有的PHP函数都回转化成内部的一个函数指针比如说扩展中函数

ZEND_FUNCTION ( my_function );//类似function my_function(){}

在内部展开后就会是一个函数

void zif_my_function ( INTERNAL_FUNCTION_PARAMETERS );

void zif_my_function(

int ht

zval * return_value

zval * this_ptr

int return_value_used

zend_executor_globals * executor_globals

);

从这个角度来看 PHP函数在内部也是对应一个函数指针

运行机制

在话说PHP性能的时候很多人都会说“C/C++是编译型 JAVA是半编译型 PHP是解释型” 也就是说PHP是先动态解析再代码运行的所以从这个角度来看 PHP性能必然很差

的确从PHP脚本运行来输出的确是一个动态解析再代码运行的过程具体来说 PHP脚本的运行机制如下图所示

图二 PHP运行机制

PHP的运行阶段也分成三个阶段

Parse 语法分析阶段

Compile 编译产出opcode中间码

Execute 运行动态运行进行输出

所以说在PHP内部本身也是存在编译的过程并且据此产生了大量的opcode cache工具比如说apc eacc xcache等等这些opcode cache在生产环境基本上在标配基于opcode cache 能到做到“PHP脚本编译一次多次运行”的效果从这点上 PHP就和JAVA的半编译机制非常类似

所以从运行机制上来看 PHP的运行模式和JAVA是非常类似的都是先产生中间码然后运行在不同虚拟机上

动态运行

从上面的几个分析来看 PHP在内存管理变量函数运行机制等几个方面都做了大量的工作所以从原理来看 PHP 不应该存在性能问题性能至少也应该和Java 比较接近

这个时候就不得不谈PHP动态语言的特性所带来的性能问题了由于PHP是动态运行时所以所有的变量函数对象调用作用域实现等等都是在执行阶段中才确定的这个从根本上决定了PHP性能中很难改变的一些东西在C/C++等能够在静态编译阶段确定的变量函数在PHP中需要在动态运行中确定也就决定了PHP中间码不能直接运行而需要运行在Zend Engine上

说到PHP变量的具体实现又不得不说一个东西了 Hashtable Hashtable可以说在PHP灵魂之一在PHP内部广泛用到包含变量符号栈函数符号栈等等都是基于hashtable的

以PHP变量为例来说明下PHP的动态运行特点比如说代码

<?php

$var = “hello blog xiuwz ”;

该代码的执行结果就是在变量符号栈（是一个hashtable）中新增一个项

当要使用到该变量时候就去变量符合栈中去查找（也就是变量调用对出了一个hash查找的过程）

同样对于函数调用也基本上类似有一个函数符号栈（hashtable）

其实关于动态运行的变量查找特点在PHP的运行机制中也能看出一些 PHP代码通过解释编译后的流程下图

图 PHP运行实例

从上图可以看出 PHP代码在pile之后产出的了类符号表函数符号表和OPCODE 在真正执行的时候 zend Engine会根据op code去对应的符号表中进行查找处理

从某种程度上在这种问题的上很难找到解决方案因为这是由于PHP语言的动态特性所决定的但是在国内外也有不少的人在寻找解决方案因为通过这样能够从根本上完全的优化PHP 典型的列子有facebook的hiphop

结论

从上面分析来看在基础的内存管理变量函数运行机制方面 PHP本身并不会存在明显的性能差异但由于PHP的动态运行特性决定了 PHP和其他的编译型语言相比所有的变量查找函数运行等等都会多一些hash查找的CPU开销和额外的内存开销至于这种开销具体有多大可以通过后续的基准性能和对比分析得出

因此也可以大体看出PHP不太适合的一些场景大量计算性任务大数据量的运算内存要求很严格的应用场景如果要实现这些功能也建议通过扩展的方式实现然后再提供钩子函数给PHP调用这样可以减低内部计算的变量函数等系列开销

基准性能

对于PHP基准性能目前缺少标准的数据大多数同学都存在感性的认识有人认为 QPS就是PHP的极限了此外对于框架的性能和框架对性能的影响很没有响应的权威数字

本章节的目的是给出一个基准的参考性能指标通过数据给大家一个直观的了解

具体的基准性能有以下几个方面

裸PHP性能完成基本的功能

裸框架的性能只做最简单的路由分发只走通核心功能

标准模块的基准性能所谓标准模块的基准性能是指一个具有完整服务模块功能的基准性能

环境说明

测试环境

Uname aPnux db forum test db baidu _ # SMP Wed Aug : : CST x _ x _ x _ GNU/Pnux

Red Hat Enterprise Pnux AS release (Nahant Update )

Intel(R) Xeon(R) CPU E @ GHz

软件相关

Nginx nginx version: nginx/ built by gcc (Red Hat )

Php （采用php fpm）

PHP (cP) (built: Mar : : )

Zend Engine v Copyright (c) Zend Technologies

with eAccelerator v Copyright (c) eAccelerator by eAccelerator

bingo

PHP框架

其他说明

目标机器的部署方式 nginx >php fpm >php脚本

测试压力机器和目标机器独立部署

裸PHP性能

最简单的PHP脚本

<?php

require_once ‘ /actions/indexAction php’;

$objAction = new indexAction();

$objAction >init();

$objAction >execute();

Acitons/indexAction php里面的代码如下

<?php

class indexAction

{

pubPc function execute()

{

echo ‘hello world!’;

}

通过压力工具测试结果如下

裸PHP框架性能

为了和的对比基于bingo 框架实现了类似的功能代码如下

<?php

require_once ‘Bingo/Controller/Front php’;

$objFrontController = Bingo_Controller_Front::getInstance(array(

‘actionDir’ => ‘ /actions’

));

$objFrontController >dispatch();

压力测试结果如下

从该测试结果可以看出框架虽然有一定的消耗但对整体的性能来说影响是非常小的

标准PHP模块的基准性能

所谓标准PHP模块是指一个PHP模块所必须要具体的基本功能

路由分发

自动加载

LOG初始化Notice日志打印所以的UI请求都一条标准的日志

错误处理

时间校正

自动计算每个阶段耗时开销

编码识别编码转化

标准配置文件的解析和调用

采用bingo 的代码自动生成工具产生标准的测试PHP模块 test

测试结果如下

结论

从测试数据的结论来看 PHP本身的性能还是可以的基准性能完全能够达到几千甚至上W的QPS 至于为什么在大多数的PHP模块中表现不佳其实这个时候更应该去找出系统的瓶颈点而是简单的说OK PHP不行那我们换C来搞吧（下一个章节会通过一些例子来对比采用C来处理不见得有特别的优势）

通过基准数据可以得出以下几个具体的结论

PHP本身性能也很不错简单功能下能够达到 QPS 极限也能过W

PHP框架本身对性能影响非常有限尤其是在有一定业务逻辑和数据交互的情况下几乎可以忽略

一个标准的PHP模块基准性能能够达到 QPS（ cpu idle）

对比分析

lishixinzhi/Article/program/PHP/201311/21287

php 数组用完之后是否需要手动清理？

作为有良好书写规范的程序员来说是需要的，不过对于系统来说无所谓，内存现在大到可以乱放变量了，哈哈

PHP命令执行PHP脚本，结束之前，内存会回收吗

再详细说下问题：

unix下，用php命令来执行php脚本，在php结束之前，内存有没有机会被回收？新的GC算法有没有机会被调用？

出现这个问题，是因为线上有个离线数据导入脚本，需要把几千万行数据筛选入库，发现，在执行过程中，到达一定程度，就会抛出内存使用超过最大值。

1 Fatal error: Allowed memory size of 293601280 bytes exhausted

那第一想到的就是程序是不是有什么bug，造成内存超出，看了半天没有发现问题，于是，突然出现了这个疑问。那要解决这个疑问，最好的办法就去翻源码吧。

在之前我这么说：

都知道，PHP5.3有了新的垃圾回收机制：GC，它不是重点，不谈它的原理。

经过翻阅PHP源码，发现，调用这个的时机是在 main/main.c ::php_request_shutdown这个函数中，

12 /* 7. Shutdown scanner/executor/compiler and restore ini entries */ zend_deactivate(TSRMLS_C);

php_request_shutdown，通过名字就能看出，它是在php请求结束的时候执行的，在这里会执行 gc_collect_cycles 来清理内存。

其实这句话是没错，但它只针对于SAPI接口（之前我就错在这个地方。），在用PHP命令执行php脚本的时候，是不会执行这个php_request_shutdown的。

那回到最初的问题，过程中到底有没有执行GC呢？

为了更直观有效的知道答案，我选择了最BT，最暴力的方法，拦截gc_collect_cycles，输出error_log到文件，只要执行了，

那肯定会输出log来。

重新编译PHP后，果不其然，符合官方的说法，只要buckets满超过默认值1000，就会启动GC来清理没用的内存，防止内存泄露。

那问 “什么时间触发的GC呢？”，答 “buckets超过1000的时候啊”，这不屁话嘛，要的是真真正正的执行流程，so。。不断的debug,

不断的grep，不断的step，不断的C+T，终于搞清楚了。下面就来根据官方的说法详细谈谈，PHP到底是怎么触发的。

有一点要注意，PHP的命令入口和 sapi接口的入口是不同的，我就载在这个地方，以为都公用一个。

测试代码以官方文档为例：

1234567891011121314 <?phpclass Foo{ public $var = '3.1415962654';} for ( $i = 0; $i <= 1000000; $i++ ){ $a = new Foo; $a->self = $a;} echo memory_get_peak_usage(), "\n";?>

这样的代码，在PHP5.3之前，肯定会造成大量的内存泄露，不过，谁在开发时又能开发出这么变态的代码来？除非这个人很变态。^.*

那PHP的命令入口是什么？流程又是什么？

主要函数流程如下：

入口main函数（sapi/cli/php_cli.c） ==》php_execute_script(main/main.c)==>zend_execute_scripts(Zend/zend.c)==>execute(Zend/zend_vm_execute.h)

调用GC的地方在execute里。

简单描述下这个过程，

main 是入口，它的作用是根据我们传递的参数做不同的设置，最后会把我们的php脚本作为一个zend_file_handle指针传递给

php_execute_script函数，zend_file_handle其实就是把FILE*做了一下封装，保存了一些其他的文件信息。

php_execute_script会做一些文件检查工作，把php脚本加到哈希表included_files中。

php_execute_scripts 会执行 zend_compile_file函数来解释我们写的PHP代码，最后执行execute。

应该都知道 Zend把脚本解析完会生成op代码保存到哈希表：active_op_array中，execute会逐个执行每个op，

op基本上都对应一个ZEND_ASSIGN_*_HANDLER这样的一个宏，它就保存在active_op_array->opline->handlers中。

在进入到 execute之后：

首先初始化execute_data，它保存了很多重要信息，上下文信息，然后调用 ZEND_VM_SET_OPCODE宏，

把execute_data->opline的指针指向active_op_array->opline->handlers。

之后，execute会执行一个while循环，逐条执行opline：

123456789101112131415161718192021222324 while (1) { int ret;#ifdef ZEND_WIN32 if (EG(timed_out)) { zend_timeout(0); }#endif if ((ret = EX(opline)->handler(execute_data TSRMLS_CC)) > 0) { switch (ret) { case 1: EG(in_execution) = original_in_execution; return; case 2: op_array = EG(active_op_array); goto zend_vm_enter; case 3: execute_data = EG(current_execute_data); default: break; } } }

每个handlers都会执行一个宏：ZEND_VM_NEXT_OPCODE()，它意思就是跳到下一个Opline，这样就能逐条执行了。

最后跟踪上面的PHP代码会执行 ZEND_ASSIGN_SPEC_CV_VAR_HANDLER这个宏，它是干嘛的？他就是变量赋值

下面代码执行的操作：

1234 class A{ }$a=new A();

这里就会执行这个宏。

在这个宏里有段代码：

12345678910111213141516171819202122232425262728293031 static int ZEND_FASTCALL ZEND_ASSIGN_SPEC_CV_VAR_HANDLER(ZEND_OPCODE_HANDLER_ARGS){ zend_op *opline = EX(opline); zend_free_op free_op2; zval *value = _get_zval_ptr_var(opline->op2, EX(Ts), free_op2 TSRMLS_CC); zval **variable_ptr_ptr = _get_zval_ptr_ptr_cv(opline->op1, EX(Ts), BP_VAR_W TSRMLS_CC); if (IS_CV == IS_VAR !variable_ptr_ptr) { if (zend_assign_to_string_offset(EX_T(opline->op1.u.var), value, IS_VAR TSRMLS_CC)) { if (!RETURN_VALUE_UNUSED(opline->result)) { EX_T(opline->result.u.var).var.ptr_ptr = EX_T(opline->result.u.var).var.ptr; ALLOC_ZVAL(EX_T(opline->result.u.var).var.ptr); INIT_PZVAL(EX_T(opline->result.u.var).var.ptr); ZVAL_STRINGL(EX_T(opline->result.u.var).var.ptr, Z_STRVAL_P(EX_T(opline->op1.u.var).str_offset.str)+EX_T(opline->op1.u.var).str_offset.offset, 1, 1); } } else if (!RETURN_VALUE_UNUSED(opline->result)) { AI_SET_PTR(EX_T(opline->result.u.var).var, EG(uninitialized_zval_ptr)); PZVAL_LOCK(EG(uninitialized_zval_ptr)); } } else { value = zend_assign_to_variable(variable_ptr_ptr, value, 0 TSRMLS_CC); if (!RETURN_VALUE_UNUSED(opline->result)) { AI_SET_PTR(EX_T(opline->result.u.var).var, value); PZVAL_LOCK(value); } } /* zend_assign_to_variable() always takes care of op2, never free it! */ if (free_op2.var) {zval_ptr_dtor(free_op2.var);}; ZEND_VM_NEXT_OPCODE();}

free_op2.var保存的是 new A的对象.

free_op2.var这个是哪儿来的呢?

在整个execute期间,维持一个 execute_data结构,里面有个 Ts指针

1 union _temp_variable *Ts;

它用来保存一些临时的变量信息,比如 new A(),这个会保存到Ts链表里,

opline->op2.u.var这个里面保存了此临时变量所在的位置,然后Ts+这个值是一个zval*指针,它就保存了new A产生的对象.

在代码中

1 if (free_op2.var) {zval_ptr_dtor(free_op2.var);};

zval_ptr_dtor会根据free_op2.var的值执行到 Zend/zend_execute_API.c::_zval_ptr_dtor函数中,

1234567891011121314151617181920212223242526 ZEND_API void _zval_ptr_dtor(zval **zval_ptr ZEND_FILE_LINE_DC) /* {{{ */{ zval *zv = *zval_ptr; #if DEBUG_ZEND>=2 printf("Reducing refcount for %x (%x): %d->%d\n", *zval_ptr, zval_ptr, Z_REFCOUNT_PP(zval_ptr), Z_REFCOUNT_PP(zval_ptr) - 1);#endif Z_DELREF_P(zv); if (Z_REFCOUNT_P(zv) == 0) { TSRMLS_FETCH(); if (zv != EG(uninitialized_zval)) { GC_REMOVE_ZVAL_FROM_BUFFER(zv); zval_dtor(zv); efree_rel(zv); } } else { TSRMLS_FETCH(); if (Z_REFCOUNT_P(zv) == 1) { Z_UNSET_ISREF_P(zv); } GC_ZVAL_CHECK_POSSIBLE_ROOT(zv); }}

GC_ZVAL_CHECK_POSSIBLE_ROOT(zv);

它就是最终GC算法执行的地方.

gc_collect_cycles就在这个宏中执行了..

所以..

回到上面的问题,

php无论在SAPI接口或命令端,都会执行 GC算法来进行垃圾内存回收.

PHP中高级面试题 – 第二天

一、写一段代码判断单向链表中有没有形成环，如果形成环，请找出环的入口处，即 P 点

二、从扑克牌中随机抽出 5 张牌，判断是不是一个顺子，即这5张牌是连续的

这个问题有个关键点，扑克牌，1-13 不能再多了。这就很简单了。用PHP来做，定义一个数组分别存着1到13, 拿出一个，置空一个，最后看下这五个置空的是不是连续的。这种情况不考虑抽出的顺序。

三、说一下 PHP 的（内存）垃圾回收机制

每一个变量对应一个 zval 数据结构，在该结构内还有一个 val 结构体，该结构体内有一个引用计数（php7 而言，对于 php5，这个引用计数是保存在 zval 结构中的），标识该对象的引用数，当对象的引用计数为 0 时代表这个对象可被回收。

对象的 refcount 减少的时机：修改变量、函数返回（释放局部变量）、unset 变量

对于数组和对象而言，可能存在变量中的成员引用变量本身的情况，也就是循环引用，这样会造成这个变量永远不会被内存回收，而成为垃圾。

PHP 里对于这种情况给出了垃圾回收机制：如果数组、对象的引用计数减少而且不为零，则认为他们可能是垃圾，把他们放到垃圾收集器里。等垃圾收集器到了一定的数量之后，进行垃圾处理：对所有可能的垃圾 refcount 减 1，如果为 1，说明是垃圾，则进行内存回收；如果不为 1，说明还有其他变量在使用，refcount 重新加 1；这种对象复用以及垃圾回收机制在其他语言中也有体现：redis 中也使用了引用计数表示每个对象的引用数量。

四、简述一下PHP短信验证码如何防刷？

1、时间限制：60 秒后才能再次发送

从发送验证码开始，前端（客户端）会进行一个 60 秒的倒数，在这一分钟之内，用户是无法提交多次发送信息的请求的。这种方法虽然使用得比较普遍，但是却不是非常有用，技术稍微好点的人完全可以绕过这个限制，直接发送短信验证码。

2、手机号限制：同一个手机号，24 小时之内不能够超过 5 条

对使用同一个手机号码进行注册或者其他发送短信验证码的操作的时候，系统可以对这个手机号码进行限制，例如，24 小时只能发送 5 条短信验证码，超出限制则进行报错（如：系统繁忙，请稍后再试）。然而，这也只能够避免人工手动刷短信而已，对于批量使用不同手机号码来刷短信的机器，这种方法也是无可奈何的。

3、短信验证码限制：30 分钟之内发送同一个验证码

网上还有一种方法说：30 分钟之内，所有的请求，所发送的短信验证码都是同一个验证码。第一次请求短信接口，然后缓存短信验证码结果，30 分钟之内再次请求，则直接返回缓存的内容。对于这种方式，不是很清楚短信接口商会不会对发送缓存信息收取费用，如果有兴趣可以了解了解。

4、前后端校验：提交 Token 参数校验

这种方式比较少人说到，个人觉得可以这种方法值得一试。前端（客户端）在请求发送短信的时候，同时向服务端提交一个 Token 参数，服务端对这个 Token 参数进行校验，校验通过之后，再向请求发送短信的接口向用户手机发送短信。

5、唯一性限制：微信产品，限制同一个微信 ID 用户的请求数量

如果是微信的产品的话，可以通过微信 ID 来进行识别，然后对同一个微信 ID 的用户限制，24 小时之内最多只能够发送一定量的短信。

6、产品流程限制：分步骤进行

例如注册的短信验证码使用场景，我们将注册的步骤分成 2 步，用户在输入手机号码并设置了密码之后，下一步才进入验证码的验证步骤。

7、图形验证码限制：图形验证通过后再请求接口

用户输入图形验证码并通过之后，再请求短信接口获取验证码。为了有更好的用户体验，也可以设计成：一开始不需要输入图形验证码，在操作达到一定量之后，才需要输入图形验证码。具体情况请根据具体场景来进行设计。

8、IP 及 Cookie 限制：限制相同的 IP/Cookie 信息最大数量

使用 Cookie 或者 IP，能够简单识别同一个用户，然后对相同的用户进行限制（如：24 小时内最多只能够发送 20 条短信）。然而，Cookie 能够清理、IP 能够模拟，而且 IP 还会出现局域网相同 IP 的情况，因此，在使用此方法的时候，应该根据具体情况来思考。

9、短信预警机制，做好出问题之后的防护

以上的方法并不一定能够完全杜绝短信被刷，因此，我们也应该做好短信的预警机制，即当短信的使用量达到一定量之后，向管理员发送预警信息，管理员可以立刻对短信的接口情况进行监控和防护。

五、mySQL 里有 2000w 数据，redis 中只存 20w 的数据，如何保证 redis 中的数据都是热点数据

相关知识：redis 内存数据集大小上升到一定大小的时候，就会施行数据淘汰策略（回收策略）。redis 提供 6 种数据淘汰策略：

volatile-lru：从已设置过期时间的数据集（server.db [i].expires）中挑选最近最少使用的数据淘汰

volatile-ttl：从已设置过期时间的数据集（server.db [i].expires）中挑选将要过期的数据淘汰

volatile-random：从已设置过期时间的数据集（server.db [i].expires）中任意选择数据淘汰

allkeys-lru：从数据集（server.db [i].dict）中挑选最近最少使用的数据淘汰

allkeys-random：从数据集（server.db [i].dict）中任意选择数据淘汰

no-enviction（驱逐）：禁止驱逐数据

关于php内存管理垃圾回收的介绍到此就结束了，不知道本篇文章是否对您有帮助呢？如果你还想了解更多此类信息，记得收藏关注本站，我们会不定期更新哦。

声明：本文来自网络，不代表【好得很程序员自学网】立场，转载请注明出处：http://www.haodehen.cn/did255261

更新时间：2023-10-09 阅读：129次