一个例子:

1
2
3
4
<?php
$foo = 1;
$bar = $foo;
echo $foo + $bar;

变量 $foo 赋值给变量 $bar,这两个变量具有相同的值,没有必要新申请内存空间,他们可以共享同一块内存。在很多场景下PHP 的 COW 对内存进行优化。比如:变量的多次赋值、函数参数传递,并在函数体内修改实参等。

什么是写时复制

1
2
3
4
<?php
   $var = "laruence";
   $var_dup = $var;
   $var = 1;

很明显在这段代码执行以后,$var_dup 的值应该还是”laruence”, 那么这又是怎么实现的呢?这就是 PHP 的 copy on write 机制:

PHP 在修改一个变量以前,会首先查看这个变量的 refcount,如果 refcount 大于1,PHP 就会执行一个分离的例程, 对于上面的代码,当执行到第三行的时候,PHP 发现 $var 指向的 zval 的 refcount 大于1,那么 PHP 就会复制一个新的 zval 出来,将原 zval 的 refcount 减 1,并修改 symbol_table,使得 $var 和 $var_dup 分离(Separation)。这个机制就是所谓的 copy on write(写时复制)。

写时复制应用场景

写时复制(Copy on Write,也缩写为COW)的应用场景非常多, 比如Linux中对进程复制中内存使用的优化,在各种编程语言中,如C++的STL等等中均有类似的应用。 COW是常用的优化手段,可以归类于:资源延迟分配。只有在真正需要使用资源时才占用资源, 写时复制通常能减少资源的占用。

一个证明 PHP COW 优化内存占用的例子:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
<?php
$j = 1;
var_dump(memory_get_usage());

$tipi = array_fill(0, 100000, 'php-internal');
var_dump(memory_get_usage());

$tipi_copy = $tipi;
var_dump(memory_get_usage());

foreach ($tipi_copy as $i) {
    $j += count($i);
}
var_dump(memory_get_usage());

运行结果:

$ php t . php int(630904) int(10479840) int(10479944) int(10480040)

内存并没有显著提高。

何为复制

多个相同值的变量共用同一块内存的确节省了内存空间,但变量的值是会发生变化的,如果在上面的例子中, 指向同一内存的值发生了变化(或者可能发生变化),就需要将变化的值“分离”出去,这个“分离”的操作, 就是“复制”。

在PHP中,Zend引擎为了区别同一个zval地址是否被多个变量共享,引入了ref_count和is_ref两个变量进行标识:

ref_countis_ref是定义于zval结构体中(见第一章第一小节)

is_ref标识是不是用户使用 & 的强制引用;

ref_count是引用计数,用于标识此zval被多少个变量引用,即COW的自动引用,为0时会被销毁;

关于这两个变量的更多内容,跳转阅读:第三章第六节:变量的赋值和销毁的实现。

注:由此可见, $a=$b; 与 $a=&$b; 在PHP对内存的使用上没有区别(值不变化时);

实现原理

相信大家也可以了解到PHP中COW的实现原理: PHP 中的 COW 基于引用计数**ref_count **和 **is_ref **实现, 多一个变量指针,就将 **ref_count **加 1, 反之减去 1,减到 0 就销毁; 同理,多一个强制引用 &,就将 **is_ref **加 1,反之减去 1。

完整内容请参见如下链接:

http://www.php-internals.com/book/?p=chapt06/06-06-copy-on-write