A闪的 BLOG 技术与人文
本文主要讲述C++ new
关键字和operator new
, placement new
之间的种种关联,new
的底层实现,以及operator new
的重载和一些在内存池,STL中的应用。
A* a = new A;
关于这两者的关系,我找到一段比较经典的描述(来自于www.cplusplus.com 见参考文献:
operator new can be called explicitly as a regular function, but in C++, new is an operator with a very specific behavior: An expression with the new operator, first calls function operator new (i.e., this function) with the size of its type specifier as first argument, and if this is successful, it then automatically initializes or constructs the object (if needed). Finally, the expression evaluates as a pointer to the appropriate type.
比如我们写如下代码:
A* a = new A;
我们知道这里分为三步:1.分配内存,2.调用A()
构造对象,3. 返回分配指针。事实上,分配内存这一操作就是由operator new(size_t)
来完成的,如果类A重载了operator new
,那么将调用A::operator new(size_t )
,否则调用全局::operator new(size_t )
,后者由C++默认提供。因此前面的步骤也就是:
operator new (sizeof(A))
A:A()
这里再一次提出来是因为后面关于这两步会有一些变形,在关于placement new那里会讲到。先举个简单例子
//平台:Visual Stdio 2008
#include<iostream>
class A
{
public:
A()
{
std::cout<<"call A constructor"<<std::endl;
}
~A()
{
std::cout<<"call A destructor"<<std::endl;
}
}
int _tmain(int argc, _TCHAR* argv[])
{
A* a = new A;
delete a;
system("pause");
return 0;
}
下面我们跟踪一下A反汇编代码,由于Debug版本反汇编跳转太多,因此此处通过Release版本在 A* a = new A;
处设断点反汇编:
在Release版本中,构造函数和析构函数都是直接展开的。
A* a = new A;
01301022 push 1 ;不含数据成员的类占用一字节空间,此处压入sizeof(A)
01301024 call operator new (13013C2h) ;调用operator new(size_t size)
01301029 mov esi,eax ;返回值保存到esi
0130102B add esp,4 ;平衡栈
0130102E mov dword ptr [esp+8],esi ;
01301032 mov dword ptr [esp+14h],0
0130103A test esi,esi ;在operator new之后,检查其返回值,如果为空(分配失败),则不调用A()构造函数
0130103C je wmain+62h (1301062h) ;为空 跳过构造函数部分
0130103E mov eax,dword ptr [__imp_std::endl (1302038h)] ;构造函数内部,输出字符串
01301043 mov ecx,dword ptr [__imp_std::cout (1302050h)]
01301049 push eax
0130104A push offset string "call A constructor" (1302134h)
0130104F push ecx
01301050 call std::operator<<<std::char_traits<char> > (13011F0h)
01301055 add esp,8
01301058 mov ecx,eax
0130105A call dword ptr [__imp_std::basic_ostream<char,std::char_traits<char> >::operator<< (1302040h)]
01301060 jmp wmain+64h (1301064h) ;构造完成,跳过下一句
01301062 xor esi,esi ;将esi置空,这里的esi即为new A的返回值
01301064 mov dword ptr [esp+14h],0FFFFFFFFh
delete a;
0130106C test esi,esi ;检查a是否为空
0130106E je wmain+9Bh (130109Bh) ;如果为空,跳过析构函数和operator delete
01301070 mov edx,dword ptr [__imp_std::endl (1302038h)] ;析构函数 输出字符串
01301076 mov eax,dword ptr [__imp_std::cout (1302050h)]
0130107B push edx
0130107C push offset string "call A destructor" (1302148h)
01301081 push eax
01301082 call std::operator<<<std::char_traits<char> > (13011F0h)
01301087 add esp,8
0130108A mov ecx,eax
0130108C call dword ptr [__imp_std::basic_ostream<char,std::char_traits<char> >::operator<< (1302040h)]
01301092 push esi ;压入a
01301093 call operator delete (13013BCh) ;调用operator delete
01301098 add esp,4
通过反汇编可以确认 A* = new A
的三个步骤,delete a
类似
,包含了 ~A()
和 operator delete(a)
两个步骤。
operator new有三种形式
throwing (1)
void* operator new (std::size_t size) throw (std::bad_alloc);
nothrow (2)
void* operator new (std::size_t size, const std::nothrow_t& nothrow_value) throw();
placement (3)
void* operator new (std::size_t size, void* ptr) throw();
(1)(2)的区别仅是是否抛出异常,当分配失败时,前者会抛出bad_alloc
异常,后者返回null
,不会抛出异常。它们都分配一个固定大小的连续内存。
A* a = new A; //调用throwing(1)
A* a = new(std::nothrow) A; //调用nothrow(2)
(3)是placement new,它也是对operator new的一个重载,定义于#include <new>
中,它多接收一个ptr参数,但它只是简单地返回ptr。其在new.h下的源代码如下:
#ifndef __PLACEMENT_NEW_INLINE
#define __PLACEMENT_NEW_INLINE
inline void *__cdecl operator new(size_t, void *_P)
{return (_P); }
#if _MSC_VER >= 1200
inline void __cdecl operator delete(void *, void *)
{return; }
#endif
#endif
那么它究竟有什么用呢?事实上,它可以实现在ptr所指地址上构建一个对象(通过调用其构造函数),这在内存池技术上有广泛应用。 它的调用形式为:
new(p) A(); //也可用A(5)等有参构造函数
placement new本身只是返回指针p,new(p) A()
调用placement new之后,还会在p上调用A:A()
,这里的p可以是动态分配的内存,也可以是栈中缓冲,如char buf[100]; new(buf) A();
我们仍然可以通过一个例子来验证:
#include <iostream>
class A
{
public:
A()
{
std::cout<<"call A constructor"<<std::endl;
}
~A()
{
std::cout<<"call A destructor"<<std::endl;
}
};
int _tmain(int argc, _TCHAR* argv[])
{
A* p = (A*)::operator new(sizeof(A)); //分配
new(p) A(); //构造
p->~A(); //析构
::operator delete(p); //释放
system("pause");
return 0;
}
上面的代码将对象的分配,构造,析构和释放分离开来,这也是new和delete关键字两句就能完成的操作。 先直接运行可以看到程序输出:
call A constructor
call A destructor
再分别注释掉new(a) A();
和a->~A();
两句,可以看到对应的构造和析构函数将不会被调用。
然后查看反汇编:
//平台: Visual Studio 2008 Debug版
A* a = (A*)::operator new(sizeof(A)); //分配
00F9151D push 1
00F9151F call operator new (0F91208h) ;调用::operator new(size_t size)也就是throwing(1)版本
00F91524 add esp,4
00F91527 mov dword ptr [ebp-14h],eax ;返回地址放入[ebp-14h] 即为p
new(a) A(); //构造
00F9152A mov eax,dword ptr [ebp-14h]
00F9152D push eax
00F9152E push 1 ;压入p
00F91530 call operator new (0F91280h);调用operator new(size_t, void* p)即placement(3)版本 只是简单返回p
00F91535 add esp,8
00F91538 mov dword ptr [ebp-0E0h],eax ;将p放入[ebp-0E0h]
00F9153E mov dword ptr [ebp-4],0
00F91545 cmp dword ptr [ebp-0E0h],0 ;判断p是否为空
00F9154C je wmain+81h (0F91561h) ;如果为空 跳过构造函数
00F9154E mov ecx,dword ptr [ebp-0E0h] ;取出p到ecx
00F91554 call A::A (0F91285h) ;调用构造函数 根据_thiscall调用约定 this指针通过ecx寄存器传递
00F91559 mov dword ptr [ebp-0F4h],eax ;将返回值(this指针)放入[ebp-0F4h]中
00F9155F jmp wmain+8Bh (0F9156Bh) ;跳过下一句
00F91561 mov dword ptr [ebp-0F4h],0 ;将[ebp-0F4h]置空 当前面判断p为空时执行此语句
00F9156B mov ecx,dword ptr [ebp-0F4h] ;[ebp-0F4h]为最终构造完成后的this指针(或者为空) 放入ecx
00F91571 mov dword ptr [ebp-0ECh],ecx ;又将this放入[ebp-0ECh] 这些都是调试所用
00F91577 mov dword ptr [ebp-4],0FFFFFFFFh
a->~A(); //析构
00F9157E push 0
00F91580 mov ecx,dword ptr [ebp-14h] ;从[ebp-14h]中取出p
00F91583 call A::`scalar deleting destructor' (0F91041h) ;调用析构函数(跟踪进去比较复杂 如果在Release下,构造析构函数都是直接展开的)
::operator delete(a); //释放
00F91588 mov eax,dword ptr [ebp-14h] ;将p放入eax
00F9158B push eax ;压入p
00F9158C call operator delete (0F910B9h);调用operator delete(void* )
00F91591 add esp,4
从反汇编中可以看出,其实operator new调用了两次,只不过每一次调用不同的重载函数,并且placement new的主要作用只是将p放入ecx,并且调用其构造函数。
事实上,在指定地址上构造对象还有另一种方法,即手动调用构造函数:p->A::A();
这里要加上A::作用域,用p->A::A();
替换掉new(p) A();
仍然能达到同样的效果,反汇编:
A* a = (A*)::operator new(sizeof(A)); //分配
010614FE push 1
01061500 call operator new (1061208h)
01061505 add esp,4
01061508 mov dword ptr [a],eax
//new(a) A(); //构造
a->A::A();
0106150B mov ecx,dword ptr [a]
0106150E call operator new (1061285h)
a->~A(); //析构
01061513 push 0
01061515 mov ecx,dword ptr [a]
01061518 call A::`scalar deleting destructor' (1061041h)
::operator delete(a); //释放
0106151D mov eax,dword ptr [a]
01061520 push eax
01061521 call operator delete (10610B9h)
01061526 add esp,4
比之前的方法更加简洁高效(不需要调用placement new)。不知道手动调用构造函数是否有违C++标准或有什么隐晦,我在其他很多有名的内存池(包括SGI STL alloc)实现上看到都是用的placement new,而不是手动调用构造函数。
前面简单提到过A* p = new A;
所发生的事情:先调用operator new,如果类A重载了operator new,那么就使用该重载版本,否则使用全局版本::operatro new(size_t size)
。
上面提到的throwing(1)和nothrow(2)的operator new是可以被重载的,比如:
#include <iostream>
class A
{
public:
A()
{
std::cout<<"call A constructor"<<std::endl;
}
~A()
{
std::cout<<"call A destructor"<<std::endl;
}
void* operator new(size_t size)
{
std::cout<<"call A::operator new"<<std::endl;
return malloc(size);
}
void* operator new(size_t size, const std::nothrow_t& nothrow_value)
{
std::cout<<"call A::operator new nothrow"<<std::endl;
return malloc(size);
}
};
int _tmain(int argc, _TCHAR* argv[])
{
A* p1 = new A;
delete p1;
A* p2 = new(std::nothrow) A;
delete p2;
system("pause");
return 0;
}
运行结果:
call A::operator new
call A constructor
call A destructor
call A::operator new nothrow
call A constructor
call A destructor
如果类A中没有对operator new的重载,那么new A和new(std::nothrow) A;
都将会使用全局operator new(size_t size)
。可将A中两个operator new注释掉,并且在A外添加一个全局operator new重载:
void* ::operator new(size_t size)
{
std::cout<<"call global operator new"<<std::endl;
return malloc(size);
}
程序输出:
call global operator new
call A constructor
call A destructor
call global operator new
call A constructor
call A destructor
注意,这里的重载遵循作用域覆盖原则,即在里向外寻找operator new的重载时,只要找到operator new()函数就不再向外查找,如果参数符合则通过,如果参数不符合则报错,而不管全局是否还有相匹配的函数原型。比如如果这里只将A中operator new(size_t, const std::nothrow_t&)
删除掉,就会报错:
error C2660: “A::operator new
”: 函数不接受 2 个参数。
对operator new的重载还可以添加自定义参数,如在类A中添加
void* operator new(size_t size, int x, int y, int z)
{
std::cout<<"X="<<x<<" Y="<<y<<" Z="<<z<<std::endl;
return malloc(size);
}
这种重载看起来没有什么大作用,因为它operator new需要完成的任务只是分配内存,但是通过对这类重载的巧妙应用,可以让它在动态分配内存调试和检测中大展身手。这将在后面operator new重载运用技巧中展现。
至于placement new,它本身就是operator new的一个重载,不需也尽量不要对它进行改写,因为它一般是搭配 new(p) A();
工作的,它的职责只需简单返回指针。
1.operator new重载运用于调试:
前面提到如何operator new的重载是可以有自定义参数的,那么我们如何利用自定义参数获取更多的信息呢,这里一个很有用的做法就是给operator new添加两个参数:char* file, int line
,这两个参数记录new关键字的位置,然后再在new时将文件名和行号传入,这样我们就能在分配内存失败时给出提示:输出文件名和行号。
那么如何获取当前语句所在文件名和行号呢,windows提供两个宏:__FILE__
和__LINE__
。利用它们可以直接获取到文件名和行号,也就是 new(__FILE__, __LINE__)
由于这些都是不变的,因此可以再定义一个宏:#define new new(__FILE__, __LINE__)
。这样我们就只需要定义这个宏,然后重载operator new即可。
源代码如下,这里只是简单输出new的文件名和行号。
//A.h
class A
{
public:
A()
{
std::cout<<"call A constructor"<<std::endl;
}
~A()
{
std::cout<<"call A destructor"<<std::endl;
}
void* operator new(size_t size, const char* file, int line)
{
std::cout<<"call A::operator new on file:"<<file<<" line:"<<line<<std::endl;
return malloc(size);
return NULL;
}
};
//Test.cpp
#include <iostream>
#include "A.h"
#define new new(__FILE__, __LINE__)
int _tmain(int argc, _TCHAR* argv[])
{
A* p1 = new A;
delete p1;
system("pause");
return 0;
}
输出:
call A::operator new on file:d:\desktop\test\test.cpp line:8
call A constructor
call A destructor
注意:需要将类的声明实现与new的使用隔离开来。并且将类头文件放在宏定义之前。否则在类A中的operator new重载中的new会被宏替换,整个函数就变成了:void* operator new(__FILE__, __LINE__)(size_t size, char* file, int line)
,编译器自然会报错。
2.内存池优化
operator new的另一个大用处就是内存池优化,内存池的一个常见策略就是分配一次性分配一块大的内存作为内存池(buffer或pool),然后重复利用该内存块,每次分配都从内存池中取出,释放则将内存块放回内存池。在我们客户端调用的是new关键字,我们可以改写operator new函数,让它从内存池中取出(当内存池不够时,再从系统堆中一次性分配一块大的),至于构造和析构则在取出的内存上进行,然后再重载operator delete,它将内存块放回内存池。关于内存池和operator new在参考文献中有一篇很好的文章。这里就不累述了。
3.STL中的new
在SGI STL源码中,defalloc.h和stl_construct.h中提供了最简单的空间配置器(allocator)封装,见《STL源码剖析》P48。它将对象的空间分配和构造分离开来,虽然在defalloc.h中仅仅是对::operator new
和::operator delete
的一层封装,但是它仍然给STL容器提供了更加灵活的接口。SGI STL真正使用的并不是defalloc.h中的分配器,而是stl_alloc.h中的SGI精心打造的”双层级配置器”,它将内存池技术演绎得淋漓尽致,值得细细琢磨。顺便提一下,在stl_alloc.h中并没有使用::operator new/delete
而直接使用malloc和free。具体缘由均可参见《STL源码剖析》。
delete的使用基本和new一致,包括operator delete的重载方式这些都相似,只不过它的参数是void*
,返回值为void。但是有一点需要注意,operator delete的自定义参数重载并不能手动调用。比如
void* operator new(size_t size, int x)
{
cout<<" x = "<<x<<endl;
return malloc(size);
}
void operator delete(void* p, int x)
{
cout<<" x = "<<x<<endl;
free(p);
}
如下调用是无法通过的:
A* p = new(3) A;//ok
delete(3) p;//error C2541: “delete”: 不能删除不是指针的对象
那么重载operator delete有什么作用?如何调用?事实上以上自定义参数operator delete 只在一种情况下被调用:当new关键字抛出异常时。
可以这样理解,只有在new关键字中,编译器才知道你调用的operator new形式,然后它会调用对应的operator delete。一旦出了new关键字,编译器对于这块内存是如何分配的一无所知,因此它只会调用默认的operator delete,而至于为什么不能主动调用自定义delete(而只能老老实实delete p),这个就不知道了。
细心观察的话,上面operator new用于调试的例子代码中,由于我们没有给出operator new对应的operator delete。在VS2008下会有如下警告:
warning C4291: “void *A::operator new(size_t,const char *,int)”: 未找到匹配的删除运算符;如果初始化引发异常,则不会释放内存
1.set_new_handler
还有一些零散的东西没有介绍到,比如set_new_handler
可以在malloc(需要调用set_new_mode(1))
或operator new内存分配失败时指定一个入口函数new_handler
,这个函数完成自定义处理(继续尝试分配,抛出异常,或终止程序),如果new_handler
返回,那么系统将继续尝试分配内存,如果失败,将继续重复调用它,直到内存分配完毕或new_handler
不再返回(抛出异常,终止)。下面这段程序完成这个测试:
#include <iostream>
#include <new.h>// 使用_set_new_mode和set_new_handler
void nomem_handler()
{
std::cout<<"call nomem_handler"<<std::endl;
}
int main()
{
_set_new_mode(1); //使new_handler有效
set_new_handler(nomem_handler);//指定入口函数 函数原型void f();
std::cout<<"try to alloc 2GB memory...."<<std::endl;
char* a = (char*)malloc(2*1024*1024*1024);
if(a)
std::cout<<"ok...I got it"<<std::endl;
free(a);
system("pause");
}
程序运行后会一直输出call nomem_handler
因为函数里面只是简单输出,返回,系统尝试分配失败后,调用nomem_handler
函数,由于该函数并没有起到实际作用(让可分配内存增大),因此返回后系统再次尝试分配失败,再调用nomem_handler
,循环下去。
在SGI STL中的也有个仿new_handler
函数:oom_malloc
2.new分配数组
new[]和new类似,仍然会优先调用类中重载的operator new[]。另外还要注意的是,在operator new[](size_t size)
中传入的并不是sizeof(A)*3
。而要在对象数组的大小上加上一个额外数据,用于编译器区分对象数组指针和对象指针以及对象数组大小。在VS2008(32 bit)下这个额外数据占4个字节,一个int大小。测试代码如下
//A.h
class A
{
public:
A()
{
std::cout<<"call A constructor"<<std::endl;
}
~A()
{
std::cout<<"call A destructor"<<std::endl;
}
void* operator new[](size_t size)
{
std::cout<<"call A::operator new[] size:"<<size<<std::endl;
return malloc(size);
}
void operator delete[](void* p)
{
std::cout<<"call A::operator delete[]"<<std::endl;
free(p);
}
void operator delete(void* p)
{
free(p);
}
};
//Test.cpp
#include <iostream>
#include "A.h"
void* operator new[](size_t size)
{
std::cout<<"call global new[] size: "<<size<<std::endl;
return malloc(size);
}
void operator delete[](void* p)
{
std::cout<<"call global delete[] "<<std::endl;
}
int _tmain(int argc, _TCHAR* argv[])
{
std::cout<<"sizeof A "<<sizeof(A)<<std::endl;
A* p1 = new A[3];
delete []p1;
system("pause");
return 0;
}
输出:
sizeof A 1
call global new[] size: 7
call A constructor
call A constructor
call A constructor
call A destructor
call A destructor
call A destructor
call A::operator delete[]
简单跟踪了一下,operator new[]返回的是0x005b668 而最后new关键字返回给p的是0x005b66c。也就是说p就是数组的起始地址,这样程序看到的内存就是线性的,不包括前面的额外数据。
在内存中,可以看到前面的四个字节额外数据是0x00000003 也就是3,代表数组元素个数。后面三个cd是堆在Debug中的默认值(中文的cdcd就是”屯”,栈的初始值为cc,0xcccc中文”烫”)。再后面的0xfdfdfdfd应该是堆块的结束标志,前面我有博客专门跟踪过。
注:其实在malloc源码中也有内存池的运用,而且也比较复杂。最近在参考dlmalloc版本和STL空间适配器,真没有想到一个内存分配能涉及这么多的东西。