特殊工具与技术
--优化内存分配
引言:
C++的内存分配是一种类型化操作:new为特定类型分配内存,并在新分配的内存中构造该类型的一个对象。new表达式自动运行合适的构造函数来初始化每个动态分配的类类型对象。
new基于每个对象分配内存的事实可能会对某些类强加不可接受的运行时开销,这样的类可能需要使用用户级的类类型对象分配能够更快一些。这样的类使用的通用策略是,预先分配用于创建新对象的内存,需要时在预先分配的内存中构造每个新对象。
另外一些类希望按最小尺寸为自己的数据成员分配需要的内存。例如,标准库中的 vector类预先分配额外内存以保存加入的附加元素,将新元素加入到这个保留容量中。将元素保持在连续内存中的时候,预先分配的元素使vector能够高效地加入元素。
在每种情况下(预先分配内存以保存用户级对象或者保存类的内部数据)都需要将内存分配与对象构造分离开。将内存分配与对象构造分离开的明显的理由是,在预先分配的内存中构造对象很浪费,可能会创建从不使用的对象。当实际使用预先分配的对象的时候,被使用的对象必须重新赋以新值。更微妙的是,如果预先分配的内存必须被构造,某些类就不能使用它。例如,考虑vector,它使用了预先分配策略。如果必须构造预先分配的内存中的对象,就不能有基类型为没有默认构造函数的vector――vector没有办法知道怎样构造这些对象。
【小心地雷】
本节提出的技术不保证使所有程序更快。即使它们确实能改善性能,也可能带来其他开销,如空间的使用或调试困难。最好将优化推迟到已知程序能够工作,并且运行时测试指出改进内存分配将解决已知的性能问题的时候。
一、C++中的内存分配
C++中,内存分配和对象构造紧密纠缠,就像对象和内存回收一样。使用new 表达式的时候,分配内存,并在该内存中构造一个对象:使用delete表达式的时候,调用析构函数撤销对象,并将对象所用内存返还给系统。
接管内存分配时,必须处理这两个任务。分配原始内存时,必须在该内存中构造对象;在释放该内存之前,必须保证适当地撤销这些对象。
【小心地雷】
对未构造的内存中的对象进行赋值而不是初始化,其行为是未定义的。对许多类而言,这样做引起运行时崩溃。赋值涉及删除现存对象,如果没有现存对象,赋值操作符中的动作就会有灾难性效果。
C++提供以下两种方法分配和释放未构造的原始内存:
1)allocator类,它提供可感知类型的内存分配。这个类支持一个抽象接口,以分配内存并随后使用该内存保存对象。
2)标准库中的operatornew 和 operatordelete,它们分配和释放需要大小的原始的、未类型化的内存。
C++还提供不同的方法在原始内存中构造和撤销对象。
1)allocator类定义了名为construct和 destroy的成员,其操作正如它们的名字所指出的那样:construct成员在未构造内存中初始化对象,destroy 成员在对象上运行适当的析构函数。
2)定位new表达式接受指向未构造内存的指针,并在该空间中初始化一个对象或一个数组。
3)可以直接调用对象的析构函数来撤销对象。运行析构函数并不释放对象所在的内存。
4)算法uninitialized_fill和uninitialized_copy像 fill和 copy 算法一样执行,除了它们的在目的地构造对象而不是给对象赋值之外。
二、allocator类
allocator类是一个模板,它提供类型化的内存分配以及对象构造与撤销。
标准allocator类与定制算法 |
allocator
a;
|
定义名为a的allocator对象,可以用于分配内存或构造T类型的对象 |
a.allocate(n) |
分配内存:分配原始的未构造内存以保存T类型的n个对象 |
a.deallocate(p,n) |
释放内存:释放在名为p的T*指针中包含的地址处保存T类型的n个对象[原文Deallocatesmemory that held n objects of type T starting at addresscontained in the T* pointer named p]。运行调用deallocate之前在该内存中构造的任意对象的destroy是用户的责任 |
a.construct(p,t) |
在T*指针p所指内存中构造一个新元素。运行T类型的复制构造函数用t初始化该对象 |
a.destroy(p) |
运行T*指针p所指对象的析构函数 |
uninitialized_copy(b,e,b2) |
从迭代器b和e指出的输入范围将元素复制到从迭代器b2开始的未构造的原始内存中。该函数在目的地构造元素,而不是给它们赋值。假定由b2指出的目的地足以保存输入范围中元素的副本 |
uninitialized_fill(b,e,t) |
将由迭代器b和e指出的范围中的对象初始化为t的副本。假定该范围是未构造的原始内存。使用复制构造函数构造对象 |
uninitialized_fill_n(b,e,t,n) |
将由迭代器b和e指出的范围中至多n个对象初始化为t的副本。假定范围至少为n个元素大小。使用复制构造函数构造对象 |
allocator类将内存分配和对象构造分开。当allocator对象分配内存的时候,它分配适当大小并排列成保存给定类型对象的空间。但是,它分配的内存是未构造的,allocator的用户必须分别construct和 destroy放置在该内存中的对象。
1、使用allocator管理类成员数据
回忆:vector类将元素保存在连续的存储中。为了获得可接受的性能,vector 预先分配比所需元素更多的元素。每次将元素加到容器中时, vector成员检查是否有可用空间以容纳另一元素。如果有,该成员在预分配内存中下一可用位置初始化一个对象;如果没有自由元素,就重新分配vector: vector获取新的空间,将现在元素复制到空间,增加新元素,并释放旧空间。
vector所用存储开始是未构造内存,它还没有保存任何对象。将元素复制或增加到这个预分配空间的时候,必须使用allocator类的construct成员构造元素。
简易实现Vector类:
template
class Vector
{
public:
Vector():elements(0),first_free(0),end(0) {}
void push_back(const T &);
//...
private:
static std::allocator
alloc; void reallocate(); T *elements; T *first_free; T *end; //... };
每个Vector
类型定义一个allocator
类型的 static数据成员,
以便在给定类型的
Vector
中
分配
和
构造
元素。每个Vector对象在
指定类型的内置数组中保存其元素,并维持该数组的下列三个指针,如图:

1)elements,指向数组的第一个元素。
2)first_free,指向最后一个实际元素之后的那个元素。
3)end,指向数组本身之后的那个元素。
可以使用这些指针来确定Vector的大小和容量:
?Vecto