Skip to content

Latest commit

 

History

History
829 lines (586 loc) · 59.6 KB

EffectiveCpp.md

File metadata and controls

829 lines (586 loc) · 59.6 KB

Effective C++

Accustoming Yourself to C++

1. View C++ as a federation of languages

  • 将C++视为多种相关语言组成的联邦,在其某个次语言中,各种守则都倾向简单易懂并容易记住,然而当你从一个次语言转移到另一个次语言时,守则可能改变
    • C
    • Object-Oriented C++
    • Template C++
    • STL

2. Prefer consts, enums, and inlines to #defines

  • #define是预处理指令,而不是语言特性

  • 对于常量,最好使用const对象或者enum,而不是#define

  • 对于形似函数的宏,最好使用inline函数,而不是#define

3. Use const whenever possible

  • const可被施加于任何作用域内的对象、函数参数、函数返回类型、成员函数本体

  • 编译器强制执行bitwise constness,但不强制执行logical constness,可以考虑使用mutable关键字实现概念上的常量性

  • constnon-const成员函数有着实质等价的实现时,令non-const版本调用const版本可避免代码重复

4. Make sure that objects are initialized before they're used

  • 对象的成员变量初始化动作发生在进入构造函数本体之前,构造函数内的动作更准确的应该叫做赋值动作

  • class的构造函数最好使用成员初始化列表,成员变量总是以声明顺序初始化

  • 为内置型对象进行手工初始化,因为C++不保证初始化他们

  • 函数内的static对象被称为local static对象,其他static对象被称为non-local static对象

  • C++对于“定义于不同编译单元内的non-local static对象”的初始化顺序是未定义的

    • 因此常用手法是利用Singleton模式将non-local static对象替换为local static对象
    • 这个手法的基础在于:C++保证,函数内的local static对象会在“该函数被调用期间”“首次遇上该对象之定义式”时被初始化

Constructors, Destructors, and Assignment Operators

5. Know what functions C++ silently writes and calls

  • 编译器会为class生成default constructor、copy constructor、copy assignment operator、destructor,所有这些函数都是public且inline的

  • default构造函数和析构函数会调用base class和non-static成员变量的构造函数和析构函数

  • 编译器生成的析构函数是non-virtual的,除非这个class的base class自身声明有virtual析构函数

6. Explicitly disallow the use of compiler-generated functions you do not want

  • C++11中,可以使用=delete关键字显式禁用某个函数

  • C++98中,可以将某个函数声明为private且不实现

7. Declare destructors virtual in polymorphic base classes

  • 带多态性质的base class应该声明virtual析构函数,以确保其derived class的析构函数被调用

  • 如果一个class带有任何virtual函数,那么它应该有virtual析构函数

8. Prevent exceptions from leaving destructors

  • 析构函数不应该抛出异常,如果一个被析构函数调用的函数可能抛出异常,析构函数应捕捉任何异常,然后吞掉异常或者结束程序

9. Never call virtual functions during construction or destruction

  • derived class对象内的base class成分会在derived class自身的成分被构造之前先行构造妥当

    • 换句通俗的话说,在base class构造期间,virtual函数不是virtual的
    • 更根本的原因是,在derived class对象的base class构造期间,对象的类型是base class,而不是derived class
    • 不止virtual函数会被编译器解析至base class,其运行期类型信息也会把对象视为base class类型
  • 解决办法之一是,既然你无法使用virtual函数从base class向下调用,那就在构造期间令derived class将必要的构造信息向上传递至base class构造函数

10. Have assignment operators return a reference to *this

  • 赋值操作符应该返回一个指向自身的引用,以便于链式赋值

11. Handle assignment to self in operator=

  • 确保当对象自我赋值时operator=有良好行为,其中技术包括几种

    • 比较“来源对象”和“目标对象”的地址,如果相同则直接返回,但可能不具备异常安全性
    • 精心周到的语句顺序,例如先“记住”原有对象,然后“复制”新值,最后“销毁”原有对象
    • 利用copy-and-swap技术
  • 确定任何函数如果操作一个以上的对象,而其中多个对象是同一个对象时,其行为仍然正确

12. Copy all parts of an object

  • 任何时候为derived class对象撰写copying函数,都必须谨慎的将base class部分一并复制,你应该让derived class的copying函数调用相应的base class函数

    • 保证复制所有的local成员变量
    • 保证调用所有base class内适当的copying函数
  • 尽管copy构造函数和copy assignment操作符往往有着近似的实现本体,但你绝不应该令两者互相调用

    • 如果你想要消除两者之间重复的代码,建立一个新的成员函数给两者调用,通常是private函数且被命名为init

Resource Management

13. Use objects to manage resources

  • 为防止资源泄露,请使用RAII(Resource Acquisition Is Initialization)对象,它们在构造函数中获取资源并在析构函数中释放资源

  • 书中介绍可以考虑使用STL库提供的auto_ptr等智能指针来管理资源

    • 早期的C++中,auto_ptr是唯一的智能指针,但是它有着一些缺陷,例如不支持array、严格所有权的复制等
    • 注意其实C++11已经废弃了auto_ptr,建议使用unique_ptr或者shared_ptr,后者也增加了对array的支持

14. Think carefully about copying behavior in resource-managing classes

  • 通常的RAII class copying的行为包括以下几种

    • 禁止复制
    • 对底层资源使用“引用计数法”
    • 复制底层资源
    • 转移底层资源的所有权
  • 复制RAII对象必须一并复制它所管理的资源,所以资源的copying行为决定RAII对象的copying行为

15. Provide access to raw resources in resource-managing classes

  • APIs往往要求访问原始资源,因此每一个RAII class都应该提供一个取得其所管理资源的办法

  • 对原始资源的访问可能经由显示转换或隐式转换,一般而言显示转换更为安全,但隐式转换更为方便

16. Use the same form in corresponding uses of new and delete

  • 当你使用new关键字时,有两件事发生

    • 一是分配内存(通过名为operator new的函数)
    • 二是针对此内存会有一个或多个构造函数被调用
  • 当你使用delete关键字时,也有两件事发生

    • 一是有一个或多个析构函数被调用
    • 二是然后内存被释放(通过名为operator delete的函数)
  • 如果你在new表达式使用了[],那么你也应该在delete表达式使用[],反之亦然,不要混用

17. Store newed objects in smart pointers in standalone statements

  • 以独立语句将newed对象存储于智能指针中
    • 如果不这样做,一旦一个复杂的语句次序被重排,中间某一步的异常被抛出,有可能导致难以察觉的资源泄露

Designs and Declarations

18. Make interfaces easy to use correctly and hard to use incorrectly

  • 好的接口很容易被正确使用,不容易被错误使用
    • 促进正确使用的办法包括接口的一致性,以及于内置类型的行为兼容
    • 阻止错误使用的办法包括建立新类型、限制类型上的操作、束缚对象值以及消除用户的资源管理责任
    • tr1::shared_ptr支持定制型删除器,这也可防范“Cross-DLL problem”,可被用来自动解除互斥锁等

19. Treat class design as type design

  • 在你想设计一个优秀的class之前,你必须首先思考和回答以下问题

    • 新type的对象应该如何被创建和销毁?
      • 这将影响对象的构造函数、析构函数、内存分配函数、内存释放函数
    • 对象的初始化和赋值该有什么样的差别?
    • 新type对象如果被passed by value,意味着什么?
    • 什么是新type的合法值?
      • 对于class的成员变量来说,通常只有有限数据集是有效的
      • 你必须精心设计成员函数的约束条件检查工作,尤其是构造函数和赋值操作符等
    • 新的type需要配合某个继承图系(inheritance graph)吗?
      • 如果需要,你就会受到这些classes的设计约束,你的设计也会影响继承新type的classes
    • 新的type需要什么样的转换?
      • 如果你允许隐式转换,就必须设计相应的类型转换函数(operator T()
      • 如果你只允许显示转换,就必须设计专门负责执行转换的函数
    • 什么样的操作符和函数对新type而言时合理的?
    • 什么样的标准函数应该被驳回?
    • 谁该取用新type的成员?
    • 什么是新type的未声明接口(undeclared interface)?
    • 新type有多么一般化?
      • 或许你并非定义一个新type,而是定义一整个types家族
      • 若果真如此,则你应该考虑定义一个新的class template
    • 你真的需要一个新的type吗?
      • 是否单纯的定义多个non-member函数或template函数更能达到你的目标?
  • Class的设计就是type的设计,在你定义新的type之前,请确定你已经考虑过了上述所有问题

20. Prefer pass-by-reference-to-const to pass-by-value

  • pass-by-value的代价很高,因为它需要复制对象,并递归的复制对象的所有成员

  • pass-by-reference不仅效率更高,还可以避免slicing(对象切割)问题

    • 当一个derived class对象以by value方式传递并被当作base class对象时,base class的copy构造函数会被调用,这将导致derived class的特化性质全被切割掉
  • pass-by-reference本质是通过指针实现的,因此往往并不适用于内置类型、STL迭代器和函数对象

    • STL迭代器是一种泛型指针,行为与指针类似
    • 函数对象是一种仿函数,行为与函数类似,一般没有构造函数和析构函数

21. Don’t try to return a reference when you must return an object

  • 函数的返回值,绝对不要执行以下操作
    • 返回pointer或reference指向local stack对象
    • 返回reference指向heap-allocated对象
    • 返回pointer或reference指向local static对象,而有可能需要多个这样的对象

22. Declare data members private

  • 切记将成员变量声明为private
    • 赋予用户访问数据一致性
    • 可细微划分访问控制
    • 允诺约束条件获得保证
    • 为class作者提供充分的实现弹性

23. Prefer non-member non-friend functions to member functions

  • 让我们从封装开始讨论,首先,越多的东西被封装,越少人可以看到它,我们改变这些东西的能力就越大,改变时就能影响越少的用户

    • 现在考虑对象内的数据,越少代码可以看到数据,越多的数据被封装,我们就能越自由的改变对象数据,通过计算能够访问该数据的函数数量就能作为一种粗糙的量测,因此成员变量应该是private的,否则就有无限量的函数可以访问它们
    • 因此,现在让你在member函数和non-member函数之间做选择,两者提供完全相同的机能,那么导致较大封装性的毫无疑问是non-member non-friend函数,因为其并不增加“能够访问class内private成分”的函数数量
  • 在C++中,比较自然的做法是让该类函数成为non-member函数并位于相关联class所在的同一个namespace

    • 另一个优势是,将不同分类的便利函数放在多个头文件内但隶属于同一个命名空间,可以降低编译依存性,并且可以让用户自由选择需要的函数
  • 现在,你应该能够理解这种反直觉的行为,即宁可用non-member non-friend函数替换member函数,这样可以增加封装性、包裹弹性和机能扩充性

24. Declare non-member functions when type conversions should apply to all parameters

  • 假设现有一个class Number,该class允许“int-to-Number”隐式转换,你需要为其实现一个operator*操作

    • 此时你的直觉告诉你应该保持面向对象精神,将其实现为成员函数,写法为const Number operator* (const Number& rhs) const
      • 很快你就会发现,当你尝试混合式算术时只有一半行得通,即Number * 2行得通,但2 * Number却会出错,如果你以函数形式重写两式为Number.operator*(2)2.operator*(Number),问题一目了然
      • 结论是,只有当参数被列于参数列表内,这个参数才是隐式类型转换的合格参与者,而“被调用之成员函数所隶属的那个对象”,即this对象这个隐喻参数,绝不是隐式转换的合格参与者,这也解释了为什么2 * Number为什么会出错,此时你并不能指望编译器自动将数字隐式转换为Number,然后调用operator*成员函数
    • 最终,可行之道拨云见日,让operator*成为一个non-member函数,这允许编译器在每一个实参身上执行隐式转换,写法为const Number operator* (const Number& lhs, const Number& rhs)
  • 最后,请记住,如果你需要为某个函数的所有参数(包括被this指针所指的那个隐喻参数)进行类型转换,那么这个函数必须是个non-member函数

25. Consider support for a non-throwing swap

  • 通常针对对象的做法是将std::swap进行模板全特化(total template specialization)

    • 为了与STL容器保持一致,我们令对象实现一个名为swap的public成员函数,然后令特化版本的std::swap调用该成员函数
    • 通常我们不被允许改变std命名空间的任何东西,但可以为标准templates制造特化版本
  • 对于class templates而言,我们需要声明一个non-member swap模板函数,但是不能将其声明为std::swap的特化版本

    • 因为C++只允许对class templates偏特化(partial specialization),而不允许对function templates偏特化
    • 虽然我们声明的swap模板函数不在std空间内,但C++依据argument-dependent lookup规则,仍能调用我们所定义的专属版本
    • 需要注意的是,不要为调用添加额外修饰符,如std::swap(a, b),这将强迫编译器调用std内的swap函数(包括其任何模板特化)
  • 现在,让我们对整个形势进行总结

    • 首先如果std::swap的缺省实现能够满足你的需求,你不需要做任何额外的工作
    • 但是如果其效率不足(那几乎总是意味着你的class或template使用了某种pimpl(pointer to implementation)手法)
      • 提供一个public swap成员函数,实现高效的swap操作,但是不要让函数抛出异常
      • 在你的class或template所在命名空间提供一个non-member swap,令其调用上述public swap成员函数
      • 如果你正在编写一个class而非template,为你的class特化std::swap,令其调用public swap成员函数
      • 最后,如果你调用swap函数,请确定包含一个using声明,令std::swap在你的函数内部可见,然后不加任何修饰符地调用swap函数

Implementations

26. Postpone variable definitions as long as possible

  • 尽可能延后定义的真正意义是

    • 不仅应该延后变量的定义,直到非要使用变量的前一刻为止
    • 甚至应该尝试延后定义直到能够赋予其“具明显意义之初值”实参为止,这样能够避免构造和析构非必要对象
  • 然而对于循环,需要单独考虑两种情况

    • 对于将变量定义于循环外,成本为:一次构造、一次析构、n次赋值
    • 对于将变量定义于循环内,成本为:n次构造、n次析构
    • 因此如果对象的赋值成本低于一组构造和析构的成本,那么应该考虑将变量定义于循环外
    • 否则,应该将变量定义于循环内,这种做法也能够保证变量的作用域不会超出循环体

27. Minimize casting

  • C++提供四种新式转型

    • const_cast通常用来实现常量性移除
    • dynamic_cast通常用来执行安全向下转型,它是唯一无法由旧式语法执行的动作,但是可能消耗重大运行成本
    • reinterpret_cast意图执行低级转型,实际动作可能取决于编辑器,也表示其不可移植
    • static_cast用来执行强迫隐式转换
  • C++中单一对象在不同类型的情况下,可能拥有一个以上的地址

    • 例如以“Base*指向它”时的地址和以“Derived*指向它”时的地址,尤其是在使用多重继承时,这种情况尤为常见
    • 这意味着“由于知道对象如何布局”而设计的转型操作,在不同编译器上可能会有不同的结果
  • derived class重写base class的虚函数后,希望调用base class中对应虚函数的方法

    • 切勿以static_cast<Base>(*this).Func()的方式调用base class的虚函数
      • 此方法并非在当前对象身上调用base class的虚函数,而是在“当前对象之base class成分”的副本上调用的函数
    • 正确的方法是使用Base::Func(),明确的告诉编译器,我要调用的是base class的函数
  • dynamic_cast存在执行时较大的开销,有两个一般性的做法可以避免它

    • 其一,是使用容器并在其中存储直接指向derived class的指针,如果要处理多种类型,你可能需要多个容器
    • 其二,是设计通过base class中的接口处理“所有可能之派生类的行为”,这样就可以通过base class调用所有派生类的函数
  • 尽量避免转型,如果转型时必要的,试着将其隐藏于某个函数背后,用户不必将转型放进自己的代码中

  • 宁可使用C++的新式转型,而不是旧式转型,因为新式转型的行为更加明确,有着分门别类的职责

28. Avoid returning handles to object internals

  • 尽量避免返回handles(包括references、指针、迭代器)指向对象内部
    • 这样做可以增加封装性,帮助const成员函数实现其目标
    • 也可以避免对象被销毁时,handle指向的内存被释放,发生悬挂指针(dangling handles)问题

29. Strive for exception-safe code

  • 带有异常安全的函数会做到:不泄露任何资源、不允许数据败坏

  • 异常安全函数提供以下三个保证之一

    • 基本保证:如果异常被抛出,程序内的任何事物仍然保持在有效的状态下,然而程序的现实状态不可预料
    • 强烈保证:如果异常被抛出,程序状态不改变,函数成功就是完全成功,失败会回复到函数调用之前的状态
    • 不抛出保证:承诺绝不抛出异常,因为它们总是能够完成承诺的功能,其实更准确的说法是如果其抛出异常,将是严重错误
  • 强烈保证往往能够以copy-and-sweep来实现,但其强烈保证并非对所有函数都可实现或具备现实意义

  • 函数提供的异常安全保证通常最高只等于其所调用各个函数的异常安全保证中的最弱者

30. Understand the ins and outs of inlining

  • 不要过度热衷inline函数,因为其会造成代码膨胀,从而可能导致额外的换页行为,降低指令高速缓存的击中率

  • inline函数只是对编译器的建议,并非强制命令,大部分编译器拒绝将太过复杂的函数inlining,而所有对virtual函数的调用(除非是最平淡无奇的)也都会使inlining落空,因为virtual意味着直到运行期才能确定调用哪个函数,而inline意味着执行前先将调用动作替换为被调用函数的本体

    • 隐喻声明inline函数的方式是将其定于于class的定义式内,明确的inline函数的方式是在函数定义式前加上inline关键字
    • 有时候编译器虽有意愿inlining某个函数,还是可能为函数生成一个本体,例如程序要获得某个inline函数的地址,编译器通常必须为此函数生成一个函数本体
  • 值得注意的是,inline函数和template函数通常都被定义于头文件中,但是template函数并非一定是inline的

    • inline函数通常一定被置于头文件内,因为大多数编译器为了将“函数调用”替换为“被调用函数本体”,必须知道函数定义式,因此inlining大多是编译期行为
    • template通常也被置于头文件内,因为它一旦被使用,编译器为了将其具现化,同样必须知道函数定义式
    • 但是template的具现化与inlining无关,如果你认为某个template函数应该被inlining,请明确的将其声明为inline
  • 构造函数和析构函数通常是inline的糟糕候选人,因为编译器可能以精致复杂的代码来实现对象创造和销毁时的各种保证,而这些代码可能就放在你的构造函数和析构函数中

31. Minimize compilation dependencies between files

  • 编译器依存性最小化的本质正是在于“声明的依存性”替换“定义的依存性”,尽量让头文件自我满足,如果做不到则让它与其他文件内的声明式(而非定义式)相依赖

  • 如果使用object references或object pointers可以完成任务,就不要使用objects

    • 你可以只靠一个类型声明式就定义出指向该类型的references和pointers,但如果定义了某类型的objects,就必须用到该类型的定义式
  • 如果能够,尽量以class声明式替换class定义式

    • 注意,当声明一个函数而它用到某个class时,并不需要该class的定义,纵使函数以by value方式传递类型的参数(或返回值)
    • 或许你会惊讶为何不需要知道定义细节,但事实是,一旦任何人调用这些函数,调用之前class的定义式就必须先曝光才行
  • 为声明式和定义式提供不同的头文件

    • 这两个文件必须总是保持一致性,而程序库的用户总是应该include那个声明式的头文件而非前置声明若干函数
    • 只含声明式的头文件命名方式参考C++标准程序库头文件<iosfwd>,其包含iostream各组件的声明式
  • 通常利用Handle classes和Interface classes解除接口和实现之间的耦合关系,从而降低文件间的编译依存性

    • 代价是运行期丧失若干速度,又为每个对象超额付出若干内存
    • 对于Handle classes,成员函数必须通过implementation pointer取得对象数据,且必须初始化并指向动态分配而来的object
    • 对于Interface classes,由于每个函数都是virtual,所以每次函数调用必须付出间接跳跃的开销,且派生对象必须包含一个vptr(virtual pointer table)

Inheritance and Object-Oriented Design

32. Make sure public inheritance models "is-a"

  • public继承意味is-a关系,适用于base class身上的每一件事情一定也适用于derived class,因为每一个derived class对象也都是一个base class对象

33. Avoid hiding inherited names

  • derived class内的名称会遮掩base class内的名称,在public继承下从来没有人希望如此

  • 为了让被遮掩的名称再见天日,可使用using声明式或forwarding function

    • using声明式的语法是using base::func;,其作用是让base class内所有名为的func的函数在derived class作用域内可见并且public
    • forwarding function的语法是type func(parameter list) { return base::func(parameter list); },现在只有某个对应参数版本的func函数在derived class中才可见

34. Differentiate between inheritance of interface and inheritance of implementation

  • 接口继承和实现继承不同,在public继承下,derived class总是继承base class的接口

  • pure virtual函数只具体指定接口继承,impure virtual函数具体指定接口继承及其缺省实现继承

  • non-virtual函数具体指定接口继承及其强制性实现继承

35. Consider alternatives to virtual functions

  • 不妨考虑virtual函数的替代方案

    • 使用non-virtual interface(NVI)手法,这是Template Method设计模式的一种特殊形式,它以public non-virtual成员函数包裹较低访问性(private或protected)的virtual函数
    • 将virtual函数替换为函数指针成员变量,这是Strategy设计模式的一种分解表现形式
    • 将继承体系内的virtual函数替换为另一个继承体系内的virtual函数,这是Strategy设计模式的传统实现手法
  • 将机能从成员函数移到class外部函数,带来的缺点是,非成员函数将无法访问class的non-public成员

36. Never redefine an inherited non-virtual function

  • non-virtual函数是静态绑定(statically bound),而virtual函数是动态绑定(dynamically bound)

37. Never redefine a function's inherited default parameter value

  • virtual函数是动态绑定(dynamically bound),而缺省参数值却是静态绑定(statically bound)

    • 静态绑定又名前期绑定,动态绑定又名后期绑定
    • 对象的静态类型(static type)是其在程序中被声明时所采用的类型
      • Shape* ps = new Circle;ps的静态类型是Shape*
    • 而对象的动态类型(dynamic type)则是指目前所指向对象的实际类型,也就是说动态类型可以表现出一个对象实际将会有什么行为,动态类型可在程序执行过程中改变(通常是经由赋值操作)
      • Shape* ps = new Circle;ps的动态类型是Circle*
  • 至于C++为何会以这种方式运作,答案在于运行期效率,如果缺省参数值是动态绑定的,编译器就必须有某种方法在运行期为virtual函数决定适当的参数缺省值

  • 合适的做法是考虑virtual函数的替代设计,其中之一便是non-virtual interface(NVI)手法,令base class内的一个public non-virtual函数调用private virtual函数,后者可被derived class重新定义

38. Model "has-a" or "is-implemented-in-terms-of" through composition

  • 复合(composition)是类型之间的一种关系,当某种类型的对象内含它种类型的对象,便是这种关系

  • 在应用域(application domain),即程序中的对象相当于你所塑造的世界中的某些事物中,复合意味着has-a

  • 在实现域(implementation domain),即对象纯粹是实现细节上的人工制品,例如缓冲区、互斥器等,复合意味着is-implemented-in-terms-of

39. Use private inheritance judiciously

  • private继承规则

    • private继承时,编译器不会自动将一个derived class对象转换为base class对象
    • private继承时,base class中的所有成员,在derived class中都会变成private属性
  • private继承意味着is-implemented-in-terms-of(根据某物实现出),其用意是为了采用base class内已经备妥的某些特性,而不是对象之间存在任何观念上的关系,private继承纯粹只是一种实现技术

  • private继承虽然意味着is-implemented-in-terms-of,但它的优先级要低于复合(composition),你需要明智而审慎的使用private继承,但是当derived class需要访问protected base class的成员,或需要重新定义继承而来的virtual函数时,这么设计是合理的

  • 和复合不同的是,private继承可以实现empty base最优化,这对致力于对象尺寸最小化的程序库开发者而言,可能很重要

40. Use multiple inheritance judiciously

  • 多重继承(multiple inheritance)是指一个derived class可以继承自多个base class,但是相应的,base class中相同的名称可能会产生歧义性,要解决这个问题你必须明白的指出要调用哪一个base class内的函数

  • 多重继承的base classes如果在继承体系中又有着共同且更高级的base class,则会产生更致命的菱形继承问题

    • 此时你需要面对这样一个问题,如果顶层base class中存在一个成员变量A,那么你是否打算让base class内的成员变量经由每一条路径被复制?如果是,那么最底层的derived class内将会有两份A成员变量,但简单的逻辑告诉我们,derived class中不应该有两份A成员变量
  • C++在这场多重继承的辩论中并没有倾斜立场,两个方案其都支持

    • 缺省情况下的做法是执行复制,也就是会产生两份成员变量
    • 如果那不是你想要的,则必须令那个带有此数据的base class成为virtual base class,你必须令所有直接继承自它的classes采用virtual继承
  • 从正确行为的观点看,public继承应该总是virtual继承的,但是不要盲目使用virtual继承,因为你需要为virtual继承付出代价

    • 使用virtual继承的class所产生的对象往往比使用non-virtual继承的体积大
    • 访问virtual base class的成员变量时,也比访问non-virtual成员时速度慢
    • 支配virtual base class初始化的规则远为复杂且不直观,virtual base的初始化责任是由继承体系中最底层的class负责
      • 因此class若派生自virtual bases而需要初始化,必须认知其virtual bases,不论那些bases距离多远
      • 当一个新的derived class加入继承体系时,它必须承担其virtual bases(不论直接或间接)的初始化责任
  • 因此对virtual base class的使用忠告很简单

    • 第一,非必要不使用virtual base class,必须确定,你的确是在明智而审慎的情况下使用它
    • 第二,如果必须使用,尽可能避免在其中放置数据,如果virtual base class不带任何数据,将是最具实用价值的情况

Templates and Generic Programming

41. Understand implicit interfaces and compile-time polymorphism

  • C++中面向对象编程的世界总是以显式接口(explicit interface)和运行期多态(runtime polymorphism)解决问题

    • 对class而言接口是显式且以函数签名(也就是函数名称,参数类型、返回类型)为中心的,多态则通过virtual函数发生于运行期
  • 但Template和泛型编程的世界,与面向对象有根本上的不同,此世界中则是以隐式接口(implicit interface)和编译期多态(compile-time polymorphism)解决问题

    • 对template参数而言,接口是隐式的,奠基于有效表达式,多态则是通过template具现化和函数重载解析(function overloading resolution)发生于编译器
    • 以如下代码为例,所谓有效表达式,是指w必须支持哪种接口,由template中执行于w身上的操作来决定,凡是涉及w的任何函数调用,例如operator<operator!=,都有可能造成template具现化,“以不同的template参数具现化function templates”会调用不同的函数,这便是所谓的编译期多态
    template<typename T> void doProcessing(T& w);
    {
      // w必须提供名为size的成员函数,且返回值类型为size_t
      // w必须支持operator!=函数,用来比较两个T对象
      if (w.size() > 10 && w != someNastyWidget) {
        T temp(w);
        temp.normalize();
        temp.swap(w);
      }
    }
  • “编译期多态”和“运行期多态”类似于“哪一个重载函数该被调用(发生在编译期)”和“哪一个virtual函数该被绑定(发生在运行期)”之间的差异

42. Understand the two meanings of typename

  • 从C++的角度看,声明template参数时,不论使用关键字class还是typename,意义完全相同

  • template内出现的名称如果相依于某个template参数,称之为从属名称(dependent names),如果从属名称在class内呈嵌套状,则称之为嵌套从属名称(nested dependent name),如果某个名称不依赖于任何template参数,则称之为非从属名称(non-dependent names)

    • 嵌套从属名称有可能导致解析困难,假设现在有模板函数template<typename C> print2nd(const C& container) { ... },函数中有语句C::const_iterator* iter;(注意这并非有效代码),看起来似乎是声明iter为一个local指针变量,指向C::const_iterator
    • 但是,如果C::const_iterator不是个类型呢?如果C有个static成员变量而其碰巧被命名为const_iterator呢?或如果iter碰巧是个global变量名称呢?那样的话上述语句就变成了一个相乘动作(这听起来确实有点疯狂,但C++解析器必须操心所有可能的输入)
    • 而C++有个规则可以解析此歧义状态:如果解析器在template中遭遇一个嵌套从属名称,便假设这名称不是个类型,除非你告诉它,因此缺省情况下嵌套从属名称并非类型
  • 请使用关键字typename标识嵌套从属类型名称,但不得在base class lists(基类列)或member initialization list(成员初值列)内以它作为base class修饰符

    template<typename T>
    class Derived: public Base<T>::Nested { // base class list中不允许typename
    public:
      explicit Derived(int x)
      : Base<T>::Nested(x) { // member initialization list中不允许typename
        typename Base<T>::Nested temp; // 嵌套从属类型名称,需加上typename
        ...
      }
    };

43. Know how to access names in templatized base classes

  • C++往往拒绝在templatized base classes(模板化基类)内寻找继承而来的名称,那是因为base class templates有可能被特化,而特化版本可能不提供和一般性template相同的接口

    • 就某种意义而言,当我们从Object Oriented C++跨进Template C++时,继承就不像以前那般畅行无阻了
  • 为了使C++“不进入templatized base classes观察可调用之函数”的行为失效,有三种办法

    • 第一,在base class函数调用动作之前加上this->
    • 第二,使用using声明式,如果你还记得条款33,此方法会让你感到熟悉,但其实两处要解决的问题并不相同
      • 条款33是描述using声明式如何将“被掩盖的base class名称”带入derived class作用域内
      • 而此处并不是因为base class名称被derived class名称掩盖,而是编译器拒绝进入base class作用域内查找,于是我们使用using告诉它,请它这么做
    • 第三,使用Base<T>::func()明确指出被调用的函数位于base class内,但这往往是最不让人满意的一个解法,因为如果被调用的是virtual函数,这种明确资格修饰(explicit qualification)会关闭virtual绑定行为
  • 从名称可视点(visibility point)的角度出发,上述每一个解法做的事情都相同,对编译器承诺“base class template的任何特化版本都将支持其一般泛化版本所提供的接口”,但如果这个承诺最终未被实践,往后的编译最终还是会面临失败

44. Factor parameter-independent code out of templates

  • Templates生成多个classes和多个函数,所以任何template代码都不该与某个造成膨胀的template参数产生相依关系

  • 因非类型模板参数(non-type template parameters)而造成的代码膨胀,往往可消除,做法是以函数参数或class成员变量替换template参数

    template<typename T, std::size_t n> class SquareMatrix {
    public:
      ...
      // 求逆矩阵,该函数除了使用矩阵的大小不同外,其余代码完全相同,但是该函数会在每个具现化的class内都出现一份
      // 因此可以建立一个带参数的函数,将n作为参数传入,而不重复代码
      void invert();
    }
  • 因类型参数(type parameters)而造成的代码膨胀,往往可降低,做法是让带有完全相同二进制表述(binary representations)的具现类型共享实现码

    • 例如大多数平台上,所有指针类型都有相同的二进制表述,因此templates持有指针者(如list<int*>list<SquareMatrix<long, 3>*等等)往往应该对每一个成员函数使用唯一一份底层实现
    • 如果你实现某些成员函数而它们操作强类型指针(strongly typed pointers,即T*),你应该令它们调用另一个操作无类型指针(untyped pointers,即void*)的函数,由后者完成实际工作

45. Use member function templates to accept "all compatible types"

  • C++中,derived class指针可以隐式转换为base class指针,指向non-const对象的指针可以转换为指向const对象的指针等等,但是对于模板代码SmartPtr<Base> p1 = SmartPtr<Derived>(new Derived)呢?

    • 显然,如果以带有继承关系的两个class为模板参数分别具现化某个template,产生出来的两个具现体并不带有base-derived关系,所以编译器视两者为完全不同的classes
  • 面对这个问题,显然一个template可以被无限量的具现化,如果我们寄希望于编写构造函数来实现转型的需要,那我们需要的构造函数数量就无止尽了,因此我们需要一个构造模板,这样的模板是所谓的member function templates,作用是为class生成函数

    • 假设现有模板类template<typename T> class SmartPtr { ... },则其构造模板的一般形式为template<typename U> SmartPtr(const SmartPtr<U>& other);
    • 此代码的意思是,对任何类型T和任何类型U,可以根据SmartPtr<U>生成一个SmartPtr<T>对象
    • 上述泛化copy构造函数并未声明为explicit,因为原始指针类型之间的转换是隐式转换,所以仿效这种行为也属合理
  • 但是还有另一个问题需要解决,那就是我们希望根据SmartPtr<Derived>创建SmartPtr<Base>,但是却不希望根据SmartPtr<Base>创建SmartPtr<Derived>,或根据SmartPtr<double>创建SmartPtr<int>,因此我们必须从某方面对这一member template所创建的成员函数群进行拣选或筛除

    • 假设SmartPtr内有原始指针成员变量T* heldPtr;,则可以用template<typename U> SmartPtr(const SmartPtr<U>& other) : heldPtr(other.getPtr()) { ... }来实现代码中约束转换行为,此处other.getPtr()的返回值类型为U*
    • 使用成员初始列表来初始化SmartPtr<T>之内T* heldPtr成员变量,以类型为U*的指针作为其初值,这个行为只有当“存在某个隐式转换可将U*指针转换为T*指针”时才能通过编译,最终效益是SmartPtr<T>现在有了一个泛化copy构造函数,这个构造函数只在其所获得的实参隶属于兼容类型时才通过编译
  • member function template(成员函数模板)的效用不限于构造函数,常用的另一方面是支持赋值操作的兼容行为,例如TR1规范中关于shared_ptr的一份摘录

    template<class T> class shared_ptr {
    public:
      template<class Y> explicit shared_ptr(Y* p); // 构造,可来自任何兼容的内置指针
      template<class Y> shared_ptr(shared_ptr<Y> const& r); // 或shared_ptr
      template<class Y> shared_ptr(weak_ptr<Y> const& r); // 或weak_ptr
      template<class Y> shared_ptr(auto_ptr<Y> const& r); // 或auto_ptr
      template<class Y> shared_ptr& operator=(shared_ptr<Y> const& r); // 赋值,可来自任何兼容的shared_ptr
      template<class Y> shared_ptr& operator=(auto_ptr<Y> const& r); // 或auto_ptr
      ...
    };
  • member function template是个奇妙的东西,但它们并不改变语言的基本规则,规则表明,如果程序需要一个copy构造函数,你却没有声明它,编译器就会暗自为你生成一个

    • 因此在class内声明泛化copy构造函数(一个member template)并不会阻止编译器生成它们自己的copy构造函数(一个non-template)
    • 因此如果你想要控制copy构造的方方面面,必须同时声明泛化copy构造函数和正常的copy构造函数,相同的规则也适用于赋值操作,例如在shared_ptr内声明copy构造函数shared_ptr(shared_ptr const& r);

46. Define non-member functions inside templates when type conversions are desired

  • Number<T>是一个template class,考虑non-member函数template<typename T> const Number<T> operator* (const Number<T>& lhs, const Number<T>& rhs),我们希望此模板函数支持混合式算术运算,同时也希望其像条款24那样支持隐式转换,即2 * Number<int>这种写法

    • 但不幸的是,template实参推导过程中,从不将隐式类型转换函数纳入考虑,也就不会考虑利用non-explicit构造函数将int转换为Number<int>,进而推导出模板参数Tint
  • 此时我们需要利用“template class内的friend声明式可以指涉某个特定函数”这一事实

    • 这意味着class Number<T>可以声明operator*为其friend函数,class templates并不依赖template实参推导(实参推导只施行于function templates身上,此处可能有些难以理解,后面有过程解释),所以编译器总是能在class Number<T>具现化时得知T的类型
    • 到这一步,Number内的friend函数声明式为friend const Number<T> operator* (const Number<T>& lhs, const Number<T>& rhs);
      • 现在来想象一下整个过程,当某一对象被声明为Number<int>时,class Number<int>于是被具现化出来,而作为过程的一部分,friend函数operator*(其接受Number<int>参数)也被自动声明出来,此时其身为一个函数而非函数模板,编译器即可在调用它时使用隐式类型转换
    • 但是将此friend函数声明于Number内,而将定义留在外部,我们最终会收获一个链接错误,为什么呢?
      • 编译器虽然知道我们要调用哪个函数,但该函数只被声明于Number内,而未被定义,我们意图令class外部的operate* template提供定义式,这是行不通的,一旦我们声明一个函数,那么就有责任定义这个函数
      • 因此或许最简单可行的办法就是将operator* template函数本体合并至其声明式之内
  • 这项技术的一个趣味点是,虽然使用friend,却与其传统用途“访问class内non-public成分”毫不相干,让我们来回顾一下整个过程

    • 首先,为了让类型转换可能发生于所有实参之上,我们需要一个non-member函数(如条款24那样)
    • 然后,为了让这个函数被自动具现化,我们需要将其声明在class template内部
    • 最终,在class内部声明non-member函数的唯一办法就是,令其成为一个friend,所以我们这样做了

47. Use traits classes for information about types

  • traits classes使得“类型相关信息”在编译期可用,它们以templates和templates特化完成实现

  • 整合重载技术后,traits classes有可能在编译期对类型执行if-then-else判断

  • 如何设计一个traits class

    • 以迭代器实现为例,我们需要针对不同分类迭代器执行不同的移动操作,因此需要能够判断迭代器的类型信息

      • 首先这要求每一个“用户定义的迭代器类型”必须嵌套一个typedef,名为iterator_category,例如deque的迭代器支持随机访问,所以看起来可能是这个样子:

        template< ... > class deque {
        public:
          class iterator {
          public:
            typedef random_access_iterator_tag iterator_category;
            ...
          };
          ...
        };
      • 至于iterator_traits,只是单纯的响应iterator class的嵌套式typedef,它的实现如下:

        // 类型IterT的iterator_category其实就是用来表现“IterT说它自己是什么类型”
        template<typename IterT> struct iterator_traits {
          typedef typename IterT::iterator_category iterator_category;
          ...
        };
      • 但是这对用户自定义类型行得通,对指针却行不通,因为指针不可能嵌套typedef,则其专门用来对付指针的实现如下:

        // 针对指针提供一个偏特化版本
        template<typename IterT> struct iterator_traits<IterT*> {
          typedef random_access_iterator_tag iterator_category;
          ...
        };
    • 现在让我们总结一下traits class的设计过程

      • 确认若干你希望将来可取得的类型相关信息,例如对迭代器而言,我们希望将来可取得其分类
      • 为该信息选择一个名字(例如iterator_category)
      • 提供一个template和一组特化版本,内含你希望支持的类型相关信息
  • 如何使用一个traits class

    • 当你设计完成iterator_traits后,为了进行类型判断,你可能会写出if (typeid(typename iterator_traits<IterT>::iterator_category) == typeid(random_access_iterator_tag)),但这其实是不可取的

      • 首先,这可能会导致编译问题,其次,IterT类型在编译期间获知,所以iterator_category也可在编译期确定,但if语句却是在运行期才会核定,为什么将可在编译期完成的事情延后到运行期呢?这不仅浪费时间,还会造成可执行文件膨胀
    • 为了解决这一问题,我们需要利用C++中的重载(overloading)技术,我们利用参数的最佳匹配,来决定调用哪个重载函数,重载函数的部分实现如下:

      template<typename IterT, typename DistT> void doAdvance(IterT& iter, DistT d, random_access_iterator_tag) {
        // 为random access类型的迭代器提供实现
        iter += d;
      }
      
      template<typename IterT, typename DistT> void doAdvance(IterT& iter, DistT d, bidirectional_iterator_tag) {
        // 为bidirectional类型的迭代器提供实现
        if (d >= 0) { while (d--) ++iter; }
        else { while (d++) --iter; }
      }
    • 有了这些重载版本,调用函数只需要额外多传递一个对象,即可利用重载解析机制调用适当的代码,例如:

      template<typename IterT, typename DistT> void advance(IterT& iter, DistT d) {
        doAdvance(iter, d, typename iterator_traits<IterT>::iterator_category());
      }
    • 现在让我们总结一下traits class的使用过程

      • 建立一组重载函数或函数模板,彼此间的差异只在于各自的traits参数,令每个函数实现码与其接受之traits信息相对应
      • 建立一个控制函数或函数模板,它调用上述那一组函数并传递traits class所提供的信息

48. Be aware of template metaprogramming

  • template metaprogramming(TMP,模板元编程)是编写template-based C++程序并执行于编译期的过程,TMP有两个伟大的效力

    • 第一,它让某些事情更容易,如果没有它,那些事情将是困难的,甚至不可能的(作者也没说是那些事情)
    • 第二,由于TMP执行于编译期,因此可将工作从运行期转移到编译期
      • 因此某些原本在运行期才能侦测到的错误,现在可以在编译期找出来
      • 而且使用TMP的C++程序可能在每一方面都更高效:较小的可执行文件、较短的运行期、较少的内存需求
      • 但是代价是,编译时间变长了,可能远长于不使用TMP的对应版本
  • 稍早在条款47中我们谈到,advance函数的typeid实现方式可能会导致编译问题,现在来看下面这个例子:

    template<typename IterT, typename DistT> void advance(IterT& iter, DistT d) {
      if (typeid(typename iterator_traits<IterT>::iterator_category) == typeid(random_access_iterator_tag)) {
        iter += d; // 可能会导致编译问题
      }
      else {
        if (d >= 0) { while (d--) ++iter; }
        else { while (d++) --iter; }
      }
    }
    
    // 调用代码
    std::list<int>::iterator iter;
    ...
    advance(iter, 10);
    • 问题出在使用+=操作符的那一行代码,当advance模板函数针对list<int>::iterator类型的迭代器进行具现化的时候,会尝试在bidirectional迭代器身上执行+=操作,但是其并不支持这一操作,只有random access迭代器才支持
      • 尽管我们知道,针对list<int>::iterator类型迭代器具现化的代码,由于判断条件的存在,执行+=操作的这一行代码永远不会执行,所以看似并不会造成问题
      • 但是编译器必须确保所有的源码都有效,纵使是永远不会执行的代码,而当迭代器类型不是random access迭代器时,+=操作就是无效的
    • 与之相对应的就是traits-based TMP解法,其针对不同类型而进行的代码,被拆分为不同的函数,每个函数所使用的操作都可施行于该函数所对应的类型
  • 为了再次认识一下“事物在TMP中如何运作”,让我们再来看看循环 - TMP中并没有真正的循环构件,所以循环效果是借由递归完成的,但TMP的递归甚至不是正常种类,因为TMP循环并不涉及递归函数调用,而是涉及递归模板具现化(recursive template instantiation)

    • TMP的起手程序是在编译期计算阶乘,阶乘运算示范如何通过递归模板具现化实现循环,以及如何在TMP中创建和使用变量

      template<unsigned N> struct Factorial {
        enum { value = N * Factorial<N - 1>::value };
      };
      // 特殊情况,0的阶乘为1
      template<> struct Factorial<0> {
        enum { value = 1 };
      };
    • 循环发生在template具现体Factorial<N>内部指涉另一个template具现体Factorial<N - 1>之时,和所有递归一样,需要一个特殊情况造成递归结束,这里的特殊情况是template特化体Factorial<0>

  • 为求领悟TMP之所以值得学习,很重要一点就是先对它能够达成什么目标有一个比较好的理解,下面举出三个例子

    • 确保量度单位正确,如果使用TMP,就可以在编译期确保程序中所有度量单位的组合都正确,不论其计算多么复杂,这也就是为什么TMP可被用来进行早期错误侦测
    • 优化矩阵运算,假设有一个SquareMatrix class,考虑类似于这样的矩阵连乘运算SquareMatrix result = m1 * m2 * m3 * m4 * m5;
      • 以“正常的”函数调用动作来计算result,会创建4个临时矩阵,每一个用来存储对operate*的调用结果
      • 如果使用高级、与TMP相关的template技术,即所谓expression templates,就有可能消除那些临时对象并合并循环,于是TMP软件使用较少内存,执行速度也有提升
    • 可以生成客户定制之设计模式实现品,运用所谓policy-based design之TMP-based技术,有可能产生一些templates用来表述独立的设计选项(所谓policies),然后任意结合它们,导致模式实现品带着客户定制的行为

Customizing new and delete

49. Understand the behavior of the new-handler

  • 当operator new抛出异常以反映一个未获满足的内存需求之前,它会先调用一个客户指定的错误处理函数,一个所谓的new-handler

    • 为了指定这个“用以处理内存不足”的函数,必须使用set_new_handler函数,set_new_handler函数的参数是一个没有参数且返回值为void的函数指针,set_new_handler函数的返回值也是个指针,指向该函数被调用前正在执行(但马上就要被替换)的那个new-handler函数
    • 顺带一提,如果new-handler函数执行期间必须动态分配内存,考虑会发生什么事...
  • 当operator new无法满足内存申请时,它会不断调用new-handler函数,直到找到足够的内存,因此一个设计良好的new-handler函数必须做以下事情(多个或之一)

    • 让更多内存可被使用,这或许可使下一次分配内存成功,实现此策略的一个做法是,程序一开始执行就分配一大块内存,而后当new-handler第一次被调用,将内存释放归还程序
    • 安装另一个new-handler,如果目前这个handler无法取得更多内存,或许让其安装另外某个有此能力的new-handler,下次再调用时,就会调用新的new-handler
    • 卸载new-handler,也就是将null指针传递给set_new_handler,这样当operator new内存分配失败时就会抛出异常
    • 抛出bad_alloc异常,这样的异常不会被operator new捕获,因此会被传递到调用处
    • 不返回,通常调用abort或exit,这样就会终止程序执行
  • C++并不支持class专属的new-handler,但你可以自己实现出这种行为,只需令每一个class提供自己的set_new_handler和operator new即可

    • 其中set_new_handler使用户得以指定class专属的new-handler,就像标准的set_new_handler允许指定global new-handler

    • 至于operator new,则确保在分配class对象内存的过程中以class专属的new-handler替换global new-handler

    • 实现这一方案的代码并不因class的不同而不同,因此可以建立一个“mixin”风格的base class,然后将这个class转换为template,借助于template的特性,使每个derived class获得实体互异的data成员变量

      template<typename T> class NewHandlerSupport { // mixin风格的base class
      public:
        explicit NewHandlerSupport(std::new_handler p) : currentHandler(p) {}
        ~NewHandlerSupport() { std::set_new_handler(currentHandler); } // RAII,析构时恢复global new-handler
      
        static std::new_handler set_new_handler(std::new_handler p) throw();
        static void* operator new(std::size_t size) throw(std::bad_alloc);
        ...
      private:
        static std::new_handler currentHandler; // 模板具现化后用以支持class专属的new-handler
      };
      
      template<typename T> std::new_handler NewHandlerSupport<T>::set_new_handler(std::new_handler p) throw() {
        std::new_handler oldHandler = currentHandler;
        currentHandler = p;
        return oldHandler;
      }
      
      template<typename T> void* NewHandlerSupport<T>::operator new(std::size_t size) throw(std::bad_alloc) {
        NewHandlerHolder h(std::set_new_handler(currentHandler)); // 以class专属的new-handler替换global new-handler
        return ::operator new(size);
      }
      
      template<typename T> std::new_handler NewHandlerSupport<T>::currentHandler = 0;
    • 假设现有Widget class,利用上述代码为其添加set_new_handler的支持能力就轻而易举了

      class Widget : public NewHandlerSupport<Widget> {
        ... // 无需声明set_new_handler和operator new
      };
      
      // 用法
      void outOfMem();
      Widget::set_new_handler(outOfMem);
      Widget* pw = new Widget; // 若内存分配失败,将调用outOfMem
      std::string* ps = new std::string; // 若内存分配失败,将调用global new-handler
    • 或许你会对这个方案感到不可思议,甚至会因为模板参数从未使用而焦虑万分,但是实际上T的确不需被使用,我们只是希望继承自NewHandlerSupport的每个class都有实体互异的static data成员变量,模板参数只是用来区分不同的derived class而已

    • 由于这是一个十分有用的技术,因为它有一个名字“怪异的循环模板模式(curiously recurring template pattern, CRTP)”,但是需要注意的是,这种风格的继承极有可能导致多重继承问题,因此在使用时务必小心

  • 新一代的operator new会抛出bad_alloc异常,但是C++仍然提供了传统的“分配失败便返回null”的行为,这个形式被称为“nothrow”形式,例如T* p = new (std::nothrow) T

    • 但其是一个颇为局限的工具,因为它只适用于内存分配,只能保证operator new不抛出异常,如果类的构造函数抛出异常,异常会一如既往地传播

50. Understand when it makes sense to replace new and delete

  • 为了检测运行错误。例如可以超额分配一些内存,在用户分配所得区块之前或之后放置特定的byte pattern(即签名,signatures),在释放内存的时候检查上述签名是否原封不动,从而检查并记录内存越界错误

  • 为了收集动态分配内存的使用统计数据。在定制自己的new和delete之前,理应先收集软件如何使用其动态内存,分配区块大小分布如何?寿命分布如何?倾向于FIFO(先进先出)次序或LIFO(后进先出)次序或随机次序来分配和归还?任何时刻所使用的最大分配量是多少等等

  • 为了强化效能,增加分配和归还内存的速度。编译器所带的new和delete主要用于一般目的,需要兼顾各种情况,无论是大块内存、小块内存、大小混合内存,因此编译器采取了中庸之道,但是如果你对动态内存运用形态有深刻的理解,你可以为特定的情况编写更为高效的new和delete

  • 为了降低缺省内存管理器带来的空间额外开销。泛用型内存管理器可以往往还是用更多的内存,因为其常常在每一个分配区块身上招引某些额外开销

  • 为了弥补缺省分配器中的非最佳齐位。例如在x86体系结构上double在8-byte齐位时访问最是迅速,但是缺省分配器可能并不保证分配而得的double是8-byte齐位的,这种情况下实现定制分配器可能会大幅提升程序效率

  • 为了将相关对象成簇集中。如果你确定某个数据结构往往被一起使用,又希望处理这些数据时内存页错误(page faults)的频率降至最低,那么可为此数据结构创建一个heap使其被集中在尽可能少的内存页上

  • 为了获得非传统行为。例如可能希望分配或归还共享内存(shared memory)内的区块,但唯一能管理该内存的只有C API函数,那么编写一个定制版管理器,你便得以为C API穿上C++外套

51. Adhere to convention when writing new and delete

  • operator new应该内含一个无穷循环,并在其中尝试分配内存,如果无法满足内存需求,就应该调用new-handler,它也应该有能力处理0-byte申请,如果是Class专属版本则还应该处理“比正确大小更大的(错误)申请”

  • operator delete应该在收到null指针时不做任何事情,如果是Class专属版本则还应该处理“比正确大小更大的(错误)释放”

52. Write placement delete if you write placement new

  • 缺省情况下,C++在global作用域内提供了以下形式的operator new

    • void* operator new(std::size_t) throw(std::bad_alloc); // normal new
    • void* operator new(std::size_t, void* p) throw(); // placement new
    • void* operator new(std::size_t, const std::nothrow_t&) throw(); // nothrow new
  • 当你编写class专属的operator new,并以placement new的形式分配内存时,你必须提供与之参数相对应的placement delete,否则会引起难以察觉的内存泄漏

    • 考虑Widget *pw = new (std::cerr) Widget;,此操作会调用operator new并传递cer为其第二个参数,如果缺少与之对应的placement delete,这个操作会在构造函数抛出异常时导致内存泄漏
    • 我们知道,new关键字的背后会有两个函数被调用,一个是operator new,另一个是构造函数,如果operator new成功分配内存,但是构造函数抛出异常,那么C++必须调用与operator new对应的operator delete来释放内存
    • 然而C++无法知道真正被调用的那个operator new如何运作,因此其只能寻找“参数个数和类型都与operator new相同”的某个operator delete,如果找不到,那么没有任何operator delete会被调用
  • 当你声明placement new和placement delete时,请确定不要无意识地遮掩了它们的正常版本

    • 例如,成员函数名称会遮掩外围作用域中相同的名称(见条款33)
    • 同样的,derived class中的operator new也会遮掩global版本和继承而来的版本

Miscellany

53. Pay attention to compiler warnings

  • 严肃对待编译器发出的警告信息,努力在编译器最高警告级别下争取“无任何警告”的荣誉

  • 例如,考虑如下代码

    class B {
    public:
      virtual void f() const;
    }
    
    class D : public B {
    public:
      virtual void f();
    }
    • 你所期望的是以D::f()重新定义virtual函数B::f(),但是却忽略了const关键字,作者的编译器给出警告“warning: D::f() hides virtual B::f()”
    • 其实这是编译器试图告诉你声明于B中的函数f()并未在D中被重新声明,而是被整个遮掩了,如果忽略这个错误,几乎可以肯定会导致错误的程序行为

54. Familiarize yourself with the standard library, including TR1

  • C++标准程序库的主要机能由STL、iostreams、multiple active locales组成

55. Familiarize yourself with Boost

  • Boost是致力于免费和源码开放的C++程序库,其在C++标准化过程中扮演深具影响力的角色