C++ 多态深度剖析

测试环境:Target: x86_64-linux-gnu

gcc version 5.3.1 20160413 (Ubuntu 5.3.1-14ubuntu2.1)

什么是多态?

多态一词最初来源于希腊语,意思是具有多种形式或形态的情形,当然这只是字面意思,它在C++语言中多态有着更广泛的含义。

这要先从对象的类型说起!对象的类型有两种:

举个栗子:Derived1类和Derived2类继承Base类

对象有静态类型,也有动态类型,这就是一种类型的多态。

多态分类

多态有静态多态,也有动态多态,静态多态,比如函数重载,能够在编译器确定应该调用哪个函数;动态多态,比如继承加虚函数的方式(与对象的动态类型紧密联系,后面详解),通过对象调用的虚函数是哪个是在运行时才能确定的。

【静态多态】

栗子:函数重载

编译器在编译期间完成的,编译器根据函数实参的类型(可能会进行隐式类型转换),即可推断出要调用哪个函数,如果有对应的函数就调用该函数,否则出现编译错误。

【动态多态】

进入动态多态前,先看一个普通继承的栗子:

运行结果:

第一组毫无疑问,通过本类对象和本类对象的指针就是调用本类的函数;第二组中先让基类指针指向子类对象,然后调用该函数,调用的是子类的,后让基类指针指向另一个子类对象,调用的是子类的函数。这是因为p的类型是一个基类的指针类型,那么在p看来,它指向的就是一个基类对象,所以调用了基类函数。就像一个int型的指针,不论它指向哪,读出来的都是一个整型(在没有崩溃的前提下),即使将它指向一个float。再来对比着看下一个栗子。

栗子:继承+虚函数

运行结果:

就像上边这个栗子所演示的那样,通过重写虚函数(不再是普通的成员函数,是虚函数!),实现了动态绑定,即在程序执行期间(非编译期)判断所引用对象的实际类型,根据其实际类型调用相应的方法。使用virtual关键字修饰函数时,指明该函数为虚函数(在栗子中为纯虚函数),派生类需要重新实现,编译器将实现动态绑定。在上边栗子中,当指针p指向Man类的对象时,调用了Man类自己的函数,p指向Woman类对象时,调用了Woman类字几的函数。

今天的重点来了,就是要分析这个动态绑定实现的原理(以下测试在VS2013环境下进行):

为了方便调试,我将程序修改如下:

先求一下两个普通的继承类的大小,在这里为空类,没有包含成员变量,所以为1,表示占位:

假如基类中包含一个int型变量,那么这里的大小都会是4。这不是今天的重点,不再叙说。主要是想看看普通空类的大小。

再改一下程序,在基类的成员函数前加virtual关键字,将这个函数变为虚函数。

其它部分代码不变,运行结果:


大小变成了4.所以这个类里面肯定是有什么东西的。

在main中加入以下代码:

Man man;

Person *p = &man;
p->GoToWashRoom();

查看监视窗口:

man对象里存在了一个指针,而且是void**类型的,那么这个指针指向哪呢?可以在内存中查看一下这个地址所在内存中的内容。

是一个可能是地址的东西,然后下边是一排的 00 00 00 00,貌似相当于NULL。继续看一下这个类似于地址的东西里面又是什么:

嗯,看不懂,不要紧,把这个数字记下来:0x01 27 13 de

继续运行程序,转到反汇编:

这两句取到man的首地址然后通过eax寄存器赋值给p,这样p就指向了man对象。目前对象模型是这样的:

同时,_vfptr的值为0x01 27 13 de。接下来就要准备调用函数了。

一句句分析:

01276036  mov         eax,dword ptr [p]    //从p所指位置取4个字节内容放到eax,其实就是取的man对象的地址:0x008BFC1C
01276039  mov         edx,dword ptr [eax]  //从eax所指位置取4个字节内容放到edx,就是我们之前看到的不明变量_vfptr的值:0x0127dc80
0127603B  mov         esi,esp  //这句先不用管,esp是栈顶指针
0127603D  mov         ecx,dword ptr [p]  //将对象地址给ecx也保存了一份,此时ecx和eax放的都是对象地址(其实这句就是调用函数之前通过ecx传递this指针)
01276040  mov         eax,dword ptr [edx]  //取对象前四个字节给eax,eax和edx都变成了_vfptr的值。
01276042  call        eax  //调用函数,函数地址在eax中,说明_vfptr指向的内容是函数的地址
01276044  cmp         esi,esp
01276046  call        __RTC_CheckEsp (01271334h)
到call这条语句跟进去看一下:

这下明白了吧,其实_vfptr存放的内容就是存放函数地址的地址,即_vfptr指向函数地址所在的内存空间,如图:

分析暂告一段落。我们知道了man对象中维护了一个虚表指针,虚表中存放着虚函数的地址。基于这个虚表指针,实现动态绑定,才可以用基类指针调用了Man类中的虚函数。因为指针p看到的是虚表的指针,它调用的虚函数是从虚表中查找的。如果基类中有多个虚函数的话,那么虚表中也会依次按基类中虚函数定义顺序存放虚函数的地址,并以0x 00 00 00 00 结尾。再如果子类中有自己定义的新的虚函数,那么会排在虚函数表的后边。在调用虚函数时由编译器自动计算偏移取得相应的虚函数地址。

看看是如何构造子类对象的:

运行结果:

先调用基类构造函数,虚表指针先指向基类虚表,然后调用子类构造函数,这时候子类对象的虚表指针就指向了子类自己的虚表。这才是动态绑定实现原理。详细内容可以查看反汇编,这里不再写了。

再举个栗子看看虚表指针在对象的首部还是尾部,又或者是在中间某个地方存放:

查看内存中:&man

可以看出,虚表指针位于对象的首部。

【动态绑定条件】

  1. 必须是虚函数
  2. 通过基类类型的引用或者指针调用

总结

  1. 派生类重写基类的虚函数实现多态,要求函数名、参数列表、返回值完全相同。(协变除外)
  2. 基类中定义了虚函数,在派生类中该函数始终保持虚函数的特性
  3. 只有类的成员函数才能定义为虚函数,静态成员函数不能定义为虚函数
  4. 如果在类外定义虚函数,只能在声明函数时加virtual关键字,定义时不用加
  5. 构造函数不能定义为虚函数,虽然可以将operator=定义为虚函数,但最好不要这么做,使用时容 易混淆
  6. 不要在构造函数和析构函数中调用虚函数,在构造函数和析构函数中,对象是不完整的,可能会 出现未定义的行为
  7. 最好将基类的析构函数声明为虚函数。(析构函数比较特殊,因为派生类的析构函数跟基类的析构 函数名称不一样,但是构成覆盖,这里编译器做了特殊处理)
  8. 虚表是所有类对象实例共用的

容易混淆的点:

1 3 收藏 评论

相关文章

可能感兴趣的话题



直接登录
跳到底部
返回顶部