本文转载自:http://www.cnblogs.com/malecrab/p/5572119.html
我要手动抄一遍,加深印象。
1.数据成员指针
对于普通指针,其值就是它所指向的地址,0表示空指针。
而对于数据成员指针(这个描述实际上并不合适,它指的应该是类或者结构的数据成员的地址),它的值是相对于对象起始地址的偏移量,-1表示空指针。如图:
代码示例:
struct X {
int a;
int b;
};
#define VALUE_OF_PTR(p) (*(long*)&p)
int main() {
int X::*p = 0; // VALUE_OF_PTR(p) == -1
p = &X::a; // VALUE_OF_PTR(p) == 0
p = &X::b; // VALUE_OF_PTR(p) == 4
return 0;
}
2.成员函数指针
成员函数指针与普通函数指针相比,其size是普通函数指针的两倍,分为ptr和adj两部分。
(1)非虚函数成员指针:
ptr内容为函数指针(指向一个全局函数,该函数的第一个参数为this指针),adj部分始终为0。例:
代码示例:
extern "C" int printf(const char*, ...);
struct B {
void foo() { printf("B::foo(): this = 0x%p\n", this); }
};
struct D : public B {
void bar() { printf("D::bar(): this = 0x%p\n", this); }
};
void (B::*pbfoo)() = &B::foo; // ptr: points to _ZN1B3fooEv, adj: 0
void (D::*pdfoo)() = &D::foo; // ptr: points to _ZN1B3fooEv, adj: 0
void (D::*pdbar)() = &D::bar; // ptr: points to _ZN1D3barEv, adj: 0
extern "C" void _ZN1B3fooEv(B*);
extern "C" void _ZN1D3barEv(D*);
#define PART1_OF_PTR(p) (((long*)&p)[0])
#define PART2_OF_PTR(p) (((long*)&p)[1])
int main() {
printf("&B::foo->ptr: 0x%lX\n", PART1_OF_PTR(pbfoo));
printf("&B::foo->adj: 0x%lX\n", PART2_OF_PTR(pbfoo)); // 0
printf("&D::foo->ptr: 0x%lX\n", PART1_OF_PTR(pdfoo));
printf("&D::foo->adj: 0x%lX\n", PART2_OF_PTR(pdfoo)); // 0
printf("&D::bar->ptr: 0x%lX\n", PART1_OF_PTR(pdbar));
printf("&D::bar->adj: 0x%lX\n", PART2_OF_PTR(pdbar)); // 0
D* d = new D();
d->foo();
_ZN1B3fooEv(d); // equal to d->foo()
d->bar();
_ZN1D3barEv(d); // equal to d->bar()
return 0;
}
(2)虚函数指针
ptr部分内容为虚函数对应的函数指针在虚函数表中的偏移地址+1(之所以+1是因为0表示了空指针),而adj部分为调节this指针的偏移字节数。
对上图的说明:
(1)A和B都没有基类,但是都有虚函数,因此各有虚函数指针(假设为vptr)。
(2)C同时继承了A和B,因此会继承两个虚函数指针,但是为了节省空间,C会和主基类A共用一个虚函数指针,即上图的vptr1,继承自B的虚函数指针假设为vptr2。
(3)C没有重写继承自A和B的虚函数,因此在C的虚函数表中存在A::foo和B::bar函数指针(如果C中重写了foo(),则C的虚函数表中A::foo会被替换为C::foo)。
(4)C中有两个虚函数指针vptr1和vptr2,相当于有两张虚函数表。
(5)A::foo(C::foo)、B::Bar(C::bar)都在虚函数表中偏移地址为0的位置,因此ptr为1(0+1=1)(这个地方注意一下,C有两张虚函数表)。而C::quz在偏移为8的位置,因此ptr为9(8+1=9)(这里需要注意的是,成员函数指针的大小是普通函数指针大小的两倍,即为8)。
(6)当我们使用pc调用C::bar()时,如:“(pc->pcbar)()”,实际上调用的是B::bar()(即_ZN1B3barEv(pc)),pc需要被转换为B类型指针,因此需要对this指针进行调节(调节至pb指向的地址),因此adj为8(adj为何为8呢,参见上图,C有两张虚函数表,vptr1和vptr2,而pb指向的是vptr2,vptr1的大小是8,所以在进行this调节时,要给adj为8才能偏移到pb指针所指的位置)。
代码示例:
extern "C" int printf(const char*, ...);
struct A {
virtual void foo() { printf("A::foo(): this = 0x%p\n", this); }
};
struct B {
virtual void bar() { printf("B::bar(): this = 0x%p\n", this); }
};
struct C : public A, public B {
virtual void quz() { printf("C::quz(): this = 0x%p\n", this); }
};
void (A::*pafoo)() = &A::foo; // ptr: 1, adj: 0
void (B::*pbbar)() = &B::bar; // ptr: 1, adj: 0
void (C::*pcfoo)() = &C::foo; // ptr: 1, adj: 0
void (C::*pcquz)() = &C::quz; // ptr: 9, adj: 0
void (C::*pcbar)() = &C::bar; // ptr: 1, adj: 8
#define PART1_OF_PTR(p) (((long*)&p)[0])
#define PART2_OF_PTR(p) (((long*)&p)[1])
int main() {
printf("&A::foo->ptr: 0x%lX, ", PART1_OF_PTR(pafoo)); // 1
printf("&A::foo->adj: 0x%lX\n", PART2_OF_PTR(pafoo)); // 0
printf("&B::bar->ptr: 0x%lX, ", PART1_OF_PTR(pbbar)); // 1
printf("&B::bar->adj: 0x%lX\n", PART2_OF_PTR(pbbar)); // 0
printf("&C::foo->ptr: 0x%lX, ", PART1_OF_PTR(pcfoo)); // 1
printf("&C::foo->adj: 0x%lX\n", PART2_OF_PTR(pcfoo)); // 0
printf("&C::quz->ptr: 0x%lX, ", PART1_OF_PTR(pcquz)); // 9
printf("&C::quz->adj: 0x%lX\n", PART2_OF_PTR(pcquz)); // 0
printf("&C::bar->ptr: 0x%lX, ", PART1_OF_PTR(pcbar)); // 1
printf("&C::bar->adj: 0x%lX\n", PART2_OF_PTR(pcbar)); // 8
return 0;
}
有了上述解释,我们就可以知道为什么回调函数不能是普通成员函数了,普通成员函数有一个隐式的this指针,做了成员函数的第一个参数,而回调函数的参数没有办法添加这个this指针。
我把上一篇没写的虚函数的底层实现挪到这里来说,更加具有连贯性,博客同样出自本文引用博客作者的作品,只能说,膜拜大神。
虚函数实现的基本原理:(这其实也是继承体系消耗性能的一个原因)
1.简单的说,每一个含有虚函数(无论是其本身的还是继承而来的)类,都至少有一个与之对应的虚函数表,其中存放着该类所有的虚函数对应的函数指针。例如:
其中:
(1)B的虚函数表中存放着B::foo和B::bar两个函数指针。
(2)D的虚函数表中存放的既有继承自B的虚函数B::foo,又有重写(override)了基类虚函数B::bar的D::bar,还有新增的虚函数D::quz。
提示:为了描述方便,本文在探讨对象内存布局时,将忽略内存对齐对布局的影响。
注:内存布局:见下一篇博文《浅谈C++内存布局》
2.虚函数表的构造过程:
从编译器的角度来说,B的虚函数表很好构造,D的虚函数表构造过程相对复杂。下面给出了构造D的虚函数表的一种方式(仅供参考):
构造D的虚函数表的过程是由编译器自主完成的,也就是说,这个替换过程发生在编译期间。
编译器只知道pb是B*类型的指针,并不知道它指向的具体对象类型 :pb可能指向的是B的对象,也可能指向的是D的对象。
但对于“pb->bar()”,编译时能够确定的是:此处operator->的另一个参数是B::bar(因为pb是B*类型的,编译器认为bar是B::bar),而B::bar和D::bar在各自虚函数表中的偏移位置是相等的。
无论pb指向哪种类型的对象,只要能够确定被调函数在虚函数中的偏移值,待运行时,能够确定具体类型,并能找到相应vptr了,就能找出真正应该调用的函数。
在上文中讲过,虚函数指针中的ptr部分是虚函数表中的偏移值加1。
B::bar是一个虚函数指针, 它的ptr部分内容为9,它在B的虚函数表中的偏移值为8(8+1=9)。
当程序执行到“pb->bar()”时,已经能够判断pb指向的具体类型了:
如果pb指向B的对象,可以获取到B对象的vptr,加上偏移值8((char)vptr + 8),可以找到B::bar。
如果pb指向D的对象,可以获取到D对象的vptr,加上偏移值8((char)vptr + 8) ,可以找到D::bar。
如果pb指向其它类型对象…同理…
4.多重继承
当一个类继承多个类,且多个基类都有虚函数时,子类对象中将包含多个虚函数表的指针(即多个vptr)。
示例:
其中:D自身的虚函数与B基类共用了同一个虚函数表,因此也称B为D的主基类(primary base class)。
虚函数替换过程与前面描述类似,只是多了一个虚函数表,多了一次拷贝和替换的过程。
虚函数的调用过程,与前面描述基本类似,区别在于基类指针指向的位置可能不是派生类对象的起始位置,以如下面的程序为例:
下面的内容,同样是同一位作者的研究结果:
博文原址为:http://www.cnblogs.com/malecrab/p/5573368.html#3736391
1.虚表与虚函数表
上文中引入虚函数表的概念,但实际上虚函数表并不独立存在,它只是虚表(virtual table)的一部分,例:
从图中可已看出,虚表除了包含虚函数指针,还包含其它一些信息(如:RTTI(运行时类型识别)信息、偏移值等)。
顺便介绍一下gcc的-fdump-class-hierarchy选项,它可以用于输出C++程序的虚表结构(在当前目录下生成一个.class文件),例:
橙色线框中的内容仅限于虚拟继承的情形(若无虚拟继承,则无此内容),虚拟继承的讨论已超过了本文的范围,暂且忽略。
“offset to top”是指到对象起始地址的偏移值,只有多重继承的情形才有可能不为0,单继承或无继承的情形都为0。
“RTTI information”是一个对象指针,它用于唯一地标识该类型。
“virtual function pointers”也就是我们之前理解的虚函数表,其中存放着虚函数指针列表。
前一节的示例是单继承的示例,下面列出了一个多继承的示例:
从中可以看到:D的虚表中包含两个虚表结构,第一个也称之为“主虚表”(primary virtual table),另一个虚表又称之为“次虚表”(secondary virtual table)。
简单地概括一下:一个含有虚函数(无论是其本身的,还是继承而来的)的类,可以有一个主虚表和多个次虚表,主虚表和次虚表构成一个虚表组(virtual table group)。
原文作者说他的博客内容,参看了:Itanium C++ ABI
关于虚函数的实现,另外一篇博文地址:https://blog.csdn.net/zhanghow/article/details/52970975