6.3 sizeof（1） - c++编程基础

6.3 sizeof（1）

面试例题1：What is the output of the following code （下面代码的输出结果是什么？）[美国某著名计算机软硬件公司2005年、2007年面试题]

#include <iostream> 
#include <stdio.h> 
#include <string.h> 
using namespace std;  
struct{  
short a1;  
short a2;  
short a3;  
}A;  
struct{  
long a1;  
short a2;  
}B;  
 
 int main()  
  {  
      char* ss1 = "0123456789";  
      char ss2[] = "0123456789";  
      char ss3[100] = "0123456789";  
      int  ss4[100] ;  
      char q1[]="abc";  
      char q2[]="a\n";  
      char* q3="a\n";  
      char *str1 = (char *)malloc(100);  
 
      void *str2 = (void *) malloc(100);  
 
      cout << sizeof(ss1) << "  ";  
      cout << sizeof(ss2) << "  ";  
      cout << sizeof(ss3) << "  ";  
      cout << sizeof(ss4) << "  ";  
      cout << sizeof(q1) << "  ";  
      cout << sizeof(q2) << "  ";  
      cout << sizeof(q3) << "  ";  
      cout << sizeof(A) << "  ";  
      cout << sizeof(B) << "  ";  
      cout << sizeof(str1) << "  ";  
      cout << sizeof(str2) << "  ";  
 
      return 0;  
  }

解析：

ss1是一个字符指针，指针的大小是一个定值，就是4字节，所以sizeof(ss1)是4字节。

ss2是一个字符数组，这个数组最初未定大小，由具体填充值来定。填充值是"0123456789"。1个字符所占空间是1字节，10个就是10字节，再加上隐含的"\0"，所以一共是11字节。

ss3也是一个字符数组，这个数组开始预分配100，所以它的大小一共是100字节。

ss4也是一个整型数组，这个数组开始预分配100，但每个整型变量所占空间是4，所以它的大小一共是400字节。

q1与ss2类似，所以是4字节。

q2里面有一个"\n"，"\n"算做一位，所以它的空间大小是3字节。

q3是一个字符指针，指针的大小是一个定值，就是4，所以sizeof(q3)是4字节。

A和B是两个结构体。在默认情况下，为了方便对结构体内元素的访问和管理，当结构体内的元素的长度都小于处理器的位数的时候，便以结构体里面最长的数据元素为对齐单位，也就是说，结构体的长度一定是最长的数据元素的整数倍。如果结构体内存在长度大于处理器位数的元素，那么就以处理器的位数为对齐单位。但是结构体内类型相同的连续元素将在连续的空间内，和数组一样。

结构体A中有3个short类型变量，各自以2字节对齐，结构体对齐参数按默认的8字节对齐，则a1、a2、a3都取2字节对齐，sizeof(A)为6，其也是2的整数倍。B中a1为4字节对齐，a2为2字节对齐，结构体默认对齐参数为8，则a1取4字节对齐，a2取2字节对齐；结构体大小为6字节，6不为4的整数倍，补空字节，增到8时，符合所有条件，则sizeof(B)为8。

CPU的优化规则大致原则是这样的：对于n字节的元素（n=2,4,8,…），它的首地址能被n整除，才能获得最好的性能。设计编译器的时候可以遵循这个原则：对于每一个变量，可以从当前位置向后找到第一个满足这个条件的地址作为首地址。例子比较特殊，因为即便采用这个原则，得到的结果也应该为6字节（long的首地址偏移量0000，short首地址偏移量0004，都符合要求）。但是结构体一般会面临数组分配的问题。编译器为了优化这种情况，干脆把它的大小设为8字节，这样就没有麻烦了，否则的话，会出现单个结构体的大小为6字节，而大小为n的结构体数组大小却为8×(n-1)+6的尴尬局面。IBM出这道题并不是考查理解语言本身和编译器，而是考查应聘者对计算机底层机制的理解和设计程序的原则。也就是说，如果让你设计编译器，你将怎样解决内存对齐的问题。

答案：

4，11，100，400，4，3，4，6，8，4，4。

扩展知识（内存中的数据对齐）

数据对齐，是指数据所在的内存地址必须是该数据长度的整数倍。DWORD数据的内存起始地址能被4除尽，WORD数据的内存起始地址能被2除尽。x86 CPU能直接访问对齐的数据，当它试图访问一个未对齐的数据时，会在内部进行一系列的调整。这些调整对于程序来说是透明的，但是会降低运行速度，所以编译器在编译程序时会尽量保证数据对齐。同样一段代码，我们来看看用VC、Dev C++(www.cppentry.com)和LCC这3个不同的编译器编译出来的程序的执行结果：

#include <stdio.h> 
 
int main()  
{  
int a;  
char b;  
int c;  
printf("0x%08x ",&a);  
printf("0x%08x ",&b);  
printf("0x%08x ",&c);  
return 0;  
}

这是用VC编译后的执行结果：

0x0012ff7c  
0x0012ff7b  
0x0012ff80

变量在内存中的顺序：b（1字节）-a（4字节）-c（4字节）。

这是用Dev C++(www.cppentry.com)编译后的执行结果：

0x0022ff7c  
0x0022ff7b  
0x0022ff74

变量在内存中的顺序：c（4字节）-中间相隔3字节-b（占1字节）-a（4字节）。

这是用LCC编译后的执行结果：

0x0012ff6c  
0x0012ff6b  
0x0012ff64

变量在内存中的顺序：同上。

3个编译器都做到了数据对齐，但是后两个编译器显然没VC"聪明"，让一个char占了4字节，浪费内存。

面试例题2：以下代码为32位机器编译，数据是以4字节为对齐单位，这两个类的输出结果为什么不同？[中国著名软件企业JS公司2008年4月面试题]

class   B  
{  
private:  
bool   m_bTemp;  
int   m_nTemp;  
bool   m_bTemp2;  
};  
 
class   C  
 
 
{  
 
 
private:  
int   m_nTemp;  
bool   m_bTemp;  
bool   m_bTemp2;  
};  
 
 
cout   <<   sizeof(B)   <<   endl;  
cout   <<   sizeof(C)   <<   endl;