此為《你可能不知道的C++》的第一部分,討論C&c++,編譯單元以及對象
C++&c##
C++ 是 C 的超集,但是 C++ 中的子集 C 跟原始的 C 還是有點不一樣。
結構 & 聯合###
- C 的結構(struct)不是一種類型,使用時得帶著關鍵字struct,一般用typedef來避免這種不便。
- C++ 的結構幾乎等價于類,只是缺省的訪問權限為public而非private。
- C++ 的聯合(union)可以有成員函數,甚至可以有構造和析構函數。
不帶參數的函數###
對 C 來說,一個不帶參數的函數意味著可以接受任意參數。所以void f()就相當于void f(...),而下面三個函數指針類型中:
<pre>typedef void (foox)();
typedef void (foo1)(int);
typedef void (*foo2)(void);
</pre>
foo1和foo2可以隱式地轉型為foox,就好比可以從int或char隱式地轉型成void*。
要想讓一個 C 函數真正沒有參數,得用void:
<pre>void foo(void);</pre>
對 C++ 來說,一個不帶參數的函數就是指不接受參數。往參數列表里放void是多余的。
提升void*###
C 會自動提升(promote)void:
<pre>int pi = malloc(sizeof(int));</pre>
函數malloc返回void,賦值給int時不需要顯式轉型。而 C++ 必須顯式轉型:
<pre>int* pi = static_cast
(int*)(malloc(sizeof(int)));</pre>
CONSTS###
C++ 允許 consts 用在常量表達式中:
<pre>const int MAX = 4;
int a[MAX + 1];
switch (i) {
case MAX:
...
}</pre>
而 C 則必須使用宏:
<pre>#define MAX 4</pre>
引一段《C++ 的設計和演化》的原文:
(Bjarne Stroustrup, The Design and Evolution Of C++, 3.8)
In C, consts may not be used in constant expressions. This makes consts far less useful in C than in C++ and leaves C dependent on the preprocessror while C++ programmers can use properly typed and scoped consts.
</br>
C 的 consts(特指用 const 關鍵字修飾的常量)不可以用在常量表達式中。這讓 C 的 consts 遠不如 C++ 的有用,也讓 C 依賴于預處理器,而 C++ 程序員則可以使用有適當類型和作用域的 consts。
前置聲明###
C 代碼塊中,所有聲明必須出現在任何程序語句之前,比如函數定義時,先聲明所有局部變量:
<pre>
void foo() {
int ival, p;
/ … */
}
</pre>
而 C++ 的聲明,諸如int ival;,其自身就是一個程序語句,也因此可以出現在程序文本中的任何位置。
編譯單元##
C/C++ 中的一個源文件(.c, .cpp, .cc)就是一個編譯單元(compilation unit)。
頭文件(.h, .hpp)不是編譯單元,是不能單獨編譯的。
源文件經過預處理,先搞定下面這些東西:
- 宏:包括用戶定義的,和預定義的(__cplusplus, FILE, ...)
- 包含語句:源文件中的include語句全部展開
- 條件編譯: #if, #else, #ifudef, ...#error, #warning, ...
預處理過的源文件,經過編譯,生成對象文件(.o, .obj)。對象文件經過鏈接或打包,生成可執行文件或程序庫。雖然這里的步驟不太嚴格,但是大抵就是這樣。
如果你對預處理的結果很感興趣,可以試試編譯器的預處理命令:gcc -E (GCC),cl /E or /P (VC)。
對象##
這里所說的對象(object),泛指一切類型的實例,不只是類的實例。
關于對象,我們將探討以下幾個方面:
- 對象的大小(size)
- 按存儲(storage)分類的對象
- 聚合(aggregate)
對象的大小###
先來考慮幾個問題:
- sizeof是一個函數嗎?
- 你知道sizeof(int), sizeof(long)各為多少嗎?
- 為什么應該用size_t?
<strong>size_t</strong>
標準庫里到處都是size_t的身影:
<pre>
void *malloc(size_t n);
void *memcpy(void *s1, void const *s2, size_t n);
size_t strlen(char const *s);
</pre>
回到前面的問題,不難理解以下幾點:
- size_t是sizeof返回值的類型
- size_t是一個typedef
- sizeof不是一個函數,它是一個編譯時操作符
- size_t能夠表示任何類型理論上可能的數組的最大大小
其實,size_t一般就是unsigned int的typedef,那為什么不直接用unsigned int?在IP16或IP32平臺上(即int和指針大小一致時),確實沒有問題,但I16LP32就不行了。此外,直接用unsigned long固然沒錯,但畢竟得多花了幾個字節,稍微有點浪費了。反正只要用size_t,你就可以同時得到正確性和可移植性。
<strong>數據對齊</strong>
請問mixed_data的大小是多少?是 8 嗎?
<pre>
struct mixed_data {
char data1;
short data2;
int data3;
char data4;
};
</pre>
在 32 位 x86 平臺上編譯后的樣子:
<pre>
struct mixed_data {
char data1;
char padding1[1];
short data2;
int data3;
char data4;
char padding2[3];
};</pre>
為了數據對齊,編譯器塞了一些邊角料進去,最終的大小為 12
<strong>按存儲分類的對象</strong>
C/C++ 的對象,按存儲類型分為以下幾種:
- 自動的(auto, register)</br>
- 靜態的(static)
自由存儲的(free-store)
關鍵字auto有點多余,下面兩條聲明語句其實等價,b前面的auto加不加一個效果:
<pre>
{
int a;
auto int b;
}
</pre>
到了 C++11,auto這個關鍵字就被拿來另作他用了:auto可以讓編譯器從變量的初始化上自動推斷出它的類型:
<pre>auto a = std::max(1.0, 4.0); // 編譯器推斷出 a 的類型為 double</pre>
聚合###
首先,什么叫聚合?
對 C 來說,數組和結構是聚合。
對 C++ 來說,除了數組外,滿足以下條件的類(或結構)也是聚合:
- 沒有用戶聲明的構造函數
- 沒有private或protected非靜態數據成員
- 沒有基類
- 沒有虛函數
所以,下面幾個類型都是聚合:
<pre>
int[5];
struct person {
std::string name;
int age;
};
boost::array;
</pre>
<strong>第一部分完。</strong>
原文地址