解析C++中的內部連接與外部連接
在介紹C++中的內部連接與外部連接前,先說明一些概念。
1.聲明
一個聲明將一個名稱引入一個作用域;
在c++中,在一個作用域中重復一個聲明是合法的
以下都是聲明:
- int foo(int,int); //函數前置聲明
- typedef int Int; //typedef 聲明
- class bar; //類前置聲明
- extern int g_var; //外部引用聲明
- class bar; //類前置聲明
- typedef int Int; //typedef 聲明
- extern int g_var; //外部引用聲明
- friend test; //友員聲明
- using std::cout; //名字空間引用聲明
- friend test; //友員聲明
- using std::cout; //名字空間引用聲明
- int foo(int,int); //函數前置聲明
在同一個作用域中你可以多次重復這些聲明。
有兩種聲明不能重復,那就是類成員函數及靜態數據成員的聲明
- class foo
- {
- static int i;
- static int i;//不可以
- public:
- int foo();
- int foo();//不可以
- };
2.定義
一個定義提供一個實體(類型、實例、函數)在一個作用域的唯一描述。
在同一作用域中不可重復定義一個實體。
以下都是定義。
- int y;
- class foo {...};
- struct bar {...};
- foo* p;
- static int i;
- enum Color{RED,GREEN,BLUE};
- const double PI = 3.1415;
- union Rep{...};
- void test(int p) {};
- foo a;
- bar b;
3.編譯單元
當一個c或cpp文件在編譯時,預處理器首先遞歸包含頭文件,形成一個含有所有 必要信息的單個源文件,這個源文件就是一個編譯單元。這個編譯單元會被編譯成為一個與cpp文件名同名的目標文件(.o或是.obj)。連接程序把不同編譯單元中產生的符號聯系起來,構成一個可執行程序。
4.自由函數
如果一個函數是自由函數,那么這個函數不是類的成員函數,也不是友元函數。
下面來看內部連接和外部連接
內部連接:如果一個名稱對于它的編譯單元來說是局部的,并且在連接時不會與其它編譯單元中的同樣的名稱相沖突,那么這個名稱有內部連接(注:有時也將聲明看作是無連接的,這里我們統一看成是內部連接的)。
以下情況有內部連接:
a)所有的聲明
b)名字空間(包括全局名字空間)中的靜態自由函數、靜態友元函數、靜態變量的定義
c)enum定義
d)inline函數定義(包括自由函數和非自由函數)
e)類的定義
f)名字空間中const常量定義
g)union的定義
外部連接:在一個多文件程序中,如果一個名稱在連接時可以和其它編譯單元交互,那么這個名稱就有外部連接。
以下情況有外部連接:
a)類非inline函數總有外部連接。包括類成員函數和類靜態成員函數
b)類靜態成員變量總有外部連接。
c)名字空間(包括全局名字空間)中非靜態自由函數、非靜態友元函數及非靜態變量
下面舉例說明:
a)聲明、enum定義、union定義有內部連接
所有的聲明、enum定義及union定義在編譯后不會產生連接符號,也就是在不同編譯單元中有相同名稱的聲明及enum、union定義并不會在連接時發生發現多個符號的錯誤。
- // main.cpp
- typedef int Int; //typedef 聲明,內部連接
- enum Color{red}; //enum定義,內部連接
- union X //union定義,內部連接
- {
- long a;
- char b[10];
- };
- int main(void)
- {
- Int i = red;
- return i;
- }
- // a.cpp
- typedef int Int; //在a.cpp中重聲明一個int類型別名,在連接時不會發生錯誤
- enum Color{blue}; //在a.cpp中重定義了一個enum Color,在連接時不會發生錯誤
- const Int i =blue; //const常量定義,內部連接
- union X //union定義,內部連接
- {
- long a;
- char b[10];
- };
b)名字空間中靜態自由函數、靜態友元函數、靜態變量、const常量定義有內部連接
- // main.cpp
- namespace test
- {
- int foo(); //函數聲明,內部連接
- static int i = 0; //名字空間靜態變量定義,內部連接
- static int foo() { return 0;} //名字空間靜態函數定義,內部連接
- }
- static int i = 0; //全局靜態變量定義,內部連接
- static int foo() {return 1;} //全局靜態函數定義,內部連接
- const int k = 0; //全局const常量定義,內部連接
- int main(void)
- {
- return 0;
- }
- //a.cpp
- namespace test
- {
- int i = 0; //名字空間變量定義,外部連接
- int foo() {return 0;} //名字空間函數定義,外部連接
- }
- int i = 0; //全局變量定義,外部連接
- int k = 0; //全局變量定義,外部連接
- int foo() { return 2;} //全局函數定義,外部連接
在全局名字空間中,main.cpp中定義了靜態變量i,常量k,及靜態自由函數foo等,這些都有內部連接。如果你將這些變量或函數的static或是const修飾符去掉,在連接時就會現multiply defined symbols錯誤,它們與a.cpp中的全局變量、全局函數發生沖突。
c)類定義總有內部連接,而非inline類成員函數定義總有外部連接,不論這個成員函數是靜態、虛擬還是一般成員函數,類靜態數據成員定義總有外部連接。
1.類的定義有內部連接。如果不是,想象一下你在4個cpp文件中include定義了類Base的頭文件,在4個編譯單元中的類Base都有外部連接,在連接的時候就會出錯。
看下面的例子:
- //main.cpp
- class B //類定義,內部連接
- {
- static int s_i; //靜態類成員聲明,內部連接
- public:
- void foo() { ++s_i;} //類inline函數,內部連接
- };
- struct D
- {
- void foo(); //類成員函數聲明,內部連接
- };
- int B::s_i = 0; //類靜態數據成員定義,外部連接
- void D::foo() //類成員函數定義,外部連接
- {
- cout << "D::foo in main.cpp" <<endl;
- }
- int main() //main函數,全局自由函數,外部連接
- {
- B b;
- D d;
- return 0;
- }
- //a.cpp
- class B
- {
- int k;
- };
- struct D
- {
- int d;
- };
在這個例子中,main.cpp與a.cpp中都有class B和class D的定義,但在編譯這兩個cpp文件時并不發生link錯誤。
2.類的非inline成員函數(一般,靜態,虛擬都是)總有外部連接,這樣當你include了某個類的頭文件,使用這個類的函數時,就能連接到正確的類成員函數上,繼續以上面為例子,如果把a.cpp中的struct D改為
- struct D //類定義
- {
- int d;
- void foo(); //類成員函數聲明
- };
- void D::foo() //類成員函數定義,外部連接
- {
- cout << " D::foo in a.cpp" <<endl;
- }
這時main.cpp與a.cpp中的D::foo都有外部連接,在連接就會出現multiply defined symbols錯。
3.類的靜態數據成員有外部連接,如上例的B::s_i,這樣當你在main.cpp中定義了類靜態數據成員,其它編譯單元若使用了B::s_i,就會連接到main.cpp對應編譯單元的s_i。
d)inline函數總有內部連接,不論這個函數是什么函數
- // main.cpp
- inline int foo() { return 1;} //inline全局函數,內部連接
- class Bar //類定義,內部連接
- {
- public:
- static int f() { return 2;} //inline 類靜態函數,內部連接
- int g(int i) { return i;} //inline 類成員函數,內部連接
- };
- class Base
- {
- public:
- inline int k(); //類成員函數聲明,內部連接
- };
- inline int Base::k(){return 5;} //inline 類成員函數,內部連接
- int main(void)
- {
- return 0;
- }
如果你的Base類是定義在Base.h中,而Base的inline 函數是在Base.cpp中定義的,那么在main.cpp中include "Base.h"編譯不會出現問題,但在連接時會找不到函數k,所以類的inline函數***放到頭文件中,讓每一個包含頭文件的cpp都能找到inline函數。
現在對c++中的連接有了一個認識,能清楚的知道是什么原因產生連接時錯誤。當你在連接時產生連接不到的錯誤,這說明所有的編譯單元都沒有這個實體的外部連接;當你在連接時發現有多個連接實體,這說明有多個編譯單元提供了同名的有外部連接的實體。同時,在進行程序設計時,也要注意不要使只有本編譯單元用到的函數、類、變量等有外部連接,減少與其它編譯單元的連接沖突。
不過在這里沒有說明template函數及template class的連接性,并且對一些特別的情況也沒有作出說明(比如inline函數不能被inline)。