如何寫(xiě)好C main函數(shù)?
學(xué)習(xí)如何構(gòu)造一個(gè) C 文件并編寫(xiě)一個(gè) C main 函數(shù)來(lái)成功地處理命令行參數(shù)。
我知道,現(xiàn)在孩子們用 Python 和 JavaScript 編寫(xiě)他們的瘋狂“應(yīng)用程序”。但是不要這么快就否定 C 語(yǔ)言 —— 它能夠提供很多東西,并且簡(jiǎn)潔。如果你需要速度,用 C 語(yǔ)言編寫(xiě)可能就是你的答案。如果你正在尋找穩(wěn)定的職業(yè)或者想學(xué)習(xí)如何捕獲空指針解引用,C 語(yǔ)言也可能是你的答案!在本文中,我將解釋如何構(gòu)造一個(gè) C 文件并編寫(xiě)一個(gè) C main 函數(shù)來(lái)成功地處理命令行參數(shù)。
我:一個(gè)頑固的 Unix 系統(tǒng)程序員。
你:一個(gè)有編輯器、C 編譯器,并有時(shí)間打發(fā)的人。
讓我們開(kāi)工吧。
一個(gè)無(wú)聊但正確的 C 程序
Parody O'Reilly book cover, "Hating Other People's Code"
C 程序以 main()
函數(shù)開(kāi)頭,通常保存在名為 main.c
的文件中。
/* main.c */
int main(int argc, char *argv[]) {
}
這個(gè)程序可以編譯但不干任何事。
$ gcc main.c
$ ./a.out -o foo -vv
$
正確但無(wú)聊。
main 函數(shù)是唯一的。
main()
函數(shù)是開(kāi)始執(zhí)行時(shí)所執(zhí)行的程序的***個(gè)函數(shù),但不是***個(gè)執(zhí)行的函數(shù)。***個(gè)函數(shù)是 _start()
,它通常由 C 運(yùn)行庫(kù)提供,在編譯程序時(shí)自動(dòng)鏈入。此細(xì)節(jié)高度依賴(lài)于操作系統(tǒng)和編譯器工具鏈,所以我假裝沒(méi)有提到它。
main()
函數(shù)有兩個(gè)參數(shù),通常稱(chēng)為 argc
和 argv
,并返回一個(gè)有符號(hào)整數(shù)。大多數(shù) Unix 環(huán)境都希望程序在成功時(shí)返回 0
(零),失敗時(shí)返回 -1
(負(fù)一)。
參數(shù) | 名稱(chēng) | 描述 |
---|---|---|
argc |
參數(shù)個(gè)數(shù) | 參數(shù)向量的個(gè)數(shù) |
argv |
參數(shù)向量 | 字符指針數(shù)組 |
參數(shù)向量 argv
是調(diào)用你的程序的命令行的標(biāo)記化表示形式。在上面的例子中,argv
將是以下字符串的列表:
argv = [ "/path/to/a.out", "-o", "foo", "-vv" ];
參數(shù)向量在其***個(gè)索引 argv[0]
中確保至少會(huì)有一個(gè)字符串,這是執(zhí)行程序的完整路徑。
main.c 文件的剖析
當(dāng)我從頭開(kāi)始編寫(xiě) main.c
時(shí),它的結(jié)構(gòu)通常如下:
/* main.c */
/* 0 版權(quán)/許可證 */
/* 1 包含 */
/* 2 定義 */
/* 3 外部聲明 */
/* 4 類(lèi)型定義 */
/* 5 全局變量聲明 */
/* 6 函數(shù)原型 */
int main(int argc, char *argv[]) {
/* 7 命令行解析 */
}
/* 8 函數(shù)聲明 */
下面我將討論這些編號(hào)的各個(gè)部分,除了編號(hào)為 0 的那部分。如果你必須把版權(quán)或許可文本放在源代碼中,那就放在那里。
另一件我不想討論的事情是注釋。
“評(píng)論謊言。”
- 一個(gè)憤世嫉俗但聰明又好看的程序員。
與其使用注釋?zhuān)蝗缡褂糜幸饬x的函數(shù)名和變量名。
鑒于程序員固有的惰性,一旦添加了注釋?zhuān)S護(hù)負(fù)擔(dān)就會(huì)增加一倍。如果更改或重構(gòu)代碼,則需要更新或擴(kuò)充注釋。隨著時(shí)間的推移,代碼會(huì)變得面目全非,與注釋所描述的內(nèi)容完全不同。
如果你必須寫(xiě)注釋?zhuān)灰獙?xiě)關(guān)于代碼正在做什么,相反,寫(xiě)下代碼為什么要這樣寫(xiě)。寫(xiě)一些你將要在五年后讀到的注釋?zhuān)菚r(shí)你已經(jīng)將這段代碼忘得一干二凈。世界的命運(yùn)取決于你。不要有壓力。
1、包含
我添加到 main.c
文件的***個(gè)東西是包含文件,它們?yōu)槌绦蛱峁┐罅繕?biāo)準(zhǔn) C 標(biāo)準(zhǔn)庫(kù)函數(shù)和變量。C 標(biāo)準(zhǔn)庫(kù)做了很多事情。瀏覽 /usr/include
中的頭文件,你可以了解到它們可以做些什么。
#include
字符串是 C 預(yù)處理程序(cpp)指令,它會(huì)將引用的文件完整地包含在當(dāng)前文件中。C 中的頭文件通常以 .h
擴(kuò)展名命名,且不應(yīng)包含任何可執(zhí)行代碼。它只有宏、定義、類(lèi)型定義、外部變量和函數(shù)原型。字符串 <header.h>
告訴 cpp 在系統(tǒng)定義的頭文件路徑中查找名為 header.h
的文件,它通常在 /usr/include
目錄中。
/* main.c */
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <libgen.h>
#include <errno.h>
#include <string.h>
#include <getopt.h>
#include <sys/types.h>
這是我默認(rèn)會(huì)全局包含的最小包含集合,它將引入:
#include 文件 | 提供的東西 |
---|---|
stdio | 提供 FILE 、stdin 、stdout 、stderr 和 fprint() 函數(shù)系列 |
stdlib | 提供 malloc() 、calloc() 和 realloc() |
unistd | 提供 EXIT_FAILURE 、EXIT_SUCCESS |
libgen | 提供 basename() 函數(shù) |
errno | 定義外部 errno 變量及其可以接受的所有值 |
string | 提供 memcpy() 、memset() 和 strlen() 函數(shù)系列 |
getopt | 提供外部 optarg 、opterr 、optind 和 getopt() 函數(shù) |
sys/types | 類(lèi)型定義快捷方式,如 uint32_t 和 uint64_t |
2、定義
/* main.c */
<...>
#define OPTSTR "vi:o:f:h"
#define USAGE_FMT "%s [-v] [-f hexflag] [-i inputfile] [-o outputfile] [-h]"
#define ERR_FOPEN_INPUT "fopen(input, r)"
#define ERR_FOPEN_OUTPUT "fopen(output, w)"
#define ERR_DO_THE_NEEDFUL "do_the_needful blew up"
#define DEFAULT_PROGNAME "george"
這在現(xiàn)在沒(méi)有多大意義,但 OPTSTR
定義我這里會(huì)說(shuō)明一下,它是程序推薦的命令行開(kāi)關(guān)。參考 getopt(3) man 頁(yè)面,了解 OPTSTR
將如何影響 getopt()
的行為。
USAGE_FMT
定義了一個(gè) printf()
風(fēng)格的格式字符串,它用在 usage()
函數(shù)中。
我還喜歡將字符串常量放在文件的 #define
這一部分。如果需要,把它們收集在一起可以更容易地修正拼寫(xiě)、重用消息和國(guó)際化消息。
***,在命名 #define
時(shí)全部使用大寫(xiě)字母,以區(qū)別變量和函數(shù)名。如果需要,可以將單詞放連在一起或使用下劃線(xiàn)分隔,只要確保它們都是大寫(xiě)的就行。
3、外部聲明
/* main.c */
<...>
extern int errno;
extern char *optarg;
extern int opterr, optind;
extern
聲明將該名稱(chēng)帶入當(dāng)前編譯單元的命名空間(即 “文件”),并允許程序訪(fǎng)問(wèn)該變量。這里我們引入了三個(gè)整數(shù)變量和一個(gè)字符指針的定義。opt
前綴的幾個(gè)變量是由 getopt()
函數(shù)使用的,C 標(biāo)準(zhǔn)庫(kù)使用 errno
作為帶外通信通道來(lái)傳達(dá)函數(shù)可能的失敗原因。
4、類(lèi)型定義
/* main.c */
<...>
typedef struct {
int verbose;
uint32_t flags;
FILE *input;
FILE *output;
} options_t;
在外部聲明之后,我喜歡為結(jié)構(gòu)、聯(lián)合和枚舉聲明 typedef
。命名一個(gè) typedef
是一種傳統(tǒng)習(xí)慣。我非常喜歡使用 _t
后綴來(lái)表示該名稱(chēng)是一種類(lèi)型。在這個(gè)例子中,我將 options_t
聲明為一個(gè)包含 4 個(gè)成員的 struct
。C 是一種空格無(wú)關(guān)的編程語(yǔ)言,因此我使用空格將字段名排列在同一列中。我只是喜歡它看起來(lái)的樣子。對(duì)于指針聲明,我在名稱(chēng)前面加上星號(hào),以明確它是一個(gè)指針。
5、全局變量聲明
/* main.c */
<...>
int dumb_global_variable = -11;
全局變量是一個(gè)壞主意,你永遠(yuǎn)不應(yīng)該使用它們。但如果你必須使用全局變量,請(qǐng)?jiān)谶@里聲明,并確保給它們一個(gè)默認(rèn)值。說(shuō)真的,不要使用全局變量。
6、函數(shù)原型
/* main.c */
<...>
void usage(char *progname, int opt);
int do_the_needful(options_t *options);
在編寫(xiě)函數(shù)時(shí),將它們添加到 main()
函數(shù)之后而不是之前,在這里放函數(shù)原型。早期的 C 編譯器使用單遍策略,這意味著你在程序中使用的每個(gè)符號(hào)(變量或函數(shù)名稱(chēng))必須在使用之前聲明?,F(xiàn)代編譯器幾乎都是多遍編譯器,它們?cè)谏纱a之前構(gòu)建一個(gè)完整的符號(hào)表,因此并不嚴(yán)格要求使用函數(shù)原型。但是,有時(shí)你無(wú)法選擇代碼要使用的編譯器,所以請(qǐng)編寫(xiě)函數(shù)原型并繼續(xù)這樣做下去。
當(dāng)然,我總是包含一個(gè) usage()
函數(shù),當(dāng) main()
函數(shù)不理解你從命令行傳入的內(nèi)容時(shí),它會(huì)調(diào)用這個(gè)函數(shù)。
7、命令行解析
/* main.c */
<...>
int main(int argc, char *argv[]) {
int opt;
options_t options = { 0, 0x0, stdin, stdout };
opterr = 0;
while ((opt = getopt(argc, argv, OPTSTR)) != EOF)
switch(opt) {
case 'i':
if (!(options.input = fopen(optarg, "r")) ){
perror(ERR_FOPEN_INPUT);
exit(EXIT_FAILURE);
/* NOTREACHED */
}
break;
case 'o':
if (!(options.output = fopen(optarg, "w")) ){
perror(ERR_FOPEN_OUTPUT);
exit(EXIT_FAILURE);
/* NOTREACHED */
}
break;
case 'f':
options.flags = (uint32_t )strtoul(optarg, NULL, 16);
break;
case 'v':
options.verbose += 1;
break;
case 'h':
default:
usage(basename(argv[0]), opt);
/* NOTREACHED */
break;
}
if (do_the_needful(&options) != EXIT_SUCCESS) {
perror(ERR_DO_THE_NEEDFUL);
exit(EXIT_FAILURE);
/* NOTREACHED */
}
return EXIT_SUCCESS;
}
好吧,代碼有點(diǎn)多。這個(gè) main()
函數(shù)的目的是收集用戶(hù)提供的參數(shù),執(zhí)行最基本的輸入驗(yàn)證,然后將收集到的參數(shù)傳遞給使用它們的函數(shù)。這個(gè)示例聲明一個(gè)使用默認(rèn)值初始化的 options
變量,并解析命令行,根據(jù)需要更新 options
。
main()
函數(shù)的核心是一個(gè) while
循環(huán),它使用 getopt()
來(lái)遍歷 argv
,尋找命令行選項(xiàng)及其參數(shù)(如果有的話(huà))。文件前面定義的 OPTSTR
是驅(qū)動(dòng) getopt()
行為的模板。opt
變量接受 getopt()
找到的任何命令行選項(xiàng)的字符值,程序?qū)z測(cè)命令行選項(xiàng)的響應(yīng)發(fā)生在 switch
語(yǔ)句中。
如果你注意到了可能會(huì)問(wèn),為什么 opt
被聲明為 32 位 int
,但是預(yù)期是 8 位 char
?事實(shí)上 getopt()
返回一個(gè) int
,當(dāng)它到達(dá) argv
末尾時(shí)取負(fù)值,我會(huì)使用 EOF
(文件末尾標(biāo)記)匹配。char
是有符號(hào)的,但我喜歡將變量匹配到它們的函數(shù)返回值。
當(dāng)檢測(cè)到一個(gè)已知的命令行選項(xiàng)時(shí),會(huì)發(fā)生特定的行為。在 OPTSTR
中指定一個(gè)以冒號(hào)結(jié)尾的參數(shù),這些選項(xiàng)可以有一個(gè)參數(shù)。當(dāng)一個(gè)選項(xiàng)有一個(gè)參數(shù)時(shí),argv
中的下一個(gè)字符串可以通過(guò)外部定義的變量 optarg
提供給程序。我使用 optarg
來(lái)打開(kāi)文件進(jìn)行讀寫(xiě),或者將命令行參數(shù)從字符串轉(zhuǎn)換為整數(shù)值。
這里有幾個(gè)關(guān)于代碼風(fēng)格的要點(diǎn):
- 將
opterr
初始化為0
,禁止getopt
觸發(fā)?
。 - 在
main()
的中間使用exit(EXIT_FAILURE);
或exit(EXIT_SUCCESS);
。 /* NOTREACHED */
是我喜歡的一個(gè) lint 指令。- 在返回 int 類(lèi)型的函數(shù)末尾使用
return EXIT_SUCCESS;
。 - 顯示強(qiáng)制轉(zhuǎn)換隱式類(lèi)型。
這個(gè)程序的命令行格式,經(jīng)過(guò)編譯如下所示:
$ ./a.out -h
a.out [-v] [-f hexflag] [-i inputfile] [-o outputfile] [-h]
事實(shí)上,在編譯后 usage()
就會(huì)向 stderr
發(fā)出這樣的內(nèi)容。
8、函數(shù)聲明
/* main.c */
<...>
void usage(char *progname, int opt) {
fprintf(stderr, USAGE_FMT, progname?progname:DEFAULT_PROGNAME);
exit(EXIT_FAILURE);
/* NOTREACHED */
}
int do_the_needful(options_t *options) {
if (!options) {
errno = EINVAL;
return EXIT_FAILURE;
}
if (!options->input || !options->output) {
errno = ENOENT;
return EXIT_FAILURE;
}
/* XXX do needful stuff */
return EXIT_SUCCESS;
}
我***編寫(xiě)的函數(shù)不是個(gè)樣板函數(shù)。在本例中,函數(shù) do_the_needful()
接受一個(gè)指向 options_t
結(jié)構(gòu)的指針。我驗(yàn)證 options
指針不為 NULL
,然后繼續(xù)驗(yàn)證 input
和 output
結(jié)構(gòu)成員。如果其中一個(gè)測(cè)試失敗,返回 EXIT_FAILURE
,并且通過(guò)將外部全局變量 errno
設(shè)置為常規(guī)錯(cuò)誤代碼,我可以告知調(diào)用者常規(guī)的錯(cuò)誤原因。調(diào)用者可以使用便捷函數(shù) perror()
來(lái)根據(jù) errno
的值發(fā)出便于閱讀的錯(cuò)誤消息。
函數(shù)幾乎總是以某種方式驗(yàn)證它們的輸入。如果完全驗(yàn)證代價(jià)很大,那么嘗試執(zhí)行一次并將驗(yàn)證后的數(shù)據(jù)視為不可變。usage()
函數(shù)使用 fprintf()
調(diào)用中的條件賦值驗(yàn)證 progname
參數(shù)。接下來(lái) usage()
函數(shù)就退出了,所以我不會(huì)費(fèi)心設(shè)置 errno
,也不用操心是否使用正確的程序名。
在這里,我要避免的***錯(cuò)誤是解引用 NULL
指針。這將導(dǎo)致操作系統(tǒng)向我的進(jìn)程發(fā)送一個(gè)名為 SYSSEGV
的特殊信號(hào),導(dǎo)致不可避免的死亡。用戶(hù)最不希望看到的是由 SYSSEGV
而導(dǎo)致的崩潰。***是捕獲 NULL
指針以發(fā)出更合適的錯(cuò)誤消息并優(yōu)雅地關(guān)閉程序。
有些人抱怨在函數(shù)體中有多個(gè) return
語(yǔ)句,他們喋喋不休地說(shuō)些“控制流的連續(xù)性”之類(lèi)的東西。老實(shí)說(shuō),如果函數(shù)中間出現(xiàn)錯(cuò)誤,那就應(yīng)該返回這個(gè)錯(cuò)誤條件。寫(xiě)一大堆嵌套的 if
語(yǔ)句只有一個(gè) return
絕不是一個(gè)“好主意”™。
***,如果你編寫(xiě)的函數(shù)接受四個(gè)以上的參數(shù),請(qǐng)考慮將它們綁定到一個(gè)結(jié)構(gòu)中,并傳遞一個(gè)指向該結(jié)構(gòu)的指針。這使得函數(shù)簽名更簡(jiǎn)單,更容易記住,并且在以后調(diào)用時(shí)不會(huì)出錯(cuò)。它還可以使調(diào)用函數(shù)速度稍微快一些,因?yàn)樾枰獜?fù)制到函數(shù)堆棧中的東西更少。在實(shí)踐中,只有在函數(shù)被調(diào)用數(shù)百萬(wàn)或數(shù)十億次時(shí),才會(huì)考慮這個(gè)問(wèn)題。如果認(rèn)為這沒(méi)有意義,那也無(wú)所謂。
等等,你不是說(shuō)沒(méi)有注釋嗎???!!
在 do_the_needful()
函數(shù)中,我寫(xiě)了一種特殊類(lèi)型的注釋?zhuān)皇亲鳛檎嘉环O(shè)計(jì)的,而不是為了說(shuō)明代碼:
/* XXX do needful stuff */
當(dāng)你寫(xiě)到這里時(shí),有時(shí)你不想停下來(lái)編寫(xiě)一些特別復(fù)雜的代碼,你會(huì)之后再寫(xiě),而不是現(xiàn)在。那就是我留給自己再次回來(lái)的地方。我插入一個(gè)帶有 XXX
前綴的注釋和一個(gè)描述需要做什么的簡(jiǎn)短注釋。之后,當(dāng)我有更多時(shí)間的時(shí)候,我會(huì)在源代碼中尋找 XXX
。使用什么前綴并不重要,只要確保它不太可能在另一個(gè)上下文環(huán)境(如函數(shù)名或變量)中出現(xiàn)在你代碼庫(kù)里。
把它們組合在一起
好吧,當(dāng)你編譯這個(gè)程序后,它仍然幾乎沒(méi)有任何作用。但是現(xiàn)在你有了一個(gè)堅(jiān)實(shí)的骨架來(lái)構(gòu)建你自己的命令行解析 C 程序。
/* main.c - the complete listing */
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <libgen.h>
#include <errno.h>
#include <string.h>
#include <getopt.h>
#define OPTSTR "vi:o:f:h"
#define USAGE_FMT "%s [-v] [-f hexflag] [-i inputfile] [-o outputfile] [-h]"
#define ERR_FOPEN_INPUT "fopen(input, r)"
#define ERR_FOPEN_OUTPUT "fopen(output, w)"
#define ERR_DO_THE_NEEDFUL "do_the_needful blew up"
#define DEFAULT_PROGNAME "george"
extern int errno;
extern char *optarg;
extern int opterr, optind;
typedef struct {
int verbose;
uint32_t flags;
FILE *input;
FILE *output;
} options_t;
int dumb_global_variable = -11;
void usage(char *progname, int opt);
int do_the_needful(options_t *options);
int main(int argc, char *argv[]) {
int opt;
options_t options = { 0, 0x0, stdin, stdout };
opterr = 0;
while ((opt = getopt(argc, argv, OPTSTR)) != EOF)
switch(opt) {
case 'i':
if (!(options.input = fopen(optarg, "r")) ){
perror(ERR_FOPEN_INPUT);
exit(EXIT_FAILURE);
/* NOTREACHED */
}
break;
case 'o':
if (!(options.output = fopen(optarg, "w")) ){
perror(ERR_FOPEN_OUTPUT);
exit(EXIT_FAILURE);
/* NOTREACHED */
}
break;
case 'f':
options.flags = (uint32_t )strtoul(optarg, NULL, 16);
break;
case 'v':
options.verbose += 1;
break;
case 'h':
default:
usage(basename(argv[0]), opt);
/* NOTREACHED */
break;
}
if (do_the_needful(&options) != EXIT_SUCCESS) {
perror(ERR_DO_THE_NEEDFUL);
exit(EXIT_FAILURE);
/* NOTREACHED */
}
return EXIT_SUCCESS;
}
void usage(char *progname, int opt) {
fprintf(stderr, USAGE_FMT, progname?progname:DEFAULT_PROGNAME);
exit(EXIT_FAILURE);
/* NOTREACHED */
}
int do_the_needful(options_t *options) {
if (!options) {
errno = EINVAL;
return EXIT_FAILURE;
}
if (!options->input || !options->output) {
errno = ENOENT;
return EXIT_FAILURE;
}
/* XXX do needful stuff */
return EXIT_SUCCESS;
}
現(xiàn)在,你已經(jīng)準(zhǔn)備好編寫(xiě)更易于維護(hù)的 C 語(yǔ)言。如果你有任何問(wèn)題或反饋,請(qǐng)?jiān)谠u(píng)論中分享。