程序員之程序設計知識點八
8.1 C文件概述
1.文件引用規則
為使計算機程序能處理大量的數據信息,常將數據存儲在計算機外部存儲介質中,如磁帶、磁盤等。計算機操作系統將存儲在外部存儲介質中的數據以數據流的形式來組織。每個獨立的數據流稱作文件,每個文件有一個名字。為便于管理文件,操作系統維持一個呈層次狀的目錄結構,每個文件都被登錄在某一目錄下。習慣也將從鍵盤輸入的數據流和向顯示屏或打印機輸出的數據流稱作文件。引用文件可由以下幾部分組成:
盤符:路徑\文件名.擴展名
其中盤符表示文件所在存儲塊,系統將外部存儲介質分成多個存儲塊,并用不同的盤符標識這些塊。路徑是文件所在目錄層次,文件名和擴展名通常是由字母開頭、字母和數字符組成。擴展名可以多至3個字符,通常用來表示文件的屬性。因操作系統保留著當前盤和當前路徑,若要引用當前盤或當前路徑下的文件,盤符和路徑可以省略。
2.文件的打開和關閉
由于文件存放在磁盤上,程序要處理文件上的數據,必須先將文件中的數據讀人到內存;反之,程序要將產生的數據永久保存,就應將數據寫到文件中。文件受操作系統管理,程序要使用文件,就要請求操作系統,讓程序與某文件之間建立某種聯系,習慣稱程序與文件建立聯系的過程為文件打開;反之,撤消程序與文件聯系的過程為文件關閉。所以,程序要使用文件,先要打開文件;程序使用文件結束后,應及時關閉文件。
3.文件緩沖技術
在現代計算機系統中,程序讀文件中的數據或寫數據到文件,都在操作系統控制下完成。若程序要從文件讀人一個數據,操作系統會一次性地讀入一大塊數據暫存于內存中,供程序已后再讀入時使用。程序向文件寫數據時,也不是立即將數據寫到文件中,而是暫時存于某個內存塊中,待內存塊寫滿,或程序明確告知寫文件結束后,再將數據寫到文件中。這種文件數據讀寫技術稱為緩沖。文件讀寫采用緩沖技術的系統稱為緩沖文件系統。在緩沖文件系統中,暫存輸入輸出數據的內存塊稱為文件緩沖區。不采用緩沖技術,操作系統直接按程序要求完成輸入輸出的系統稱為非緩沖系統。操作系統為了控制和完成文件讀寫操作,為每個正與程序相聯系的文件設有一個控制塊,在控制塊中記錄文件的名稱、文件的屬性、文件當前讀寫位置、文件緩沖區開始地址、文件當前讀寫位置所對應緩沖區的位置等等。文件緩沖區和文件控制塊都由系統分配和受系統控制。
4.二進制文件和文本文件
文件按其數據信息的存放格式分類,文件可分二進制文件和文本文件兩種。二進制文件中的數據是按二進制方式存放,即以數據在計算機內存的存放格式將數據存儲在文件中。將數據轉換成字符列,每個字符又以字符的代碼(例如,ASCII代碼)存儲的文件稱為文本文件。一般來說,二進制文件比文本文件更緊湊,并在數據傳輸時不必進行格式轉換,常用于計算機與計算機之間、計算機與外部設備之間傳輸數據用。由于文本文件以字符的代碼存儲,輸出內容能讓人直接閱讀,常用于人與計算機之間通信時使用。
5.順序文件和隨機文件
文件按讀寫方式分,可以把文件分為順序文件和隨機文件。順序文件要求文件讀寫從文件頭開始,讀或寫操作順序進行。若臨時要讀取文件中間的某個數據,必須從頭開始讀,直至讀人要讀的數據;若在文件某位置要寫入新的數據,也必須從文件的第一個數據開始順序讀取和復寫,并在要改寫的數據寫入后,還要繼續讀取和復寫其后的全部數據。隨機文件允許隨機地讀取或改寫文件任一位置上的數據。
C語言本身未提供有關文件操作的輸入輸出語句,但對文件的打開、關閉和讀寫操作都可用系統提供的庫函數來實現。程序可用它們對文件作各種復雜的處理。
6.設備文件
系統將常規設備上的輸入輸出數據流稱為標準文件,程序運行前,系統自動打開這些標準文件。它們是標準輸入文件、標準輸出文件、標準出錯輸出文件和標準打印輸出文件。系統自動定義了這些標準文件的文件指針,它們依次是stdin、stdout、stderr和stdprn,供程序直接使用。
程序除能直接使用前面各章都使用的不帶文件指針的標準輸入輸出庫函數外,也可對它們使用下面介紹的帶文件指針的一般形式的輸入輸出庫函數。如stdin,就是指從終端輸入數據;stdout,就是向終端輸出數據。
7.文件類型和文件類型指針變量
為了正確地完成文件讀寫,操作系統為每個正被程序使用的文件在內存中開辟一個存儲區,用于存放有關對文件進行操作所需的控制信息(簡稱控制塊)。如文件名、文件讀寫狀態。文件緩沖區大小和位置、當前讀寫位置等。控制塊是一個結構變量,其類型由系統預定義,取名為FILE,習慣稱文件類型。程序通過指向該控制塊的指針調用系統提供的文件處理庫函數。
程序在使用文件前,先調用文件打開函數。打開函數為將要使用的文件指定一個FILE類型的結構變量,并返回該結構的指針。系統通過指向該結構的指針來引用結構中的文件控制信息,實現正確讀寫對應的文件。
程序要使用文件,就要定義FILE類型的指針變量(稱文件指針變量)。例如:
FILE * fp;
定義如是一個文件指針變量,它能指向前述類型為FILE的文件控制塊結構變量。
8.文件打開庫函數 fopen()
在讀寫文件之前,先得打開文件。打開文件可使用庫函數fopen() 。調用函數fopen() 的一般形式為
fopen(文件名,使用方式)
其中文件名(可能還包括盤符和目錄路徑) 為字符串表達式。使用方式也是一個字符串,用來指明文件的讀寫方式。函數fopen() 將返回文件控制塊結構變量指針,程序應將調用函數fopen(),返回的指針值賦給某個文件指針變量來保存。如語句
fp = fopen(“\\usr4\\smp.dat”,“r”);
以文件讀方式打開根目錄下的usr4子目錄中的smp.dat文件。
調用函數fopen()時,可能會因某種原因不能打開文件。如讀方式下打開一個不存在的文件;在寫方式下,外部存儲介質已無剩余的自由空間,或外設故障,或超過系統能同時打開的文件數;等等。文件不能打開時,函數fopen()將返回一個空指針值NULL。程序應考慮到文件不能正常打開的極端情況,所以常用以下形式的C代碼描述打開一個文件的要求:
if((fp =fopen( filename,“r”))==NULL) {
printf(“Can not open %s file.\n”, filename);
exit(0); /* 結束程序的執行,回到環境或操作系統 */
}
以上代碼以讀方式打開一個文件,其中filename是某文件名字符串表達式。上述代碼在調用函數fopen()后立即檢查打開是否成功,如果打開不成功,就在終端上輸出該文件不能打開字樣,調用exit函數。exit函數是系統提供的函數,該函數的執行將釋放程序的全部資源,終止程序的執行。調用該函數時需指定一個整數,該整數將作為程序終止時給系統的一個返回值。若程序使用該函數,應在程序的頭寫上包含stdio.h頭文件的預處理命令。
關于函數fopen()的使用方式參數,說明以下幾點:
(1)用“r”方式打開的文件只能用于從文件輸入數據,不能用于輸出;而且要求該文件已經存在,否則函數fopen() 返回NULL值。
(2)用“w”方式打開的文件只能用于向文件輸出數據,不能用于輸入。如打開時,原文件不存在,則新建立一個以指定名字命名的文件;如原文件已存在,則原文件上的數據被全部刪除。
(3)如希望打開文件用于寫,又不要刪除原文件中的數據,并從原文件的末尾開始添加新的數據,應該用“a”方式打開。
(4)用“r+”、“w+”、“a+” 方式打開的文件可以輸入數據,也可以輸出數據。用“r+”方式只允許打開已存在的文件,以便程序能輸入數據;用“w+”方式打開,則新建立一個文件,先是向文件輸出數據,然后可以從該文件讀人數據;用“a+”方式打開一個已存在的文件,位置指針先移到文件的末尾,準備添加數據,以后也可以輸入數據。
(5)要打開二進制文件,只要在對應正文文件打開方式中接上字符b即可,如“rb”表示以輸入方式打開二進制文件。
正文文件與二進制文件在使用時,還有一點不同。對于正文文件,輸入時,回車符和換行符合成為一個換行符輸入;輸出時,換行符('\n')轉換成為回車符和換行符兩個字符一起輸出。對于二進制文件,不進行上述這種轉換。
9.文件關閉庫函數fclose()
在使用完一個文件后,程序應該立即關閉它,以防止后繼執行的程序語句錯誤或人為的誤操作破壞正打開著的文件。關閉文件可調用庫函數fclose()來實現。調用函數fclose()的一般形式為
fclose(文件指針);
例如:
fclose(fp);
調用函數fclose()的作用是使文件指針變量終止原先調用函數fopen()時所建立的它與文件的聯系。調用函數fclose()之后,不能再通過該文件指針變量對其原先相連的文件進行讀寫操作,除非被再次打開。文件被關閉后,原文件指針變量又可用來打開文件,或與別的文件相聯系,或重新與原先文件建立新的聯系。
8.2 文件處理程序結構和文件輸入輸出常用庫函數
1.正文文件輸入處理
從正文文件逐一輸入字符,對輸入的字符作某種處理的程序結構有:
int c; /* 不能為char類型 */
… /*說明有關變量和設置初值等 */
fp=fopen(文件名,“r”); /* 正文文件以讀方式打開 */
while(( c= fgetc(f))!= EOF) {
… /* 這里對剛讀人的存于C中的字符作某種處理 */
}
fclose(fp);
.../*輸出處理結果 */
其中函數 fgetC()的說明形式為
int fgetc(FILE *fp)
該函數的功能是從與中相聯系的文件中讀人下一個字符。在文件的控制塊中,有一個當前讀字符的位置信息,每讀入一個字符后,在文件還未結束情況下,這個當前位置信息就移向其后一個字符,從而保證程序反復調用函數fgetc() 能順序讀人文件中的字符。函數fgetc() 的返回值就是讀入字符的ASCII代碼值。讀八字符時,如遇到文件結束,函數返回文件結束標記EOF。對于正文文件,由于字符的ASCII代碼不可能是-1,因此可用EOF(定義為-1) 作為文件結束標記。
【例8.1】 輸入正文文件,統計文件中英文字母的個數,并輸出。
為使程序更有一般性,設程序要統計的正文文件名在程序啟動時由輸入指定。
# include
FILE *fp;
int main()
{ int count, ch;
char fname[40];
printf(“輸入文件名!\n”);
scanf(“%s%*c”, fname) ; /* 讀入文件名和名后的回車符 */
if((fp = fopen(fname,“r”))== NULL) { /* 以讀方式打開正文文件 */
printf(“Can not open%s file.\n”, fname);
return 0; /* 程序非正常結束 */
}
count= 0;
while((ch =fgetc(fp))! =EOF) {
/ * 這里對剛讀人的存于ch中的字符信息作某種處理 */
if(ch>=‘a' && ch<='z' || ch>='A' && ch<='Z' )
count++;
}
fclose(fp);
/*輸出處理結果 */
printf(“文件%s有英文字母%d個.\n”, fname, count)
return l; /* 程序執行正常結束 */
}
2.二進制文件輸入處理
從二進制文件逐一輸入字節,并作某種處理的程序結構有:
char c; /* 也可以是 int類型 */
… /* 說明有關變量和設置初值等 */
fp = fopen(文件名,“rb”);
while(! feof(fp)) {
c=fgetc(fp);
… /* 這里對存于C中的字節信息作某種處理 */
}
fclose(fp);
/* 輸出處理結果 */
其中函數feof() 用來判斷文件是否結束。函數調用feof(fp) 用來測試與fp相聯系的文件當前狀態是否為“文件結束”狀態。如果是文件結束狀態,函數調用feof(fp)返回非零值,否則返回零值。函數feof()也可用于測試正文文件。
對于二進制文件,一般不能以讀人字節的值是否為-1來判定二進制文件是否結束,而應該用函數feof()。
3.字符(或字節)逐一生成形成新文件的程序結構
正文文件與二進制文件的生成程序除文件打開方式不同外,它們的程序結構基本相同。字符(或字節)逐一生成輸出,形成新文件的程序結構有:
int c; /* 也可以是char類型 */
… /* 說明有關變量和設置初值等 */
fp = fopen(文件名,“W”); /* 或fP=fopen(文件,“wb”) */
while(還有字符(或字節)) {
… /* 生成字符(或字節)存于變量c */
fpute( c,fp); /* 將生成的字符(或字節)輸出 */
}
fclose(fp);
… /* 輸出程序結束報告 */
這里的函數fputc()的說明形式為
int fputc( char ch, FILE *fp)
該函數的功能是將ch中的字符輸出到與fp文件指針相聯系的文件中。函數fputc()返回一個整數值。如果輸出成功,則返回值就是輸出字符的ASCII代碼值;如果輸出失敗,則返回EOF,即-1。
曾介紹過的函數putchar()是在stdio.h中用函數fputc()定義的宏:
# define putchar(c) fputc(c, stdout)
用宏putchar(c) 比寫fputc(c,stdout) 在概念上更簡單一些。從使用者來說,可以把putchar(c) 看作函數調用,不必嚴格地稱它為宏調用。
4. 數據成塊輸入/輸出函數
為加快程序的處理速度,程序可以成批地讀人文件中的數據,也可成批地寫數據到文件。它們是函數fread()和fwrite()。
成批讀函數fread()的說明形式為
int fread(char *buf,int size, int count, FILE *rfp);
成批寫函數fwrite() 的說明形式為
int fwrite( char *buf, int size, int count,FILE *wfp);
其中,buf是字符數組首元指針。對fread()來說,它是讀人數據的存放開始地址;對bote()來說,是要輸出數據的開始地址。size是讀寫的數據塊的字節數。count為要進行讀寫的數據塊的個數。rfp和wfp為文件指針。調用上述函數共讀寫size。 count個字節或字符。函數fread()和fwrite()的返回值是實際完成輸入或輸出的數據塊的個數。一般情況下,輸出調用成功,返回值為count的值。
如果是讀寫二進制文件,用函數fread()和fwrite()可以讀寫任何類型的信息。如有一個如下形式的通信錄結構類型:
typedef struct {
char name[21]; /* 名字 */
char phone[15]; /* 電話 */
char zip[10]; /* 郵編 */
char addr[31]; /* 地址 */
} infoType;
利用類型infoType,可定義數組,如:
infoType info[30];
表示結構數組info[]能存放30個通信錄數據。而下面的兩個函數調用能分別實現20個通信錄信息從某文件讀出和寫入某文件:
fread( info,sizeof(infoType),20,rfp);
fwrite( info,sizeo(infoType),20,wfp);
5.格式輸入/輸出庫函數
與用函數scanf()從標準設備輸入和用函數printf()向標準設備輸出一樣,一般文件也可進行格式輸入和格式輸出。
函數fscanf()和fprintf()分別能對一般文件進行格式輸入和格式輸出。它們的調用形式分別為
fscantf(文件指針,格式字符串,輸入項地址表)
和
fprintf(文件指針,格式字符串,輸出項表)
例如:
fscanf(rp,“%d%f”,&i,&r);
fprintf(wp,“i=%d, r=%6.4f\n”, i,r);
前者表示從與叩相聯系的文件為變量i和r讀人數據;后者表示將整型變量i和實型變量r的值按格式輸出到與呷相聯系的文件上。
6.字符串輸入/輸出庫函數
函數fgets()和fputs()分別用于從正文文件輸入字符串和向正文文件輸出字符串。它們的說明形式分別為
char *fgets(char *str,int n, FILE *fp)
和
fputs(char *str, FILE *fp)
函數fgets() 用于從文件讀取字符序列,并存于字符指針所指出的存儲區域中。當連續讀人n-1個字符,或遇到換行符時,讀字符過程結束。
函數fgets()與函數gets()都在讀人的字符序列之后自動存儲字符串結束標記'\0’,使其成為字符串,并返回字符率的首字符指針。但它們有差別,函數fgets()除增加整型參數和文件指針參數之外,還在讀到換行符時,存儲換行符,而函數gets()不存儲換行符。
函數fputs()的作用是將字符串復制到文件。其中字符串的結束標記符是不復制的,也不在復制的字符序列之后另外再添加換行符,這一點與函數puts()不同。
7.文件定位庫函數
利用前面介紹的函數進行文件操作,只能順序讀寫文件。然而,在有些場合,還需要能對文件作隨機存取。實際上,因文件是存儲在外部存儲介質上的數據流,程序即刻能讀寫的是文件某一位置上的數據,這個位置稱為文件的當前讀寫位置。對于順序讀寫情況,每讀寫一個字符后,當前位置就自動向后移一個字符位置。對于允許隨機讀寫的文件,要讀寫其他別的位置上的數據,就得改變文件當前讀寫位置。實現這樣的移動可調用庫函數rewind()和fseek()來實現。另設有函數ftell()用于查詢文件當前讀寫位置。
函數rewind()的說明形式為
void rewind( FILE *fp)
函數rewind()的作用是使文件當前位置重新回到文件之首。該函數沒有返回值。
函數fseek()是實現文件隨機存取的最主要函數,用它可以將文件的當前位置移到文件的任意位置上。所謂文件的隨機存取(或隨機讀寫),是指讀寫完一個字符(或字節)之后,并不一定要讀寫其后繼的字符(或字節),可以改變當前位置,去讀寫文件中其他位置上的字符(或字節)。
函數fseek()的說明形式為
fseek(FILE *fp, long offset, int ptrname)
其中ptname表示定位基準。只允許0,l或2。其中0代表以文件首為基準,1代表以當前位置為基準,2代表以文件尾為基準。0、l和2分別被定義為名稱SEEK-SET、SEEK-CUR和SEEK-END。long型形參offset是偏移量,表示以prname為基準,偏移的字節數。因它是long型形參,當以整數作為它的實參調用函數 fseek()時,直在常數之后加上字母L,表示是long型常量。見下面調用函數fseek()的例子:
fseek(fp,4OL,SEEK-SET);
fseek(fp,20L,SEEK-CUR);
fseek(fp,-30L,SEEK-END);
分別表示將文件的當前位置定于離文件頭4O個字節處、將文件當前位置定于離當前位置20個字節處、將文件的當前位置定于文件尾后退30個字節處。
函數fseek()一般用于二進制文件的隨機讀寫,這是因為數據在二進制文件中的表示形式與數據在內存中的表示形式相同,各種類型的數據表示都有確定的字節數。而數據在正文文件中的表示形式與數據在內存中的表示形式不同,它們在輸入輸出時,數據的內外表示形式要進行轉換,數值類型的數據在正文文件中的表示沒有固定的字節數,計算位置時會發生混亂。
函數ftell()用于得到文件當前位置相對于文件首的偏移字節數。在隨機方式存取文件時,由于文件位置頻繁的前后移動,程序不容易確定文件的當前位置。調用函數ftell()就能非常容易地確定文件的當前位置。
函數ftell()的說明形式為
long ftell(FILE *fp)
利用函數ftell()也能方便地知道一個文件的長。如以下語句序列:
fseek(fp,OL,SEEK-END);
len=ftell(fp)
首先將文件的當前位置移到文件的末尾,然后調用函數ftell()獲得當前位置相對于文件首的偏移,該偏移值等于文件所含字節數。
8.文件錯誤測式庫函數
文件處理程序常用輸入輸出庫函數的返回值來判斷輸入輸出是否發生錯誤,也可以調用文件錯誤測試函數了解剛完成的文件輸入輸出函數的調用是否有錯。文件錯誤測試函數的說明形式為
int ferror(FILE *fp)
函數的返回值是與文件指針中相聯的最近一次文件庫函數調用是否發生錯誤。若有錯,函數返回非0值,若沒有錯誤,函數返回0值。通常在這非0值,詳細指出錯誤的類別和原因。
【編輯推薦】