C語言基礎之文件操作基本常識
我們都知道,在C語言中,文件操作都是由庫函數來完成的。下面會給大家介紹到輸入輸出等函數,供參考 。
由于程序中經常有大量對文件的輸入輸出操作,它經常構成了程序的主要部分,因而C語言提供了很多輸入輸出的函數,它們分別用于兩種類型文件輸入輸出系統:即由ANSI標準定義的緩沖文件(也稱標準文件(流)輸入輸出(I/O)系統);另一類是ANSI標準中沒有定義的非緩沖文件(也稱非標準文件(流)輸入輸出(I/O)系統)。
我們已經熟悉了通過鍵盤和顯示器進行輸入輸出的一些函數,如scanf(),printf()等等,這些通過控制臺(鍵盤、顯示器等)進行I/O的操作,可以看作標準文件輸入輸出系統的一些特例,實際上在標準輸入輸出系統中的一些函數,有關文件的參數(文件結構指針或稱流指針),只要用標準設備的流指針代替,這些標準輸入輸出函數即成為控制臺I/O函數。
在任何程序執行時,C系統都定義了5個標準設備文件可供使用。自動打開的5個標準設備文件的文件結構指針(在標準I/O系統中)和文件代號將有一個規定值:
設備 標準文件I/O系統中的流指針名 非標準文件……
鍵盤(標準輸入) stdin 0
顯示器(標準輸出) stdout 1
顯示器(標準錯誤) stderr 2
串行口(標準輔助) stdoux 3
打印機(標準打印) stdprn 4
這樣,不論在標準文件系統還是非標準文件系統中,文件結構只要用上述的流指針或文件代號代替,則這些函數也均適用于控制臺設備。
一、文本流和二進制流
在C中引入了流(stream)的概念。它將數據的輸入輸出看作是數據的流入和流出,這樣不管是磁盤文件或者是物理設備(打印機、顯示器、鍵盤等),都可看作一種流的源和目的,視他們為同一種東西,而不管其具體的物理結構,即對他們的操作,就是數據的流入和流出。
這種把數據的輸入輸出操作對象,抽象化為一種流,而不管它的具體結構的方法很有利于編程,而涉及流的輸出操作函數可用于各種對象,與其具體的實體無關,即具有通用性。
在C中流可分為兩大類,即文本流(text stream)和二進制流(binary stream)。所謂文本流是指在流中流動的數據是以字符形式出現。在文本流中,\'\\n\'被換成回車CR和換行LF的代碼0DH和0AH。而當輸出時,則0DH和0AH本換成\'\\n\'。
二進制流是指流動的是二進制數字序列,若流中有字符,則用一個字節的二進制ASCII碼表示,若是數字,則用一個字節的二進制數表示。在流入流出時,對\\n符號不進行變換。例如2001這個數,在文本流中用其ASCII碼表示為:
\'2\' \'0\' \'0\' \'1\'
| | | |
50 48 48 49
共占4字節。而在二進制流中則表示為:00000111 11010001 用十六進制就是07D1。只占兩字節。
由此看出,二進制流比文本流節省空間,且不用進行對\\n的轉換,這樣可以大大加快流的速度,提高效率。因而,對于含有大量數字信息的數字流,可以采用二進制流的方式;對于含有大量字符信息的流,則采用文本流的方式。
二、流和文件
在C語言中流就是一種文件形式,它實際上就表示一個文件或設備(從廣義上講,設備也是一種文件)。把流當作文件總覺得不習慣,因而有人稱這種和流等同的文件為流式文件,流的輸入輸出也稱為文件的輸入輸出操作。當流到磁盤而成為文件時,意味著要啟動磁盤寫入操作,這樣流入一個字符(文本流)或流入一個字節(二進制流)均要啟動磁盤操作,將大大降低傳輸效率(磁盤是慢速設備),且降低磁盤的使用壽命。
為此,C語言在輸入輸出的使用使用了緩沖技術,即在內存為輸入的磁盤文件開辟了一個緩沖區(缺省為512字節),當流到該緩沖區裝滿后,再啟動磁盤一次,將緩沖區內容裝到磁盤文件中去。讀取文件也是類似。
在C語言中將此種文件輸入輸出操作稱為標準輸入輸出,或稱流式輸入輸出(因這種輸入輸出操作是ANSI C推薦的標準)。還有一種是不帶緩沖文件輸入輸出,稱為非標準文件輸入輸出或低級輸入輸出,它將由DOS直接管理。關于這兩種輸入輸出文件系統下節將會介紹。
三、文件FILE的數據結構
- typedef struct
- {
- short level;
- unsigned flags;
- char fd;
- unsigned char hold;
- short bsize;
- unsigned char *buffer;
- unsigned char *curp;
- unsigned istemp;
- short token;
- }FILE;
這是Turbo C中使用的定義(在stdio.h文件中),不同的C編譯器,可能使用不同的定義,但基本含義變化不會太大。
flags: 是一個10位的標志字,其具體含義如下:
位 | 代表符號 | 含義 |
0 | _F_READ | 讀 |
1 | _F_WRIT | 寫 |
2 | _F_BUF | 由fclose釋放緩沖區 |
3 | _F_LBUF | 行緩沖 |
4 | _F_ERR | 出錯標志 |
5 | _F_EOF | EOF文件尾標志 |
6 | _F_BIN | 二進制方式 |
7 | _F_IN | 在進行輸入 |
8 | _F_OUT | 在進行輸出 |
9 |
_F_TERM | 文件是一個終端 |
其他各字段內容以及flags字段內各位所的功能,請參照其他一些資料。這里不多說了,它目前并不是我們要求的內容。
應該注意,不要把文件指針和FILE結構指針混為一談,它們代表兩個不同的地址。文件指針指出了對文件當前讀寫的數據位置,而FILE結構指針是指出了打開文件所對應的FILE結構在內存中的地址,這個指針它實際本身也包含了文件指針的信息。流指針中的各字段是供C語言內部使用的,用戶不應該存取它的任何字段。
希望通過本文對文件操作的介紹,能夠給你帶來幫助。