在另一個(gè)貼子中,我與一些朋友對(duì) getc 展開了一些討論. 由于覺得樓主最終未能明白
我的意思,所以我把我個(gè)人的看法總結(jié)出來(lái),寫在這里.我不太擅長(zhǎng)說(shuō)明,但已經(jīng)盡力了.
任何人轉(zhuǎn)本貼, 請(qǐng)務(wù)必把本人的名字寫在顯眼的位置.??
約定編譯器為 gcc2/x86:
所以 char, unsigned char 為 8 位, int 為 32 位
(1) 字節(jié)的讀取
在正常的情況下, getc 以 unsigned char 的方式讀取文件流, 擴(kuò)張為一個(gè)整數(shù),并返
回. 換言之, getc 從文件流中取一個(gè)字節(jié), 并加上24個(gè)零,成為一個(gè)小于256的整數(shù),
然后返回.
int c;
while ((c = fgetc (rfp))!= -1) // -1就是 EOF
fputc (c, wfp);
上面 fputc 中的 c 雖然是整數(shù), 但在 fputc 將其寫入文件流之前, 又把整數(shù)的高24位
去掉了, 因此 fgetc, putc 配合能夠?qū)崿F(xiàn)文件復(fù)制. 到目前為止, 把 c 定義為
char仍然是可行的, 但下面我們將看到,把 c 定義為 int 是為正確判段文件是否結(jié)束.
(2) 判斷文件結(jié)束.
多數(shù)人認(rèn)為文件中有一個(gè)EOF,用于表示文件的結(jié)尾. 但這個(gè)觀點(diǎn)實(shí)際上是錯(cuò)誤的,在文
件所包含的數(shù)據(jù)中,并沒(méi)有什么文件結(jié)束符. 對(duì)getc 而言, 如果不能從文件中讀取,
則返回一個(gè)整數(shù) -1,這就是所謂的EOF. 返回 EOF 無(wú)非是出現(xiàn)了兩種情況,一是文件已
經(jīng)讀完; 二是文件讀取出錯(cuò),反正是讀不下去了.
請(qǐng)注意: 在正常讀取的情況下, 返回的整數(shù)均小于256, 即0x0~0xFF. 而讀不出返回的
是 0xFFFFFFFF. 但, 假如你用fputc把 0xFFFFFFFF 往文件里頭寫, 高24位被屏蔽,寫入的將
是 0xFF. // lixforalpha 請(qǐng)注意這一點(diǎn)
(3) 0xFF 會(huì)使我們混淆嗎?
不會(huì), 前提是, 接收返回值的 c 要按原型定義為 int.
如果下一個(gè)讀取的字符將為 0xFF, 則
int c;
c = fgetc (rfp); // c = 0x000000FF;
if (c != -1)? ? // 當(dāng)然不等, -1 是 0xFFFFFFFF
fputc (wfp);? ?// 噢, OXFF 復(fù)制成功.
字符0xFF, 其本身并不是EOF.
(4) 將 c 定義 char
假定下一個(gè)讀取的字符為 0xFF 則
char c;
c = fgetc (rfp); // fgetc(rfp)的值為 0x000000FF, 暗中降為字節(jié), c = 0xFF
if (c != -1)? ? // 字符與整數(shù)比較? c 被帶符號(hào)(signed)擴(kuò)展為0xFFFFFFFF, 喔噢,
條件成立,文件復(fù)制提前退出.
while ((c=fgetc(rfp))!=EOF) 中的判別條件成立, 文件復(fù)制結(jié)束! 意外中止.
(5) 將 c 定義為 unsigned char;
當(dāng)讀到文件末尾, 返回 EOF 也就是 -1 時(shí),
unsigned char c;
c = fgetc (rfp); // fgetc (rfp)的值為EOF,即-1,即0xFFFFFFFF, 降格為字節(jié), c=0xFF
if ( c!= -1)??// c 被擴(kuò)展為 0x000000FF, 永遠(yuǎn)不回等于 0xFFFFFFFF
所以這次雖然能正確復(fù)制 0xFF, 但卻不能判斷文件結(jié)束. 事實(shí)上,在 c 為 uchar 時(shí),
c != -1 是永遠(yuǎn)成立的, 一個(gè)高質(zhì)量的編譯器, 比如 gcc會(huì)在編譯時(shí)指出這一點(diǎn).
(6) 為何需要feof?
FILE *fp;
fp 指向一個(gè)很復(fù)雜的數(shù)據(jù)結(jié)構(gòu), feof 是通過(guò)這個(gè)結(jié)構(gòu)中的標(biāo)志來(lái)判斷文件是否結(jié)束的.
如果文件用 fgetc 讀取, 剛好把最后一個(gè)字符讀出時(shí), fp 中的EOF標(biāo)志不會(huì)打開,這時(shí)
用feof判斷,將會(huì)得到文件尚未結(jié)束的結(jié)論.
fgetc 返回 -1 時(shí), 我們?nèi)詿o(wú)法確信文件已經(jīng)結(jié)束, 因?yàn)榭赡苁亲x取錯(cuò)誤! 這時(shí)我們
需要 feof 和 ferror.