如何在C語言中插入、刪除和更改文件內(nèi)容
我們平時(shí)所見的文件,例如 txt、doc、mp4 等,文件內(nèi)容是按照從頭到尾的順序依次存儲(chǔ)在磁盤上的,就像排起一條長(zhǎng)長(zhǎng)的隊(duì)伍,稱為順序文件。
除了順序文件,還有索引文件、散列文件等,一般用于特殊領(lǐng)域,例如數(shù)據(jù)庫、高效文件系統(tǒng)等。
順序文件的存儲(chǔ)結(jié)構(gòu)決定了它能夠高效讀取內(nèi)容,但不能夠隨意插入、刪除和修改內(nèi)容。例如在文件開頭插入100個(gè)字節(jié)的數(shù)據(jù),那么原來文件的所有內(nèi)容都要向后移動(dòng)100個(gè)字節(jié),這不僅是非常低效的操作,而且還可能覆蓋其他文件。因此C語言沒有提供插入、刪除、修改文件內(nèi)容的函數(shù),要想實(shí)現(xiàn)這些功能,只能自己編寫函數(shù)。
以插入數(shù)據(jù)為例,假設(shè)原來文件的大小為 1000 字節(jié),現(xiàn)在要求在500字節(jié)處插入用戶輸入的字符串,那么可以這樣來實(shí)現(xiàn):
1) 創(chuàng)建一個(gè)臨時(shí)文件,將后面500字節(jié)的內(nèi)容復(fù)制到臨時(shí)文件;
2) 將原來文件的內(nèi)部指針調(diào)整到500字節(jié)處,寫入字符串;
3) 再將臨時(shí)文件中的內(nèi)容寫入到原來的文件(假設(shè)字符串的長(zhǎng)度為100,那么此時(shí)文件內(nèi)部指針在600字節(jié)處)。
刪除數(shù)據(jù)時(shí),也是類似的思路。假設(shè)原來文件大小為1000字節(jié),名稱為 demo.mp4,現(xiàn)在要求在500字節(jié)處往后刪除100字節(jié)的數(shù)據(jù),那么可以這樣來實(shí)現(xiàn):
1) 創(chuàng)建一個(gè)臨時(shí)文件,先將前500字節(jié)的數(shù)據(jù)復(fù)制到臨時(shí)文件,再將600字節(jié)之后的所有內(nèi)容復(fù)制到臨時(shí)文件;
2) 刪除原來的文件,并創(chuàng)建一個(gè)新文件,命名為 demo.mp4;
3) 將臨時(shí)文件中的所有數(shù)據(jù)復(fù)制到 demo.mp4。
修改數(shù)據(jù)時(shí),如果新數(shù)據(jù)和舊數(shù)據(jù)長(zhǎng)度相同,那么設(shè)置好內(nèi)部指針,直接寫入即可;如果新數(shù)據(jù)比舊數(shù)據(jù)長(zhǎng),相當(dāng)于增加新內(nèi)容,思路和插入數(shù)據(jù)類似;如果新數(shù)據(jù)比舊數(shù)據(jù)短,相當(dāng)于減少內(nèi)容,思路和刪除數(shù)據(jù)類似。實(shí)際開發(fā)中,我們往往會(huì)保持新舊數(shù)據(jù)長(zhǎng)度一致,以減少編程的工作量,所以我們不再討論新舊數(shù)據(jù)長(zhǎng)度不同的情況。
總起來說,本節(jié)重點(diǎn)討論數(shù)據(jù)的插入和刪除。
文件復(fù)制函數(shù)
在數(shù)據(jù)的插入刪除過程中,需要多次復(fù)制文件內(nèi)容,我們有必要將該功能實(shí)現(xiàn)為一個(gè)函數(shù),如下所示:
/** * 文件復(fù)制函數(shù) * @param ?fSource ? ? ? 要復(fù)制的原文件 * @param ?offsetSource ?原文件的位置偏移(相對(duì)文件開頭),也就是從哪里開始復(fù)制 * @param ?len ? ? ? ? ? 要復(fù)制的內(nèi)容長(zhǎng)度,小于0表示復(fù)制offsetSource后邊的所有內(nèi)容 * @param ?fTarget ? ? ? 目標(biāo)文件,也就是將文件復(fù)制到哪里 * @param ?offsetTarget ?目標(biāo)文件的位置偏移,也就是復(fù)制到目標(biāo)文件的什么位置 * @return ?成功復(fù)制的字節(jié)數(shù)**/long fcopy(FILE *fSource, long offsetSource, long len, FILE *fTarget, long offsetTarget){ ? ?int bufferLen = 1024*4; ?// 緩沖區(qū)長(zhǎng)度 ? ?char *buffer = (char*)malloc(bufferLen); ?// 開辟緩存 ? ?int readCount; ?// 每次調(diào)用fread()讀取的字節(jié)數(shù) ? ?long nBytes = 0; ?//總共復(fù)制了多少個(gè)字節(jié) ? ?int n = 0; ?//需要調(diào)用多少次fread()函數(shù) ? ?int i; ?//循環(huán)控制變量 ? ?fseek(fSource, offsetSource, SEEK_SET); ? ?fseek(fTarget, offsetTarget, SEEK_SET); ? ?if(len<0){ //復(fù)制所有內(nèi)容
while( (readCount=fread(buffer, 1, bufferLen, fSource)) > 0 ){
nBytes += readCount;
fwrite(buffer, readCount, 1, fTarget);
}
}else{ //復(fù)制len個(gè)字節(jié)的內(nèi)容
n = (int)ceil((double)((double)len/bufferLen));
for(i=1; i<=n; i++){
if(len-nBytes < bufferLen){ bufferLen = len-nBytes; }
readCount = fread(buffer, 1, bufferLen, fSource);
fwrite(buffer, readCount, 1, fTarget);
nBytes += readCount;
}
}
fflush(fTarget);
free(buffer);
return nBytes;
}