本节主要讨论如何使用C语言随机读写二进制文件。

版权声明

本文可以在互联网上自由转载,但必须:注明出处(作者:海洋饼干叔叔)并包含指向本页面的链接。

本文不可以以纸质出版为目的进行改编、摘抄。

  文件既可以顺序读写,也可以随机读写。所谓顺序读写,可以简单理解为从头读/写到尾,数据项是一个接着一个进行读取/写入的;而随机读写则允许我们随时改变文件的当前读写位置,如果在非文件尾的位置写入内容,则相应位置的原始数据会被覆盖。

  二进制文件可以视为字节流,程序为每一个被打开的二进制文件维护了一个读写位置标记,该标记为一个整数,表示当前读写位置相对于文件起始处的偏移量,以字节为单位。随着文件读写操作的进行,该读写位置会自动后移,其偏移量等于读写操作的字节数。

表20-6 文件随机访问函数(C语言)
函数 说明
rewind void rewind(FILE* f);
说明:将文件f的读写位置移回文件头(起始处)。
fseek int fseek(FILE* f, long offset, int origin);
说明:
  该函数通常应用于二进制文件,其将文件f的读写位置移动至偏离参考点(origin)指定偏移量(offset)的位置。参考点origin应为SEEK_SET、SEEK_CUR、SEEK_END之一,依次为文件头、当前读写位置和文件尾。
  函数应用于文本文件时,offset只能是0或者是前次ftell()的返回值,而origin只能是SEEK_SET。
  操作成功,函数返回0,否则返回非零值。
ftell long ftell(FILE* f);
说明:
  对于二进制文件,返回文件的当前读写位置,即当前读写位置相对于文件头的偏移字节数。
  对于文本文件,函数返回值可能没有实际意义,但仍然可以配合fseek()函数恢复文件的读写位置。
  如果函数执行出错,返回-1。
fgetpos int fgetpos(FILE* f, fpos_t* pos);
说明:
  获取文件f的当前读写位置,写入指针pos所指向的fpos_t对象中。指针pos指向的对象必须是已分配好的。通常情况下,fpos_t事实上是长整型或者长长整型。
  操作成功,函数返回0,否则返回非零值。
fsetpos int fsetpos(FILE* f, const fpos_t* pos);
说明:
  设置文件f的读写位置,指针pos所指向的fpos_t对象即为目标位置。
  操作成功,函数返回0,否则返回非零值。

  表20-6列出了C语言中用于二进制文件随机访问的常用函数,以这些函数为工具,我们可以在文件中随意移动读写位置,方便地读写二进制文件。

  C语言程序BinaryPriceList展示了一个灵活的二进制商品价格表存储结构,该结构以不重复的固定的商品编号为基础进行工作。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
//Project - BinaryPriceList
#include <stdio.h>
#include <stdbool.h>
#include <string.h>
#include <fcntl.h>

typedef struct {
int iNo; //商品编号,不重复
char sName[20]; //名称
float fPrice; //价格
int iQuantity; //在库数量
} Commodity;

bool locateCommodity(FILE* f, int iNo){
rewind(f); //读写指针回到文件头
int t;
while (true){
if (fread(&t,sizeof(int),1,f)!=1)
return false;
if (t==iNo){
fseek(f,-sizeof(int),SEEK_CUR);
return true;
}
else
fseek(f,sizeof(int)+sizeof(float)+20,SEEK_CUR);
}
}

void saveCommodity(FILE* f, const Commodity* c){
if (!locateCommodity(f,c->iNo))
fseek(f,0,SEEK_END);

fwrite(&c->iNo,sizeof(int),1,f);
fwrite(c->sName,20,1,f);
fwrite(&c->fPrice,sizeof(float),1,f);
fwrite(&c->iQuantity,sizeof(int),1,f);
}

bool loadCommodity(FILE* f, int iNo, Commodity* c){
if (!locateCommodity(f,iNo))
return false;

fread(&c->iNo,sizeof(int),1,f);
fread(c->sName,20,1,f);
fread(&c->fPrice,sizeof(float),1,f);
fread(&c->iQuantity,sizeof(int),1,f);
return true;
}

int main() {
char sPath[512];
if (getcwd(sPath,512)!=NULL) //获取并打印当前工作路径
printf("cwd: %s\n",sPath);

FILE* f = NULL;
if (access("commodity.dat",F_OK)==0) //判断文件是否存在
f = fopen("commodity.dat","rb+"); //打开已有文件进行随机读写
else
f = fopen("commodity.dat","wb+"); //打开新文件进行随机读写

Commodity c1 = {1,"Apple",5.2764123f,2000};
saveCommodity(f,&c1);

printf("ftell(f): %ld\n",ftell(f)); //输出文件当前读写位置

Commodity c3 = {3,"Beef",65.741f,5000};
saveCommodity(f,&c3);
Commodity c5 = {5,"Cherry",117.4f,500};
saveCommodity(f,&c5);
strcpy(c3.sName,"Pork");
saveCommodity(f,&c3);

Commodity t;
printf("%-6s%-20s%10s%10s\n","No","Name","Price","Quantity");
printf("----------------------------------------------\n");
for (int i=1;i<=5;i++){
if (!loadCommodity(f,i,&t))
printf("%-6d%-20s%10.2f%10d\n",i,"NA",0.0,0);
else
printf("%-6d%-20s%10.2f%10d\n",t.iNo,t.sName,t.fPrice,t.iQuantity);
}

fclose(f);
return 0;
}

上述代码的执行结果为:

1
2
3
4
5
6
7
8
9
cwd: D:\C2Cpp\C20_FileIO\build-BinaryPriceList-Desktop_Qt_5_14_1_MinGW_64_bit-Debug
ftell(f): 32
No Name Price Quantity
----------------------------------------------
1 Apple 5.28 2000
2 NA 0.00 0
3 Pork 65.74 5000
4 NA 0.00 0
5 Cherry 117.40 500

  上述程序执行完成后,我们得到一个二进制文件commodity.dat,其尺寸为96字节。为了便于描述上述程序的随机读写过程及工作原理,我们画出了commodity.dat的内部结构,请见图20-7。请读者注意,图20-7只是一个示意图,其并不能“精细”表达commodity.dat的内部结构。

commodity

图20-7 commodity.dat的内部结构示意图

🚩第7 ~ 12行:一个Commodity表示一条商品价格信息。简单计算可知,一个Commodity对象的内存尺寸为4 + 20 + 4 + 4 = 32字节。如图20-7所示,程序执行完成后,commodity.dat内部储存了编号为1、3、5的三条价格信息,分别对应3个Commodity对象,每个32字节,3个共96字节,地址范围为0 ~ 95。这里所称的地址,表示相对于文件起始处的偏移字节数。

🚩第14 ~ 27行:locateCommodity()函数用于在已打开的二进制文件f中查找编号为iNo的商品价格信息。如果查找成功,函数将f的读写位置移至对应的商品价格信息的起始处并返回true,否则返回false。

🚩第15行:rewind(f)将文件f的读写位置移至文件头,即地址0处。

🚩第17 ~ 26行:通过while“死”循环对文件进行顺序查找。

🚩第18 ~ 19行:从文件f读取商品编号至整数t,如果fread()函数的返回值不是1,说明已抵达文件尾,查找失败,返回false。

🚩第20 ~ 23行:如果第18行读到的商品编号t等于iNo,说明找到了指定记录,使用fseek()函数将读写位置后退4个字节至该商品价格信息的起始处,然后返回true。此处的SEEK_CUR表示参考位置为当前位置,负的sizeof(int)表示回退4个字节。

🚩第25行:如果第18行读到的商品编号t不等于iNo,说明匹配不成功,使用fseek()函数将当前读写位置前移28个字节至下一条商品价格信息的起始处,然后继续循环。

  表20-7列出了locateCommodity(f,3)的执行过程,请读者结合图20-7进行分析。

表20-7 locateCommodity(f,3)的执行过程
序号 说明 代码行
1 rewind(f)将读写位置移至文件头,即地址0处。 15
2 在文件的当前位置读出商品编号,其值为1,fread()执行完后,读写位置前移至地址4。 18
3 1不等于3,说明匹配不成功,执行第25行,读写位置前移28至地址32,也就是下一条记录的起始位置。 20~25
4 循环继续,在文件的当前位置读出商品编号,其值为3,读写位置因读动作前移至36。 18
5 3等于3,匹配成功,执行第21行,读写位置后移4个字节至地址32,地址32正好是编号为3的商品价格记录在文件中的起始位置。 20~23
6 返回true,向函数的调用者报告定位成功的消息。 22

🚩第29 ~ 37行:saveCommodity()函数用于将c所指向的商品价格对象存入文件f,如果对应编号的商品价格记录已存在,则覆盖更新原有信息。

🚩第30 ~ 31行:使用locateCommodity()函数在文件f中定位指定商品编号的记录。如果locateCommodity()返回false,表示未找到,则将读写位置移至文件尾,准备在文件尾追加新记录。此处的SEEK_END表示参考位置为文件尾,0表示相对于文件尾偏移0字节。

🚩第33 ~ 36行:向文件中依次写入商品编号、名称、价格以及库存数量。当读写位置位于文件尾时,这4行代码的执行结果相当于往文件尾附加了一条新记录。当读写位置位于locateCommodity()函数定位的原有记录的起始处,这4行代码的执行结果相当于覆盖更新了原有记录。

🚩第39 ~ 48行:loadCommodity()函数从文件中查找并读取指定编号的商品价格信息至c指向的结构体。如果指定的编号不存在,返回false,否则返回true。

🚩第40 ~ 41行:使用locateCommodity()定位指定编号的记录,如果没找到,返回false表示读取失败。

🚩第43 ~ 46行:如果指定编号的记录在文件中存在,locateCommodity()函数执行后,文件的读写位置正好位于该记录的起始处。依次读入编号、名称、价格和库存数量。

🚩第47行:返回true表示读取成功。

🚩第55 ~ 59行:以二进制读写模式打开文件commodity.dat备用。程序第一次运行时,commodity.dat文件可能不存在,以wb+模式打开,该模式确保当文件不存在时,自动新建一个文件。程序第N次运行时,commodity.dat文件已存在,以rb+模式打开,该模式确保文件的原有内容不会被截断。

  函数access()用于判断文件fname是否具体指定的访问权限,其原型如下。当文件具有指定的权限时,返回0,否则返回-1。

1
int access(const char* fname, int mode);

  参数mode可以为F_OK、X_OK、W_OK和R_OK等值,依次表示文件是否存在、是否可执行、是否可写、是否可读。

🚩第61 ~ 62行:存入编号为1的商品价格信息。在程序第1次运行时,第62行在文件中新增记录;在第N次运行时,第62行在文件中覆盖更新记录。

🚩第64行:打印输出文件的当前读写位置。由于刚刚在第62行写入1号商品信息完毕,该读写位置的理论值应为32,因为如前所述,一行记录空间占用正好是32字节。

🚩第66 ~ 69行:存储3号及5号商品价格信息。

🚩第70 ~ 71行:修改3号商品的名称,再次将其写入文件。第71行执行前3号商品记录肯定已存在于文件中,因此第71行事实上覆盖更新了原有记录。执行结果的第7行证实,3号商品的名称被正确修改为Pork。

🚩第73 ~ 81行:逐一读取并打印编号1至5的商品价格信息。执行结果的第6行和第8行证实,由于2号商品和4号商品不存在,第77行的loadCommodity()返回了false,第78行将对应的商品名称打印为“NA”,意为不可用(not available)。

🚩第83行:关闭文件f。