Linux编程入门(4)改变文件的读写位置
当对某个文件进行操作时,我们可以指定文件的读/写位置吗?答案是:当然可以。让我们一起来学习下,如何设置文件的操作位置。 文件读写位置
Linux系统每次打开一个文件,内核会用一个指针来记录该 文件的偏移量 ,有时也称为 读写偏移量 或 指针 。 文件偏移量是指执行下一个 read() 或者 write() 操作的文件起始位置 ,通常是非负整数,用以度量从文件开始处计算的字节数。文件内第一个字节的偏移量为 0。
文件打开时,文件偏移量的值设置为指向文件的开头。以后每次读或者写将自动对其进行调整,以指向已读或已写数据的下一个字节。
当从文件 读取数据时 ,内核从指针所表明的地方开始读取指定的字节,然后移动指针,指向下一个未被读取的字节。向文件 写入数据 的操作类似。
指针是与文件描述符相关联的,而不是与文件关联的。如果两个程序同时打开一个文件,这时会有两个指针,两个程序对文件的 读操作 不会互相干扰。 系统调用
系统函数 lseek() 可以改变已经打开文件的当前读写位置。其函数原型如下 #include #include off_t lseek(int fd, off_t offset, int whence);
针对文件描述符 fd 所指代的已打开文件,系统调用 lseek() 依照 offset 和 whence 参数值调整该文件的偏移量。
参数 fd ,已打开文件的描述符。
参数 offset ,指定了一个以字节为单位的数值。
参数 whence ,表明应该参照哪个基点来解释 offset 参数,应为下列其中之一:
SEEK_SET
将文件的偏移量设置为距 文件开始 处的 offset 个字节,其值必须为非负数。
SEEK_CUR
将该文件的偏移量设置为距离 当前位置 处的 offset 个字节,即当前偏移量加 offset(可为正或负)。
SEEK_END
将该文件的偏移量设置为距离 文件结尾 处的 offset 个字节,即文件偏移量设置为文件长度加 offset(可为正或负)。
lseek() 返回值 ,调用成功,会返回新的文件偏移量;调用失败,返回 -1。
通常,文件偏移量应当是一个非负整数。但是,某些设备也可能允许负的偏移量。 对于普通文件,其偏移量必须是非负值。 由于偏移量可能为负值,所以 在判断 lseek 的返回值时,要测试它是否等于 -1,而不要测试它是否小于 0。
系统调用 lseek() ,只是调整内核中与文件描述符相关的文件偏移量记录,并没有引起任何 I/O 操作,即没有对任何物理设备进行访问。
lseek() 并不适用于所有类型的文件。例如, 不允许将 lseek() 应用于管道、 FIFO、 socket 或者终端等 。一旦如此, 调用将会失败。 文件空洞
如果文件偏移超过文件结尾,可以吗?再执行 I/O 操作会出现什么现象?
文件的偏移量可以超出文件结尾 。这种情况下,执行 read() 调用将返回 0,表示已经到达文件结尾。执行 write() 函数却可以在文件结尾之后的任意位置写入数据。新写入数据的文件位置与文件结尾之间的空间,会构成一个空洞,即 文件空洞 。从编程的角度来看,文件空洞是存在字节的, 读取空洞将返回 0(空字节) 。
文件的空洞不占用任何磁盘空间 。如果在文件空洞中写入了数据,文件系统才会为之分配磁盘块。带空洞的文件叫做 稀疏文件 。其优势在于,与为实际需要的空字节分配磁盘相比,稀疏填充的文件会占用较少的磁盘空间。
空洞的存在,意味着一个文件名义上的大小可能要比其占用的磁盘存储总量要大(有时会大出许多)。向文件空洞中写入字节,内核需要为其分配存储单元,即使文件大小不变,系统的可用磁盘空间也将减少。 示例代码
让我们来写一段代码,来进行实验,调整文件偏移量,产生空洞文件。代码如下 #include #include #include #include #include char buf1[] = "abcdefghijk"; char buf2[] = "ABCDEFGHIJK"; int main(void) { int fd; /* 创建新文件 */ if((fd = creat("file.hole", 0660)) < 0) { perror("creat error"); } /* 向文件写入缓冲区buf1数据 */ if(write(fd, buf1, 11) != 11) { perror("buf1 write error"); } /* 以当前偏移量为基点,向后调整文件偏移量 */ if(lseek(fd, 16384, SEEK_SET) == -1) { perror("lseek error"); } /* 在新的偏移量位置写入缓冲区buf2数据 */ if(write(fd, buf2, 11) != 11) { perror("buf2 write error"); } exit(0); }
编译、运行后的结果如下: $ gcc lseek.c -o lseek1 $ ./lseek1 $ ls -l file.hole /* 查看文件大小 */ -rw-rw---- 1 user user 16395 11月 9 23:13 file.hole $ od -c file.hole /* 查看实际内容 */ 0000000 a b c d e f g h i j k 0000020 * 0040000 A B C D E F G H I J K 0040013
使用 od 命令查看该文件的实际内容。命令中的 -c 选项表示以字符方式打印文件内容。从中可以看到,文件中间的 21 个未写入字节都被读成 0。每一行开始的 7 位数是以八进制形式表示的字节偏移量。 总结
经过本篇文章,学习了文件偏移相关内容,以及如何显示地调整文件偏移量。
至此,文件 I/O 基本的系统函数全部学习完毕。包括:
open、close、read、write、lseek。
OK,接下来,我们继续其他内容的学习。