当前位置: 首页 > news >正文

Linux编程学习笔记 | Linux IO学习[1] - 文件IO

系统调用与程序运行空间

在Linux操作系统中,为了提高系统的稳定性,保证内核的安全,程序运行时的内存空间被分为了用户空间和内核空间。普通应用程序工作在用户空间,不能直接访问内核空间。它们需要使用Linux系统提供给用户的一些"特殊接口" - 系统调用来安全地访问内核空间。

要对文件进行读写就需要使用Linux系统提供的一些系统调用。在这篇文章中我主要介绍 open() , write() , read() , lseek()close() 等函数,在下文中我会详细讲解这些函数的使用。

文件描述符

在Linux系统中,一切都可以被看作是文件,这包括:普通文件、目录文件、链接文件和设备文件。要访问文件,必须使用文件描述符。文件描述符是一个非负的整数,它是系统中被打开文件的索引。当打开或者创建一个文件时,内核会返回一个文件描述符;当需要读写文件时,也需要将相应的文件描述符作为参数传给读写函数。程序启动时,默认有3个文件描述符:

文件描述符说明
0STDIN_FILENO标准输入
1STDOUT_FILENO标准输出
2STDERR_FILENO标准错误输出

如果此时创建或打开一个文件,这个文件的文件描述符就是3.

文件IO基本操作

打开/创建文件

open() 函数用于打开或者创建文件。其在打开或者创建文件时可以指定文件的属性及用户的权限等各种参数。要使用 open() 函数,需要包含 #include <sys/stat.h>#include <fcntl.h> 这两个头文件。下面是函数的说明:

int open(const char *path, int oflag, [mode_t mode]);

args:
    const char *path: 文件路径,可以是绝对,也可以是相对路径 
    int oflag       : 文件打开的方式
                        - O_RDONLY 只读打开
                        - O_WRONLY 只写打开
                        - O_RDWR   可读可写打开
                        以上3种必选一个,以下4种可以任意选择
                        - O_APPEND 追加打开,所写数据附加到文件末
                        - O_CREAT  若此文件不存在则创建它
                        - O_EXCL   若文件存在则报错返回 
                        - O_TRUNC  如果文件已存在,并且以只写或可读可写方式打开,则将其长度截断为0字节
    [mode_t mode]   : 文件权限,只有在创建文件时需要使用
    
return:
    文件描述符,非负整数是成功,-1是失败

open() 函数中,文件的打开方式不止上面的几种,这里只列举了常用的7种。注意,新建文件的权限不是直接等于 mode 的值,而是等于 mode & ~uname

写文件

当文件打开后,我们就可以向该文件写数据了。在Linux系统中,用 write() 向打开的文件写入数据,要使用这个函数,需要包含 #include <unistd.h> 。下面是函数的说明:

ssize_t write(int fildes, const void *buf, size_t nbyte);

args:
    int fildes     : 写入文件的文件描述符
    const void *buf: 写入数据在内存空间存储的地址
    size_t nbyte   : 期待写入数据的最大字节数
    
return:
    文件实际写入的字节数,非负整数是成功,-1是失败(磁盘已满或者超出该文件的长度等)

注意函数的返回类型是 ssize_tssize_tsize_t 类似,只是 ssize_t 表示有符号数。想了解更多 size_tssize_t 的区别请看这篇文章。

读文件

同写文件类似,要使用读文件函数 read() ,需要包含 #include <unistd.h> 。下面是函数的说明:

ssize_t read(int fildes, void *buf, size_t nbyte);

args:
    int fildes  : 读取文件的文件描述符
    void *buf   : 读取数据在内存空间存储的地址
    size_t nbyte: 期待读取数据的最大字节数
    
return:
    文件实际读取的字节数,非负整数是成功,-1是失败

write() 一样, read() 函数的返回类型也是 ssize_t

文件的偏移量

在每个打开的文件中都有一个文件的偏移量,文件的偏移量会根据文件的读写而改变位置。我们可以通过 lseek() 函数来调整文件的偏移量。默认情况下,新打开文件的文件偏移量在文件的开始。同 write()read() 函数类似,要使用这个函数,需要包含 #include <unistd.h> 。下面是函数的说明:

off_t lseek(int fildes, off_t offset, int whence);

args:
    int fildes  : 修改文件的文件描述符
    off_t offset: 文件偏移量移动的距离
    int whence  : 文件偏移量的基址
                    - SEEK_SET 文件开始处
                    - SEEK_CUR 文件当前位置
                    - SEEK_END 文件结束处
    
return:
    当前文件指针的位置,非负整数是成功,-1是失败

off_tssize_t 类似,都是有符号数。

关闭文件

当文件不再被使用时,可以调用 close() 函数来关闭被打开的文件。
除了用 close() 显示地关闭文件外,通过结束进程也能隐式地关闭被该进程打开的所有文件。要使用该函数,需要包含 #include <unistd.h> 。下面是函数的说明:

int close(int fildes);

args:
   int fildes: 要关闭文件的文件描述符
   
return:
    文件关闭状态,0是成功,-1是失败

文件IO实例

文件基本操作

这是一个简单的文件基本操作实例。在这个例子中,程序分两次将内存中的字符串写入文件,然后又将文件内容读回内存空间。

#include <stdio.h>
#include <string.h>
#include <unistd.h>
#include <fcntl.h>

/**
 * This is a simple example for using open(), write(), read(), lseek() and close().
 */
int main(int argc, char *argv[])
{
    int fd;
    ssize_t wr_size, rd_size;
    char buffer[128];
    char string_1[30], string_2[30] = "This is the second line!\n";
    char *path = "./file_io.log"; 
    
    fd = open(path, O_RDWR | O_CREAT | O_TRUNC, 511);
    if (fd < 0) {
        printf("File create fail...\n");
        return -1; 
    } else {
        printf("File create success...\n");
    }
    
    /* write the first line to file_io.log */
    strcpy(string_1, "This is a demo for file_io!\n");
    wr_size = write(fd, string_1, strlen(string_1));
    if (wr_size < 0) {
        printf("File write 1 fail...\n");
        printf("wr_size = %d\n", wr_size);
        return -1; 
    } else {
        printf("File write 1 success...\n");
        printf("wr_size = %d\n", wr_size);
    }
    
    /* write the second line to file_io.log 
     * in this case, we only write 10 bytes data from string_2 to file.
     */
    wr_size = write(fd, string_2, 10);
    /* add "\0"(not '\0'!!) to the end of the second line */ 
    wr_size = write(fd, "\0", 1);
    if (wr_size < 0) {
        printf("File write 2 fail...\n");
        printf("wr_size = %d\n", wr_size);
        return -1; 
    } else {
        printf("File write 2 success...\n");
        printf("wr_size = %d\n", wr_size);
    }
    
    /* decrease current file offset by 20 bytes */
    lseek(fd, -20, SEEK_CUR);

    rd_size = read(fd, buffer, 100); 
    if (rd_size < 0) {
        printf("File read_1 fail...\n");
        printf("rd_size = %d\n", rd_size);
        return -1; 
    } else {
        printf("File read_1 success...\n");
        printf("rd_size = %d,\nbuffer = %s\n", rd_size, buffer);
    } 

    close(fd);
    
    return 0; 
}

编译并运行该程序,程序和文件输出结果如下:
程序输出结果
文件输出结果

对于上面的例子,有几点需要注意:
1) 在40行处, wr_size = write(fd, string_2, 10); 我们写入的字节数是小于 string_2 中的字节数的。如果想要写入的字节数大于 string_2 中的字节数,那 string_2 外的字节也会写入文件(这些额外的字节不是我们希望要的)。比如我们将40行改为 wr_size = write(fd, string_2, 100); 其输出结果如下:
实际写入的字节数大于需要写入的字节数

2)如果注释掉53行,则读出的字节数为0,因为此时文件的偏移量处于文件的尾部。
忘记修改文件偏移量

简易版CP指令

这是一个模仿Linux cp指令的小程序,这里并没有考虑效率,也没有考虑特殊情况,只是简单地实现其功能。

#include <stdio.h>
#include <string.h>
#include <unistd.h>
#include <fcntl.h>

/* 
 * This a simple version of cp command. 
 */
int main(int argc, char *argv[])
{
    int fd1, fd2;
    ssize_t rd_size;
    char buffer[128];
    
    if (argc != 3) {
        printf("You should enter enter 2 parameters\n"); 
        return -1;
    }

    fd1 = open(argv[1], O_RDONLY);
    if (fd1 < 0) {
        printf("File %d does not exist...\n", fd1);
        return -1; 
    }
    fd2 = open(argv[2], O_WRONLY | O_CREAT | O_TRUNC, 511); 
    if (fd2 < 0) {
        printf("File %d open fail...\n", fd2);
        return -1; 
    }

    while(read(fd1, buffer, 1))
        write(fd2, buffer, 1);

    close(fd1);
    close(fd2);
    
    return 0; 
}

编译并运行该程序,程序输出结果如下:
模仿CP指令

总结

这篇文章主要介绍了如何使用文件IO的系统调用函数对文件进行操作,文中出现的代码都可在我的github上找到。

如果觉得本文对你有帮助,请多多点赞支持,谢谢!

相关文章:

  • Java double字符串转数字
  • PHP中的 !== 与 !=
  • 线程生命周期状态UML图
  • 【JAVA秒会技术之异常解决】解决Eclipse添加新server时无法选择Tomcat7的问题
  • Leopard概述
  • Spring源码阅读-ApplicationContext
  • linux系统下查看网卡的UUID
  • String类型的方法总结
  • 通过Servlet生成验证码图片(转)
  • C#实现MD5字符串加密
  • 集成软件开发工具有多难?现实很残酷!
  • bzoj2333
  • rpm的含义
  • 使用ffmpeg将BMP图片编码为x264视频文件,将H264视频保存为BMP图片,yuv视频文件保存为图片的代码...
  • 兄弟选择器 + 和 ~
  • @jsonView过滤属性
  • 【108天】Java——《Head First Java》笔记(第1-4章)
  • 【css3】浏览器内核及其兼容性
  • 【挥舞JS】JS实现继承,封装一个extends方法
  • 78. Subsets
  • Angular数据绑定机制
  • Codepen 每日精选(2018-3-25)
  • ES10 特性的完整指南
  • ES6系列(二)变量的解构赋值
  • HTTP传输编码增加了传输量,只为解决这一个问题 | 实用 HTTP
  • JavaScript标准库系列——Math对象和Date对象(二)
  • ng6--错误信息小结(持续更新)
  • Nodejs和JavaWeb协助开发
  • React as a UI Runtime(五、列表)
  • react-native 安卓真机环境搭建
  • Solarized Scheme
  • Spring Cloud Alibaba迁移指南(一):一行代码从 Hystrix 迁移到 Sentinel
  • Spring-boot 启动时碰到的错误
  • 对象引论
  • 可能是历史上最全的CC0版权可以免费商用的图片网站
  • 浏览器缓存机制分析
  • 目录与文件属性:编写ls
  • 批量截取pdf文件
  • 深入 Nginx 之配置篇
  • 小李飞刀:SQL题目刷起来!
  • SAP CRM里Lead通过工作流自动创建Opportunity的原理讲解 ...
  • ​Base64转换成图片,android studio build乱码,找不到okio.ByteString接腾讯人脸识别
  • ​一些不规范的GTID使用场景
  • # Java NIO(一)FileChannel
  • # Maven错误Error executing Maven
  • #### go map 底层结构 ####
  • #【QT 5 调试软件后,发布相关:软件生成exe文件 + 文件打包】
  • (02)Cartographer源码无死角解析-(03) 新数据运行与地图保存、加载地图启动仅定位模式
  • (day6) 319. 灯泡开关
  • (SpringBoot)第七章:SpringBoot日志文件
  • (多级缓存)缓存同步
  • (过滤器)Filter和(监听器)listener
  • (转)eclipse内存溢出设置 -Xms212m -Xmx804m -XX:PermSize=250M -XX:MaxPermSize=356m
  • (转)Linq学习笔记
  • .net 4.0 A potentially dangerous Request.Form value was detected from the client 的解决方案