打开文件的本质是进程打开文件。
打开的文件在内存中,未打开的文件在磁盘中。
当进程打开多个文件,操作系统中有多个进程,那么操作系统中就必定会存在多个打开的文件。
为了管理文件就要先描述再组织。
文件存在于磁盘,所以向文件写数据就是向硬件写入,磁盘作为硬件我们用户无法绕过操作系统进行访问,所以操作系统就一定要向用户提供系统调用,而我们平时用的c / c++函数就是系统调用的封装。
pathname:指明文件创建的路径和文件名。若没有路径默认创建在当前按路径。
flags:选项,类似于c语言中 w, a等打开方式。
mode:设置文件权限,与之前Linux下的文件权限一样。
系统调用函数 umask() 可以设置当前进程中的权限掩码。
(1)O_WRONLY 只写打开
(2)O_CREATE 文件不存在就创建,要mode指明文件权限
(3)O_RDONLY 只读打开
(4)O_RDRW 读写打开
(5)O_APPEND 追加打开
(6)O_TRUNC 清空文件
fd:open() 函数的返回值,表示文件描述符。
buf:要插入的文件内容。
count:内容大小。
一开始 log.txt 文件不存在,只读打开并创建文件。
现在文件存在并且内容是 hello,此时我们再次只读打开写入a
我们发现结果是覆盖文件内容,这次我们再加上清空文件,写入a
最后文件内只有a,其实我们就能发现c语言中'w'方式打开文件,就是上面三个选项全带的功能,所以一开始说 c / c++ 文件函数就是封装的系统调用。
我们上面提到 open 函数会返回一个文件描述符,其实每一个进程的开始,我们自己创建的文件描述符是从3开始,0 1 2 分别对应的是标准输入(键盘),标准输出(显示器),标准错误(显示器),这三个文件是进程运行时自动创建的。
那为什么函数传一个数字 fd 进程就能打开对应文件写入或关闭呢?
上图中我们就能知道其实返回的 fd 就是内核中进程 : 文件映射关系的数组下标。
(1)常见 file 内核数据结构。
(2)开辟文件缓冲区,加载文件数据。
(3)查看文件描述符表。
(4)file 地址填入文件描述符表。
(5)返回 fd 文件描述符。
我们知道c语言中结构体是不能有函数的,但是上图中操作系统层面的文件结构体存放函数指针,以此来调用函数,就相当于c++中的类。
由于对应不同的硬件,调用方式不同,在操作系统层面每一个文件结构体函数名都是 read, write....,但是在驱动层实现函数时是截然不同的,这就像是c++中的多态。
上图的一整套逻辑就是 vfs(virtual file system 虚拟文件系统)
结论就是上层访问不同硬件调用函数名相同的函数。
系统调用中函数 open 返回 fd,类比c语言就是类型是 FILE* 的指针(本质是结构体)。
所有c语言上的文件操作函数,本质底层都是系统调用的封装。
为什么要封装系统调用?
不同的系统,系统调用不同,导致用系统调用代码不具备跨平台性。
所以在写语言的源代码时要把所有常见平台中的文件系统调用封装,在哪个平台就下载哪个平台的c标准库。