Unix系統(tǒng)中主要的文件操作包括:
unbuffered IO和standard I/O相對(duì)應(yīng),后面的章節(jié)我們會(huì)討論這兩者的區(qū)別。
在討論open函數(shù)的時(shí)候,會(huì)引入原子操作,多進(jìn)程通信(共享文件描述符)和內(nèi)核相關(guān)的數(shù)據(jù)結(jié)構(gòu)。
一,文件描述符對(duì)應(yīng)內(nèi)核來說,每一個(gè)打開的文件都對(duì)應(yīng)一個(gè)非負(fù)整數(shù)。
有三個(gè)特殊的文件描述符:
對(duì)于較新的內(nèi)核來說(linux3.2.0,Solaris10等),文件描述符的數(shù)量并沒有明確的限制,受限于內(nèi)存的大小。
二,常用的幾個(gè)文件操作函數(shù)常用的文件操作函數(shù)包括:open,read,write,lseek,close
1 open和openat函數(shù)函數(shù)聲明:
#include <fcntl.h>int open (const char *path, int oflag, … /* mode_t mode */);int openat (int fd, const char *path, int oflag, … /* mode_t mode */);
返回值:
OK:文件描述符(非負(fù)整數(shù))
Error:-1
注:參數(shù)列表中,“...”表示不同的系統(tǒng)和標(biāo)準(zhǔn)中,該處的參數(shù)可能不相同。
參數(shù)說明:
path:文件名
oflag:打開創(chuàng)建文件的屬性。
下面有五個(gè)必選的oflag參數(shù)值,這五個(gè)值有切只能選一個(gè)。另外還有若干個(gè)可選參數(shù)值,可以自行百度。
細(xì)節(jié)說明:
由open和openat返回的文件描述符保證為未使用的最小的文件描述。有的應(yīng)用利用這一特性,先關(guān)閉標(biāo)準(zhǔn)輸入描述符0,就可以在標(biāo)準(zhǔn)輸入描述0上打開文件。
參數(shù)fd可以區(qū)分open和openat函數(shù)。其取值有三種可能:
openat函數(shù)解決了兩個(gè)問題:
這里介紹一下TOCTTOU錯(cuò)誤。該類錯(cuò)誤指的是,程序是非常脆弱的(vulnerable)如果該程序調(diào)用了兩個(gè)文件相關(guān)的函數(shù),第二個(gè)函數(shù)依賴于第一個(gè)函數(shù)的結(jié)果。因?yàn)閮蓚€(gè)函數(shù)是非原子操作,被操作的文件可能被兩個(gè)函數(shù)輪流操作(線程切換),導(dǎo)致第一個(gè)函數(shù)的結(jié)果出錯(cuò),從而程序出錯(cuò)。
2 creat函數(shù)函數(shù)聲明:
#include <fcntl.h>int creat(const char* path, mode_t mode);
返回值:
creat函數(shù)相當(dāng)于下面這樣調(diào)用open函數(shù)
open (path, O_WEONLY | O_CREAT | O_TRUNC, mode);
creat有一點(diǎn)不方便,因?yàn)樗蜷_的文件描述符是只讀的,如果希望寫入之后讀回,需要依次調(diào)用creat、close和open,才能實(shí)現(xiàn)。
因此,在這種場(chǎng)景下,一個(gè)更好的打開文件的方法是像下面這樣調(diào)用open函數(shù):
open (path, O_RDWR | O_CREAT | O_TRUNC, mode);
3 close函數(shù)函數(shù)聲明:
#include <unistd.h>int close(int fd);
返回值:
關(guān)閉一個(gè)文件會(huì)釋放所有當(dāng)前進(jìn)程加在該文件上的記錄鎖。
4 lseek函數(shù)每一個(gè)打開的文件都有一個(gè)”當(dāng)前文件偏移量(current file offset)“,該偏移量是一個(gè)非負(fù)整數(shù),記錄了從文件開始到當(dāng)前位置的字節(jié)數(shù)。
函數(shù)聲明:
#include <unistd.h>off_t lseek(int fd, off_t offset, int whence);
參數(shù)說明:
offset的作用取決于參數(shù)whence的值:
細(xì)節(jié)說明:
獲取當(dāng)前文件偏移量的方法:
1 off_t currpos;2 3 currpos = lseek(fd, 0, SEEK_CUR);
lseek只記錄當(dāng)前文件在內(nèi)核中的偏移量,并不會(huì)引起任何的IO操作。返回的offset將會(huì)在后面的read或write函數(shù)中使用。
偏移量可以比當(dāng)前文件的長(zhǎng)度大,這時(shí),再調(diào)用write函數(shù)時(shí),將擴(kuò)展該文件的長(zhǎng)度。這樣的操作相當(dāng)于在文件中建了一個(gè)洞,該洞范圍內(nèi)讀時(shí)返回0。
使用od命令可以看到文件中的hole
函數(shù)聲明:
#include <unistd.h>ssize_t read(int fd, void *buf, size_t nbytes);
返回值:
細(xì)節(jié)說明:
在一些情況下,函數(shù)返回的字節(jié)數(shù)比指定的讀入字節(jié)數(shù)要小,多數(shù)是因?yàn)樽x到了文件末尾,或者指定的讀取位置中包含的字節(jié)數(shù)小于指定的讀入字節(jié)數(shù),這時(shí),read返回的為可讀到的字節(jié)數(shù)。
5 write函數(shù)函數(shù)聲明:
#include <unistd.h>ssize_t write (int fd, const void *buf, size_t nbytes);
返回值:
返回值總是等于參數(shù)nbytes的值,否則就會(huì)報(bào)錯(cuò)。
對(duì)于常規(guī)的文件來說,寫操作總是從當(dāng)前文件偏移量開始。
三、小結(jié)簡(jiǎn)單地介紹了一下常用的文件IO操作,并介紹了一些使用上的細(xì)節(jié),比較常規(guī)。
下一篇講介紹更多文件IO的特性,包括:dup,fcntl,sync,fsync和ioctl函數(shù)。。
好久沒寫博客了,又第一次用mac下的一個(gè)博客軟件寫,不太熟悉,所以寫的比較簡(jiǎn)單,以后會(huì)寫的更努力。
參考資料:
《Advanced PRogramming in the UNIX Envinronment 3rd》
新聞熱點(diǎn)
疑難解答
圖片精選