您的位置:首页 > 编程语言 > Python开发

Python按行读文件

2015-10-30 16:22 393 查看
Python按行读文件

1. 最基本的读文件方法readline()

fp = open("file.txt","r")

while 1:

line = fp.readline()

if not line:

break

pass # do something

一行一行得从文件读数据,速度比较慢,但是省内存。如果文件比较大的时候,由于内存有限,缓存整个个文件内容可能出错,可以考虑逐行读取处理;

2. 一次读取文件固定大小

file = open("file.txt","r")

while 1:

lines = file.readlines(100000)

if not lines:

break

for line in lines:

pass # do something

fp.close()

fp.readline([size]) #把文件每一行作为一个list的一个成员,并返回这个list。其实它的内部是通过循环调用readline()来实现的。如果提供size参数,size是表示读取内容的总长,也就是说可能只读到文件的一部分。

3. 一次读取文件所有内容

file = open("file.txt","r")

lines = fp.readlines()

fp.close()

for line in lines:

pass #do somgthing

4.使用linecache

在python中,有个好用的模块linecache,该模块允许从任何文件里得到任何的行,并且使用缓存进行优化。读取大文件的时候,建议使用此模块读取

cache=linecache.getlines('file.txt')[0:4]

for line in cache:

pass # do something

linecache.clearcache()

lines=linecache.getlines('file.txt')[0:5] #获取文件中第1-5行的内容

line =linecache.getline('file.txt',5) #获取文件中第5行的内容

linecache.getlines(filename) #从名为filename的文件中得到全部内容,输出为列表格式,以文件每行为列表中的一个元素,并以linenum-1为元素在列表中的位置存储

在使用linecache.getlines('file.txt')打开文件的内容之后,如file.txt文件发生了改变,如果要再次用linecache.getlines获取的内容,不是文件的最新内容,还是之前的内容,此时有两种方法:

(1)使用linecache.checkcache(filename)来更新文件在硬盘上的缓存,然后在执行linecache.getlines('file.txt')就可以获取到a.txt的最新内容;

(2)直接使用linecache.updatecache('file.txt'),即可获取最新的文件内容

另外:

(1)读取文件之后,不需要使用文件的缓存时,需要在最后清理一下缓存,使linecache.clearcache()清理缓存,释放缓存。

(2)此模块使用内存来缓存文件内容,所以需要耗费内存,打开文件的大小和打开速度和你的内存大小有关系。

5、 文件其他相关操作

fp.close()

#关闭文件。python会在一个文件不用后自动关闭文件,不过这一功能没有保证,最好还是养成自己关闭的习惯。如果一个文件在关闭后还对其进行操作会产生ValueError

fp.flush()

#把缓冲区的内容写入硬盘

fp.fileno()

#返回一个长整型的”文件标签“

fp.isatty()

#文件是否是一个终端设备文件(unix系统中的)

fp.read([size])

#size为读取的长度,以byte为单位

fp.readline([size])

#读一行,如果定义了size,有可能返回的只是一行的一部分

fp.tell()

#返回文件操作标记的当前位置,以文件的开头为原点

fp.next()

#返回下一行,并将文件操作标记位移到下一行。把一个file用于for ... in file这样的语句时,就是调用next()函数来实现遍历的。

fp.seek(offset[,whence])

#将文件打操作标记移到offset的位置。这个offset一般是相对于文件的开头来计算的,一般为正数。但如果提供了whence参数就不一定了,whence可以为0表示从头开始计算,1表示以当前位置为原点计算。2表示以文件末尾为原点进行计算。需要注意,如果文件以a或a+的模式打开,每次进行写操作时,文件操作标记会自动返回到文件末尾。

fp.truncate([size])

#把文件裁成规定的大小,默认的是裁到当前文件操作标记的位置。如果size比文件的大小还要大,依据系统的不同可能是不改变文件,也可能是用0把文件补到相应的大小,也可能是以一些随机的内容加上去。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: