您的位置:首页 > 编程语言 > Python开发

python3基础之文件操作

2018-03-06 21:37 274 查看
一.文件存取操作
文件的打开模式



file 对象使用 open 函数来创建,下表列出了 file 对象常用的函数:
序号方法及描述
1file.close()关闭文件。关闭后文件不能再进行读写操作。
2file.flush()刷新文件内部缓冲,直接把内部缓冲区的数据立刻写入文件, 而不是被动的等待输出缓冲区写入。
3file.fileno()返回一个整型的文件描述符(file descriptor FD 整型), 可以用在如os模块的read方法等一些底层操作上。
4file.isatty()如果文件连接到一个终端设备返回 True,否则返回 False。
5file.next()返回文件下一行。
6file.read([size])从文件读取指定的字节数,如果未给定或为负则读取所有。
7file.readline([size])读取整行,包括 "\n" 字符。
8file.readlines([sizeint])读取所有行并返回列表,若给定sizeint>0,返回总和大约为sizeint字节的行, 实际读取值可能比 sizeint 较大, 因为需要填充缓冲区。
9file.seek(offset[, whence])设置文件当前位置
10file.tell()返回文件当前位置。
11file.truncate([size])从文件的首行首字符开始截断,截断文件为 size 个字符,无 size 表示从当前位置截断;截断之后 V 后面的所有字符被删除,其中 Widnows 系统下的换行代表2个字符大小。
12file.write(str)将字符串写入文件,没有返回值。
13file.writelines(sequence)向文件写入一个序列字符串列表,如果需要换行则要自己加入每行的换行符。
样例:
>>> f=open('D:\\python3.6\\word.txt')

>>> f.read(3)

'123'
>>> f.read(10)

':小甲鱼工作室\n22'
>>> f.tell()

21
>>> f.seek(0,0)

0
>>> f.readline()

'123:小甲鱼工作室\n'
>>> f.read()

'222:是的\n33:haha'
>>> f.seek(0,0)
0
>>> f.read()

'123:小甲鱼工作室\n222:是的\n33:haha'
>>> f.tell()

38
>>>
>>> f.seek(0,0)

0
>>> for each_line in f:
print(each_line)
123:小甲鱼工作室

222:是的

33:haha
>>> f=open('D:\\python3.6\\word.txt','w')

>>> f.write('yuci')
4
>>> f.close()
二.os模块

序号方法及描述
1os.access(path, mode)
检验权限模式
2os.chdir(path)
改变当前工作目录
3os.chflags(path, flags)
设置路径的标记为数字标记。
4os.chmod(path, mode)
更改权限
5os.chown(path, uid, gid)
更改文件所有者
6os.chroot(path)
改变当前进程的根目录
7os.close(fd)
关闭文件描述符 fd
8os.closerange(fd_low, fd_high)
关闭所有文件描述符,从 fd_low (包含) 到 fd_high (不包含), 错误会忽略
9os.dup(fd)
复制文件描述符 fd
10os.dup2(fd, fd2)
将一个文件描述符 fd 复制到另一个 fd2
11os.fchdir(fd)
通过文件描述符改变当前工作目录
12os.fchmod(fd, mode)
改变一个文件的访问权限,该文件由参数fd指定,参数mode是Unix下的文件访问权限。
13os.fchown(fd, uid, gid)
修改一个文件的所有权,这个函数修改一个文件的用户ID和用户组ID,该文件由文件描述符fd指定。
14os.fdatasync(fd)
强制将文件写入磁盘,该文件由文件描述符fd指定,但是不强制更新文件的状态信息。
15os.fdopen(fd[, mode[, bufsize]])
通过文件描述符 fd 创建一个文件对象,并返回这个文件对象
16os.fpathconf(fd, name)
返回一个打开的文件的系统配置信息。name为检索的系统配置的值,它也许是一个定义系统值的字符串,这些名字在很多标准中指定(POSIX.1, Unix 95, Unix 98, 和其它)。
17os.fstat(fd)
返回文件描述符fd的状态,像stat()。
18os.fstatvfs(fd)
返回包含文件描述符fd的文件的文件系统的信息,像 statvfs()
19os.fsync(fd)
强制将文件描述符为fd的文件写入硬盘。
20os.ftruncate(fd, length)
裁剪文件描述符fd对应的文件, 所以它最大不能超过文件大小。
21os.getcwd()
返回当前工作目录
22os.getcwdu()
返回一个当前工作目录的Unicode对象
23os.isatty(fd)
如果文件描述符fd是打开的,同时与tty(-like)设备相连,则返回true, 否则False。
24os.lchflags(path, flags)
设置路径的标记为数字标记,类似 chflags(),但是没有软链接
25os.lchmod(path, mode)
修改连接文件权限
26os.lchown(path, uid, gid)
更改文件所有者,类似 chown,但是不追踪链接。
27os.link(src, dst)
创建硬链接,名为参数 dst,指向参数 src
28os.listdir(path)
返回path指定的文件夹包含的文件或文件夹的名字的列表。
29os.lseek(fd, pos, how)
设置文件描述符 fd当前位置为pos, how方式修改: SEEK_SET 或者 0 设置从文件开始的计算的pos; SEEK_CUR或者 1 则从当前位置计算; os.SEEK_END或者2则从文件尾部开始. 在unix,Windows中有效
30os.lstat(path)
像stat(),但是没有软链接
31os.major(device)
从原始的设备号中提取设备major号码 (使用stat中的st_dev或者st_rdev field)。
32os.makedev(major, minor)
以major和minor设备号组成一个原始设备号
33os.makedirs(path[, mode])
递归文件夹创建函数。像mkdir(), 但创建的所有intermediate-level文件夹需要包含子文件夹。
34os.minor(device)
从原始的设备号中提取设备minor号码 (使用stat中的st_dev或者st_rdev field )。
35os.mkdir(path[, mode])
以数字mode的mode创建一个名为path的文件夹.默认的 mode 是 0777 (八进制)。
36os.mkfifo(path[, mode])
创建命名管道,mode 为数字,默认为 0666 (八进制)
37os.mknod(filename[, mode=0600, device])
创建一个名为filename文件系统节点(文件,设备特别文件或者命名pipe)。
38os.open(file, flags[, mode])
打开一个文件,并且设置需要的打开选项,mode参数是可选的
39os.openpty()
打开一个新的伪终端对。返回 pty 和 tty的文件描述符。
40os.pathconf(path, name)
返回相关文件的系统配置信息。
41os.pipe()
创建一个管道. 返回一对文件描述符(r, w) 分别为读和写
42os.popen(command[, mode[, bufsize]])
从一个 command 打开一个管道
43os.read(fd, n)
从文件描述符 fd 中读取最多 n 个字节,返回包含读取字节的字符串,文件描述符 fd对应文件已达到结尾, 返回一个空字符串。
44os.readlink(path)
返回软链接所指向的文件
45os.remove(path)
删除路径为path的文件。如果path 是一个文件夹,将抛出OSError; 查看下面的rmdir()删除一个 directory。
46os.removedirs(path)
递归删除目录。
47os.rename(src, dst)
重命名文件或目录,从 src 到 dst
48os.renames(old, new)
递归地对目录进行更名,也可以对文件进行更名。
49os.rmdir(path)
删除path指定的空目录,如果目录非空,则抛出一个OSError异常。
50os.stat(path)
获取path指定的路径的信息,功能等同于C API中的stat()系统调用。
51os.stat_float_times([newvalue])
决定stat_result是否以float对象显示时间戳
52os.statvfs(path)
获取指定路径的文件系统统计信息
53os.symlink(src, dst)
创建一个软链接
54os.tcgetpgrp(fd)
返回与终端fd(一个由os.open()返回的打开的文件描述符)关联的进程组
55os.tcsetpgrp(fd, pg)
设置与终端fd(一个由os.open()返回的打开的文件描述符)关联的进程组为pg。
56os.tempnam([dir[, prefix]])
Python3 中已删除。返回唯一的路径名用于创建临时文件。
57os.tmpfile()
Python3 中已删除。返回一个打开的模式为(w+b)的文件对象 .这文件对象没有文件夹入口,没有文件描述符,将会自动删除。
58os.tmpnam()
Python3 中已删除。为创建一个临时文件返回一个唯一的路径
59os.ttyname(fd)
返回一个字符串,它表示与文件描述符fd 关联的终端设备。如果fd 没有与终端设备关联,则引发一个异常。
60os.unlink(path)
删除文件路径
61os.utime(path, times)
返回指定的path文件的访问和修改的时间。
62os.walk(top[, topdown=True[, onerror=None[, followlinks=False]]])
输出在文件夹中的文件名通过在树中游走,向上或者向下。
63os.write(fd, str)
写入字符串到文件描述符 fd中. 返回实际写入的字符串长度
>>> import os
>>> os.getcwd()#当前目录
'D:\\python3.6_更新'
>>> os.chdir('D:\\python3.6')#更换目录
>>> os.getcwd()
'D:\\python3.6'

>>> os.listdir('D:\\python3.6')#把目录下的内容显示出来
['computePai.py', 'divnum.py', 'Ftem.py', 'month1.py', 'quadratic1.py', 'reverse1.py', 'sum2.py', 'test1.py', 'tree1.py', 'turtle1.py', 'word.txt']
>>> os.mkdir('D:\\python3.6\\A')#新建目录
>>> os.mkdir('D:\\python3.6\\A\\B')
>>> os.rmdir('D:\\python3.6\\A\\B')#如果目录非空,则rmdir目录会报错
Traceback (most recent call last):
File "<pyshell#11>", line 1, in <module>
os.rmdir('D:\\python3.6\\A\\B')
OSError: [WinError 145] 目录不是空的。: 'D:\\python3.6\\A\\B'
>>> os.remove('D:\\python3.6\\A\\B\\test.txt')#要先删除目录下的文件
>>> os.rmdir('D:\\python3.6\\A\\B')#再删除B目录

>>> os.system('cmd')#打开cmd
-1073741510
>>> os.system('calc')#打开计算机
三.path>>> os.path.basename('D:\\python3.6\\sum2.py')
'sum2.py'
>>> os.path.join('A','B')
'A\\B'
>>> os.path.join('D:\\','A','B')
'D:\\A\\B'
>>> os.path.split('D:\\A\\B\\word.txt')
('D:\\A\\B', 'word.txt')
>>> os.path.splitext('D:\\A\\B\\word.txt')
('D:\\A\\B\\word', '.txt')

import time
>>> time.gmtime(os.path.getatime('D:\\python3.6\\A\\B\\test.txt'))#gmtime格林时间
time.struct_time(tm_year=2018, tm_mon=3, tm_mday=5, tm_hour=12, tm_min=12, tm_sec=32, tm_wday=0, tm_yday=64, tm_isdst=0)

>>> time.localtime(os.path.getatime('D:\\python3.6\\A\\B\\test.txt'))#上次访问时间
time.struct_time(tm_year=2018, tm_mon=3, tm_mday=5, tm_hour=20, tm_min=12, tm_sec=32, tm_wday=0, tm_yday=64, tm_isdst=0)

>>> time.localtime(os.path.getmtime('D:\\python3.6\\A\\B\\test.txt'))#修改时间
time.struct_time(tm_year=2018, tm_mon=3, tm_mday=5, tm_hour=20, tm_min=16, tm_sec=38, tm_wday=0, tm_yday=64, tm_isdst=0)

>>> time.localtime(os.path.getctime('D:\\python3.6\\A\\B\\test.txt'))#创建时间
time.struct_time(tm_year=2018, tm_mon=3, tm_mday=5, tm_hour=20, tm_min=12, tm_sec=32, tm_wday=0, tm_yday=64, tm_isdst=0)
>>>

exists(path)判断指定路径是否存在
isabs(path)判断指定路径是否是绝对路径
isdir(path) 判断指定路径是否存在且是一个目录
isfile(path)判断指定路径是否存在且是一个文件
islink(path)
ismount(path)
samefile(path1,path2)
四.pickle模块
pickling:存放,将对象转换成二进制的过程unpickling:读取,将二进制转换成对象的过程>>> import pickle
>>> my_list=[123,3,14,'xiaojiayu',['another list']]
>>> pickle_file=open('my_list.pkl','wb')#二进制写入形式
>>> pickle.dump(my_list,pickle_file)
>>> pickle_file.close()

>>> import os
>>> os.getcwd()
'D:\\python3.6_更新'
#读取
>>> pickle_file=open('my_list.pkl','rb')
>>> my_list2=pickle.load(pickle_file)
>>> print(my_list2)
[123, 3, 14, 'xiaojiayu', ['another list']]
>>> 五.编码
1.ASCII码
7个二进制位编码
表示128个字符
ord和chr提供ASCII的转换>>> ord('A')
65
>>> ord('a')
97
>>> chr(65)
'A'
>>> chr(97)
'a'
>>> 2.Unicode编码
跨语言,跨平台
统一且唯一的二进制编码
每个字符两个字节长
65536个字符的编码空间
3.UTF-8
可变长度的Unicode
4.在python中字符串是未编码的
可以用encode进行编码
用decode进行解码
举例:>>> s='中文字符串'
>>> bs=s.encode('utf-8')
>>> bs
b'\xe4\xb8\xad\xe6\x96\x87\xe5\xad\x97\xe7\xac\xa6\xe4\xb8\xb2'
>>> bs.decode('utf-8')
'中文字符串'
>>> 、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、
文件实例1:绘制五角星
data.txt中的数据:
300,0,144,1,0,0
300,0,144,0,1,0
300,0,144,0,0,1
300,0,144,1,1,0
300,0,108,0,1,1
184,0,72,1,0,1
184,0,72,0,0,0
184,0,72,0,0,0
184,0,72,0,0,0

代码:import turtle
def main():
turtle.title('数据驱动的动态路径绘制')
turtle.setup(800,600,0,0)
#设置画笔
pen=turtle.Turtle()#默认位置为窗口的原点
pen.color('red')
pen.width(5)
pen.shape('turtle')
pen.speed(5)

#读取数据文件
result=[]
file=open('data.txt','r')
for line in file:
result.append(list(map(float,line.split(','))))
print(result)

#动态绘制
for i in range(len(result)):
pen.color((result[i][3],result[i][4],result[i][5]))
pen.fd(result[i][0])#沿着当前位置向前移动...距离
if result[i][1]:
pen.rt(result[i][2])
else:
pen.lt(result[i][2])

pen.goto(0,0)
if __name__=='__main__':
main()



、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、
文件操作之实例二:
输入:电话簿、邮箱地址簿文件
处理:将两个文件内容进行合并

输出:合并后包含电话和邮箱地址簿的文件
两个文件的内容分别预先存入:
addressBook.txt中
姓名 邮箱
王颐笳 57320091@qq.com
李斯 12211212@qq.com
王五    949495968@qq.com
桑迪 wqweqe@163.com

TelBook.txt中
姓名    电话号码      
王颐笳  13691177890  
张三    135329293939
李斯    15811589981

桑迪    13010026896
代码:(待修改)'''
输入:电话簿、邮箱地址簿文件
处理:将两个文件内容进行合并
输出:合并后包含电话和邮箱地址簿的文件
'''
'''
程序的步骤
一:打开文件、读取文件
二:分别获取文件中的信息,到两个列表1和列表2
三:建立合并用的空列表3,完成列表1和列表2的信息合并操作到列表3中
四:将列表3中的信息写入到新文件
五:关闭所有打开的文件

'''
def main():
ftele1=open('TelBook.txt','rb')
ftele2=open('addressBook.txt','rb')
ftele1.readline()#跳过第一行
ftele2.readline()
lines1=ftele1.readlines()
lines2=ftele2.readlines()

list1_name=[]
list1_tele=[]
list2_name=[]
list2_email=[]

for line in lines1:
elements=line.split()
list1_name.append(str(elements[0].decode('gbk')))
list1_tele.append(str(elements[1].decode('gbk')))

for line in lines2:
elements = line.split()
list2_name.append(str(elements[0].decode('gbk')))
list2_email.append(str(elements[1].decode('gbk')))

#生成新的数据
lines=[]
lines.append('姓名\t 电话\t 邮箱\n')

for i in range(len(list1_name)):
s=''
if list1_name[i] in list2_name:
j=list2_name.index(list1_name[i])
s='\t'.join([list1_name[i],list1_tele[i],list2_email[j]])
s+='\n'
else:
s='\t'.join([list1_name[i],list1_tele[i],str(' ----- ')])
s+='\n'
lines.append(s)

for i in range(len(list2_name)):
s=''
if list2_name[i] not in list1_name:
s='\t'.join([list2_name[i],str(' ----- '),list2_email[i]])
s+='\n'
lines.append(s)

#合并到新文件中
ftele3=open('Book.txt','w')
ftele3.writelines(lines)

ftele3.close()
ftele1.close()
ftele2.close()

print('The addressBooks are merged!')

if __name__=='__main__':
main()

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息