Python 文件数据读写的具体实现
文件数据读写
读写文件,本质上是请求操作系统打开一个文件对象,然后,通过操作系统提供的接口从这个文件对象中读取数据(读文件),或者把数据写入这个文件对象(写文件)。
文件读取
使用Python内置open()函数,以rt的模式读取文件,如下示例:
>>>f=open('some.txt','rt')
这行代码就表示打开一个文件,若是文件不存在,会抛出IOError的异常,并给出详细的信息提示:
>>>f=open('undefined.txt','rt') Traceback(mostrecentcalllast): File"",line1,in FileNotFoundError:[Errno2]Nosuchfileordirectory:'undefined.txt'
当成功打开文件时,可使用read()函数读取文件的内容:
>>>f.read() 'Helloworld!'
当数据读取完毕后,需要调用close()关闭文件。因为文件对象会占用资源,使用完毕后需要及时关闭释放资源。
>>>f.close()
还有一种方法就是使用with语句,给被使用的文件创建一个上下文环境,这样文件对象就能够自动关闭。
>>>withopen('some.txt','rt')asf: ...data=f.read() ...
调用read()时一次性读取全部内容,若是文件内容过大,可以使用read(size)固定大小循环读取,每次最多读取size字节的内容。readline()函数,每次读取一行内容,readlines()读取所有内容,但是按行返回list。三者的使用,可根据实际的需求进行选择。
二进制文件
读取二进制的文件,需要使用rb的模式打开:
>>>f=open('image.jpg','rb') >>>f.read() b'\xff\xd8\xff\xe0\x00\x10JFIF\x00...'
从文件中读取数据,需要注意编码的问题。当编码错误时,会抛出UnicodeDecodeError异常。比如:
>>>f=open('some.txt','rt',encoding='ascii') >>>f.read() Traceback(mostrecentcalllast): File"",line1,in File"/usr/local/lib/python3.6/encodings/ascii.py",line26,indecode returncodecs.ascii_decode(input,self.errors)[0] UnicodeDecodeError:'ascii'codeccan'tdecodebyte0xccinposition2:ordinalnotinrange(128)
这种情况下,通常为读取文本指定的编码不正确,需要确认文件编码是否正确。如果编码错误还是存在的话,可以给open()函数传递一个可选的errors参数来处理这些错误。比如:
>>>f=open('some.txt','rt',encoding='ascii',errors='replace') >>>f.read() 'Un��ic��o��de��' >>>f=open('some.txt','rt',encoding='ascii',errors='ignore') >>>f.read() 'Unicode'
使用参数errors能够处理编码错误的问题,但是过程会觉得非常糟糕。这里提倡的是确保使用的是正确的编码。模棱两可的时候,使用默认的设置(通常是UTF-8)。
压缩文件
读取gzip和bz2格式的压缩文件时,可以使用gzip和bz2模块。两个模块都为open()提供了另外的实现来解决读取gzip和bz2两个格式的压缩文件的问题。例如读取压缩文件,示例如下:
>>>importgzip >>>withgzip.open('some.gz','rt')asf: ...text=f.read() >>>importbz2 >>>withbz2.open('some.bz2','rt')asf: ...text=f.read()
文件写入
文件写入,同样需要调用open()参数,但是指定的模式为wt或者wb,用以表示写文本文件或是二进制文件:
>>>f=open('some.txt','wt') >>>f.write('Hello,world!') 13 >>>f.close()
数据写入完毕,同样需要调用close()关闭文件对象。也可以with语句创建上下文,用以正常关闭文件对象。
类似的,写入压缩数据时,导入gzip或者bz2模块:
>>>importgzip >>>withgzip.open('some.gz','wt')asf: ...f.write(text) >>>importbz2 >>>withbz2.open('some.bz2','wt')asf: ...f.write(text)
写入压缩数据时,可选参数compresslevel可以指定一个压缩等级。例如:
>>>withgzip.open('some.gz','wt',compresslevel=6)asf: ...f.write(text)
compresslevel参数默认值为9,表示最高的压缩等级。等级越低性能越好,但是压缩程度也就越低。
使用w模式的open()函数,若打开的文件在写入前有数据内容,则会被清除覆盖。如果是要在已经存在的文件中添加内容的话,使用模式为at的open()函数。
涉及读写文件模式的定义及含义,内容如下:
模式 | 含义 |
---|---|
'r' | 读取数据(默认) |
'w' | 写入数据 |
'x' | 文件存在抛出异常,不存在则创建 |
'a' | 追加写入数据 |
'b' | 二进制模式 |
't' | 文本模式(默认) |
'+' | 更新文件(读写) |
具体更详细的内容可以参考Python官方文档。
参考资料
来源
DavidM.Beazley;BrianK.Jones.PythonCookbook,3rdEdtioni.O'ReillyMedia.2013.
LucianoRamalho.FluentPython.O'ReillyMedia.2015.
“2.Built-inFunctions”.docs.python.org.Retrieved20January2020.
"gzip—Supportforgzipfiles".docs.python.org.Retrieved22January2020.
"bz2—Supportforbzip2compression".docs.python.org.Retrieved22January2020.
廖雪峰.“Python教程”.liaoxuefeng.com.[2020-01-18].
以上为本篇的主要内容。希望对大家的学习有所帮助,也希望大家多多支持毛票票。
声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:czq8825#qq.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。