Python的file.read()方法无法读全文件
2013-01-13 22:06
381 查看
作为一个python的菜鸟,最近在用python读取html文件内容。
由于文件本身存在乱码(应该是保存到本地产生的),所以使用以下代码读取时,读取到乱码处就无法返回了。
查找了stackoverflow
http://stackoverflow.com/questions/7297220/cant-get-python-to-read-until-the-end-of-a-file
说在python的帮助文档中有关于read()的说明(我没有找到):
Also note that when in non-blocking mode, less data than was requested may be returned, even if no size parameter was given.
也就是说,即使read不传入size的参数,有可能反回的也不是文档的全部数据,有两种方式解决:
方法一是使用read(size)方法
方法二说是用readline或readlines读取
但在我的场景,这个方法不管用:P
欢迎各位大牛指导。
来自:http://www.cnblogs.com/anic/
由于文件本身存在乱码(应该是保存到本地产生的),所以使用以下代码读取时,读取到乱码处就无法返回了。
html = open(filename).read()
查找了stackoverflow
http://stackoverflow.com/questions/7297220/cant-get-python-to-read-until-the-end-of-a-file
说在python的帮助文档中有关于read()的说明(我没有找到):
Also note that when in non-blocking mode, less data than was requested may be returned, even if no size parameter was given.
也就是说,即使read不传入size的参数,有可能反回的也不是文档的全部数据,有两种方式解决:
方法一是使用read(size)方法
def readhtmlfile(filename): f = open(filename) html = '' while True: tmp = f.read(1024) if tmp == '': break html += tmp return html
方法二说是用readline或readlines读取
但在我的场景,这个方法不管用:P
欢迎各位大牛指导。
来自:http://www.cnblogs.com/anic/
相关文章推荐
- .NET下编译C++代码时出现fatal error C1083: 无法打开包括文件:“xuhk_JNIHelloWorld.h”: No such file or directory错误的解决方法。
- php readfile下载大文件失败的解决方法
- python3之File文件方法
- Python File(文件) 方法
- 在Python中操作文件之read()方法的使用教程
- Python3 pandas read_csv 读取txt文件报错:IOError: Initializing from file failed
- filestream read方法 循环读取固定文件
- Python3 File(文件) 方法
- 郁闷N天了,IDFTP发生10054错误后无法继续上传文件,重新创建IDFTP后发生错误:550 cannot create file。请教解决方法
- Python File(文件) 方法
- Python3基础 file read 读取txt文件的前几个字符
- Python3 File(文件) 方法
- Python:file (read,readline,readline )使用方法
- Python获取当前文件名分两种方法:__file__、sys.argv[0]
- Python随记(五)文件对象方法 Method of FileObject
- 使用FileReader对象的readAsDataURL方法来读取图像文件
- Python File(文件) 方法
- windows Git Bash 无法运行python文件的解决方法
- File.ReadAllText方法,File.WriteAllText方法修改文件内容
- Python3 File(文件) 方法