Python练手项目4 -- 统计英文单词的数目
2018-03-08 18:07
495 查看
项目来源:show-me-the-code
4号题目:任一个英文的纯文本文件,统计其中的单词出现的个数。
分析:这道题目我个人觉得开放性很大,可以用很多种方式去做,我个人因为目前在做爬虫,使用正则表达式会多一些,就写了一个正则表达式的解析方法。主要是因为这样简洁一点。
上代码:
效果图:
这个题目其实很简单,但是不知道什么原因,我一开始读取文本时,始终会出现一个错误或者说是异常
以上。
4号题目:任一个英文的纯文本文件,统计其中的单词出现的个数。
分析:这道题目我个人觉得开放性很大,可以用很多种方式去做,我个人因为目前在做爬虫,使用正则表达式会多一些,就写了一个正则表达式的解析方法。主要是因为这样简洁一点。
上代码:
import re with open('4.txt', 'r', errors='ignore') as f: data = f.read() p = re.compile(r'(\w+)') items = re.findall(p, data) print(len(items)) for i in items: print(i)
效果图:
这个题目其实很简单,但是不知道什么原因,我一开始读取文本时,始终会出现一个错误或者说是异常
UnicodeDecodeError: 'gbk' codec can't decode byte 0x9d in position 2114: incomplete multibyte sequence,导致这个异常的原因是:我没有在
open方法里添加
errors='ignore'参数。我个人的理解是保存的英文文本因为一些原因导致编码时多了一些东西,导致出错。虽然不明白具体的原因,但觉得可能和操作系统有关。
以上。
相关文章推荐
- 如何用Python实现任一个英文的纯文本文件,统计其中的单词出现的个数?
- python实现统计汉字/英文单词数的正则表达式
- [一天一项目]统计字符串中的单词数目
- 模拟基础之统计字符串中的英文单词数目
- Python实现统计英文单词个数及字符串分割代码
- Python统计txt文件中的英文单词个数
- Python统计一个英文文档中各单词出现的行数
- Python 统计一个纯英文文件中的单词总个数
- 布同 统计英文单词的个数的python代码
- 布同 统计英文单词的个数的python代码
- Java 文件统计:编写程序,统计英文文本文件中的字符数目和单词数目。程序运行时,输入要统计的文件的名称,程序处理后输出字符数目和单词数目
- 使用Python+NLTK实现英文单词词频统计
- python 统计 英文 单词
- 每天一个小程序之python实现统计英文单词出现个数
- [Python]任一个英文的纯文本文件,统计其中的单词出现的个数。(考虑单词-分行)
- 统计英文单词的个数的python代码
- Python每日练习 05 任一个英文的纯文本文件,统计其中的单词出现的个数
- python实现统计汉字/英文单词数的正则表达式
- 每天一个python小程序 004:任一个英文的纯文本文件,统计其中的单词出现的个数
- 任意一个英文的纯文本文件,统计其中的单词出现的个数(shell python 两种语言实现)