Python学习笔记:汉字字频统计
2017-07-27 15:26
543 查看
文本为UTF8编码,未经特殊处理
dict={}
fd=open("/home/daya/Downloads/尘缘.txt",'r')
for row in fd: #按行处理
row=row.strip()
if len(row)==0: #跳过空行
continue
for char in row: #行中的每一个字符
if char in [' ',',','。','”','“','※','…','?',':','!']:
continue
if char not in dict: #为首次出现的字创建key
dict[char]=0
dict[char]+=1
#字典按值排序,返回值为元组列表
dict=sorted(dict.items(),key=lambda item:item[1],reverse=True)
for x in range(0,21,1):
print(dict[x][0],dict[x][1]) #类似C中二维数组
fd.close()
fd=open("/home/daya/Downloads/count.txt",'w')
for item in dict:
fd.write(item[0]+','+str(item[1])+'\n')
fd.close()
dict={}
fd=open("/home/daya/Downloads/尘缘.txt",'r')
for row in fd: #按行处理
row=row.strip()
if len(row)==0: #跳过空行
continue
for char in row: #行中的每一个字符
if char in [' ',',','。','”','“','※','…','?',':','!']:
continue
if char not in dict: #为首次出现的字创建key
dict[char]=0
dict[char]+=1
#字典按值排序,返回值为元组列表
dict=sorted(dict.items(),key=lambda item:item[1],reverse=True)
for x in range(0,21,1):
print(dict[x][0],dict[x][1]) #类似C中二维数组
fd.close()
fd=open("/home/daya/Downloads/count.txt",'w')
for item in dict:
fd.write(item[0]+','+str(item[1])+'\n')
fd.close()
相关文章推荐
- Python学习笔记总结(二):函数和模块
- 【Python】学习笔记——-8.3、面向对象高级编程:3.多重继承
- Python学习笔记一 time模块学习
- python学习笔记:MySQLdb中的connect
- Python学习笔记一:数据类型转换
- Python基础教程 第11章: 文件和流 学习笔记
- 【学习笔记】Python条件判断-If语句
- Python学习笔记 图形界面GUI
- 计算机科学与Python编程导论_MIT 学习笔记(六)
- Python学习笔记1 - 语言的基本要素
- Python学习笔记1
- Python中的类学习笔记
- Python 学习笔记 (II-B)
- 《HeadFirst Python》第一章学习笔记
- Python学习笔记四:面向对象编程
- Python学习笔记(3)--数据文件的读写
- Python学习笔记(5)Timer
- Python学习笔记(2)
- Python入门学习笔记1(变量、运算符、数据类型I)
- Python 学习笔记 - 面向对象(特殊成员)