python实现汉字转拼音和读写excel
2013-09-17 16:19
567 查看
本文再次见证python是对付杂活的利器。不过,为什么这么多杂活呢?最近接到上级的任务,要在网络上收集一大批人图片,主页等信息,然后将这些信息填入到Excel表格。其中有一个令人发指地无聊的工作就是要将所有人的英文名写好整理好,由于都是中国人,因此,这工作也就是在考验我的汉语拼音水平。
于是,我想到了python。在网上找了一些信息,得出如下的思路:
1、汉字转拼音
https://github.com/cleverdeng/pinyin.py.git" target=_blank>github上有人实现好了,我只需用现成的。
2、操作excel
关于python操作excel,由于网上某些低质量博文的误导,多走了不少弯路。直到看到:
Python中一般使用xlrd(excel read)来读取Excel文件,使用xlwt(excel write)来生成Excel文件(可以控制Excel中单元格的格式),需要注意的是,用xlrd读取excel是不能对其进行操作的:xlrd.open_workbook()方法返回xlrd.Book类型,是只读的,不能对其进行操作。而xlwt.Workbook()返回的xlwt.Workbook类型的save(filepath)方法可以保存excel文件。
因此对于读取和生成Excel文件都非常容易处理,但是对于已经存在的Excel文件进行修改就比较麻烦了。不过,还有一个xlutils(依赖于xlrd和xlwt)提供复制excel文件内容和修改文件的功能。其实际也只是在xlrd.Book和xlwt.Workbook之间建立了一个管道而已。
这样,剩下的问题就是写脚本了。
现在,excel的格式如下:
下面写脚本将name_en列填好,代码如下:
代码运行之后,excel表的name_en列被填充,如下:
于是,我想到了python。在网上找了一些信息,得出如下的思路:
1、汉字转拼音
https://github.com/cleverdeng/pinyin.py.git" target=_blank>github上有人实现好了,我只需用现成的。
2、操作excel
关于python操作excel,由于网上某些低质量博文的误导,多走了不少弯路。直到看到:
Python中一般使用xlrd(excel read)来读取Excel文件,使用xlwt(excel write)来生成Excel文件(可以控制Excel中单元格的格式),需要注意的是,用xlrd读取excel是不能对其进行操作的:xlrd.open_workbook()方法返回xlrd.Book类型,是只读的,不能对其进行操作。而xlwt.Workbook()返回的xlwt.Workbook类型的save(filepath)方法可以保存excel文件。
因此对于读取和生成Excel文件都非常容易处理,但是对于已经存在的Excel文件进行修改就比较麻烦了。不过,还有一个xlutils(依赖于xlrd和xlwt)提供复制excel文件内容和修改文件的功能。其实际也只是在xlrd.Book和xlwt.Workbook之间建立了一个管道而已。
这样,剩下的问题就是写脚本了。
现在,excel的格式如下:
school_name | name_cn | name_en |
Tianjin University | 周天 | |
Tianjin University | 韩冬 | |
Tianjin University | 李兴 |
#!/usr/bin/python #-*-coding:utf-8-*- from pinyin import PinYin #module for excel handle import xlrd from xlutils.copy import copy def name_tran(str): test=PinYin() test.load_word() str[0] family=test.hanzi2pinyin(string=str[0])[0] last=u'' print str[1:] for word in test.hanzi2pinyin(string=str[1:]): last=last+word name_en=last.title()+u' '+family.title() return name_en def file_fill(file_name,sheet_name,row_count): #打开Excel文件读取数据 data = xlrd.open_workbook(file_name) #获取一个工作表 #table = data.sheets()[0]#通过索引顺序获取 #table = data.sheet_by_name(sheet_name)#通过名称获取 table = data.sheet_by_index(3) #通过索引顺序获取 #using xlutils to modify excel wb = copy(data) #通过get_sheet()获取的sheet,有write()方法 ws = wb.get_sheet(3) for i in range(1,row_count): name_cn=table.cell(i,1).value print name_cn try: name_en=name_tran(name_cn) ws.write(i,2,name_en) print name_en except: print i+1,"th row fail to translate." wb.save(file_name) return "Over!" if __name__=="__main__": file_fill(u"scholar&school.xls",u"Scholars",442)
代码运行之后,excel表的name_en列被填充,如下:
school_name | name_cn | name_en |
Tianjin University | 周天 | Tian Zhou |
Tianjin University | 韩冬 | Dong Han |
Tianjin University | 李兴 | Xing Li |
相关文章推荐
- Python实现的Excel文件读写类
- python实现对excel表的读写操作(一)
- python把汉字转换成拼音实现程序
- Python实现的Excel文件读写类
- java实现Excel文件解析---apache POI以及把汉字转化为拼音
- 在excel中实现汉字转换拼音全拼
- 在excel中实现汉字转换拼音首字母大写
- 用Python实现Excel的读写
- python实现excel读写数据
- excel中如何实现提取汉字的拼音首字母
- 文件一键上传、汉字转拼音、excel文件上传下载功能模块的实现
- 文件一键上传、汉字转拼音、excel文件上传下载功能模块的实现
- Python实现爬虫抓取与读写、追加到excel文件操作示例
- 文件一键上传、汉字转拼音、excel文件上传下载功能模块的实现
- Python实现读写sqlite3数据库并将统计数据写入Excel的方法示例
- 用Python语言实现对EXCEL文件的读写
- 文件一键上传、汉字转拼音、excel文件上传下载功能模块的实现
- python 操作excel读写
- python操作Excel读写(使用xlrd)
- java实现对Excel的读写操作