您的位置:首页 > 职场人生

如何区分Office2003格式中的Word或Excel文档

2011-10-28 11:48 597 查看
由于近日来上级机构、合作单位发来的Office2003格式文档后缀名经常错乱,有些明明是Word文档,后缀就会变成dat、无后缀、甚至是xls后缀,需要用Word或Excel打开去试,造成工作上的不便,所以研究了一下如何区分这些文件。

首先文件头肯定是复合文件头:D0 CF 11 E0 A1 B1 1A E1

刚开始研究的时候发现文件头之后的数据根本分不出来哪些是Word、哪些是Excel,因为没有特别的标志来区分。在得到CSDN论坛上某帖子的提示后开始研究文件尾,发现文件尾大概2K字节内只要有类似“WordDocument”或者“Workbook”字样的就是Word或Excel文档,但有些尾部内容十分混乱,全是乱码,根本不能区分。今天发现一款微软官方的软件Microsoft Office Visualization Tool,虽然是用来检测Office2003格式文档中是否有恶意代码的,但能完整的分析文档结构,所以能够区分Word或Excel。

使用起来非常简单,打开相应文档,然后选择Parser里的OLESSFormat,再点击Parser即可。

下边是Word文档:





下边是Excel文档:





软件下载地址是:http://www.microsoft.com/download/en/details.aspx?id=2096
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息