MHT富媒体文件分析及提取转换HTML文件-Delphi7实现QQ聊天记录导出文件提取
2016-11-25 17:00
821 查看
最近需要导出QQ群聊天记录,然后批量获取里面的图片。看了QQ的导出方式一共有三种:
1、加密文件(*.bak,支持导入):这个适用于聊天记录备份。
2、网页格式(*.mht,不支持导入):包含图片,文字。
3、文本文件(*.txt,不支持导入):不包含图片。
看来第二种是最适合的格式。导出后的文件富媒体文件格式MHT,即MHTML文件,又称为聚合HTML文档、Web档案或单一文件网页。单个文件网页可将网站的所有元素(包括文本和图形)都保存到单个文件中。这种封装使您可将整个网站发布为单个内嵌MIME (MIME:通过 Internet 连接传递多媒体资源的一列标准。MIME类型通知程序对象所包含的内容(如图形、声音或视频)的聚合HTML文档(MHTML)文件,或将整个网站作为一个电子邮件或附件发送。Internet Explorer 4.0及更高版本支持此格式。
由于导出的MHT文件是把所有的文件打包在一起的,所以还是无法批量获取里面的图片等资料。
研究了MHT的内容,发现都是有规律的一些数据块,如下:
------=_NextPart_A01590A4_5DA4_4db7_A25B.4EF2B5346CC6
Content-Type: text/html
Content-Transfer-Encoding:7bit
------=_NextPart_A01590A4_5DA4_4db7_A25B.4EF2B5346CC6
Content-Type:image/jpeg
Content-Transfer-Encoding:base64
Content-Location:{96B5A2C4-6A9E-401c-B84C-A6038B97602B}.dat
网上找了一些MHT文件的提取软件,能提取出图片。但好奇心让我想自己写一个软件。经过两天的研究,软件写成了。
界面比较简单:
把需要解析的MHT文件加入列表,并处理:
处理的文档20.8MB,耗时1.045s,生成了397个文件:
版权信息:
1、加密文件(*.bak,支持导入):这个适用于聊天记录备份。
2、网页格式(*.mht,不支持导入):包含图片,文字。
3、文本文件(*.txt,不支持导入):不包含图片。
看来第二种是最适合的格式。导出后的文件富媒体文件格式MHT,即MHTML文件,又称为聚合HTML文档、Web档案或单一文件网页。单个文件网页可将网站的所有元素(包括文本和图形)都保存到单个文件中。这种封装使您可将整个网站发布为单个内嵌MIME (MIME:通过 Internet 连接传递多媒体资源的一列标准。MIME类型通知程序对象所包含的内容(如图形、声音或视频)的聚合HTML文档(MHTML)文件,或将整个网站作为一个电子邮件或附件发送。Internet Explorer 4.0及更高版本支持此格式。
由于导出的MHT文件是把所有的文件打包在一起的,所以还是无法批量获取里面的图片等资料。
研究了MHT的内容,发现都是有规律的一些数据块,如下:
------=_NextPart_A01590A4_5DA4_4db7_A25B.4EF2B5346CC6
Content-Type: text/html
Content-Transfer-Encoding:7bit
------=_NextPart_A01590A4_5DA4_4db7_A25B.4EF2B5346CC6
Content-Type:image/jpeg
Content-Transfer-Encoding:base64
Content-Location:{96B5A2C4-6A9E-401c-B84C-A6038B97602B}.dat
网上找了一些MHT文件的提取软件,能提取出图片。但好奇心让我想自己写一个软件。经过两天的研究,软件写成了。
界面比较简单:
把需要解析的MHT文件加入列表,并处理:
处理的文档20.8MB,耗时1.045s,生成了397个文件:
版权信息:
相关文章推荐
- QQ聊天记录保存在哪个文件里?
- 防止记录丢失,保存QQ聊天记录文件的方法
- 用C#实现将html文件转换为chm文件
- QQ聊天记录备份BAK文件的修复方法
- 微信QQ聊天记录分析工具-微Q
- 手机QQ2009聊天记录分析及提取
- 用C#实现将HTML文件转换为CHM文件(转)
- 特定用户QQ群聊天记录导出的实现
- Delphi实现操作Foxpro的dbf文件,并导出整合实现txt和dbf互相转换
- Java实现从数据库导出大量数据记录并保存到文件的方法(转)
- VC写的手机qq聊天记录导出工具
- ios 版 qq 聊天记录的导出
- 手机QQ2009(塞班第三版)聊天记录提取完全代码
- 通过脚本实现从日志文件中提取时间最近的几条记录
- QQ导出的txt聊天记录导入数据库方法
- FlashFXP 2 FileZilla 将 FlashFXP 的站点文件 Sites.dat 或其导出的 *.ftp 站点信息文件转换为 FileZilla 的站点文件,以便导入到 FileZilla 中,实现 FTP 客户端从 FlashFXP 到
- 用C#实现将HTML文件转换为CHM文件(转) - C#探索者 - 博客园
- ios版qq聊天记录的导出
- 用Python实现CSV格式文件转换为HTML文件[Python3程序开发指南实现]
- 导出手机QQ聊天记录到电脑