用python导出mht文件中的JPG图片
2010-12-23 21:54
399 查看
import os import sys import re import time import base64 def extract_data(filename, dir): file = open(filename, "r") content = file.read() index = 0 for match in re.finditer(r'(?=/9j)(.|\n)*?(?=(\n\n))', content): index = index + 1 print("%s/%s.jpg" % (dir, index)) newfile = open("%s/%s.jpg" % (dir, index), "wb") real = re.sub("\n", "", match.group()) length = len(real) times = (4 - length % 4) % 4 i = 0 while i < times: real = "%sA===" % real i = i + 1 #newfile.write(real) newfile.write(base64.b64decode(real)) newfile.close() file.close() def export_file(file_path): r = re.search(r"(?<=\\|/).*", file_path) file_name_ext = file_path while r != None: r = r.group() file_name_ext = r r = re.search(r"(?<=\\|/).*", r) pattern = "%s" % file_name_ext pattern = re.sub("\[", "\\\[", pattern) pattern = re.sub("\]", "\\\]", pattern) pattern = re.sub("\(", "\\\(", pattern) pattern = re.sub("\)", "\\\)", pattern) pattern = ".*?(?=%s)" % pattern path = re.search(pattern, file_path) if path != None: path = path.group() else: path = "" dot = re.search(r"\.", file_name_ext) file_name = file_name_ext if dot != None: file_name = re.search(r".*?(?=\.)", file_name_ext) file_name = file_name.group() else: file_name = file_name + "_dir" full_path = path + file_name bExist = os.path.exists(full_path) if bExist != True: os.mkdir(full_path) else: print("The Directory \"%s\" Exists!\n" % full_path) extract_data(file_path, full_path) def main(): print(os.name) index = 0 for arg in sys.argv: index += 1 if index == 1: continue if index == 2: export_file(arg) if index == 1: file_path = "E:\\Scripts\\test.mht" export_file(file_path) if __name__ == "__main__": main() print("just wait for 2 seconds!\n") time.sleep(2)
相关文章推荐
- 使用python查询某目录下所有‘jpg’结尾的图片文件
- 导出目录下所有图片文件 - Python脚本
- Python批量导出多个PPT/PPTX文件中每个幻灯片为独立JPG图片
- python将.ppm格式图片转换成.jpg格式文件
- python将.ppm格式图片转换成.jpg格式文件的方法
- Python导出数据到Excel可读取的CSV文件的方法
- 用delphi批量导入某子目录下所有JPG图片文件到数据库
- python学习 二 04 爬一个图片网站-解析文件,获得所有图片链接
- 【文件操作】_copy /b 要显示的图片 + 压缩包 生成的“图片"名.jpg
- 将存在表里的IMAGE类型的数据图片导出存为一个图片文件
- Python之BeautifulSoup学习之三 读取本地html文件,并将其中图片保存下来
- pdf文件转换成jpg图片格式的四种方法
- FlashBuilder4.7读取FlashCS导出SWC的JPG图片为空的问题
- pdf文件是怎么导出图片的
- python实现对文件中图片生成带标签的txt文件方法
- 用delphi批量导入某子目录下所有JPG图片文件到数据库
- python+selenium 上传文件或者图片
- Web Scraping with Python:使用 Python 导出 CSDN 博客全部文章(保留样式)和附带图片
- 怎么将iMindMap中文版中文件导出为图片
- CAD文件转jpg图片好转么