刚刚回复了坛子里,有关FOXMIAL的提问,不明白的来看看这个。
2010-09-22 13:50
393 查看
本文通过对Foxmail邮件箱文件的分析而给出了一种自动将邮件箱内邮件导出为各自独立的".eml"格式的邮件文件,导出后的邮件文件可为OutLook等软件打开。本文所述方法在处理大批量信笺的导出有较好的效果。
引言
在中国Foxmail早已成为收发邮件的首选软件,其功能也早已超越Outlook,但是Foxmail也并非尽善尽美,尤其是在对邮件夹内邮件的导出、备份的处理上做的不是太好,只能手工一封一封将信导出,如果信件数目较少这样处理还可以应付,但如果对于成百上千封邮件仍这样处理显然是相当困难的。为此,本文通过对Foxmail邮件夹文件的分析而给出了一种通过程序自动将某个邮件夹中的所有邮件导出到指定文件夹的方法。
Foxmail邮件夹组成分析
为了能编程实现对Foxmail邮件夹的处理,首先要对Foxmail的邮件夹和内部邮件的组成方式及其采取的存放格式有一个清楚的认识。进入到Foxmail的安装目录,然后发一封邮件给自己,把信接收后,查看安装目录下各个文件的时间属性,发现只有fmnmtk.dat文件是最新的,但该文件大小远远小于所发邮件,因此应当排除。mail文件夹中的子目录对应Foxmail账号。进入某个帐号所对应的文件夹,文件夹中的in、out、send和trash等文件分别对应收件夹、发件夹、已发送文件夹和废件箱。
在明确了邮件夹所对应的存储文件后,可以通过二进制查看软件来进一步分析邮件夹的内部结构组成。根据目前的情况可以断定某个邮件夹内的邮件均存放在同一个文件中,因此本文对邮件夹内邮件的批量导出问题可以转化为从邮件夹文件中分离出各个邮件并将其输出到外部文件的问题。这样,在对邮件夹文件内部结构组成的分析时,只需关心两封邮件的边界即可。打开某个邮件夹文件,可以看到开始一段16进制内容为:
10 10 10 10 10 10 10 11 11 11 11 11 11 53 0D 0A
52 65 74 75 72 6E 2D 50 61 74 68 3A 20 3C 7A 68
这里,开始一段代码非常规整,因此可以猜测为文件的格式头或是各个邮件的格式头,在文件内对前7个10和6个11共13个字符进行搜寻,可以发现存在有许多相同字符,而且搜寻到的字符邻近几个字符"53"、"0D"和"0A"也同时出现,其后的字符则不固定,因此可以进一步假定这16个字符为邮件的格式头而非文件的格式头(文件格式头通常只在文件开始处出现一次),再在邮件夹文件中对这16个字符进行搜寻并记录搜寻到的次数,可以发现正好同邮件夹中的邮件数目相吻合,而且在删除或增添邮件后,该数目也会相应变化。根据以上情况可以断定"10 10 10 10 10 10 10 11 11 11 11 11 11 53 0D 0A"是邮件的格式头,根据此头可以分离出邮件。
程序的设计实现
在弄清楚Foxmail邮件夹文件的组成结构后,对内部邮件的提取、导出就不是什么难事了,编程的中心思想是对邮件格式头的判别,并对位于其后邮件内容数据的文件导出。为此,可以对全部邮件夹文件内容搜寻ASCII码10(16进制),一旦发现该字符说明其后15个字节有可能是邮件格式头,然后继续判断其后15个字节是否满足邮件格式头,一旦某个字节不符合则表明其并非邮件格式头而不予处理,否则开始将邮件数据写入导出文件,同时关闭上一封打开过的导出文件:
//从邮件夹文件读取字符
c = fgetc(fp1);
while (!feof(fp1))
{
//发现有分隔特征串的开头字符, 则进入check()函数进行分析
if (c == 0x10)
check();
//生成输出文件名
j++;
filename.Format("%d",j);
//确定待导出文件的存放路径
char exeFullPath[MAX_PATH];
CString strPath;
GetModuleFileName(NULL, exeFullPath, MAX_PATH);
strPath = CString(exeFullPath);
strPath = strPath.Left(strPath.ReverseFind('//'));
strPath = strPath + "//mail//" + CString(filename) + ".eml";
strcpy(fullname, strPath);
//以写方式打开导出文件,如果文件不存在则创建之
fp2 = fopen(fullname, "w");
//没有到输入文件的结尾, 又不是分隔特征串的开头字符, 则将字符写入输出文件
while (!feof(fp1) && (c = fgetc(fp1)) != 0x10)
fputc(c, fp2);
}
其中,对于邮件格式头的判断是在check()函数中完成的,依次对0x10之后的15个字节进行判断,一旦发现不是邮件格式头字符,立即返回,并将其当作邮件内容数据进行处理只有在断定为邮件格式头后才将上一封导出文件关闭:
for (int i = 0; i < 6; i++)
{
c = fgetc(fp1);
//不符合分隔特征串,则返回
if(c != 0x10)
return;
}
for (i = 0; i < 6; i++)
{
c = fgetc(fp1);
//不符合分隔特征串,则返回 由此可以断定邮件夹的内容
if (c != 0x11)
return;
}
if ((c = fgetc(fp1)) == 0x53)
if ((c = fgetc(fp1)) == 0x0D)
if ((c = fgetc(fp1)) == 0x0A)
{
c = fgetc(fp1);
//完全符合特征串,则当前邮件输出完毕, 关闭输出文件
fclose(fp2);
}
由于本程序的设计目的在于自动批量导出邮件,因此处理数据量一般是比较大的,为避免程序阻塞,可以将此处理过程放置于线程之中进行。经实验,由上述程序导出的eml文件可以为OutLook文件识别并打开,达到了预期目的。
小结
本文通过对Foxmail邮件夹的组成结构进行分析而最终实现了对其邮件的批量导出,极大方便了对Foxmail邮件的备份、管理等工作,而且对不同版本的Foxmail均有很好的支持(当前最新版本为4.2,本文方法适用),因此不失为一款实用的邮件辅助管理工具。本文所述代码在Windows 2000 Professional下由Microsoft Visual C++ 6.0编译通过。
引言
在中国Foxmail早已成为收发邮件的首选软件,其功能也早已超越Outlook,但是Foxmail也并非尽善尽美,尤其是在对邮件夹内邮件的导出、备份的处理上做的不是太好,只能手工一封一封将信导出,如果信件数目较少这样处理还可以应付,但如果对于成百上千封邮件仍这样处理显然是相当困难的。为此,本文通过对Foxmail邮件夹文件的分析而给出了一种通过程序自动将某个邮件夹中的所有邮件导出到指定文件夹的方法。
Foxmail邮件夹组成分析
为了能编程实现对Foxmail邮件夹的处理,首先要对Foxmail的邮件夹和内部邮件的组成方式及其采取的存放格式有一个清楚的认识。进入到Foxmail的安装目录,然后发一封邮件给自己,把信接收后,查看安装目录下各个文件的时间属性,发现只有fmnmtk.dat文件是最新的,但该文件大小远远小于所发邮件,因此应当排除。mail文件夹中的子目录对应Foxmail账号。进入某个帐号所对应的文件夹,文件夹中的in、out、send和trash等文件分别对应收件夹、发件夹、已发送文件夹和废件箱。
在明确了邮件夹所对应的存储文件后,可以通过二进制查看软件来进一步分析邮件夹的内部结构组成。根据目前的情况可以断定某个邮件夹内的邮件均存放在同一个文件中,因此本文对邮件夹内邮件的批量导出问题可以转化为从邮件夹文件中分离出各个邮件并将其输出到外部文件的问题。这样,在对邮件夹文件内部结构组成的分析时,只需关心两封邮件的边界即可。打开某个邮件夹文件,可以看到开始一段16进制内容为:
10 10 10 10 10 10 10 11 11 11 11 11 11 53 0D 0A
52 65 74 75 72 6E 2D 50 61 74 68 3A 20 3C 7A 68
这里,开始一段代码非常规整,因此可以猜测为文件的格式头或是各个邮件的格式头,在文件内对前7个10和6个11共13个字符进行搜寻,可以发现存在有许多相同字符,而且搜寻到的字符邻近几个字符"53"、"0D"和"0A"也同时出现,其后的字符则不固定,因此可以进一步假定这16个字符为邮件的格式头而非文件的格式头(文件格式头通常只在文件开始处出现一次),再在邮件夹文件中对这16个字符进行搜寻并记录搜寻到的次数,可以发现正好同邮件夹中的邮件数目相吻合,而且在删除或增添邮件后,该数目也会相应变化。根据以上情况可以断定"10 10 10 10 10 10 10 11 11 11 11 11 11 53 0D 0A"是邮件的格式头,根据此头可以分离出邮件。
程序的设计实现
在弄清楚Foxmail邮件夹文件的组成结构后,对内部邮件的提取、导出就不是什么难事了,编程的中心思想是对邮件格式头的判别,并对位于其后邮件内容数据的文件导出。为此,可以对全部邮件夹文件内容搜寻ASCII码10(16进制),一旦发现该字符说明其后15个字节有可能是邮件格式头,然后继续判断其后15个字节是否满足邮件格式头,一旦某个字节不符合则表明其并非邮件格式头而不予处理,否则开始将邮件数据写入导出文件,同时关闭上一封打开过的导出文件:
//从邮件夹文件读取字符
c = fgetc(fp1);
while (!feof(fp1))
{
//发现有分隔特征串的开头字符, 则进入check()函数进行分析
if (c == 0x10)
check();
//生成输出文件名
j++;
filename.Format("%d",j);
//确定待导出文件的存放路径
char exeFullPath[MAX_PATH];
CString strPath;
GetModuleFileName(NULL, exeFullPath, MAX_PATH);
strPath = CString(exeFullPath);
strPath = strPath.Left(strPath.ReverseFind('//'));
strPath = strPath + "//mail//" + CString(filename) + ".eml";
strcpy(fullname, strPath);
//以写方式打开导出文件,如果文件不存在则创建之
fp2 = fopen(fullname, "w");
//没有到输入文件的结尾, 又不是分隔特征串的开头字符, 则将字符写入输出文件
while (!feof(fp1) && (c = fgetc(fp1)) != 0x10)
fputc(c, fp2);
}
其中,对于邮件格式头的判断是在check()函数中完成的,依次对0x10之后的15个字节进行判断,一旦发现不是邮件格式头字符,立即返回,并将其当作邮件内容数据进行处理只有在断定为邮件格式头后才将上一封导出文件关闭:
for (int i = 0; i < 6; i++)
{
c = fgetc(fp1);
//不符合分隔特征串,则返回
if(c != 0x10)
return;
}
for (i = 0; i < 6; i++)
{
c = fgetc(fp1);
//不符合分隔特征串,则返回 由此可以断定邮件夹的内容
if (c != 0x11)
return;
}
if ((c = fgetc(fp1)) == 0x53)
if ((c = fgetc(fp1)) == 0x0D)
if ((c = fgetc(fp1)) == 0x0A)
{
c = fgetc(fp1);
//完全符合特征串,则当前邮件输出完毕, 关闭输出文件
fclose(fp2);
}
由于本程序的设计目的在于自动批量导出邮件,因此处理数据量一般是比较大的,为避免程序阻塞,可以将此处理过程放置于线程之中进行。经实验,由上述程序导出的eml文件可以为OutLook文件识别并打开,达到了预期目的。
小结
本文通过对Foxmail邮件夹的组成结构进行分析而最终实现了对其邮件的批量导出,极大方便了对Foxmail邮件的备份、管理等工作,而且对不同版本的Foxmail均有很好的支持(当前最新版本为4.2,本文方法适用),因此不失为一款实用的邮件辅助管理工具。本文所述代码在Windows 2000 Professional下由Microsoft Visual C++ 6.0编译通过。
相关文章推荐
- 求人看看这个代码,有关DLL中使用回调函数的问题:回调不能返回正确值
- 刚刚接触C 好多都不懂 大家帮忙看看 这个程序错哪了
- 刚刚从Cherry处MSN得知这个blog无法回复了,我说这几天怎么这么清静嘞。【恢复了!】
- NAntGUI 刚刚写了一个生成 NAnt .build 编译文件的小工具。刚刚写完了总体部分,先给大家看看界面 (二)
- 大家看看这个资料,有助于你了解股市
- 当你想放弃时,一定要看看这个漫画!
- 帮忙看看这个是为什么..
- 想考试系统分析师么?就来看看这个传说中的希赛四金花和三宝刀吧.
- 有关/proc/uptime这个文件里两个参数所代表的意义
- 但找不到刚刚编辑关闭的文档放在哪里的时候,可以看看
- 哪位大侠可以帮我看看这个该怎么办
- 设置图片inSampleSize但是内存没变?或许你应该看看这个
- SABAPDEMOS 这个包下好多好玩儿的,可以看看
- 把读过的书记录下来。很多年以后再看看这个书单,应该很有趣~
- 若干年后,看看写这个文章的真实性,判断媒体是不是在胡喊野叫---英对冲基金押注中国经济崩盘 若成功可获利5亿美元
- 没有审美能力,看看这个布局行不
- 从医学生到测试工程师——偶五年多来的职业发展经历(兼回复 double 朋友的提问 ^_^)
- 关于TChrome中加载JS与delphi交互问题,回复liqiao的提问
- Android核心分析28篇,强烈推荐android初学者,android进阶者看看这个系列教程
- 有iOS 10的iPhone 7长啥样 看看这个概念设计