您的位置:首页 > 编程语言 > Java开发

文本中多余字符串的批量删除和替换

2016-10-15 09:28 239 查看
   
文本中多余字符串的批量删除和替换

     
        最近,我用别人提供的java源代码制作了一个小程序,成功地将《大主宰》这部玄幻小说第1至第1333章的内容下载到自己的电脑并保存在路径为f:\test.txt的文件里。

        但是,下载的这个txt文本从内容到形式还存在不少问题。一是在每隔几行,就出现www.lingdiankanshu.com这样的网址,二是在需要换行的前面都添加上了*****字符串,三是每一章节下面不分行,一排到底。

        有没有办法将这些多余的字符串去掉,并重新进行分行呢?答案是肯定的,我相信会找到这样的办法。

        第一步,打开“排版助手”/“文件”,“打开”f:\test.txt文件,点击“执行”,待排版助手自动将文本中的所有空行加以删除、重新排版后,点击“文件”/“另存为”,将文件保存为f:\testa.txt。

        第二步,打开f:\testa.txt,复制其中的一个字符串“www.lingdiankanshu.com”,然后打开“编辑”/“替换”,在“替换内容”一栏输入“www.lingdiankanshu.com”,“替换为”一栏啥也不输入,然后点“全部替换”,稍停片刻,文本中的“www.lingdiankanshu.com”即被全部去除。然后,点击“文件”/“另存为”,将文件保存为f:\testb.txt。

        第三步,打开f:\testb.txt,点击“编辑”/“替换”,在“替换内容”一栏输入“*****”,“替换为”一栏输入“ ”,然后点“全部替换”,稍停片刻,文本中“*****”即被替换为“ ”。然后,点击“文件”/“另存为”,将文件保存为f:\testc.txt。

        第四步,打开EmEditor,在“文件”中“打开”f:\testc.txt,在“搜索”中打开“替换”,“替换”栏里输入“ ”,“替换为”栏里输入“\n  ”(n后面敲两次空格键),点“全部替换”,文本中所有有“ ”的地方便都另起一行,而且行首都缩进了两个空格。然后,点击“文件”/“另存为”,将文件保存为f:\testd.txt。 

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  java