|
起点中文网提供了小说的txt格式下载功能,极大的方便了广大电子书爱好者,我们可以在此基础上制作各种格式的手机电子书。但起点下载的txt文件中有许多影响浏览的文字,加了许多随机代码,如果用一般方式替换基本无法成功。但我们有功能强大的文本编辑工具editplus,可以很方便快速的删除这些文字。


起点在txt文件中加入了许多如上图字样的更新说明,中间插入了若干随机字母,后面的“本章字数”也是变化的,这些因素使得这部分内容无法批量替换,我们还是使用editplus的正则表达式来搞定它。。。。
(本人关于editplus在电子书排版中的应用还有两篇文章:《使用Editplus正则表达式排版疑难电子书一例》和《txt格式电子书排版经验浅谈》大家可以多了解一下)
广告过后,言归正传。在editplus中打开要编辑的文件,ctrl+H打开“替换”对话框。因为要用到正则表达式,千万不要忘了在“正则表达式”前面打上勾。
注意观察,在这行文字前面有几个空格,为了一劳永逸,我们决定把这些空格也替换掉。复制空格到替换框的“查找内容”里。www.sjshu.com端木忧伤原创,转载请说明出处,谢谢!!

空格后面的部分,我们仔细观察一下,中间夹杂着一些随机字符,是变化的,还有更新时间以及字数等都是变化的。但是这行文字的开头和结尾都是固定的:开头都是“(起”,结尾都是“)”。正则表达式可以定义开头和结尾来表示若干文字。我们就来定义一下边界,中间部分是什么内容根本就不用考虑。
先定义要替换内容的起始边界:点击“查找内容”输入框后面的 按钮,选择“字符在范围内”,输入框中会自动出现“[ ]”,这表示把要定义的字符放在这里面,也就是“(起”,如下图:www.sjshu.com端木忧伤原创,转载请说明出处,谢谢!!

起始边界定义好之后,就是中间的字符了,如上文所说,我们根本不必管这些字符是什么,因此可以用正则表达式中的“任意字符”来表示,点击 按钮,选择“任意字符”,输入框里就会多一个“.”符号,代表任意字符。因为是多个任意字符,所以再选择一下“匹配1次或多次”,输入框里自动加入一个“+”符号,翻译过来的意思就是一个或多个的任意字符。如下图:

最后定义结尾边界,很简单,就是个右括号,按上上步骤的方法,添加为如下显示:

至此,这一行文字就定义完了,先点“查找”按钮测试下,看看我们定义的表达式是否代表了正确的文本,如果是的话,直接点全部替换,嘿嘿,文本文件中所有的这种文字就全部被删除了。
文本文件中还有许多类似:起0M点0M中0M文0M网0M授权发布好书尽在www.cmfu.com这样的文字,也是有许多随机字符,但是不要怕,按照我们上面的方法,只要找到了起始和边界,中间字符不管它如何随机,我们也是有办法处理的。www.sjshu.com端木忧伤原创,转载请说明出处,谢谢!!
本文再次说明了EDITPLUS的功能强大,特别是其中正则表达式的强大,大家可以在网上搜一下相关资料,再实际作些实验和练习,就可以驾轻就熟的排版TXT文件,为大家提供更高质量的电子书了。
大家有什么问题可以到手机电子书论坛www.sjshu.net去讨论。
www.sjshu.com端木忧伤原创,转载请说明出处,谢谢!!
|