AlltoTXT! 电子书格式转换全攻略


一 前言

我的一个同学是个正宗的“书虫”,他几乎每天都捧着个MP3,看从网上下载的电子书。一日他来找我,说有没有什么办法把其它格式的电子书都转换成TXT。本来想给他讲一些“保护版权”之类的体面话的,可看到他苦恼的样子,我的心一下子就软了,说你直接下载TXT格式的不就得了。他说我也想这样啊,可有些书根本找不到TXT格式的。我想,罢了罢了,还是从“学习研究”的角度给他一些技术支持吧。


二 转换

为了方便操作,我们在进行转换之前,最好把待转换的电子书,放到一个路径不是很深的文件夹内。

1
HTM(HTML)转TXT

所需软件:HTML2TXT

说明:启动软件,单击“添加文件夹”按钮(图1),选择存放HTM文件的文件夹,单击确定,即可看到软件左下方的窗口中已经列出了该文件夹下的所有HTM文件;此时单击“全部转换”按钮,即可将列表中的文件全部转换为TXT,并保存在HTM文件所在的文件夹中。

All2TXT_图1.jpg

2
CHM转TXT

所需软件:CHM Encoder

说明:启动软件,单击“打开”按钮(图2),找到需要转换的CHM文件;选择一个输出文件夹,然后单击“开始”按钮(图3),即可得到反编译后的HTM文件。接下来执行上面讲过的HTM(HTML)转TXT的步骤,即可得到TXT文件。

All2TXT_图2.jpg

All2TXT_图2.jpg

3
PDF转TXT

所需软件:PDF Text Converter

说明:启动软件后,先在左上方的浏览器窗口内找到PDF文件所在的文件夹,此时左下方的文件列表窗口中会显示出该文件夹中的PDF文件,选中欲转换的文件,单击工具栏上的“添加文件”按钮,即会在右上方的窗口中列出等待转换的文件,添加完成后,单击齿轮形状的“转换”按钮,即可完成转换(图4)。转换好的TXT文件保存在源文件所在文件夹内。

All2TXT_图2.jpg

4
JAR转TXT

所需软件:WinRAR

说明:只要你的电脑上安装了WinRAR,即可右击JAR文件,直接将其解压缩。此时你需要做的,就是将这些没有扩展名的文件加上TXT的扩展名并合并(快捷的方法下面会有介绍)。

5
UMD转TXT

所需软件:XBookMaker

说明:启动软件后,单击左上方的“Open
folder”按钮,定位到包含UMD电子书的文件夹,此时会在左边的的“Files”窗口列出该文件夹内包含的所有UMD格式的电子书,点击一个UMD文件,左下方的“Chapters”窗口中即会显示该电子书中所包含的章节。单击任意一个章节,即可在右边的窗口中看到该章节的内容。现在你只需将其复制并将其粘贴到记事本中,保存为TXT即可(图5)。

All2TXT_图2.jpg

6
EXE转TXT

所需软件:miniKillEBook

说明:先打开想要转换的EXE电子书,再启动miniKillEBook,勾选“以文本方式保存”复选框,拖动图中的图标到电子书窗口中(图6)。单击“开始”按钮,软件即会自动将电子书“逐页翻过”并将每一页的内容存为TXT文本。

All2TXT_图2.jpg

7
TCR转TXT

所需软件:Fine Reader

说明:启动软件,定位到最右边的“TCR”标签,单击“开始解压”按钮,找到需要转换的TCR文件,即可将其转换为TXT文本。


三 善后

至此,你已经可以将大部分常见格式的电子书转换成TXT放入MP3中阅读了,但这样的文本往往会存在一些问题,而这些问题有时会严重影响正常的阅读,所以我们最好还是再花一点时间,来做一些“善后工作”。

1
去除硬回车

所需软件:TxtEasy!

说明:好多朋友不了解什么叫“硬回车”,现在我们来先对比一下图7和图8。很明显地,我们可以看出,图7中框住的部分,本来不该折行的,却出现了折行,这种情况就是由于多余的硬回车引起的。由于MP3屏幕较小,所以这种在电脑上看来似乎没有什么影响的问题到了MP3上,会严重影响正常的阅读。现在我们要做的,就是去掉这些硬回车。

All2TXT_图2.jpg

All2TXT_图2.jpg

启动软件,先将左下方的目录定位到待处理文本所在的文件夹,此时在右边的窗口中会出现该文件夹中所包含的TXT文件。单击“批量GB文本文件智能分段”,即可将列表内所有文本文件中所包含的硬回车去除(同时还会去掉空行等)。原来的文件则会自动备份到该目录下的Easy!Bak目录内。

All2TXT_图2.jpg

2
修改文件名

所需软件:拖把更名器

说明:批量转换出的TXT文件,往往会有着杂乱的文件名,面对这样的文件,我们找起来会很麻烦。借助“拖把更名器”,可以使其文件名统一。

启动软件后,将欲更名的文件拖到软件窗口内,上下拖动列表中的文件,将之调整到合适的位置。单击“序号”标签,并在“模板”文本框中输入想要使用的文件名前缀,其后以“#”号作为变量参数。此时下面的窗口中会列出修改后的文件名预览,确定无误后,单击左上角的“应用”图标(图10),以完成批量命名。(建议在改名前,先备份源文件)

All2TXT_图10.jpg

3
文件合并

所需软件:拖把更名器、TxtEasy!

说明:转换出的文件有时会很零碎,放入MP3的话,很可能会影响机子的速度,所以我们有必要将之合并。

先打开上面用过的“拖把更名器”,将连续的章节,修改为连续的文件名(诸如book1、book2、book3这种形式)。接着打开“TxtEasy!”,定位到已经重命名完毕的TXT文件所在文件夹,单击“合并文件”按钮(图9),打开合并文件窗口(如图11)。在“文件名前缀字符”文本框中输入TXT文件的前缀(比如在这里输入book),并在“起始序号”和“终止序号”中输入合并文件的范围。之后单击“合并文件”,即可在同文件夹中生成合并后的文件。

All2TXT_图10.jpg

4
文件分割

所需软件:ChapCuttor

说明:有人会问怎么上面刚合并了这里又要分割,要知道,有的MP3并不支持单个大文件,这时我们就不得不将单个大文件分成几个小部分。手工复制粘贴不是我们“电脑爱好者”做的事情,但普通的文件分割软件在分割文本文件时,会在“断口”处产生乱码,且由于不是按章节分割的,所以会在阅读时造成一定程度上的不便。

在这里我们用一款叫做“小说章节分割器”的软件,来完成这项工作。启动软件后,选择好待分割的文件和输出路径,并在“输出文件”中设置好输出文件的前缀名(如图12)。接下来打开待分割的文章,找到关键字(如这里的“第一回”)后,在软件的“查找条件”文本框中输入查找的条件(这里使用的是正则表达式,有兴趣的朋友可以研究一下它的详细用法,嫌麻烦的话,可以仿照图中的形式),点击“分析”按钮,即会在下面的预览窗口中看到分割后的每个章节。比如你想将每三章分割为一个小文件,则在“每个文件?章”文本框中输入3,只要保证单个文件不超过你MP3所支持的大小即可。设置完成后单击“输出”,即可得到分割开来的文本。

All2TXT_图10.jpg


四 后记

写了这么 多,翻过来掉过去,无非就是在用软件,没什么“技术含量”;可是,不正是这些看似“没技术含量”的东西,帮助我们解决了实际的问题吗?

(上述软件下载地址:http://bbs.cfan.com.cn/thread-657390-1-1.html

声明:该文章由刊于《电脑爱好者》2007年第24期和《网友世界》2008年第5期的两篇文章合并整理而得,版权所有,未经许可,他人不得转载,谢谢合作

AlltoTXT! 电子书格式转换全攻略》有6个想法

  1. 话说昨天意外的在阅览室的一本稀饭上发现你的名字,很意外。
    ps:“虫二”是谁?
  2. 哈哈,今天在《电脑爱好者》第6期上意外发现,此文被读者评为“当期优秀文章”,还有300元奖金呢,太高兴了,哈哈。
  3. 好文章。个人的很多文档(不包括程序文档)都存成txt,喜欢txt的简约。

发表回复

邮箱地址不会被公开。 必填项已用*标注