喜欢泡论坛的朋友一定不少,但如果你由于工作繁忙或其他的原因不方便浏览帖子的话,不妨利用论坛抽水机将帖子批量下载回来,这样即使在脱机状态下也可以慢慢浏览,绝对是省时省钱,而且节省下来的时间还可以去浏览其他的页面呢。
论坛抽水机是张仁惠朋友个人开发的一款免费软件,曾获得2005年上网助手杯中国原创软件大赛创新奖,可以从这里下载安装,这款软件最主要的功能就是批量下载论坛上的帖子,还可以下载一些站点上的有规律文件名的文章,下载完成后,会按照帖子编号自动到指定路径,方便以后随时查看。 实例一:下载论坛中的帖子
PCShow.net是笔者经常访问的论坛,但经常由于各种原因错过了浏览帖子的时间,此时就可以利用论坛抽水机自动下载若干条帖子,操作步骤如下:
第1步,配置参数
如图1所示,这就是论坛抽水机的主窗口,我们首先需要做的工作就是配置参数,配置方法如下:
图1
网址(主机):填写www.pcshow.net/bbs
端口:一般是80或8080
路径及文件名:你需要打开两个帖子:http://www.pcshow.net/bbs/viewthread.php?tid=350729359&&extra=page%3D1,
http://www.pcshow.net/bbs/viewthread.php?tid=350729748&&extra=page%3D1,这里的“/viewthread.php”就是路径及文件名。
变量参数名称:比较上面的两个帖子的地址,可以发现它们的区别就在于tid后面的值,因此“tid”即变量参数名称,而350729359和350729748则是每个帖子的具体编号。
固定参数名称:两个帖子中共有的“extra”是固定参数名称
固定参数值:两个帖子中共有的“page%3D1”是固定参数值
对于具有多个固定参数的地址,可以先找出固定参数,然后按照顺序输入固定参数值即可。由于这个论坛要求登录,因此需要先切换到“登录”标签页,输入论坛地址并使用用户名和密码正常登录,然后再返回“下载”标签页,选中“需要登录才能下载”复选框,那些不要求登录的论坛就没有必要勾选这个复选框了。
第2步,批量下载
例如,我们准备下载编号350729359后面的10个帖子,只要将开始值设置为“350729359”,结束值设置为“350729369”,变化步长当然是1了。接下来,设置好保存下载帖子的路径,最后点击“开始下载”按钮即可(如图2),很快就可以将10个帖子下载到指定路径中。
图2
第3步,保存配置 为了减少同一论坛的重复设置,我们可以将当前配置保存下来,以后需要再次下载同一论坛上的帖子时,只要选择“从配置文件中装载参数”导入事先保存的论坛信息,装载后即可自动填写论坛的各项配置参数,你需要做的只是修改帖子编号的开始值和结束值,然后就可以开始下载了。 下载回来的帖子默认保存为HTM格式的文件,按照编号进行保存(如图3),以方便用户浏览。我们可以用IE浏览器直接打开观看,也可以安装FileSee通用文件浏览器进行查看,这样可能更为方便。
图3
实例二:批量下载电子小说
新浪的读书频道经常连载一些非常好看的小说,例如最近笔者天天在看的《正说汉朝二十四帝》,是否也能将各个章节下载回来慢慢阅读呢?
首先看一下第一部分前言,首页地址是http://book.sina.com.cn/nzt/his/zhengshuohanchao24di/1.shtml,第五部分恒帝刘志的最后一页地址是http://book.sina.com.cn/nzt/his/zhengshuohanchao24di/83.shtml,一共有83页,由此可以得到如下配置参数:
网址(主机):book.sina.com.cn
端口:80
路径及文件名:/nzt/his/zhengshuohanchao24di
变量参数名称:初看起来,这里好像并没有什么变量参数,但稍作分析后可以得知,“shtml”前面的数值是不断改变的,因此我们可以以“*.shtml”作为变量参数,开始值当然是1,结束值是83,变化步长为1。
固定参数名称:无
固定参数值:无
至于存盘路径可任意设置,由于新浪读书频道并不要求登录,因此请将“需要登录才能下载”复选框去除,然后就可以开始下载这部小说了(如图4),惟一遗憾的是下载回来的文件名是1.shtml、2.shtml…83.shtml。按照同样的方法,我们可以下载新浪读书频道中的其他连载小说,这样汇聚起来就是一部完整的电子小说了。
图4
不过论坛抽水机只针对论坛帖子的文字下载,无法下载图片,因此下载回来的帖子是无法显示图片的。另外,下载回来的帖子都是以变量参数值为文件名,你只能手工重命名了。
|