一种自动抓取经济学人生成电子书的方法
calibre是一款电子书管理软件。也可以抓取网页直接生成电子书。
0.1 任务:
在服务器端使用脚本每周五上午10点20分执行economist爬取脚本。
保存为mobi epub docx文件。用于HTTP下载。
0.2 系统:
Ubuntu版本:18.04
carlibre
python:3.6.7
apache (web目录:/var/www/html/te)
1.py脚本编写
在root目录新建文件,编写python脚本 保存为 /root/eco.py
2. 控制cron
编辑crontab:
vim /etc/crontab
在末尾增加一行:关闭保存
20 10 * * 5 root python3 /root/eco.py
意思是:每个周五上午10点20分执行脚本。
重启cron:
service cron restart
3.执行结果:
每周五10点20分过几分钟后,通过http下载所需文件。
下载链接样式为 http://www.*.com/te/teyyyyymmdd.mobi
4.直接下载:
最后,嫌搭建服务器麻烦的,不想自己折腾的,
也可以到下面这个网站通过网盘直接下载 te:
http://www.te2022.xyz
每周五更新最新一期。