去年因项目需要,用python写了个爬虫。因爬到的数据需要存到生产环境的PG数据库。所以需要将脚本部署到CentOS服务器,并设置定时任务,自动启动脚本。
实施步骤如下:
1.安装pip(操作系统自带了python2.6可以直接用,但是没有pip)
1
2
3
4
5
6
|
# 下载pip安装包 wget "https://pypi.python.org/packages/source/p/pip/pip-1.5.4.tar.gz#md5=834b2904f92d46aaa333267fb1c922bb" - - no - check - certificate # 解压安装包并安装 tar - xzvf pip - 1.5 . 4.tar .gz cd pip - 1.5 . 4 python setup.py install |
2.用pip安装第三方库
1
2
|
pip install PyGreSQL = = 5.0 . 3 pip install requests = = 2.18 . 3 |
3.设置定时任务
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
|
# 开启定时任务服务 service crond start # 查看定时任务服务状态 service crond status # 打开定时任务编辑窗口 crontab - e # 添加两条定时任务,即每天0点0分和12点20分各执行一次,并写入日志 0 0 * * * / usr / bin / python / home / longrise / psrd / collect.py > / home / longrise / psrd / collect.log 2 >& 1 & 20 12 * * * / usr / bin / python / home / longrise / psrd / collect.py > / home / longrise / psrd / collect.log 2 >& 1 & 定时任务语法如下: # For details see man 4 crontabs # Example of job definition: # .---------------- minute (0 - 59) # | .------------- hour (0 - 23) # | | .---------- day of month (1 - 31) # | | | .------- month (1 - 12) OR jan,feb,mar,apr ... # | | | | .---- day of week (0 - 6) (Sunday=0 or 7) OR sun,mon,tue,wed,thu,fri,sat # | | | | | # * * * * * user-name command to be executed |
以上这篇Linux部署python爬虫脚本,并设置定时任务的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持服务器之家。
原文链接:https://blog.csdn.net/mikezhou002/article/details/80693801