Linux部署python爬虫脚本,并设置定时任务的方法

 更新时间:2019年06月29日 09:52:58   作者:mikezhou002  
今天小编就为大家分享一篇Linux部署python爬虫脚本,并设置定时任务的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧

去年因项目需要,用python写了个爬虫。因爬到的数据需要存到生产环境的PG数据库。所以需要将脚本部署到CentOS服务器,并设置定时任务,自动启动脚本。

实施步骤如下:

1.安装pip(操作系统自带了python2.6可以直接用,但是没有pip)

# 下载pip安装包
wget "https://pypi.python.org/packages/source/p/pip/pip-1.5.4.tar.gz#md5=834b2904f92d46aaa333267fb1c922bb" --no-check-certificate
# 解压安装包并安装
tar -xzvf pip-1.5.4.tar.gz
cd pip-1.5.4
python setup.py install

2.用pip安装第三方库

pip install PyGreSQL==5.0.3
pip install requests==2.18.3

3.设置定时任务

# 开启定时任务服务
service crond start
# 查看定时任务服务状态
service crond status
# 打开定时任务编辑窗口
crontab -e 
# 添加两条定时任务,即每天0点0分和12点20分各执行一次,并写入日志
0 0 * * * /usr/bin/python /home/longrise/psrd/collect.py > /home/longrise/psrd/collect.log 2>&1 &

20 12 * * * /usr/bin/python /home/longrise/psrd/collect.py > /home/longrise/psrd/collect.log 2>&1 &

定时任务语法如下:
# For details see man 4 crontabs

# Example of job definition:
# .---------------- minute (0 - 59)
# | .------------- hour (0 - 23)
# | | .---------- day of month (1 - 31)
# | | | .------- month (1 - 12) OR jan,feb,mar,apr ...
# | | | | .---- day of week (0 - 6) (Sunday=0 or 7) OR sun,mon,tue,wed,thu,fri,sat
# | | | | |
# * * * * * user-name command to be executed

以上这篇Linux部署python爬虫脚本,并设置定时任务的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • linux开机启动nodemanager步骤

    linux开机启动nodemanager步骤

    这篇文章主要介绍了linux开机启动nodemanager的步骤,大家参考使用吧
    2014-01-01
  • Linux下gdb调试打印栈帧中的变量过程

    Linux下gdb调试打印栈帧中的变量过程

    这篇文章主要介绍了Linux下gdb调试打印栈帧中的变量过程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2023-09-09
  • Apache源码安装和虚拟主机配置的教程详解

    Apache源码安装和虚拟主机配置的教程详解

    这篇文章主要介绍了Apache源码安装和虚拟主机配置的教程,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-11-11
  • ZFS是什么?使用ZFS的理由及特性介绍

    ZFS是什么?使用ZFS的理由及特性介绍

    今天小编就为大家分享一篇关于ZFS是什么,及其特性介绍与使用理由的文章,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧
    2018-09-09
  • web服务器集群(多台web服务器)session同步、共享的3种解决方法

    web服务器集群(多台web服务器)session同步、共享的3种解决方法

    这篇文章主要介绍了web服务器集群(多台web服务器)session同步、共享的3种解决方法,需要的朋友可以参考下
    2014-04-04
  • Linux使用perf分析CPU占用情况的方法步骤

    Linux使用perf分析CPU占用情况的方法步骤

    perf是Linux下的一款性能分析工具,能够进行函数级与指令级的热点查找,它由一个叫“Performance counters“的内核子系统实现,基于事件采样原理,支持针对处理器相关性能指标与操作系统相关性能指标的性能剖析,本文介绍了Linux使用perf分析CPU占用情况的方法步骤
    2024-05-05
  • LAMP服务器性能优化技巧之加速PHP

    LAMP服务器性能优化技巧之加速PHP

    目前LAMP (Linux + Apache + MySQL + PHP) 近几年来发展迅速,已经成为Web 服务器的事实标准。本文我们将介绍基于LAMP组合的服务器的性能优化技巧:加速PHP。
    2012-02-02
  • 解析Linux内核与设备树的编译和烧写

    解析Linux内核与设备树的编译和烧写

    在内核源码中,存在大量对板级细节信息描述的代码。开源文档中对设备树的描述是,一种描述硬件资源的数据结构,它通过bootloader将硬件资源传给内核,使得内核和硬件资源描述相对独立
    2021-06-06
  • Apache之AllowOverride参数使用说明

    Apache之AllowOverride参数使用说明

    通常利用Apache的rewrite模块对 URL 进行重写的时候, rewrite规则会写在 .htaccess 文件里。但要使 apache 能够正常的读取.htaccess 文件的内容,就必须对.htaccess 所在目录进行配置。
    2011-01-01
  • 在 Ubuntu 15.04/CentOS 7 中安装 Lighttpd Web 服务器的方法

    在 Ubuntu 15.04/CentOS 7 中安装 Lighttp

    以下是我们在运行 Ubuntu 15.04 或 CentOS 7 Linux 发行版的机器上安装 Lighttpd Web 服务器的简要流程,需要的朋友可以参考下
    2017-04-04

最新评论