Python爬蟲之用supervisor使scrapy在服務(wù)器后臺運行

Turbo 發(fā)布于2019-07-30 18:37 / 1767人閱讀

摘要：折騰原因之前都是遠程連接服務(wù)器，然后在命令行運行，一旦關(guān)閉遠程連接，爬蟲就會停止，很不爽，畢竟能讓一個爬蟲在服務(wù)器一直跑才是每個小白的夢想，所以開始研究如何使程序在后臺運行，剛開始看了，感覺不好用，又搜了搜，發(fā)現(xiàn)了這個進程管理程序。

折騰原因

之前都是遠程連接服務(wù)器，然后在命令行運行scrapy crawl spider，一旦關(guān)閉遠程連接，爬蟲就會停止，很不爽，畢竟能讓一個爬蟲在服務(wù)器一直跑才是每個小白的夢想= =，所以開始研究如何使程序在后臺運行，剛開始看了scrapyd，感覺不好用，又搜了搜，發(fā)現(xiàn)了supervisor這個python進程管理程序。

supervisor簡介

Supervisor是用Python開發(fā)的一套通用的進程管理程序，能將一個普通的命令行進程變?yōu)楹笈_daemon，并監(jiān)控進程狀態(tài)，異常退出時能自動重啟。它是通過fork/exec的方式把這些被管理的進程當作supervisor的子進程來啟動，這樣只要在supervisor的配置文件中，把要管理的進程的可執(zhí)行文件的路徑寫進去即可。也實現(xiàn)當子進程掛掉的時候，父進程可以準確獲取子進程掛掉的信息的，可以選擇是否自己啟動和報警。supervisor還提供了一個功能，可以為supervisord或者每個子進程，設(shè)置一個非root的user，這個user就可以管理它對應(yīng)的進程。

安裝supervisor

我的系統(tǒng)是centos7所以運行以下命令

# yum install supervisor

等待安裝完后，進入/ect目錄,主要看如下兩個文件。

supervisord.conf為主配置文件，可以打開看一下，不用更改，supervisord.d為子進程的配置文件夾，存放在這里的配置文件在程序啟動后會自動讀取該文件夾下的文件，我們進入這個文件夾，創(chuàng)建一個子進程文件，名為awesome.ini,內(nèi)容如下：

[program:awesome]

command     = shell.py
directory   = /python/scrapy
user        = root
startsecs   = 3

redirect_stderr         = true
stdout_logfile_maxbytes = 50MB
stdout_logfile_backups  = 10
stdout_logfile          = /log/app.log

說明：
command：為要后臺運行的shell命令
directory：指定command命令要執(zhí)行的文件夾
user：執(zhí)行命令的用戶
stdout_logfile：程序運行的日志，報錯可以在這里看。
創(chuàng)建好子進程文件后,運行如下命令解鎖程序：

# sudo unlink /run/supervisor.sock

再運行以下命令運行程序啟動爬蟲：

# supervisord

運行成功會有如下提示：

/usr/lib/python2.7/site-packages/supervisor/options.py:296: UserWarning: Supervisord is running 
as root and it is searching for its configuration file in default locations (including it
s current working directory); you probably want to specify a "-c" argument specifying an absolute path to a configuration file for improved security.
  "Supervisord is running as root and it is searching "

進程管理的相關(guān)命令

1) 查看所有子進程的狀態(tài)：

# supervisorctl status

awesome                             RUNNING    pid 2395, uptime 0:08:41

2）關(guān)閉、開啟指定的子進程：

# supervisorctl stop zhoujy
awesome: stopped

3）關(guān)閉、開啟所有的子進程：

# supervisorctl stop all
awesome: stopped
# supervisorctl start all
awesome: started

總結(jié)

終于可以愉快的爬蟲了呢！OvO

GPU云服務(wù)器云服務(wù)器 scrapy運行爬蟲如何運行scrapy爬蟲 python爬蟲scrapy python爬蟲框架scrapy

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址：http://m.specialneedsforspecialkids.com/yun/42760.html

發(fā)表評論

登陸后可評論

0條評論

Turbo

男|高級講師

我要關(guān)注我要私信

TA的文章

Pygame實戰(zhàn)：風(fēng)靡全球的經(jīng)典泡泡龍小游戲來襲，你會喜歡嘛？（附源碼）

閱讀 2900·2021-11-15 11:39
ION Cloud：兩周年慶，$336/年/2GB內(nèi)存/25GB SSD空間/250GB流量/10M

閱讀 1522·2021-08-19 10:56
CSS初體驗#1

閱讀 1097·2019-08-30 14:12
css3實現(xiàn)信紙/同學(xué)錄效果

閱讀 3742·2019-08-29 17:29
2019屆校招前端面試題整理——HTML、CSS篇

閱讀 723·2019-08-29 16:21
善用Object.defineProperty巧妙找到修改某個變量的準確代碼位置

閱讀 3425·2019-08-26 12:22
WEBPACK

閱讀 1520·2019-08-23 16:30
Web頁面中png jpg gif webp svg的區(qū)別和使用

閱讀 1026·2019-08-23 15:25

国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

Python爬蟲之用supervisor使scrapy在服務(wù)器后臺運行

相關(guān)文章

Python3網(wǎng)絡(luò)爬蟲實戰(zhàn)---12、部署相關(guān)庫的安裝：Docker、Scrapyd

學(xué)會了這項技能，你就能獲得任何想要的信息！

網(wǎng)絡(luò)爬蟲介紹

**CentOS7之Scrapy爬蟲部署**

**CentOS7之Scrapy爬蟲部署**

發(fā)表評論

0條評論

Turbo

男|高級講師

TA的文章

Pygame實戰(zhàn)：風(fēng)靡全球的經(jīng)典泡泡龍小游戲來襲，你會喜歡嘛？（附源碼）

ION Cloud：兩周年慶，$336/年/2GB內(nèi)存/25GB SSD空間/250GB流量/10M

CSS初體驗#1

css3實現(xiàn)信紙/同學(xué)錄效果

2019屆校招前端面試題整理——HTML、CSS篇

善用Object.defineProperty巧妙找到修改某個變量的準確代碼位置

WEBPACK

Web頁面中png jpg gif webp svg的區(qū)別和使用

最新活動