Docker 部署Scrapy的详解
假设我们要在10台Ubuntu 部署爬虫如何搞之?用传统的方法会吐血的,除非你记录下来每个步骤,然后步骤之间的次序还完全一样,这样才行。但是这样还是累啊,个别软件下载又需要时间。所以Docker出现了。Docker把系统,各种需要的应用,还有设置编译成一个image,然后 run一下就可以了。跟虚拟机的区别是不需要而外的物理支持,共用的。
1. 部署步骤
1.1 上传本地scrapy爬虫代码除了settings外到git 服务器
1.2 编写Dockerfile文件,把settings和requirements.txt 也拷贝到image里,一起打包成一个image
Dockerfile内容:
FROM ubuntu RUN apt-get update RUN apt-get install -y git RUN apt-get install -y nano RUN apt-get install -y redis-server RUN apt-get -y dist-upgrade RUN apt-get install -y openssh-server RUN apt-get install -y python3.5 python3-pip RUN apt-get install -y zlib1g-dev libffi-dev libssl-dev RUN apt-get install -y libxml2-dev libxslt1-dev RUN mkdir /code WORKDIR /code ADD ./requirements.txt /code/ ADD ./settings.py /code/ RUN mkdir /code/myspider RUN pip3 install -r requirements.txt VOLUME [ "/data" ]
requirements.txt 内容:
BeautifulSoup4 scrapy setuptools scrapy_redis redis sqlalchemy pymysql pillow
整个目录结构:

docker build -t fox6419/scrapy:scrapyTag .
fox6419是用户名,scrapyTag是tag
成功后,执行docker images可以在本地看到image
1.3 打包的image 上传到docker hub中
docker push username/repository:tag
push的命令格式是这样的,我这边就是:
docker push fox6419/scrapy:scrapyTag
1.4 在DigitalOcean这种主机商创建带docker应用的Ubuntu 16.04版本
1.5 登陆docker,拉下1.3的image,然后run起来
docker run -it fox6419/scrapy:scrapyTag /bin/bash
1.6 命令进去后,git clone 1.1中的爬虫,然后复制images里的settings到爬虫目录,然后执行scrapy crawl xxx即可
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。
- windows10系统中安装python3.x+scrapy教程
- python使用scrapy发送post请求的坑
- Python爬虫框架scrapy实现downloader_middleware设置proxy代理功能示例
- Python爬虫框架scrapy实现的文件下载功能示例
- Python爬虫框架Scrapy常用命令总结
- 详解Python安装scrapy的正确姿势
- Scrapy基于selenium结合爬取淘宝的实例讲解
- 利用Anaconda简单安装scrapy框架的方法
- 基于scrapy的redis安装和配置方法
- mac下给python3安装requests库和scrapy库的实例
- 利用scrapy将爬到的数据保存到mysql(防止重复)
- Centos7 Python3下安装scrapy的详细步骤
- Windows下安装Scrapy
相关文章
详解基于docker 如何部署surging分布式微服务引擎
这篇文章主要介绍了详解基于docker 如何部署surging分布式微服务引擎,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧2018-06-06
Docker容器Container镜像Image如何存储详解
本文主要介绍Docker容器(Container)和镜像(Image)是如何进行数据存储详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪2023-09-09
详细讲解Docker-Compose部署Kafka KRaft集群环境
这篇文章主要为大家介绍了Docker-Compose部署Kafka KRaft集群环境的全面详细讲解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪2023-01-01
使用Docker安装向量数据库milvus并且安装图形化界面的方法
文章介绍了如何在Windows上使用Docker安装并配置Milvus向量数据库,包括启用WSL2、安装Ubuntu、配置Docker仓库、安装Milvus服务端和用户图形界面Attu,并提供了一个修改后的Dockerfile以提高Attu的安装速度,感兴趣的朋友一起看看吧2025-02-02


最新评论