如何在django中运行scrapy框架

更新时间：2020年04月22日 14:20:05 作者：小陆同学

这篇文章主要介绍了如何在django中运行scrapy框架,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

1.新建一个django项目，

2.前端展示一个按钮

<form action="/start/" method="POST">
    {% csrf_token %}
    <input type="submit" value="启动爬虫">
</form>

3.在django项目的根目录创建scrapy项目

4.cmd命令行运行：scrapyd 启动服务

5.将scrapy项目部署到当前工程：scrapyd-deploy 爬虫名称 -p 项目名称

6.views.py

# 首页
def index(request):
  return render(request,'index.html',locals())

def start(request):
  if request.method == 'POST':
    # 启动爬虫
    url = 'http://localhost:6800/schedule.json'
    data = {'project': 'ABCkg', 'spider': 'abckg'}
    print(requests.post(url=url, data=data))
    return JsonResponse({'result':'ok'})

7.在本地6800端口点击jobs当前爬虫项目就在运行了。

8.写一个按钮，点击停止scrapy爬虫

def stop(request):
  if request.method == 'POST':
    # 停止爬虫
    url = 'http://127.0.0.1:6800/cancel.json'
    data={"project":'ABCkg','job':'b7fe64ee7ad711e9b711005056c00008'}
    print(requests.post(url=url, data=data))
    return JsonResponse({'result':'stop'})

总结：

----------------scrapyd 管理----------------------

1、获取状态

http://127.0.0.1:6800/daemonstatus.json

2、获取项目列表

http://127.0.0.1:6800/listprojects.json

3、获取项目下已发布的爬虫列表

http://127.0.0.1:6800/listspiders.json?project=myproject

4、获取项目下已发布的爬虫版本列表

http://127.0.0.1:6800/listversions.json?project=myproject

5、获取爬虫运行状态

http://127.0.0.1:6800/listjobs.json?project=myproject

6、启动服务器上某一爬虫（必须是已发布到服务器的爬虫)

http://localhost:6800/schedule.json

(post方式，data={"project":myproject,"spider":myspider}）

7、删除某一版本爬虫

http://127.0.0.1:6800/delversion.json -d project=项目名 -d versions

(post方式，data={"project":myproject,"version":myversion}）

8、删除某一工程，包括该工程下的各版本爬虫

http://127.0.0.1:6800/delproject.json

(post方式，data={"project":myproject}）

9、取消爬虫

http://127.0.0.1:6800/cancel.json

(post方式，data={"project":myproject,'job':myjob}）

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持脚本之家。

您可能感兴趣的文章:

pandas根据指定条件筛选数据的实现示例
条件筛选是pandas中非常重要的一个功能,它允许我们根据特定条件来快速、高效地筛选数据,本文主要介绍了pandas根据指定条件筛选数据的实现示例,具有一定的参考价值,感兴趣的可以了解一下
2024-03-03
基于注解实现 SpringBoot 接口防刷的方法
这篇文章主要介绍了基于注解实现 SpringBoot 接口防刷的方法，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2021-03-03
PyQt5 对图片进行缩放的实例
今天小编就为大家分享一篇PyQt5 对图片进行缩放的实例，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2019-06-06
解决Django中调用keras的模型出现的问题
今天小编就为大家分享一篇解决Django中调用keras的模型出现的问题，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2019-08-08
python实现拼接图片
这篇文章主要为大家详细介绍了python实现拼接图片，文中示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2020-03-03
python实现的守护进程(Daemon)用法实例
这篇文章主要介绍了python实现的守护进程(Daemon)用法,实例分析了Python进程操作的相关技巧,需要的朋友可以参考下
2015-06-06
Python文件读写w+和r+区别解析
这篇文章主要介绍了Python文件读写w+和r+区别解析,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2020-03-03
Python简单格式化时间的方法【strftime函数】
这篇文章主要介绍了Python简单格式化时间的方法,结合实例形式分析了Python使用strftime函数进行时间格式化的操作技巧,需要的朋友可以参考下
2016-09-09
PyCharm配置mongo插件的方法
今天小编就为大家分享一篇PyCharm配置mongo插件的方法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2018-11-11
Python中的socket网络模块介绍
这篇文章主要介绍了Python中的socket网络模块介绍，Python 中，文章围绕主题展开详细的内容介绍，具有一定的参考价值，需要的小伙伴可以参考一下
2022-07-07

如何在django中运行scrapy框架

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具