scrapy中的spider传参实现增量的方法

 更新时间:2022年06月12日 10:13:34   作者:retime123  
有时候需要根据项目的实际需求向spider传递参数来控制spider的运行方式,本文主要介绍了scrapy中的spider传参实现增量的方法,具有一定的参考价值,感兴趣的可以了解一下

有时候需要根据项目的实际需求向spider传递参数来控制spider的运行方式。

比如说,1.根据用户提交的url来控制spider爬取的网站。2.根据需求增量爬取数据。

今天就写一个增量(augmenter)的方式:

Spider参数通过 crawl 命令的 -a 选项来传递,比如:

scrapy crawl xxx -a augmenter=xxxxxx

注:augmenter=不为空

1.首先在spider里添加

注:在网上也看了不少的博客,最后发现*args, **kwargs这两个必须加上,要不然会出现bug,不信的话可以试试哦!

如果想减少代码量的话,可以写到类里面去继承!那这样的话,spider里面就不要在写了!!!要不然就不起作用了!!!

还有

super(eval(self.__class__.__name__), self).__init__(*args, **kwargs)

这里的eval()获取的是类名,这样写必须是最后一个是你要的类名,中间有继承什么的,就会出错!或者直接把类名粘过来!

2.spider实现方式:

这样就实现了简单的增量!增量的方式有很多,常见的:时间、计数、爬取特定的几页!

选择自己需要的增量方式写在这个parse_augmenter()里面,

这样需要从头开始run和增量run就不受影响!

到此这篇关于scrapy中的spider传参实现增量的方法的文章就介绍到这了,更多相关scrapy spider传参增量内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Matplotlib animation模块实现动态图

    Matplotlib animation模块实现动态图

    这篇文章主要介绍了Matplotlib animation模块实现动态图,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-02-02
  • python面试题之列表声明实例分析

    python面试题之列表声明实例分析

    这篇文章主要介绍了python面试题之列表声明,结合实例形式分析了Python列表的声明、计算相关操作技巧,需要的朋友可以参考下
    2019-07-07
  • python实现求解列表中元素的排列和组合问题

    python实现求解列表中元素的排列和组合问题

    本篇文章给大家分享使用python的内置模块实现求解列表中元素的排列和组合问题,具体实现代码大家参考下本文
    2018-03-03
  • Python获取协程返回值的四种方式详解

    Python获取协程返回值的四种方式详解

    这篇文章主要为大家介绍了Python中获取协程返回值的四种方法的示例代码,文中的代码详细易懂,对我们学习Python有一定的帮助,需要的朋友可以了解一下
    2021-12-12
  • Python Tkinter Menu控件使用详解

    Python Tkinter Menu控件使用详解

    Menu控件(菜单控件)可以说是 GUI 中“精髓所在”,它以可视化的方式将一系列的命令进行分组,在每一个分组下又可以“隐藏”许多的程序执行命令(即功能)。本文将详细介绍它的使用,需要的可以参考一下
    2022-01-01
  • Python3并发写文件与Python对比

    Python3并发写文件与Python对比

    这篇文章主要介绍了Python3并发写文件原理解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-11-11
  • python脚本实现分析dns日志并对受访域名排行

    python脚本实现分析dns日志并对受访域名排行

    这篇文章主要介绍了python脚本实现分析dns日志并对受访域名排行,本文是在Windows服务器环境中实现,需要的朋友可以参考下
    2014-09-09
  • Python面向对象的程序设计详情

    Python面向对象的程序设计详情

    这篇文章主要介绍了Python面向对象的程序设计详情,面向对象的程序设计在Python中具有非常重要的地位,熟练的使用面向对象编程能够为我们的Python编程提供很多的便利之处,希望您阅读完本文后能够有所收获
    2022-01-01
  • 根据tensor的名字获取变量的值方式

    根据tensor的名字获取变量的值方式

    今天小编就为大家分享一篇根据tensor的名字获取变量的值方式,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-01-01
  • 屏蔽Django admin界面添加按钮的操作

    屏蔽Django admin界面添加按钮的操作

    这篇文章主要介绍了屏蔽Django admin界面添加按钮的操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-03-03

最新评论