python使用scrapy解析js示例

 更新时间:2014年01月23日 10:06:22   作者:  
这篇文章主要介绍了python使用scrapy解析js的示例,大家参考使用吧

复制代码 代码如下:

from selenium import selenium

class MySpider(CrawlSpider):
    name = 'cnbeta'
    allowed_domains = ['cnbeta.com']
    start_urls = ['https://www.jb51.net']

    rules = (
        # Extract links matching 'category.php' (but not matching 'subsection.php')
        # and follow links from them (since no callback means follow=True by default).
        Rule(SgmlLinkExtractor(allow=('/articles/.*\.htm', )),
             callback='parse_page', follow=True),

        # Extract links matching 'item.php' and parse them with the spider's method parse_item
    )

    def __init__(self):
        CrawlSpider.__init__(self)
        self.verificationErrors = []
        self.selenium = selenium("localhost", 4444, "*firefox", "https://www.jb51.net")
        self.selenium.start()

    def __del__(self):
        self.selenium.stop()
        print self.verificationErrors
        CrawlSpider.__del__(self)


    def parse_page(self, response):
        self.log('Hi, this is an item page! %s' % response.url)
        sel = Selector(response)
        from webproxy.items import WebproxyItem

        sel = self.selenium
        sel.open(response.url)
        sel.wait_for_page_to_load("30000")
        import time

        time.sleep(2.5)

相关文章

  • python filecmp.dircmp实现递归比对两个目录的方法

    python filecmp.dircmp实现递归比对两个目录的方法

    这篇文章主要介绍了python filecmp.dircmp实现递归比对两个目录的方法,本文通过实例代码给大家介绍的非常详细,大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-05-05
  • PyTorch学习之软件准备与基本操作总结

    PyTorch学习之软件准备与基本操作总结

    这篇文章主要介绍了PyTorch学习之软件准备与基本操作总结,文中有非常详细的代码示例,对正在学习python的小伙伴们有很好地帮助,需要的朋友可以参考下
    2021-05-05
  • 关于 Python opencv 使用中的 ValueError: too many values to unpack

    关于 Python opencv 使用中的 ValueError: too many values to unpack

    这篇文章主要介绍了关于 Python opencv 使用中的 ValueError: too many values to unpack,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2019-06-06
  • python cv2在验证码识别中应用实例解析

    python cv2在验证码识别中应用实例解析

    这篇文章主要介绍了python cv2在验证码识别中应用实例解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-12-12
  • Python利用魔法方法玩转对象

    Python利用魔法方法玩转对象

    Python中魔法方法(magic method)其实就是那些被双下划线包围的方法,这些魔法方法为类添加了**“魔力”,让我们可以在面向对象编程中用更加简洁的代码来操作对象,下面我们就来具体了解一下如何利用魔法方法玩转对象吧
    2023-12-12
  • python实现发送带附件的邮件代码分享

    python实现发送带附件的邮件代码分享

    在本篇文章里小编给大家整理的是关于python实现发送带附件的邮件代码分享内容,需要的朋友们可以参考下。
    2020-09-09
  • python读取excel表格生成erlang数据

    python读取excel表格生成erlang数据

    这篇文章主要为大家详细介绍了python读取excel表格生成erlang数据,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2017-08-08
  • 浅谈Python实现opencv之图片色素的数值运算和逻辑运算

    浅谈Python实现opencv之图片色素的数值运算和逻辑运算

    今天带大家来学习的是关于Python的相关知识,文章围绕着图片色素的数值运算和逻辑运算展开,文中有非常详细的的介绍及代码示例,需要的朋友可以参考下
    2021-06-06
  • Python中对象的引用与复制的使用

    Python中对象的引用与复制的使用

    引用和复制是Python处理对象的重要概念,本文主要介绍了Python中对象的引用与复制的使用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-12-12
  • python使用paramiko模块通过ssh2协议对交换机进行配置的方法

    python使用paramiko模块通过ssh2协议对交换机进行配置的方法

    今天小编就为大家分享一篇python使用paramiko模块通过ssh2协议对交换机进行配置的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-07-07

最新评论