python使用scrapy解析js示例

 更新时间:2014年01月23日 10:06:22   作者:  
这篇文章主要介绍了python使用scrapy解析js的示例,大家参考使用吧

复制代码 代码如下:

from selenium import selenium

class MySpider(CrawlSpider):
    name = 'cnbeta'
    allowed_domains = ['cnbeta.com']
    start_urls = ['https://www.jb51.net']

    rules = (
        # Extract links matching 'category.php' (but not matching 'subsection.php')
        # and follow links from them (since no callback means follow=True by default).
        Rule(SgmlLinkExtractor(allow=('/articles/.*\.htm', )),
             callback='parse_page', follow=True),

        # Extract links matching 'item.php' and parse them with the spider's method parse_item
    )

    def __init__(self):
        CrawlSpider.__init__(self)
        self.verificationErrors = []
        self.selenium = selenium("localhost", 4444, "*firefox", "https://www.jb51.net")
        self.selenium.start()

    def __del__(self):
        self.selenium.stop()
        print self.verificationErrors
        CrawlSpider.__del__(self)


    def parse_page(self, response):
        self.log('Hi, this is an item page! %s' % response.url)
        sel = Selector(response)
        from webproxy.items import WebproxyItem

        sel = self.selenium
        sel.open(response.url)
        sel.wait_for_page_to_load("30000")
        import time

        time.sleep(2.5)

相关文章

  • Python数据可视化实现多种图例代码详解

    Python数据可视化实现多种图例代码详解

    这篇文章主要介绍了Python数据可视化实现多种图例代码详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-07-07
  • Python 线程池模块之多线程操作代码

    Python 线程池模块之多线程操作代码

    最近在做一个爬虫相关的项目,单线程的整站爬虫,耗时真的不是一般的巨大,运行一次也是心累,所以,要想实现整站爬虫,多线程是不可避免的,那么python多线程又应该怎样实现呢?今天小编给大家分享下实现代码,感兴趣的朋友一起看看吧
    2021-05-05
  • Python处理Excel的14个常用操作总结

    Python处理Excel的14个常用操作总结

    在数据处理和分析的领域中,Excel是一种被广泛使用的工具,然而,通过Python处理Excel,能够更好地实现自动化和批量处理,本文为大家整理了14个Python处理Excel的常用操作,希望对大家有所帮助
    2023-12-12
  • python ipset管理 增删白名单的方法

    python ipset管理 增删白名单的方法

    今天小编就为大家分享一篇python ipset管理 增删白名单的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-01-01
  • Python解决MySQL数据处理从SQL批量删除报错

    Python解决MySQL数据处理从SQL批量删除报错

    这篇文章主要为大家介绍了Python解决MySQL数据处理从SQL批量删除报错,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-12-12
  • 使用python实现多维数据降维操作

    使用python实现多维数据降维操作

    今天小编就为大家分享一篇使用python实现多维数据降维操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-02-02
  • python+django加载静态网页模板解析

    python+django加载静态网页模板解析

    这篇文章主要介绍了python+django加载静态网页模板解析,具有一定借鉴价值,需要的朋友可以参考下。
    2017-12-12
  • python Pexpect模块的使用

    python Pexpect模块的使用

    这篇文章主要介绍了python Pexpect模块的使用,帮助大家更好的理解和使用python,感兴趣的朋友可以了解下
    2020-12-12
  • Python实现将图像转换为ASCII字符图

    Python实现将图像转换为ASCII字符图

    使用Python进行图像处理,非常快捷方便,往往简短几行代码就可以实现功能强大的效果。在这篇文章中,我们将使用Python将图像转换为ASCII字符照,感兴趣的可以了解一下
    2022-08-08
  • Python深度学习pytorch实现图像分类数据集

    Python深度学习pytorch实现图像分类数据集

    这篇文章主要为大家讲解了关于Python深度学习中pytorch实现图像分类数据集的示例解析,有需要的朋友可以借鉴参考下,希望能够有所帮助
    2021-10-10

最新评论