python使用scrapy解析js示例

更新时间：2014年01月23日 10:06:22 作者：

这篇文章主要介绍了python使用scrapy解析js的示例，大家参考使用吧

from selenium import selenium

class MySpider(CrawlSpider):
    name = 'cnbeta'
    allowed_domains = ['cnbeta.com']
    start_urls = ['https://www.jb51.net']

    rules = (
        # Extract links matching 'category.php' (but not matching 'subsection.php')
        # and follow links from them (since no callback means follow=True by default).
        Rule(SgmlLinkExtractor(allow=('/articles/.*\.htm', )),
             callback='parse_page', follow=True),

# Extract links matching 'item.php' and parse them with the spider's method parse_item
)

    def __init__(self):
        CrawlSpider.__init__(self)
        self.verificationErrors = []
        self.selenium = selenium("localhost", 4444, "*firefox", "https://www.jb51.net")
        self.selenium.start()

    def __del__(self):
        self.selenium.stop()
        print self.verificationErrors
        CrawlSpider.__del__(self)

    def parse_page(self, response):
        self.log('Hi, this is an item page! %s' % response.url)
        sel = Selector(response)
        from webproxy.items import WebproxyItem

        sel = self.selenium
        sel.open(response.url)
        sel.wait_for_page_to_load("30000")
        import time

time.sleep(2.5)

您可能感兴趣的文章:

scrapy

Python数据可视化实现多种图例代码详解
这篇文章主要介绍了Python数据可视化实现多种图例代码详解,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2020-07-07
Python 线程池模块之多线程操作代码
最近在做一个爬虫相关的项目，单线程的整站爬虫，耗时真的不是一般的巨大，运行一次也是心累，所以，要想实现整站爬虫，多线程是不可避免的，那么python多线程又应该怎样实现呢？今天小编给大家分享下实现代码，感兴趣的朋友一起看看吧
2021-05-05
Python处理Excel的14个常用操作总结
在数据处理和分析的领域中,Excel是一种被广泛使用的工具,然而,通过Python处理Excel,能够更好地实现自动化和批量处理,本文为大家整理了14个Python处理Excel的常用操作,希望对大家有所帮助
2023-12-12
python ipset管理增删白名单的方法
今天小编就为大家分享一篇python ipset管理增删白名单的方法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2019-01-01
Python解决MySQL数据处理从SQL批量删除报错
这篇文章主要为大家介绍了Python解决MySQL数据处理从SQL批量删除报错，有需要的朋友可以借鉴参考下，希望能够有所帮助，祝大家多多进步，早日升职加薪
2023-12-12
使用python实现多维数据降维操作
今天小编就为大家分享一篇使用python实现多维数据降维操作，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2020-02-02
python+django加载静态网页模板解析
这篇文章主要介绍了python+django加载静态网页模板解析，具有一定借鉴价值，需要的朋友可以参考下。
2017-12-12
python Pexpect模块的使用
这篇文章主要介绍了python Pexpect模块的使用，帮助大家更好的理解和使用python，感兴趣的朋友可以了解下
2020-12-12
Python实现将图像转换为ASCII字符图
使用Python进行图像处理，非常快捷方便，往往简短几行代码就可以实现功能强大的效果。在这篇文章中，我们将使用Python将图像转换为ASCII字符照，感兴趣的可以了解一下
2022-08-08
Python深度学习pytorch实现图像分类数据集
这篇文章主要为大家讲解了关于Python深度学习中pytorch实现图像分类数据集的示例解析，有需要的朋友可以借鉴参考下，希望能够有所帮助
2021-10-10

python使用scrapy解析js示例

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具