Windows下安装Scrapy

 更新时间:2018年10月17日 12:04:15   作者:no-96  
今天小编就为大家分享一篇关于Windows下安装Scrapy,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧

这几天正好有需求实现一个爬虫程序,想到爬虫程序立马就想到了python,python相关的爬虫资料好像也特别多。于是就决定用python来实现爬虫程序了,正好发现了python有一个开源库scrapy,正是用来实现爬虫框架的,于是果断采用这个实现。下面就先安装scrapy,决定在windows下面安装。

Scrapy简介

Scrapy,Python开发的一个快速、高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。

Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。

Scrapy吸引人的地方在于它是一个框架,任何人都可以根据需求方便的修改。它也提供了多种类型爬虫的基类,如BaseSpider、sitemap爬虫等,最新版本又提供了web2.0爬虫的支持。

安装依赖

  • Scrapy安装依赖于以下几个Python库
  • lxml, an efficient XML and HTML parser
  • parsel, an HTML/XML data extraction library written on top of lxml,
  • w3lib, a multi-purpose helper for dealing with URLs and web page encodings
  • twisted, an asynchronous networking framework
  • cryptography and pyOpenSSL, to deal with various network-level security needs

我选择手动安装这些依赖

  • pip install lxml
  • pip install parsel
  • pip install w3lib
  • pip install twisted
  • pip install cryptography
  • pip install pyOpenSSL

其他的安装都很顺利,就是在安装twisted的时候报错了。

Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": http://landinghub.visualstudio.com/visual-cpp-build-tools

于是下载离线的安装(下载自己的版本)
https://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted

下载到一个目录,然后用

pip install Twisted-17.9.0-cp36-cp36m-win32.whl

之后再用下面的命令安装就可以了

pip install Scrapy

在命令行中输入scrapy,出现如下界面,则表示安装成功

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对脚本之家的支持。如果你想了解更多相关内容请查看下面相关链接

相关文章

  • python找出列表中大于某个阈值的数据段示例

    python找出列表中大于某个阈值的数据段示例

    今天小编就为大家分享一篇python找出列表中大于某个阈值的数据段示例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-11-11
  • 如何运行带参数的python脚本

    如何运行带参数的python脚本

    这篇文章主要介绍了如何运行带参数的python脚本,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-11-11
  • 解决python3读取Python2存储的pickle文件问题

    解决python3读取Python2存储的pickle文件问题

    今天小编就为大家分享一篇解决python3读取Python2存储的pickle文件问题,具有很好的参考价值。希望对大家有所帮助。一起跟随小编过来看看吧
    2018-10-10
  • python常规方法实现数组的全排列

    python常规方法实现数组的全排列

    这篇文章主要介绍了python常规方法实现数组的全排列,实例分析了全排列的概念及Python常规实现技巧,需要的朋友可以参考下
    2015-03-03
  • Python+PyQt5实现自制pdf工具箱

    Python+PyQt5实现自制pdf工具箱

    这篇文章主要为大家详细介绍了Python如何利用PyQt5自制pdf工具箱,可以实现合并拆分和删除指定pdf页面,感兴趣的小伙伴可以跟随小编一起学习一下
    2023-12-12
  • Python3将jpg转为pdf文件的方法示例

    Python3将jpg转为pdf文件的方法示例

    这篇文章主要介绍了Python3将jpg转为pdf文件的方法,结合完整实例形式分析了Python3针对jpg转pdf格式的文件读写、编码装换等相关操作技巧,需要的朋友可以参考下
    2019-12-12
  • 解决pytorch-gpu 安装失败的记录

    解决pytorch-gpu 安装失败的记录

    这篇文章主要介绍了解决pytorch-gpu 安装失败的记录,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2021-05-05
  • python爬取网站数据保存使用的方法

    python爬取网站数据保存使用的方法

    这篇文章主要介绍了使用Python从网上爬取特定属性数据保存的方法,其中解决了编码问题和如何使用正则匹配数据的方法,详情看下文
    2013-11-11
  • 利用Python获取赶集网招聘信息前篇

    利用Python获取赶集网招聘信息前篇

    这篇文章主要为大家分享了如何利用Python获取赶集网招聘信息的前一篇内容,感兴趣的小伙伴们可以参考一下
    2016-04-04
  • Python 实现选择排序的算法步骤

    Python 实现选择排序的算法步骤

    下面小编就为大家分享一篇Python 实现选择排序的算法步骤,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-04-04

最新评论