Windows下安装Scrapy
这几天正好有需求实现一个爬虫程序,想到爬虫程序立马就想到了python,python相关的爬虫资料好像也特别多。于是就决定用python来实现爬虫程序了,正好发现了python有一个开源库scrapy,正是用来实现爬虫框架的,于是果断采用这个实现。下面就先安装scrapy,决定在windows下面安装。
Scrapy简介
Scrapy,Python开发的一个快速、高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。
Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。
Scrapy吸引人的地方在于它是一个框架,任何人都可以根据需求方便的修改。它也提供了多种类型爬虫的基类,如BaseSpider、sitemap爬虫等,最新版本又提供了web2.0爬虫的支持。
安装依赖
- Scrapy安装依赖于以下几个Python库
- lxml, an efficient XML and HTML parser
- parsel, an HTML/XML data extraction library written on top of lxml,
- w3lib, a multi-purpose helper for dealing with URLs and web page encodings
- twisted, an asynchronous networking framework
- cryptography and pyOpenSSL, to deal with various network-level security needs
我选择手动安装这些依赖
- pip install lxml
- pip install parsel
- pip install w3lib
- pip install twisted
- pip install cryptography
- pip install pyOpenSSL
其他的安装都很顺利,就是在安装twisted
的时候报错了。
Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": http://landinghub.visualstudio.com/visual-cpp-build-tools
于是下载离线的安装(下载自己的版本)
https://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted
下载到一个目录,然后用
pip install Twisted-17.9.0-cp36-cp36m-win32.whl
之后再用下面的命令安装就可以了
pip install Scrapy
在命令行中输入scrapy
,出现如下界面,则表示安装成功
总结
以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对脚本之家的支持。如果你想了解更多相关内容请查看下面相关链接
- windows10系统中安装python3.x+scrapy教程
- python使用scrapy发送post请求的坑
- Python爬虫框架scrapy实现downloader_middleware设置proxy代理功能示例
- Python爬虫框架scrapy实现的文件下载功能示例
- Python爬虫框架Scrapy常用命令总结
- 详解Python安装scrapy的正确姿势
- Scrapy基于selenium结合爬取淘宝的实例讲解
- 利用Anaconda简单安装scrapy框架的方法
- 基于scrapy的redis安装和配置方法
- mac下给python3安装requests库和scrapy库的实例
- Docker 部署Scrapy的详解
- 利用scrapy将爬到的数据保存到mysql(防止重复)
- Centos7 Python3下安装scrapy的详细步骤
相关文章
解决python3读取Python2存储的pickle文件问题
今天小编就为大家分享一篇解决python3读取Python2存储的pickle文件问题,具有很好的参考价值。希望对大家有所帮助。一起跟随小编过来看看吧2018-10-10
最新评论