Python3安装Scrapy的方法步骤

 更新时间:2017年11月23日 10:47:30   作者:Jack-Cui  
本篇文章主要介绍了Python3安装Scrapy的方法步骤,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧

本文介绍了Python3安装Scrapy的方法步骤,分享给大家,具体如下:

  1. 运行平台:Windows
  2. Python版本:Python3.x
  3. IDE:Sublime text3

一、Scrapy简介

Scrapy是一个为了爬取网站数据提取结构性数据而编写的应用框架,可以应用于数据挖掘,信息处理或存储历史数据等一些列的程序中。Scrapy最初就是为了网络爬取而设计的。现在,Scrapy已经推出了曾承诺过的Python3.x版本。

为什么学习Scrapy呢?它能我们更好的完成爬虫任务,自己写Python爬虫程序好比孤军奋战,而使用了Scrapy就好比手底下有了千军万马。Scrapy可以起到事半功倍(甚至好几倍*.*)的效果。所以,学习Scrapy也就显得很有必要了。

二、Scrapy安装

1.直接使用指令pip3 install scrapy,发现有诸多错误。

  1. Failed building wheel for lxml
  2. Microsoft Visual C++ 10.0 is required
  3. Failed building twisted
  4. Unable to find vcvarsall.bat

遇到的错误,如下图所示:

1

2

3

2.解决办法

http://www.lfd.uci.edu/~gohlke/pythonlibs/有很多用于windows的编译好的Python第三方库,我们下载好对应自己Python版本的库即可。

(1)在cmd中输入指令python,查看python的版本,如下:

4

从上图可以看出可以看出我的Python版本为Python3.5.2-64bit。

(2)登陆http://www.lfd.uci.edu/~gohlke/pythonlibs/,Ctrl+F搜索Lxml、Twisted、Scrapy,下载对应的版本,例如:lxml-3.7.3-cp35-cp35m-win_adm64.whl,表示lxml的版本为3.7.3,对应的python版本为3.5-64bit。我下载的版本如下图所示:

5

6

7

(3)在cmd中输入DOS指令,进入下载好的whl文件夹下,例如我的三个whl文件放在了Scrapy文件夹下:

8

(4)依次执行如下命令:

a.pip3 install wheel

9

b.pip3 install lxml-3.7.3-cp35-cp35m-win_amd64.whl

10

c.pip3 install Twisted-17.1.0-cp35-cp35m-win_amd64.whl

11

d.pip3 install Scrapy-1.3.2-py2.py3-none-any.whl

12

这样Scrapy的安装就完成了,请忽略最后两行让我升级pip的信息。*.*

(5)Srapy已经安装成功,还要下载pywin32,找到对应版本下载,一路下一步安装即可。安装完成后,就可以正常使用Scrapy了。

URL:https://sourceforge.net/projects/pywin32/files/pywin32/Build%20220/

13

至此,大功告成,我们可以愉快的使用Scrapy了。

常见错误

1、pkg_resources.VersionConflict: (six 1.5.2 (/usr/lib/python3/dist-packages), Requirement.parse('six>=1.6.0'))

six包版本过低,six包是一个提供兼容Python2和Python3的库,升级six包即可。

sudo pip3 install -U six

2、c/_cffi_backend.c:15:17: fatal error: ffi.h: No such file or directory

缺少Libffi这个库。什么是libffi?“FFI” 的全名是 Foreign Function Interface,通常指的是允许以一种语言编写的代码调用另一种语言的代码。而Libffi库只提供了最底层的、与架构相关的、完整的”FFI”。

安装相应的库即可。

Ubuntu、Debian:

sudo apt-get install build-essential libssl-dev libffi-dev python3-dev

CentOS、RedHat:

sudo yum install gcc libffi-devel python-devel openssl-devel

3、ImportError: No module named 'cryptography'

这是缺少加密的相关组件,利用pip安装即可。

sudo pip3 install cryptography

4、ImportError: No module named 'packaging'

缺少packaging这个包,它提供了Python包的核心功能,利用pip安装即可。

sudo pip3 install packaging

5、ImportError: No module named 'appdirs'

缺少appdirs这个包,它用来确定文件目录,利用pip单独安装即可。

sudo pip3 install appdirs

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

相关文章

  • 计算Python Numpy向量之间的欧氏距离实例

    计算Python Numpy向量之间的欧氏距离实例

    这篇文章主要介绍了计算Python Numpy向量之间的欧氏距离实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-05-05
  • Python 类属性与实例属性,类对象与实例对象用法分析

    Python 类属性与实例属性,类对象与实例对象用法分析

    这篇文章主要介绍了Python 类属性与实例属性,类对象与实例对象用法,结合实例形式分析了java类相关的属性、实例化、对象等相关概念与操作技巧,需要的朋友可以参考下
    2019-09-09
  • python第三方库pygame的使用详解

    python第三方库pygame的使用详解

    这篇文章主要介绍了python第三方库pygame的使用,pygame一般用来做游戏,在这需要注意在使用pygame提供的功能之前,需要调用init方法,本文给大家介绍的非常详细,需要的朋友可以参考下
    2022-08-08
  • python中的json模块常用方法汇总

    python中的json模块常用方法汇总

    这篇文章主要介绍了python中的json模块常用方法汇总,json模块可以实现json数据的序列化和反序列化,更多相关资料介绍需要的小伙伴可以参考一下下面文章内容
    2022-06-06
  • 使用Python实现毫秒级抢单功能

    使用Python实现毫秒级抢单功能

    年中购物618大狂欢开始了,各大电商又开始了大力度的折扣促销,我们的小胖又给大家谋了一波福利,淘宝APP直接搜索:小胖发福利,每天领取三次粉丝专属现金大红包。这篇文章主要介绍了用Python完成毫秒级抢单,助你秒杀淘宝大单,需要的朋友可以参考下
    2019-06-06
  • 基于Python实现虚假评论检测可视化系统

    基于Python实现虚假评论检测可视化系统

    这篇文章主要为大家详细介绍了如何基于Python实现一个简单的虚假评论检测可视化系统,文中的示例代码讲解详细,感兴趣的小伙伴可以了解一下
    2023-04-04
  • python实现可将字符转换成大写的tcp服务器实例

    python实现可将字符转换成大写的tcp服务器实例

    这篇文章主要介绍了python实现可将字符转换成大写的tcp服务器,通过tcp服务器端实现针对字符的转换与返回功能,具有一定参考借鉴价值,需要的朋友可以参考下
    2015-04-04
  • Python OpenCV视频文件相关操作教程

    Python OpenCV视频文件相关操作教程

    最近看了一些opencv的相关内容,这里做一下记录以及学习中的体会,和大家分享一下,下面这篇文章主要给大家介绍了关于Python OpenCV视频文件相关操作的相关资料,需要的朋友可以参考下
    2022-11-11
  • 关于Python去除字符串中空格的方法总结

    关于Python去除字符串中空格的方法总结

    用Python处理字符串时会经常要去掉字符串首、尾或者中间的空白,以得到我们想要的结果,下面这篇文章主要给大家介绍了关于Python去除字符串中空格的相关资料,需要的朋友可以参考下
    2022-12-12
  • python运行加速的几种方式

    python运行加速的几种方式

    Python运行的慢是历来被诟病的,本文就来介绍一下python运行加速的几种方式,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2021-07-07

最新评论