python中常见的5种框架解读

 更新时间:2022年12月19日 08:40:33   作者:__淡墨青衫__  
这篇文章主要介绍了python中常见的5种框架,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教

python常见的框架有哪些

1.scrapy框架

scrapy框架是一套比较成熟的python爬虫框架,是使用python开发的快速、高层次的信息爬取框架,可以高效率地爬取web页面并提取出我们关注的结构化数据。

scrapy框架的应用领域有许多,比如网络爬虫,数据挖掘、数据监测、自动化测试等。

scrapy框架是一套开源的框架,开源也就意味着我们能够看到并且免费试用scrapy的所有代码。

2.crawley框架

crawley也是使用python开发出来的一款爬虫框架,该框架致力于改变人们从互联网中提取数据的方式,让大家可以更高效地从互联网中爬取对应内容。

crawley框架的主要特点有:

  • 1>高速爬取对应网站内容
  • 2> 可以将爬取到内容轻松地存储到数据库中,比如:postgres,mysql,oracle,sqlite等数据库
  • 3>可以将爬取到的数据导出为json,xml等格式
  • 4>支持非关系型数据库,比如:mongodb,couchdb等
  • 5>支持使用命令行工具
  • 6>可以使用你喜欢的工具提取数据,比如使用xpath或者pyquery等工具
  • 7>支持使用cookie登陆并访问哪些只有登陆才能够访问的网页
  • 8>简单易学

3.portia框架

portia框架是一款允许没有任何编程基础的用户可视化地爬取网页的爬虫框架,给出你要爬取的网页中感兴趣的数据内容,通过portia框架,可以将你所需要的信息从相似的网页中自动提取出来,如果需要,可以子啊github上的主页进行获取。

如果需要,上百度自己查吧,具体的我就不写了。

4.newspaper框架

newspaper框架是一种用来提取新闻、文章以及内容分析的python爬虫框架。

更准确地说,newspaper是一个python的库,只不过这个库是由第三方开发的,可以归为一种框架。

newspaper框架在的主要特点:

  • 1>比较简单
  • 2>速度比较快
  • 3>支持多线程
  • 4>支持十多种语言

由此我们可以知道newspaper框架是轻量级框架,并且就爬取文章信息这一功能来说,使用起来很方便

5.Python-goose框架

coose本来是一款用java写的文章提取工具,Xavier Grangier用python重写了goose,并将重写后goose命名为python-goose。

所以,python-coose框架实现的功能同样是进行文章提取。

总结

以上是python常用的5种框架,这是我知道,如果各位大神,还有其他的 ,也可以留言,相互沟通,学习。

另外后面3种框架可以再github上找到。希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • PyTorch基础之torch.nn.Conv2d中自定义权重问题

    PyTorch基础之torch.nn.Conv2d中自定义权重问题

    这篇文章主要介绍了PyTorch基础之torch.nn.Conv2d中自定义权重问题,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-02-02
  • Python传递参数的多种方式(小结)

    Python传递参数的多种方式(小结)

    这篇文章主要介绍了Python传递参数的多种方式,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-09-09
  • python实现画桃心表白

    python实现画桃心表白

    这篇文章主要介绍了python实现画桃心表白的代码,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-05-05
  • python中的五种异常处理机制介绍

    python中的五种异常处理机制介绍

    这篇文章主要介绍了python中的五种异常处理机制介绍,本文是Learn Python一书的读书笔记,需要的朋友可以参考下
    2014-09-09
  • Python导入父文件夹中模块并读取当前文件夹内的资源

    Python导入父文件夹中模块并读取当前文件夹内的资源

    这篇文章主要给大家介绍了关于Python导入父文件夹中模块并读取当前文件夹内资源的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-11-11
  • Python实现在PDF中添加数字签名

    Python实现在PDF中添加数字签名

    无论是商业文件、法律文件还是个人文件,都可能需要证明其来源的真实性和完整性,PDF数字签名就是解决这些问题的关键工具,下面我们来看看如何使用 Python 为PDF文档添加数字签名吧
    2025-01-01
  • python访问类中docstring注释的实现方法

    python访问类中docstring注释的实现方法

    这篇文章主要介绍了python访问类中docstring注释的实现方法,涉及python类注释的访问技巧,非常具有实用价值,需要的朋友可以参考下
    2015-05-05
  • python实现定时同步本机与北京时间的方法

    python实现定时同步本机与北京时间的方法

    这篇文章主要介绍了python实现定时同步本机与北京时间的方法,涉及Python针对时间的操作技巧,具有一定参考借鉴价值,需要的朋友可以参考下
    2015-03-03
  • 基于Python列表解析(列表推导式)

    基于Python列表解析(列表推导式)

    今天小编就为大家分享一篇基于Python列表解析(列表推导式),具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-06-06
  • Python设计模式结构型代理模式

    Python设计模式结构型代理模式

    这篇文章主要介绍了Python设计模式结构型代理模式,代理模式即Proxy Pattern,为其他对象提供一种代理以控制对这个对象的访问,下文内容详细介绍,具有一定的参考价值,需要的小伙伴可以参考一下
    2022-02-02

最新评论