python爬虫之场内ETF基金获取

 更新时间:2022年05月05日 16:43:39   作者:​ 斜月   ​  
这篇文章主要介绍了python爬虫之场内ETF基金获取,ETF 是一种场内交易型基金,可以在盘中进行交易,交易性比场外基金强一点,下文基于python的相关资料展开,需要的小伙伴可以参考一下

1 前言

之前已经介绍了基金的变动信息,但是这些基金都是属于场外的,今天我们要介绍的是一个带门槛的投资产品-ETF。只有开立证券账户的玩家才能入局,ETF 是一种场内交易型基金,可以在盘中进行交易,交易性比场外基金强一点,那么闲言少叙,马上开始介绍正题。

2 ETF列表和简称

ETF基金变动情况和基本情况的获取方式和场外基金是一样的,怎么获取比较全面的ETF基金列表呢?

# 获取基金信息的列表
http://fund.eastmoney.com/data/fbsfundranking.html

以下是ETF信息列表所展示的信息:

ETF 在场内进行交易时,一般都有一个简称,获取简称的方式比较麻烦一点,需要访问一个页面,然后通过 bs4 去解析元素的方式去获取。

#经过分析,我们可以发现基金代码前缀就代表这其市场,5上海市场 1-深圳市场,以地产ETF和光伏ETF为例
http://quote.eastmoney.com/sz159707.html
http://quote.eastmoney.com/sh515790.html

3 ETF 信息获取

3.1 ETF列表信获取

ETF 列表信息我们通过访问列表发现在访问列表数据时,是请求了一个api接口到了后台,然后返回给前端一个响应报文。 

http://fund.eastmoney.com/data/rankhandler.aspx?op=ph&dt=fb&ft=ct&rs=&gs=0&sc=zzf&st=desc&pi=1&pn=50

看到这里就觉得很开心,不用解析 html 文件了,当通过request使用get 方式获取数据时,发现竟然没有返回无访问权限,我想可能是没有携带cookie的原因,但是我也没有登录呀,可能是请求头需要携带一些页面信息,于是,经过尝试,最终确定了需要携带的信息为:

headers = {
    'Host': 'fund.eastmoney.com',
    'Referer': 'http://fund.eastmoney.com/data/fbsfundranking.html'
}

最终我们获取基金列表的代码应该这样写:

调试后获取到的结果如下图所示:

3.2 获取基金的简称

获取基金的简称相对比较简单,通过分析发现,简称所在的位置在 <span class="quote_title_0 wryh">光伏ETF</span> 中,通过访问页面获取元素即可拿到简称的描述。

具体的代码如下图所示:

4 最终结果展示

经过获取基金列表和获取基金简称两个步骤,我们获取到了最终的结果如下图所示,已经达成了需要获取信息的目的:

后续我们会把基金信息和ETF 信息进行合并存入数据库中,方便后续的数据分析。

到此这篇关于python爬虫之场内ETF基金获取的文章就介绍到这了,更多相关python ETF基金获取内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 你可能不知道的Python 技巧小结

    你可能不知道的Python 技巧小结

    有许许多多文章写了 Python 中的许多很酷的特性,例如变量解包、偏函数、枚举可迭代对象,但是关于 Python 还有很多要讨论的话题,因此在本文中,我将尝试展示一些我知道的和在使用的,但很少在其它文章提到过的特性。那就开始吧
    2020-01-01
  • PyCharm利用pydevd-pycharm实现Python远程调试的详细过程

    PyCharm利用pydevd-pycharm实现Python远程调试的详细过程

    这篇文章主要介绍了PyCharm利用pydevd-pycharm实现Python远程调试,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2022-09-09
  • pytorch cuda安装报错的解决方法

    pytorch cuda安装报错的解决方法

    这篇文章主要给大家介绍了关于pytorch cuda安装报错的解决方法,文中通过图文介绍的非常详细,对大家学习或者使用Pytorch具有一定的参考学习价值,需要的朋友可以参考下
    2023-01-01
  • django中的auth模块与admin后台管理方法

    django中的auth模块与admin后台管理方法

    这篇文章主要介绍了django中的auth模块与admin后台管理方法,包括auth模块的常用方法及如何扩展auth_user表,本文通过实例代码给大家介绍的非常详细,需要的朋友可以参考下
    2022-09-09
  • python中JWT用户认证的实现

    python中JWT用户认证的实现

    这篇文章主要介绍了python中JWT用户认证的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-05-05
  • Python 十大经典排序算法实现详解

    Python 十大经典排序算法实现详解

    排序算法是《数据结构与算法》中最基本的算法之一。排序算法可以分为内部排序和外部排序,内部排序是数据记录在内存中进行排序,而外部排序是因排序的数据很大,一次不能容纳全部的排序记录,在排序过程中需要访问外存
    2022-01-01
  • python爬不同图片分别保存在不同文件夹中的实现

    python爬不同图片分别保存在不同文件夹中的实现

    这篇文章主要介绍了python爬不同图片分别保存在不同文件夹中的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-04-04
  • 详解python里的命名规范

    详解python里的命名规范

    这篇文章主要介绍了详解python里的命名规范,命名应当尽量使用全拼写的单词,缩写的情况文章中也给大家提到,需要的朋友参考下吧
    2018-07-07
  • python目标检测给图画框,bbox画到图上并保存案例

    python目标检测给图画框,bbox画到图上并保存案例

    这篇文章主要介绍了python目标检测给图画框,bbox画到图上并保存案例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-03-03
  • Win10 Anaconda 新建环境安装python-pcl的步骤

    Win10 Anaconda 新建环境安装python-pcl的步骤

    这篇文章主要介绍了Win10 Anaconda 新建环境安装python-pcl的方法,至于VS环境下安装C++ 版本的pcl也可以按照此文提供的步骤安装实现,需要的朋友可以参考下
    2022-04-04

最新评论