教你用Python读取CSV文件的5种方式

 更新时间:2021年11月04日 11:31:02   作者:寰宇001  
一个股票的数据集,其实就是常见的表格数据,有自己的头部和身体,这篇文章主要介绍了用Python读取CSV文件的5种方式,通过五招给大家介绍的非常详细,需要的朋友可以参考下

在python里面,读取或写入csv文件时,首先要import csv这个库,然后利用这个库提供的方法进行对文件的读写。

典型的数据集stocks.csv:

在这里插入图片描述

一个股票的数据集,其实就是常见的表格数据。有股票代码,价格,日期,时间,价格变动和成交量。这个数据集其实就是一个表格数据,有自己的头部和身体。

第一招:简单的读取

我们先来看一种简单读取方法,先用csv.reader()函数读取文件的句柄f生成一个csv的句柄,其实就是一个迭代器,我们看一下这个reader的源码:

在这里插入图片描述

喂给reader一个可迭代对象或者是文件的object,然后返回一个可迭代对象。

在这里插入图片描述

  • 首先读取csv 文件,然后用csv.reader生成一个csv迭代器f_csv
  • 然后利用迭代器的特性,next(f_csv)获取csv文件的头,也就是表格数据的头
  • 接着利用for循环,一行一行打印row的内容,也就是表格数据的身体

在这里插入图片描述 

第二招:用nametuple

上面的第一招其实是最简单的,下面我们用nametuple 来包裹一下这个生成的row数据。

在这里插入图片描述

  • nametuple其实是一个非常有用的类,这个类属于collections模块,而这个模块简直就是一个百宝箱里面有非常多的牛逼的库;
  • 这里我们用next(f_csv)其实就是获取表格的头部来初始化这个Row;
  • 然后循环来构造这个Row的数据,把我们表格里面的每一行的数据都喂成nametuple格式的row_info;
  • 这样做的好处就是你可以随心所欲的访问这个row_info里面的数据,就想访问类数据一样,比如row_info.price

第三招:用tuple类型转换

如果我们对csv数据每一行的类型都非常清楚的话,嘿嘿可以用一个设定好的数据格式转换头来对数据进行转换。

在这里插入图片描述

操作的步骤其实跟上面差不多,就是对数据结果的清洗处理稍微不一样。这里非常巧妙的zip来构造一个嵌套的数据列表,然后用convert(data)把csv文件里面每一行的数据进行类型转换,这招真的不错!
看一下结果:

在这里插入图片描述

第四招:用DictReader

上面用的nametuple其实也是一个数据的映射,有没有什么方法可以直接把csv 的内容用映射的方法读取,直接出来一个字典,还真有的,来看一下代码:

在这里插入图片描述

是不是非常简捷,原来csv模块直接内置了DictReader(),按照字典的方法进行读取,然后生成一个有序的字典,看一下结果:

在这里插入图片描述

有兴趣的可以看一下这个DictReader()的源码,它其实一个内部构造的迭代器类,在内部的__next__其实也是用的OrderedDict(zip(self.fieldnames, row))来生成的。

第五招:用字典转换

如果我们需要对这个csv里面的数据进行清洗,因为读出来的时候都是字符串,我们需要更新为特定的数据类型,这个时候也可以用字典转换这一招,也是非常巧妙的,我们看一下源码:

在这里插入图片描述

原来的数据价格Price和成交量,我希望最后读取生成的是一个浮点型数据和整形的数据,这么搞呢,用一个字典来巧妙的更新key即可。

  • 首先我们声明一个自定义的类型转换器field_types;
  • 然后循环生成一个可迭代的对象(key,conversion(row[key]);
  • 最后更新一下字典里面相同的key,比如row[‘price']的内容就会被更新了

参考链接 :

用Python读取CSV文件的5种方式https://mp.weixin.qq.com/s/cs4buSULva1FgCctp_fB6g

到此这篇关于教你用Python读取CSV文件的5种方式的文章就介绍到这了,更多相关Python读取CSV文件内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 一篇文章带你了解python正则表达式的正确用法

    一篇文章带你了解python正则表达式的正确用法

    这篇文章主要介绍了Python中正则表达式的详细教程,正则表达式是Python学习进阶当中的重要内容,需要的朋友可以参考下
    2021-08-08
  • matlab调用python的各种方法举例子详解

    matlab调用python的各种方法举例子详解

    为了发挥matlab的绘图优势+原先python写好的功能组合方式,下面这篇文章主要给大家介绍了关于matlab调用python的各种方法,需要的朋友可以参考下
    2023-09-09
  • 利用OpenCV给彩色图像添加椒盐噪声的方法

    利用OpenCV给彩色图像添加椒盐噪声的方法

    椒盐噪声是数字图像中的常见噪声,一般是图像传感器、传输信道及解码处理等产生的黑白相间的亮暗点噪声,椒盐噪声常由图像切割产生,这篇文章主要给大家介绍了关于利用OpenCV给彩色图像添加椒盐噪声的相关资料,需要的朋友可以参考下
    2021-10-10
  • django数据库迁移migration实现

    django数据库迁移migration实现

    这篇文章主要介绍了django数据库迁移migration实现,迁移任务是根据对models.py文件的改动情况,添加或者删除表和列,下面详细的相关内容需要的小伙伴可以参考一下
    2022-02-02
  • Python中Numpy模块使用详解

    Python中Numpy模块使用详解

    这篇文章主要介绍了Python中Numpy模块使用详解,NumPy是Python 的一个扩展程序库,支持大量的维度数组与矩阵运算。更多相关内容需要的朋友可以参考一下
    2022-07-07
  • python获取本机mac地址和ip地址的方法

    python获取本机mac地址和ip地址的方法

    这篇文章主要介绍了python获取本机mac地址和ip地址的方法,涉及Python获取系统相关信息的技巧,需要的朋友可以参考下
    2015-04-04
  • Django的多表查询操作实战

    Django的多表查询操作实战

    Django提供一种强大而又直观的方式来"处理"查询中的关联关系,它在后台自动帮你处理JOIN,下面这篇文章主要给大家介绍了关于Django多表查询操作的相关资料,文中通过实例代码介绍的非常详细,需要的朋友可以参考下
    2023-06-06
  • python项目以docker形式打包部署详细流程

    python项目以docker形式打包部署详细流程

    Docker是一个开源项目,为开发人员和系统管理员提供了一个开放平台,可以将应用程序构建、打包为一个轻量级容器,并在任何地方运行,这篇文章主要给大家介绍了关于python项目以docker形式打包部署的详细流程,需要的朋友可以参考下
    2024-08-08
  • python通过Windows下远程控制Linux系统

    python通过Windows下远程控制Linux系统

    这篇文章主要为大家详细介绍了python通过Windows下远程控制Linux系统,实现对socket模块认识,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-06-06
  • python基础篇之pandas常用基本函数汇总

    python基础篇之pandas常用基本函数汇总

    Pandas是一个python数据分析库,它提供了许多函数和方法来加快数据分析过程,下面这篇文章主要给大家介绍了关于python基础篇之pandas常用基本函数的相关资料,需要的朋友可以参考下
    2022-07-07

最新评论