Python工程实践之np.loadtxt()读取数据

 更新时间:2023年07月14日 09:23:48   作者:DonngZH  
为了方便使用和记忆,有时候我们会把numpy.loadtxt()缩写成np.loadtxt(),这篇文章主要给大家介绍了关于Python工程实践之np.loadtxt()读取数据的相关资料,需要的朋友可以参考下

前言

机器学习中使用np.loadtxt()可以高效的导入数据,np.loadtxt()适合.txt文件和.csv文件。但是它默认读取float类型的值。

1.np.loadtxt()读取txt文件

1-1 基础参数

numpy.loadtxt(
    fname, dtype=, comments='#', 
    delimiter=None, converters=None, 
    skiprows=0, usecols=None, 
    unpack=False, ndmin=0)

1-2 参数详解 

fname要读取的文件、文件名、或生成器。
dtype数据类型,默认float。
comments注释。
delimiter分隔符,默认是空格。
skiprows跳过前几行读取,默认是0,必须是int整型。
usecols要读取哪些列,0是第一列。例如,usecols = (1,4,5)将提取第2,第5和第6列。默认读取所有列。
unpack如果为True,将分列读取。

1-3 应用示例

文件的存储路径为:'./data.txt', 文件内容如下:

1-3-1 fname

fname可以是文件的路径也可以是要读取的文件。 

#根据文件名直接读取
data = np.loadtxt('./data/data.csv')

1-3-2 dtype

dtype默认为np.float32类型,也可以设置为其他类型,比如int。设置为其他dtype时需要考虑数据本身的类型。

#设置dtype
data = np.loadtxt('./data/data.csv',dtype=np.float32)
#设置dtype
data = np.loadtxt('./data/data.csv',dtype=int)

1-3-3 comments

comment的是指, 如果行的开头为comment的值,那在读取时就会跳过该行。示例代码中comment  = '1',则在读取数据时,会跳过开头为1的行。

data = np.loadtxt('./data.txt',dtype = int,comments='1')

1-3-4 delimiter 

delimiter是分隔符,默认是空格。

data = np.loadtxt('./data.txt',dtype = int,comments='1',delimiter=' ')

我们改变一下数据,将数据中的分隔符改为','之后再重新读取。

data = np.loadtxt('./data.txt',dtype = int,delimiter=',')

1-3-5 skiprows

skiprows跳过前几行读取,默认是0,必须是int整型。skiprows = 2则表示跳过前两行读取数据。

data = np.loadtxt('./data.txt',dtype = int,delimiter=',',skiprows=2)

读取数据时,设定 skiprows = 2,则将前两行跳过,从第三行开始读取。

1-3-6 usecols

usecols要读取哪些列,0是第一列。例如,usecols = (1,4,5)将提取第2,第5和第6列。默认读取所有列。

读取第2列数据。

data = np.loadtxt('./data.txt',dtype = int,delimiter=',',usecols = 1)

读取第2,6,9列数据。 

data = np.loadtxt('./data.txt',dtype = int,delimiter=',',usecols =(1,5,8))

1-3-7 unpack

unpack如果设置为Ture,将分列读取,类似于矩阵的转置。

未设置之前,数据读取时是以行为单位进行读取。

设置unpack=Ture之后再次读取,矩阵的列变为了行。

1-4 np.loadtxt()读取csv文件 

读取csv文件与读取txt文件的参数一致,需要注意的是csv文件的分隔符一般是“,”并且含有表头,所以需要使用delimiter=','作为分隔符,以及使用skiprows=1跳过表头。

原始csv文件内容:

#根据data_path读取文件内容
train_XY  = np.loadtxt(data_path, delimiter=',', skiprows = 1,dtype=np.float32)

总结 

到此这篇关于Python工程实践之np.loadtxt()读取数据的文章就介绍到这了,更多相关np.loadtxt()读取数据内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 几个提升Python运行效率的方法之间的对比

    几个提升Python运行效率的方法之间的对比

    这篇文章主要介绍了几个提升Python运行效率的方法之间的对比,包括使用Cython和PyPy等这些热门方法,需要的朋友可以参考下
    2015-04-04
  • python绘制多个曲线的折线图

    python绘制多个曲线的折线图

    这篇文章主要为大家详细介绍了python绘制多个曲线的折线图,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-09-09
  • Python实现计算长方形面积(带参数函数demo)

    Python实现计算长方形面积(带参数函数demo)

    今天小编就为大家分享一篇Python实现计算长方形面积(带参数函数demo),具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-01-01
  • Python中11种NumPy高级操作总结

    Python中11种NumPy高级操作总结

    熬夜整了了11种Numpy的高级操作,每一种都有参数解释与小例子辅助说明。文中的示例代码讲解详细,感兴趣的小伙伴快跟随小编一起学习一下吧
    2022-05-05
  • Python 保持登录状态进行接口测试的方法示例

    Python 保持登录状态进行接口测试的方法示例

    这篇文章主要介绍了Python 保持登录状态进行接口测试的方法示例,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2019-08-08
  • jupyter notebook出现In[*]的问题及解决

    jupyter notebook出现In[*]的问题及解决

    这篇文章主要介绍了jupyter notebook出现In[*]的问题及解决方案,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2023-09-09
  • Python3爬虫关于代理池的维护详解

    Python3爬虫关于代理池的维护详解

    在本篇文章里小编给大家分享了关于Python3爬虫关于代理池的维护详解内容,需要的朋友们可以参考下。
    2020-07-07
  • Flask之pipenv虚拟环境的实现

    Flask之pipenv虚拟环境的实现

    这篇文章主要介绍了Flask之pipenv虚拟环境的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-11-11
  • Python 实现文件读写、坐标寻址、查找替换功能

    Python 实现文件读写、坐标寻址、查找替换功能

    这篇文章主要介绍了Python 实现文件读写、坐标寻址、查找替换功能,本文通过实例代码给大家介绍的非常详细,需要的朋友可以参考下
    2019-09-09
  • python 显示数组全部元素的方法

    python 显示数组全部元素的方法

    下面小编就为大家分享一篇python 显示数组全部元素的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-04-04

最新评论