Python数据分析之pandas读取数据

 更新时间:2021年06月02日 17:10:41   作者:小菜鸡也会有春天  
Pandas读取的文件主要有CSV,TXT和JSON,今天就整理了这3种文件格式的读取和导出代码,文中有非常详细的代码示例及介绍,需要的朋友可以参考下

一、三种数据文件的读取

在这里插入图片描述

二、csv、tsv、txt 文件读取

1)CSV文件读取:

语法格式:pandas.read_csv(文件路径)
CSV文件内容如下:

在这里插入图片描述

import pandas as pd
file_path = "e:\\pandas_study\\test.csv"
content = pd.read_csv(file_path)

content.head()  # 默认返回前5行数据
content.head(3)  # 返回前3行数据
content.shape  # 返回一个元组(总行数,总列数),总行数不包括标题行

content.index    #    返回索引,是一个可迭代的对象<class 'pandas.core.indexes.range.RangeIndex'>

content.column    #  返回所有的列名 Index(['姓名', '年龄', '籍贯'], dtype='object')

content.dtypes  #  返回的是每列的数据类型
姓名    object
年龄     int64
籍贯    object
dtype: object

2)CSV文件读取:

语法格式:pandas.read_csv(文件路径)
CSV文件内容如下:

在这里插入图片描述

import pandas as pd
file_path = "e:\\pandas_study\\test2.txt"

content = pd.read_csv(file_path,sep='\t',header = None ,names= ['name','age','adress'])
#参数说明:
# header = None 表示没有标题行
# sep='\t'  表示去除分割符中的空格
# names= ['name','age','adress'] ,列名依次自定义为'name','age','adress'

content.head()  # 默认返回前5行数据
content.head(3)  # 返回前3行数据
content.shape  # 返回一个元组(总行数,总列数),总行数不包括标题行

content.index    #    返回索引,是一个可迭代的对象<class 'pandas.core.indexes.range.RangeIndex'>

content.column    #  返回所有的列名 Index(['姓名', '年龄', '籍贯'], dtype='object')

content.dtypes  #  返回的是每列的数据类型

三、excel文件读取

在这里插入图片描述

import pandas as pd
file_path = "e:\\pandas_study\\test3.xlsx"
content = pd.read_excel(file_path)

content.head()  # 默认返回前5行数据
content.head(3)  # 返回前3行数据
content.shape  # 返回一个元组(总行数,总列数),总行数不包括标题行

content.index    #    返回索引,是一个可迭代的对象<class 'pandas.core.indexes.range.RangeIndex'>

content.column    #  返回所有的列名 Index(['姓名', '年龄', '籍贯'], dtype='object')

content.dtypes  #  返回的是每列的数据类型
姓名    object
年龄     int64
籍贯    object
dtype: object

四、数据库表格读取

语法: pandas.read_sql(sql语句,数据库连接对象)
数据对象的创建,可以根据pymysql,cx_oracle等模块连接mysql或者oracle。

到此这篇关于Python数据分析之pandas读取数据的文章就介绍到这了,更多相关pandas读取数据内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • kNN算法python实现和简单数字识别的方法

    kNN算法python实现和简单数字识别的方法

    这篇文章主要介绍了kNN算法python实现和简单数字识别的方法,详细讲述了kNN算法的优缺点及原理,并给出了应用实例,需要的朋友可以参考下
    2014-11-11
  • Python如何用str.format()批量生成网址(豆瓣读书为例)

    Python如何用str.format()批量生成网址(豆瓣读书为例)

    这篇文章主要介绍了Python如何用str.format()批量生成网址(豆瓣读书为例),文中通过示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2021-09-09
  • Python 模拟动态产生字母验证码图片功能

    Python 模拟动态产生字母验证码图片功能

    这篇文章主要介绍了Python 模拟动态产生字母验证码图片,这里给大家介绍了pillow模块的使用,需要的朋友可以参考下
    2019-12-12
  • 使用TensorFlow实现SVM

    使用TensorFlow实现SVM

    这篇文章主要为大家详细介绍了使用TensorFlow实现SVM的相关资料,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-09-09
  • pandas预处理部分地区数据案例

    pandas预处理部分地区数据案例

    本文主要介绍了pandas预处理部分地区数据案例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-01-01
  • Python3.5 + sklearn利用SVM自动识别字母验证码方法示例

    Python3.5 + sklearn利用SVM自动识别字母验证码方法示例

    这篇文章主要给大家介绍了关于Python3.5 + sklearn利用SVM自动识别字母验证码的相关资料,文中通过示例代码介绍的非常详细,对大家学习或者使用Python具有一定的参考学习价值,需要的朋友们下面来一起学习学习吧
    2019-05-05
  • Python中random.shuffle()函数用法代码案例

    Python中random.shuffle()函数用法代码案例

    random.shuffle方法,对元素进行重新排序,打乱原有的顺序,返回一个随机序列,该方法的作用类似洗牌,本文重点给大家介绍Python中random.shuffle()函数用法代码案例,感兴趣的朋友跟随小编一起看看吧
    2022-11-11
  • 详解Python中__str__和__repr__方法的区别

    详解Python中__str__和__repr__方法的区别

    这篇文章主要介绍了__str__和__repr__方法的区别 ,__str__和__repr__是基本的内置方法,使用时的区别也是Python学习当中的基础,需要的朋友可以参考下
    2015-04-04
  • 使用Playwright模拟API的项目实践

    使用Playwright模拟API的项目实践

    Playwright是一个强大的自动化测试工具,它不仅可以用于浏览器自动化测试,还可以模拟API请求,具有一定的参考价值,感兴趣的可以了解一下
    2025-04-04
  • 使用Python项目生成所有依赖包的清单方式

    使用Python项目生成所有依赖包的清单方式

    这篇文章主要介绍了使用Python项目生成所有依赖包的清单方式,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-07-07

最新评论