Python数据分析之pandas读取数据

 更新时间:2021年06月02日 17:10:41   作者:小菜鸡也会有春天  
Pandas读取的文件主要有CSV,TXT和JSON,今天就整理了这3种文件格式的读取和导出代码,文中有非常详细的代码示例及介绍,需要的朋友可以参考下

一、三种数据文件的读取

在这里插入图片描述

二、csv、tsv、txt 文件读取

1)CSV文件读取:

语法格式:pandas.read_csv(文件路径)
CSV文件内容如下:

在这里插入图片描述

import pandas as pd
file_path = "e:\\pandas_study\\test.csv"
content = pd.read_csv(file_path)

content.head()  # 默认返回前5行数据
content.head(3)  # 返回前3行数据
content.shape  # 返回一个元组(总行数,总列数),总行数不包括标题行

content.index    #    返回索引,是一个可迭代的对象<class 'pandas.core.indexes.range.RangeIndex'>

content.column    #  返回所有的列名 Index(['姓名', '年龄', '籍贯'], dtype='object')

content.dtypes  #  返回的是每列的数据类型
姓名    object
年龄     int64
籍贯    object
dtype: object

2)CSV文件读取:

语法格式:pandas.read_csv(文件路径)
CSV文件内容如下:

在这里插入图片描述

import pandas as pd
file_path = "e:\\pandas_study\\test2.txt"

content = pd.read_csv(file_path,sep='\t',header = None ,names= ['name','age','adress'])
#参数说明:
# header = None 表示没有标题行
# sep='\t'  表示去除分割符中的空格
# names= ['name','age','adress'] ,列名依次自定义为'name','age','adress'

content.head()  # 默认返回前5行数据
content.head(3)  # 返回前3行数据
content.shape  # 返回一个元组(总行数,总列数),总行数不包括标题行

content.index    #    返回索引,是一个可迭代的对象<class 'pandas.core.indexes.range.RangeIndex'>

content.column    #  返回所有的列名 Index(['姓名', '年龄', '籍贯'], dtype='object')

content.dtypes  #  返回的是每列的数据类型

三、excel文件读取

在这里插入图片描述

import pandas as pd
file_path = "e:\\pandas_study\\test3.xlsx"
content = pd.read_excel(file_path)

content.head()  # 默认返回前5行数据
content.head(3)  # 返回前3行数据
content.shape  # 返回一个元组(总行数,总列数),总行数不包括标题行

content.index    #    返回索引,是一个可迭代的对象<class 'pandas.core.indexes.range.RangeIndex'>

content.column    #  返回所有的列名 Index(['姓名', '年龄', '籍贯'], dtype='object')

content.dtypes  #  返回的是每列的数据类型
姓名    object
年龄     int64
籍贯    object
dtype: object

四、数据库表格读取

语法: pandas.read_sql(sql语句,数据库连接对象)
数据对象的创建,可以根据pymysql,cx_oracle等模块连接mysql或者oracle。

到此这篇关于Python数据分析之pandas读取数据的文章就介绍到这了,更多相关pandas读取数据内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • python Pangu自动美化中文排版工具使用探索

    python Pangu自动美化中文排版工具使用探索

    这篇文章主要为大家介绍了python Pangu自动美化中文排版工具使用探索,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2024-01-01
  • Python while循环使用else语句代码实例

    Python while循环使用else语句代码实例

    这篇文章主要介绍了Python while循环使用else语句代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-02-02
  • python创建生成器以及访问的方法详解

    python创建生成器以及访问的方法详解

    这篇文章主要介绍了python创建生成器以及访问的方法详解,与列表一次性地将数据全都加载到内存不同的是,生成器使用推断加载数据,每次只推断出一个对象,在数据量比较大时,可以节省内存,需要的朋友可以参考下
    2023-11-11
  • pygame实现俄罗斯方块游戏(AI篇2)

    pygame实现俄罗斯方块游戏(AI篇2)

    这篇文章主要为大家详细介绍了pygame实现俄罗斯方块游戏AI的第2篇,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-10-10
  • 利用Python绘制数据的瀑布图的教程

    利用Python绘制数据的瀑布图的教程

    这篇文章主要介绍了利用Python绘制数据的瀑布图的教程,教程中主要用到Pandas和matplotlib这两个库,需要的朋友可以参考下
    2015-04-04
  • python写入数据到csv或xlsx文件的3种方法

    python写入数据到csv或xlsx文件的3种方法

    这篇文章主要为大家详细介绍了python写入数据到csv或xlsx文件的3种方法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-08-08
  • python 3.10上如何安装pyqt5

    python 3.10上如何安装pyqt5

    这篇文章主要介绍了python 3.9上安装pyqt5的详细步骤,本文分步骤给大家介绍如何在python 3.9 上安装 pyqt5,需要的朋友可以参考下
    2022-07-07
  • Python变量名详细规则详细变量值介绍

    Python变量名详细规则详细变量值介绍

    这篇文章主要介绍了Python变量名详细规则详细变量值,Python需要使用标识符给变量命名,其实标识符就是用于给程序中变量、类、方法命名的符号(简单来说,标识符就是合法的名称,下面葛小编一起进入文章里哦阿姐更多详细内容吧
    2022-01-01
  • Python DataFrame Rank详解

    Python DataFrame Rank详解

    在数据分析中,pandas库的DataFrame对象的rank()方法可用于计算数据排名,处理重复值并支持多种参数定制排名规则,如ascending、axis、numeric_only等,是数据分析和竞赛中的有力工具
    2024-09-09
  • Python入门

    Python入门

    Python入门...
    2007-02-02

最新评论