Pandas中DataFrame的常用用法分享

 更新时间:2023年04月18日 15:13:27   作者:小小鸟爱吃辣条  
Pandas是Python中最流行的数据分析和处理工具之一,它提供了一个名为DataFrame的数据结构,可以被认为是一个二维表格或电子表格。本文主要来和大家分享一下Pandas中DataFrame的常用用法,希望对大家有所帮助

Pandas是Python中最流行的数据分析和处理工具之一,它提供了一个名为DataFrame的数据结构,可以被认为是一个二维表格或电子表格,其中包含行和列。在本文中,我们将深入探讨Pandas中DataFrame的各种常用的用法,包括创建DataFrame、选择数据、修改数据、数据排序、数据统计、数据合并、数据分组和数据透视表等。

1.创建DataFrame

要创建DataFrame,可以使用Pandas中的DataFrame()函数。下面是一个例子:

import pandas as pd

data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
        'age': [25, 32, 18, 47],
        'gender': ['F', 'M', 'M', 'M']}

df = pd.DataFrame(data)
print(df)

输出:

       name  age gender
0     Alice   25      F
1       Bob   32      M
2   Charlie   18      M
3     David   47      M

2.选择数据

在DataFrame中选择数据有几种方法。可以使用loc[]和iloc[]函数,也可以使用布尔索引。下面是一些例子:

# 使用loc[]函数选择数据
print(df.loc[0])          # 选择第一行
print(df.loc[0:2])        # 选择前三行
print(df.loc[0:2, 'name'])# 选择前三行的name列

# 使用iloc[]函数选择数据
print(df.iloc[0])         # 选择第一行
print(df.iloc[0:2])       # 选择前两行
print(df.iloc[0:2, 0])    # 选择前两行的第一列

# 使用布尔索引选择数据
print(df[df['age'] > 30]) # 选择年龄大于30的行

3.修改数据

要修改DataFrame中的数据,可以使用loc[]或iloc[]函数。下面是一个例子:

# 修改数据
df.loc[0, 'age'] = 26
print(df)

# 添加新数据
df.loc[4] = ['Eve', 29, 'F']
print(df)

# 删除数据
df = df.drop(4)
print(df)

4.数据排序

要对DataFrame中的数据进行排序,可以使用sort_values()函数。下面是一个例子:

# 按年龄升序排序
df = df.sort_values('age')
print(df)

# 按年龄降序排序
df = df.sort_values('age', ascending=False)
print(df)

5.数据统计

要对DataFrame中的数据进行统计,可以使用describe()函数和其他函数,例如mean()、median()和std()。下面是一个例子:

# 描述数据
print(df.describe())

# 计算平均年龄
print(df['age'].mean())

# 计算年龄中位数
print(df['age'].median())

# 计算年龄标准差
print(df['age'].std())

6.数据合并

要合并两个DataFrame,可以使用concat()函数。下面是一个例子:

# 创建第二个DataFrame
data2 = {'name': ['Frank', 'Grace'],
         'age': [39, 28],
         'gender': ['M', 'F']}
df2 = pd.DataFrame(data2)

# 合并两个DataFrame
df = pd.concat([df, df2])
print(df)

7.数据分组

要按某些标准对DataFrame中的数据进行分组,可以使用groupby()函数。下面是一个例子:

# 按性别分组并计算平均年龄
print(df.groupby('gender')['age'].mean())

8.数据透视表

要创建数据透视表,可以使用pivot_table()函数。下面是一个例子:

# 创建数据透视表
print(pd.pivot_table(df, values='age', index='gender', columns='name'))

到此这篇关于Pandas中DataFrame的常用用法分享的文章就介绍到这了,更多相关Pandas DataFrame内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Python使用pickle模块储存对象操作示例

    Python使用pickle模块储存对象操作示例

    这篇文章主要介绍了Python使用pickle模块储存对象操作,结合实例形式分析了Python使用pickle模块针对文件读写与转换的相关操作技巧,需要的朋友可以参考下
    2018-08-08
  • Python中的迭代器与生成器使用及说明

    Python中的迭代器与生成器使用及说明

    这篇文章主要介绍了Python中的迭代器与生成器使用及说明,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-12-12
  • Python2.7实现多进程下开发多线程示例

    Python2.7实现多进程下开发多线程示例

    这篇文章主要为大家详细介绍了Python2.7实现多进程下开发多线程示例,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-05-05
  • python统计日志ip访问数的方法

    python统计日志ip访问数的方法

    这篇文章主要介绍了python统计日志ip访问数的方法,涉及Python操作日志文件及正则匹配的相关技巧,非常具有实用价值,需要的朋友可以参考下
    2015-07-07
  • Python实现模拟时钟代码推荐

    Python实现模拟时钟代码推荐

    本文给大家汇总介绍了下使用Python实现模拟时钟的代码,一共3个例子,后两个是基于QT实现,有需要的小伙伴可以参考下
    2015-11-11
  • python读取二进制mnist实例详解

    python读取二进制mnist实例详解

    这篇文章主要介绍了python读取二进制mnist实例详解的相关资料,需要的朋友可以参考下
    2017-05-05
  • Python常用模块介绍

    Python常用模块介绍

    这篇文章主要介绍了Python常用模块介绍,本文罗列了如python运行时服务、数学、数据结构、算法和代码简化、string 和 text 处理、python数据库访问等模块,需要的朋友可以参考下
    2014-11-11
  • python进阶之多线程对同一个全局变量的处理方法

    python进阶之多线程对同一个全局变量的处理方法

    今天小编就为大家分享一篇python进阶之多线程对同一个全局变量的处理方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-11-11
  • 什么是Python变量作用域

    什么是Python变量作用域

    在本篇文章里小编给大家整理的是关于Python变量作用域的相关知识点内容,需要的朋友们可以学习下。
    2020-06-06
  • python的urllib模块显示下载进度示例

    python的urllib模块显示下载进度示例

    这篇文章主要介绍了python的urllib模块显示下载进度的示例,大家参考使用吧
    2014-01-01

最新评论