Python中pandas库的常用操作实例

 更新时间:2023年07月29日 09:29:35   作者:菜菜01  
这篇文章主要介绍了Python中pandas库的常用操作实例,Pandas 库是一个免费、开源的第三方 Python 库,是 Python 数据分析必不可少的工具之一,它为 Python 数据分析提供了高性能,且易于使用的数据结构,即 Series 和 DataFrame,需要的朋友可以参考下

pandas库常用操作

series

使用列表创建

import pandas as pd
data = pd.Series([i for i in range(4)],index=['a','b','c','d'])
data

使用字典创建

import pandas as pd
dict1 = {"a":0,"b":1,"c":2,"d":3}
data = pd.Series(dict1)
data

DataFrame

使用数组创建

import pandas as pd
import numpy as np
arr = np.array([i for i in range(12)]).reshape(3,4)
data = pd.DataFrame(arr)
data

指定列索引

import pandas as pd
import numpy as np
arr = np.array([i for i in range(12)]).reshape(3,4)
data = pd.DataFrame(arr,columns=['a','b','c','d'])
data

index

查询索引

#series
import pandas as pd
data = pd.Series([i for i in range(3)],index=['a','b','c'])
data.index
#DataFrame
import pandas as pd
import numpy as np
arr = np.array([i for i in range(9)]).reshape(3,3)
data = pd.DataFrame(arr,columns=['a','b','c'])
data.columns

查询索引

#series
import pandas as pd
data = pd.Series([i for i in range(3)],index=['a','b','c'])
data[2] #2
data['c'] #2
data[0:2] #0,1
data['a':'c'] #0,1
data[[0,2]] #0,2
data[['a','c']] #0,2
#dataframe
import pandas as pd
import numpy as np
arr = np.array([i for i in range(9)]).reshape(3,3)
data = pd.DataFrame(arr,columns=['a','b','c'])
data['a'] 
""""
0    0
1    3
2    6
""""
data[['a','c']]
""""
	a	c
0	0	2
1	3	5
2	6	8
""""
data[:2]
"""
a	b	c
0	0	1	2
1	3	4	5
"""
##loc是index,iloc是行号
data.loc[:,["a","c"]]
data.iloc[:,[0,2]]

sort

sort in index

#series
import pandas as pd
data = pd.Series([1,3,0],index=['a','b','c'])
data.sort_index(axis=0)
data.sort_index(axis=0,ascending=False)
#DataFrame
import pandas as pd
import numpy as np
data = pd.DataFrame(np.arange(9).reshape(3,3),columns=['a','b','c'])
data.sort_index()

sort in values

#series
import pandas as pd
data = pd.Series([1,3,0],index=['a','b','c'])
data.sort_values(axis=0)
data.sort_values(axis=0,ascending=False)
#DataFrame
import pandas as pd
import numpy as np
data = pd.DataFrame(np.arange(9).reshape(3,3),columns=['a','b','c'])
data.sort_values()
data.sort_values(by='a')

multidnex

read , write file

import pandas as pd
data = pd.DataFrame(np.arange(9).reshape(3,3),columns=['a','b','c'])
data.to_csv(r'./data.csv',index=False)
data = pd.read_csv(r'./data.csv')
data
import pandas as pd
data = pd.DataFrame(np.arange(9).reshape(3,3),columns=['a','b','c'])
data.to_excel(r'./data.xlsx',index=False)
data = pd.read_excel(r'./data.xlsx')
data

空值和缺失值处理

import pandas as pd
import numpy as np
from numpy import NaN
data = pd.Series([1,NaN,3])
data.isnull()
#delete
data.dropna()
#fill
data.fillna(6)
#重复值处理
import pandas as pd
data = pd.DataFrame({'id': [1, 2, 3, 4, 4, 5],
                            'name': ['小铭', '小月月', '彭岩', '刘华', '刘华', '周华'],
                            'age': [18, 18, 29, 58, 58, 36],
                            'height': [180, 180, 185, 175, 175, 178],
                            'gender': ['女', '女', '男', '男', '男', '男']})
data.duplicated() 
data.duplicateds()

更改数据类型

import pandas as pd
dict1 = {'A':['5', '6', '7'], 'B':['3', '2', '1']}
data = pd.DataFrame(dict1)
data.dtypes 
data = pd.DataFrame(dict1,dtype='int')
data.dtypes
data.astype(dtype='float')

数据合并

import pandas as pd
data1 = pd.DataFrame({'A': ['A0', 'A0', 'A1'],
                    'B': ['B0', 'B0', 'B1']})
data2 = pd.DataFrame({'C': ['C0', 'C0', 'C1', 'C3'],
                    'D': ['D0', 'D2', 'D2', 'D3']})
# 横向堆叠合并df1和df2,采用外连接的方式
pd.concat([data1,data2], join='outer',axis=1)

数据聚合和组内运算

import pandas as pd
import numpy as np
dict1 = {"Key":['C','B','C','A','B','B','A','C','A'],"Data":[2,4,6,8,10,1,14,16,18]}
data = pd.DataFrame(dict1)
data
for i in pd.groupby(by='Key'):
    print(i)

到此这篇关于Python中pandas库的常用操作实例的文章就介绍到这了,更多相关pandas库的常用操作内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Python从零开始训练AI模型的实用教程

    Python从零开始训练AI模型的实用教程

    本文介绍了如何使用Python从零开始训练自己的AI模型,包括确定问题和数据集、数据预处理、构建模型、训练模型、评估和调优模型以及部署和应用模型等步骤
    2025-02-02
  • matplotlib基础绘图命令之errorbar的使用

    matplotlib基础绘图命令之errorbar的使用

    这篇文章主要介绍了matplotlib基础绘图命令之errorbar的使用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-08-08
  • 用python对excel进行操作(读,写,修改)

    用python对excel进行操作(读,写,修改)

    这篇文章主要介绍了用python对excel进行操作(读,写,修改),帮助大家更好的利用python处理表格,感兴趣的朋友可以了解下
    2020-12-12
  • Python中常用的十个函数介绍

    Python中常用的十个函数介绍

    这篇文章主要介绍了Python中常用的十个函数,shutil 是 Python 中的高级文件操作模块,与os模块形成互补的关系,需要的朋友可以参考下
    2023-04-04
  • numpy库reshape用法详解

    numpy库reshape用法详解

    这篇文章主要介绍了numpy库reshape用法详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-04-04
  • Python如何基于Tesseract实现识别文字功能

    Python如何基于Tesseract实现识别文字功能

    这篇文章主要介绍了Python如何基于Tesseract实现识别文字功能,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-06-06
  • Python容器使用的5个技巧和2个误区总结

    Python容器使用的5个技巧和2个误区总结

    在本篇文章里小编给大家整理的是关于Python容器使用的5个技巧和2个误区的相关知识点内容,需要的朋友们学习下。
    2019-09-09
  • VSCode设置类似Pycharm控制台运行Python显示中间变量的步骤

    VSCode设置类似Pycharm控制台运行Python显示中间变量的步骤

    这篇文章主要介绍了如何在VSCode中设置调试功能,以实现类似于Pycharm在控制台输出中间变量的功能,文中通过图文介绍的非常详细,需要的朋友可以参考下
    2025-03-03
  • Python 实现二叉查找树的示例代码

    Python 实现二叉查找树的示例代码

    这篇文章主要介绍了Python 实现二叉查找树的示例代码,帮助大家更好的理解和使用python,感兴趣的朋友可以了解下
    2020-12-12
  • Python入门教程(三十三)Python的字符串格式化

    Python入门教程(三十三)Python的字符串格式化

    这篇文章主要介绍了Python入门教程(三十三)Python的字符串格式化,为了确保字符串按预期显示,我们可以使用 format()方法对结果进行格式化,需要的朋友可以参考下
    2023-05-05

最新评论