Python pandas DataFrame操作的实现代码

 更新时间:2019年06月21日 14:46:18   作者:huahuayu  
这篇文章主要介绍了Python pandas DataFrame操作的实现代码,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧

1. 从字典创建Dataframe

>>> import pandas as pd
>>> dict1 = {'col1':[1,2,5,7],'col2':['a','b','c','d']}
>>> df = pd.DataFrame(dict1)
>>> df
  col1 col2
0   1  a
1   2  b
2   5  c
3   7  d

2. 从列表创建Dataframe (先把列表转化为字典,再把字典转化为DataFrame)

>>> lista = [1,2,5,7]
>>> listb = ['a','b','c','d']
>>> df = pd.DataFrame({'col1':lista,'col2':listb})
>>> df
  col1 col2
0   1  a
1   2  b
2   5  c
3   7  d
 

3. 从列表创建DataFrame,指定data和columns

>>> a = ['001','zhangsan','M']
>>> b = ['002','lisi','F']
>>> c = ['003','wangwu','M']
>>> df = pandas.DataFrame(data=[a,b,c],columns=['id','name','sex'])
>>> df
  id   name sex
0 001 zhangsan  M
1 002   lisi  F
2 003  wangwu  M

4. 修改列名,从['id','name','sex']修改为['Id','Name','Sex']

>>> df.columns = ['Id','Name','Sex']
>>> df
  Id   Name Sex
0 001 zhangsan  M
1 002   lisi  F
2 003  wangwu  M

5. 调整DataFrame列顺序、调整列编号从1开始
https://www.jb51.net/article/163644.htm

6. DataFrame随机生成10行4列int型数据

>>> import pandas
>>> import numpy
>>> df = pandas.DataFrame(numpy.random.randint(0,100,size=(10, 4)), columns=list('ABCD')) # 0,100指定随机数为0到100之间(包括0,不包括100),size = (10,4)指定数据为10行4列,column指定列名
>>> df
  A  B  C  D
0 67 28 37 66
1 21 27 43 37
2 73 54 98 85
3 40 78  4 93
4 99 60 63 16
5 48 46 24 61
6 59 52 62 28
7 20 74 36 64
8 14 13 46 60
9 18 44 70 36

7. 用时间序列做index名

>>> df # 原本index为自动生成的0~9
  A  B  C  D
0 31 25 45 67
1 62 12 61 88
2 79 36 20 97
3 26 57 50 44
4 24 12 50  1
5  4 61 99 62
6 40 47 52 27
7 83 66 71  4
8 58 59 25 62
9 38 81 60  8
>>> import pandas
>>> dates = pandas.date_range('20180121',periods=10)
>>> dates # 从20180121开始,共10天
DatetimeIndex(['2018-01-21', '2018-01-22', '2018-01-23', '2018-01-24',
        '2018-01-25', '2018-01-26', '2018-01-27', '2018-01-28',
        '2018-01-29', '2018-01-30'],
       dtype='datetime64[ns]', freq='D')
>>> df.index = dates # 将dates赋值给index
>>> df
       A  B  C  D
2018-01-21 31 25 45 67
2018-01-22 62 12 61 88
2018-01-23 79 36 20 97
2018-01-24 26 57 50 44
2018-01-25 24 12 50  1
2018-01-26  4 61 99 62
2018-01-27 40 47 52 27
2018-01-28 83 66 71  4
2018-01-29 58 59 25 62
2018-01-30 38 81 60  8

8. dataframe 实现类SQL操作

pandas官方文档 Comparison with SQL

https://pandas.pydata.org/pandas-docs/stable/comparison_with_sql.html

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

相关文章

  • python机器学习pytorch 张量基础教程

    python机器学习pytorch 张量基础教程

    这篇文章主要为大家介绍了python机器学习pytorch 张量基础教程,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-10-10
  • pyinstaller打包可执行文件出现KeyError的问题

    pyinstaller打包可执行文件出现KeyError的问题

    这篇文章主要介绍了pyinstaller打包可执行文件出现KeyError的问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2023-11-11
  • python判断一组数呈上升还是下降趋势的操作方法

    python判断一组数呈上升还是下降趋势的操作方法

    要判断一组数(数列)是呈上升趋势、下降趋势还是无明显趋势,我们可以比较数列中相邻元素的差值,这篇文章主要介绍了python 如何判断一组数呈上升还是下降趋势,需要的朋友可以参考下
    2024-06-06
  • Python super()函数使用及多重继承

    Python super()函数使用及多重继承

    这篇文章主要介绍了Python super()函数使用及多重继承,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-05-05
  • pip版本低导致Python离线包安装失败的问题解决

    pip版本低导致Python离线包安装失败的问题解决

    在使用Python进行开发时,安装各种第三方库是必不可少的,不过,有时候我们会遇到一些麻烦,尤其是当pip的版本较低时,下面我们来看看如何解决这一问题吧
    2025-03-03
  • keras实现多GPU或指定GPU的使用介绍

    keras实现多GPU或指定GPU的使用介绍

    这篇文章主要介绍了keras实现多GPU或指定GPU的使用介绍,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-06-06
  • Django跨域请求原理及实现代码

    Django跨域请求原理及实现代码

    这篇文章主要介绍了Django跨域请求原理及实现代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-11-11
  • Python导入模块的3种方式超级详细讲解

    Python导入模块的3种方式超级详细讲解

    这篇文章主要给大家介绍了关于Python导入模块的3种方式,本文介绍了在Python中使用模块的概念和不同的导入方式,文中通过代码介绍的非常详细,需要的朋友可以参考下
    2023-12-12
  • Python脚本实现datax全量同步mysql到hive

    Python脚本实现datax全量同步mysql到hive

    这篇文章主要和大家分享一下mysql全量同步到hive自动生成json文件的python脚本,文中的示例代码讲解详细,有需要的小伙伴可以参加一下
    2024-10-10
  • 使用python实现简单去水印功能

    使用python实现简单去水印功能

    这篇文章主要为大家详细介绍了使用python实现简单去水印功能,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2022-05-05

最新评论