在Python dataframe中出生日期转化为年龄的实现方法

 更新时间:2018年10月20日 09:12:24   作者:技术小能手  
这篇文章主要介绍了在Python dataframe中出生日期转化为年龄的实现方法,非常不错,具有一定的参考借鉴价值,需要的朋友可以参考下

我们在做数据挖掘项目或大数据竞赛时,如果个体是人的时候,获得的数据中可能有出生日期的Series,举个简单例子,比如这样的一些数:

# -*- coding: utf-8 -*-
import pandas as pd
from pandas import Series, DataFrame
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt %matplotlib inline
data = {'birth': ['10/8/00', '7/21/93', '6/14/01', '5/18/99', '1/5/98']}
frame = DataFrame(data)
frame

从数据来看,'10/8/00'之类的数,最左边的数表示月份,中间的数表示日,最后的数表示年度。

实际上我们在分析时并不需要人的出生日期,而是需要年龄,不同的年龄阶段会有不同的状态,比如收入、健康、居住条件等等,且能够很好地把不同样本的差异性进行大范围的划分,而不是像出生日期那样包含信息量过大且在算法训练时不好作为有效数据进行训练,age是一个很好地特征工程指示变量。

那如何把上述birth数据变为年龄age呢?

在这里用到datetime这个库,如下:

(1)首先把birth转化为标准时间格式

frame['birth'] = pd.to_datetime(frame['birth'])
frame

 

(2)获取当前时间的年份,并减去birth的年份

import datetime as dt
now_year =dt.datetime.today().year #当前的年份
frame['age']=now_year-frame.birth.dt.year
frame

在这里使用了dt.datetime.today().year来获取当前日期的年份,然后将birth数据中的年份数据提取出来(frame.birth.dt.year),两者相减就得到需要的年龄数据,如下:

有时候我们可能还会关注到人的出生月份与要预测变量的关系,比如人的星座就是很流行的一种以出生月份、日份来评估其对人的影响,也可以按这种方法去提取月、日数据。

总结

以上所述是小编给大家介绍的在Python dataframe中出生日期转化为年龄的实现方法,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对脚本之家网站的支持!

相关文章

  • python关于变量名的基础知识点

    python关于变量名的基础知识点

    在本篇文章里小编给大家整理的是关于python关于变量名的基础知识点,需要的朋友们可以参考下。
    2020-03-03
  • rsa详解及例题及python算法

    rsa详解及例题及python算法

    RSA公开密钥密码体制的原理是:根据数论,寻求两个大素数比较简单,而将它们的乘积进行因式分解却极其困难,因此可以将乘积公开作为加密密钥,这篇文章主要介绍了rsa 详解及例题及python,需要的朋友可以参考下
    2022-04-04
  • Python类及获取对象属性方法解析

    Python类及获取对象属性方法解析

    这篇文章主要介绍了Python类及获取对象属性方法解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-06-06
  • Python lambda 匿名函数优点和局限性深度总结

    Python lambda 匿名函数优点和局限性深度总结

    这篇文章主要为大家介绍了Python lambda 匿名函数的优点和局限性深度总结,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-08-08
  • django template 模板渲染的实现

    django template 模板渲染的实现

    Django 的模板系统旨在使设计人员能够编写 HTML,同时以一种安全和灵活的方式动态显示数据,本文主要介绍了django template模板渲染的实现,具有一定的参考价值,感兴趣的可以了解一下
    2025-01-01
  • python批量生成身份证号到Excel的两种方法实例

    python批量生成身份证号到Excel的两种方法实例

    这篇文章主要给大家介绍了关于python批量生成身份证号到Excel的两种方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-01-01
  • 如何使用python数据处理解决数据冲突和样本的选取

    如何使用python数据处理解决数据冲突和样本的选取

    这篇文章主要介绍了如何使用python数据处理解决数据冲突和样本的选取,其中主要包括 实际业务数据冲突、样本选取问题、数据共线性等思路
    2021-08-08
  • Python基于paramunittest模块实现excl参数化

    Python基于paramunittest模块实现excl参数化

    这篇文章主要介绍了Python基于paramunittest模块实现excl参数化,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-04-04
  • python logging模块的使用

    python logging模块的使用

    这篇文章主要介绍了python logging模块的使用,帮助大家更好的理解和学习python,感兴趣的朋友可以了解下
    2020-09-09
  • Python使用遗传算法解决最大流问题

    Python使用遗传算法解决最大流问题

    这篇文章主要为大家详细介绍了Python使用遗传算法解决最大流问题,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-01-01

最新评论