Pandas中的日期时间date处理小结

 更新时间:2025年04月26日 10:30:53   作者:请一直在路上  
Pandas提供了强大的日期和时间处理功能,本文主要介绍了Pandas中的日期时间date处理小结,具有一定的参考价值,感兴趣的可以了解一下

Pandas提供了强大的日期和时间处理功能,这对于时间序列分析至关重要。本教程将介绍Pandas中处理日期时间的主要方法。包括:

  • 日期时间数据的创建和转换
  • 日期时间属性的提取
  • 时间差计算和日期运算
  • 重采样和频率转换
  • 时区处理
  • 基于日期时间的索引操作

Pandas中的日期时间类型

  • 时间戳(timestamp):表示的是一个特定的时刻,比如 2008 年 8 月 8 日下午午 8:00。
  • 时间周期(period):引用特定开始和结束点之间的时间长度;例如,2015 年。时间段通常引用时间间隔的特殊情况,其中每个间隔具有统一的长度并且不重叠(例如,构成每天的 24 小时长的时间段)。
  • 时间增量或间隔(timedelta):引用确切的时间长度(例如,间隔为 22.56 秒)。

1. 创建日期时间数据

1.1 使用to_datetime()函数

import pandas as pd

# 将字符串转换为datetime
date_str = ['2023-01-01', '2023-01-02', '2023-01-03']
dates = pd.to_datetime(date_str)
print(dates)

1.2 创建日期范围

# 创建日期范围
date_range = pd.date_range('2023-01-01', periods=5, freq='D')
print(date_range)

# 带有时区的日期范围
date_range_tz = pd.date_range('2023-01-01', periods=5, freq='D', tz='Asia/Shanghai')
print(date_range_tz)

2. 访问日期时间属性

# 创建示例DataFrame
df = pd.DataFrame({
    'date': pd.date_range('2023-01-01', periods=5, freq='D'),
    'value': [10, 20, 30, 40, 50]
})

# 提取年、月、日等属性
df['year'] = df['date'].dt.year
df['month'] = df['date'].dt.month
df['day'] = df['date'].dt.day
df['day_of_week'] = df['date'].dt.dayofweek  # 周一=0, 周日=6
df['day_name'] = df['date'].dt.day_name()
df['is_weekend'] = df['date'].dt.dayofweek >= 5

print(df)

3. 日期时间运算

3.1 时间差计算

# 计算时间差
df['date_diff'] = df['date'] - df['date'].shift(1)
print(df[['date', 'date_diff']])

# 使用Timedelta进行时间运算
df['date_plus_2days'] = df['date'] + pd.Timedelta(days=2)
df['date_plus_3hours'] = df['date'] + pd.Timedelta(hours=3)
print(df)

3.2 日期比较

# 日期比较
start_date = pd.to_datetime('2023-01-02')
df['after_start_date'] = df['date'] > start_date
print(df[['date', 'after_start_date']])

4. 重采样和时间频率转换

# 创建示例时间序列数据
ts = pd.Series(
    [1, 2, 3, 4, 5],
    index=pd.date_range('2023-01-01', periods=5, freq='D')
)

# 降采样(低频) - 计算每周平均值
weekly = ts.resample('W').mean()
print("Weekly resample:\n", weekly)

# 升采样(高频) - 填充缺失值
hourly = ts.resample('H').ffill()
print("Hourly resample (forward fill):\n", hourly.head(10))  # 只显示前10行

5. 时区处理

# 本地化时区
ts = pd.Series(
    [1, 2, 3],
    index=pd.date_range('2023-01-01', periods=3, freq='D')
)
ts = ts.tz_localize('UTC')
print("UTC timezone:\n", ts)

# 时区转换
ts_shanghai = ts.tz_convert('Asia/Shanghai')
print("Shanghai timezone:\n", ts_shanghai)

6. 日期时间索引操作

# 设置日期为索引
df.set_index('date', inplace=True)

# 按年份切片
print(df.loc['2023'])

# 按月份切片
print(df.loc['2023-01'])

# 按日期范围切片
print(df.loc['2023-01-02':'2023-01-04'])

7. 实际应用示例

# 读取包含日期时间的数据
# 假设有一个CSV文件包含日期列
# df = pd.read_csv('data.csv', parse_dates=['date_column'])

# 处理缺失日期
full_date_range = pd.date_range(start=df.index.min(), end=df.index.max(), freq='D')
df = df.reindex(full_date_range)

# 填充缺失值
df['value'] = df['value'].fillna(method='ffill')  # 前向填充

# 计算滚动平均值
df['7_day_avg'] = df['value'].rolling(window='7D').mean()

print(df.head(10))

8. 高级技巧

8.1 自定义工作日历

from pandas.tseries.offsets import CustomBusinessDay
from pandas.tseries.holiday import USFederalHolidayCalendar

# 使用美国联邦假日日历
us_bd = CustomBusinessDay(calendar=USFederalHolidayCalendar())
date_range = pd.date_range('2023-01-01', periods=10, freq=us_bd)
print("US business days only:\n", date_range)

8.2 季度数据处理

# 创建季度数据
quarterly = pd.Series(
    [100, 200, 300, 400],
    index=pd.date_range('2023-01-01', periods=4, freq='Q')
)

# 季度开始和结束日期
print("Quarter start:\n", quarterly.index)
print("Quarter end:\n", quarterly.index + pd.offsets.QuarterEnd())

到此这篇关于Pandas中的日期时间date处理小结的文章就介绍到这了,更多相关Pandas 日期时间date内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家! 

相关文章

  • python opencv实现图像矫正功能

    python opencv实现图像矫正功能

    这篇文章主要为大家详细介绍了python opencv实现图像矫正功能,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2022-08-08
  • python根据list重命名文件夹里的所有文件实例

    python根据list重命名文件夹里的所有文件实例

    今天小编就为大家分享一篇python根据list重命名文件夹里的所有文件实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-10-10
  • 使用Python批量生成PPT版荣誉证书的示例代码

    使用Python批量生成PPT版荣誉证书的示例代码

    使用Python处理PPT文件通常需要使用第三方库来简化对PPT文件的读取、写入和修改操作,本文将给大家介绍一个小案例,使用Python批量生成PPT版荣誉证书,感兴趣的同学跟着小编一起来看看吧
    2023-08-08
  • 通过淘宝数据爬虫学习python scrapy requests与response对象

    通过淘宝数据爬虫学习python scrapy requests与response对象

    本文主要介绍了通过淘宝数据爬虫学习python scrapy requests与response对象,首先从Resquest和Response对象开始展开详细文章,需要的小伙伴可以参考一下
    2022-05-05
  • Python切片操作深入详解

    Python切片操作深入详解

    这篇文章主要介绍了Python切片操作,结合实例形式详细深入的分析了Python切片操作的原理、参数属性、相关函数及操作注意事项,需要的朋友可以参考下
    2018-07-07
  • 基于Python制作一个全自动微信清粉小工具

    基于Python制作一个全自动微信清粉小工具

    在当今社交软件中,微信是最常用的通讯工具之一,这篇文章主要为大家介绍了一个使用 Python 和 uiautomator2 库编写的微信清粉工具,希望对大家有所帮助
    2024-12-12
  • Python工厂函数用法实例分析

    Python工厂函数用法实例分析

    这篇文章主要介绍了Python工厂函数用法,结合实例形式分析了Python工厂函数的概念、功能、使用方法及相关注意事项,需要的朋友可以参考下
    2018-05-05
  • Python调用Ollama本地大模型API的完全指南

    Python调用Ollama本地大模型API的完全指南

    Ollama 是一个开源工具,允许开发者在本地轻松运行主流大语言模型,这篇文章主要介绍了Python调用Ollama本地大模型API的相关方法,文中的示例代码讲解详细,感兴趣的小伙伴可以了解下
    2026-03-03
  • 一篇文章带你了解Python的进程,线程和协程

    一篇文章带你了解Python的进程,线程和协程

    这篇文章主要为大家介绍了Python的进程,线程和协程,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望能够给你带来帮助
    2022-01-01
  • python离线安装requests模块并且在pycharm中实现使用

    python离线安装requests模块并且在pycharm中实现使用

    文章主要介绍了如何在Python中离线安装requests模块及其依赖包,包括手动下载安装包、验证安装以及在PyCharm中配置解释器以正确识别安装的模块
    2025-11-11

最新评论