《Pandas 简易速速上手小册》第6章:Pandas 时间序列分析(2024 最新版)

在这里插入图片描述

文章目录

  • 6.1 时间序列数据基础
    • 6.1.1 基础知识
    • 6.1.2 重点案例:股票市场分析
    • 6.1.3 拓展案例一:温度变化分析
    • 6.1.4 拓展案例二:电商平台日销售额分析
  • 6.2 日期与时间功能
    • 6.2.1 基础知识
    • 6.2.2 重点案例:活动日志分析
    • 6.2.3 拓展案例一:工作日计算
    • 6.2.4 拓展案例二:股票市场交易日数据重采样
  • 6.3 时间序列的高级应用
    • 6.3.1 基础知识
    • 6.3.2 重点案例:金融市场趋势分析
    • 6.3.3 拓展案例一:能源消耗季节性分析
    • 6.3.4 拓展案例二:零售销售的扩展窗口分析

6.1 时间序列数据基础

时间序列数据是在连续时间点或者时间段上收集的数据点,常用于分析趋势、做出预测等。

6.1.1 基础知识

  1. 时间戳和时间间隔: 时间戳代表某一具体的瞬间,而时间间隔则表示一段时间。
  2. 解析时间数据: 通常需要将字符串格式的时间数据转换成 Python 的 datetime 对象以便处理。
  3. 设置时间索引: 在 Pandas 中,将时间数据设置为 DataFrame 的索引可以方便地进行时间序列分析。

6.1.2 重点案例:股票市场分析

假设你有一份股票市场的历史数据,包含日期和当日的收盘价,你需要分析股价随时间的变化趋势。

数据准备

import pandas as pd

# 示例股票市场数据
stock_data = {
    'date': ['2023-01-01', '2023-01-02', '2023-01-03', '2023-01-04'],
    'close_price': [100, 105, 103, 108]
}
stock_df = pd.DataFrame(stock_data)

处理时间序列数据

# 将字符串日期转换为 datetime 对象
stock_df['date'] = pd.to_datetime(stock_df['date'])

# 将日期设置为索引
stock_df.set_index('date', inplace=True)

6.1.3 拓展案例一:温度变化分析

假设你有一份每日温度记录数据,需要分析温度随时间的变化。

数据准备

# 示例温度记录数据
temperature_data = {
    'date': ['2023-01-01', '2023-01-02', '2023-01-03', '2023-01-04'],
    'temperature': [22, 23, 21, 24]
}
temperature_df = pd.DataFrame(temperature_data)

处理时间序列数据

# 将字符串日期转换为 datetime 对象并设置为索引
temperature_df['date'] = pd.to_datetime(temperature_df['date'])
temperature_df.set_index('date', inplace=True)

6.1.4 拓展案例二:电商平台日销售额分析

分析一份电商平台每日销售额数据,观察销售额随时间的变化。

数据准备

# 示例电商平台销售数据
sales_data = {
    'date': ['2023-01-01', '2023-01-02', '2023-01-03', '2023-01-04'],
    'daily_sales': [2000, 3000, 2500, 3200]
}
sales_df = pd.DataFrame(sales_data)

处理时间序列数据

# 将日期转换为 datetime 对象并设置为索引
sales_df['date'] = pd.to_datetime(sales_df['date'])
sales_df.set_index('date', inplace=True)

通过这些案例,我们展示了如何处理和分析时间序列数据。从股市趋势分析到温度变化观察,再到电商销售额的时间分析,掌握时间序列数据的基础操作是进行这些分析的关键。

在这里插入图片描述


6.2 日期与时间功能

在时间序列分析中,处理和操作日期与时间是常见的需求。Pandas 提供了丰富的日期与时间功能,使得这些操作变得简单。

6.2.1 基础知识

  1. Datetime 类型: Pandas 使用 datetime64 类型来处理日期和时间。可以使用 pd.to_datetime() 将字符串转换成 datetime64 类型。
  2. 时间索引: 设置时间索引后,可以使用时间索引来选择、过滤和重采样数据。
  3. 时间偏移和频率: Pandas 允许使用时间偏移和频率来进行日期计算,如加减天数、找到下一个月的开始等。

6.2.2 重点案例:活动日志分析

假设你有一份网站的活动日志,记录了每次活动的日期和时间,你需要分析特定时间段内的活动。

数据准备

import pandas as pd

# 示例活动日志数据
log_data = {
    'timestamp': ['2023-01-01 12:00', '2023-01-01 12:30', '2023-01-02 13:00', '2023-01-02 14:00'],
    'activity': ['login', 'view', 'purchase', 'logout']
}
log_df = pd.DataFrame(log_data)

处理时间序列数据

# 将字符串转换为 datetime 对象
log_df['timestamp'] = pd.to_datetime(log_df['timestamp'])

# 设置时间索引
log_df.set_index('timestamp', inplace=True)

# 选择特定日期的活动
activities_on_first = log_df['2023-01-01']

6.2.3 拓展案例一:工作日计算

计算一个时间范围内的工作日总数。

数据准备

# 定义一个时间范围
date_range = pd.date_range(start='2023-01-01', end='2023-01-31')

计算工作日

# 计算工作日
workdays = date_range.to_series().map(lambda x: 0 if x.weekday() >= 5 else 1).sum()

6.2.4 拓展案例二:股票市场交易日数据重采样

假设你有一份股票市场的日交易数据,需要按周计算平均交易量。

数据准备

# 示例股票市场交易数据
trade_data = {
    'date': pd.date_range(start='2023-01-01', periods=30),
    'volume': pd.np.random.randint(1000, 5000, size=30)
}
trade_df = pd.DataFrame(trade_data).set_index('date')

重采样计算周平均交易量

# 按周重采样并计算平均交易量
weekly_avg_volume = trade_df.resample('W').mean()

通过这些案例,我们展示了如何利用 Pandas 的日期与时间功能进行分析,从处理具体的活动日志到计算工作日总数,再到重采样股票市场交易数据。掌握这些技巧,你可以更灵活地处理时间序列数据,提取有价值的时间维度信息。

在这里插入图片描述


6.3 时间序列的高级应用

探索时间序列数据的高级应用可以帮助我们深入理解数据的时间维度,从而做出更准确的分析和预测。

6.3.1 基础知识

  1. 时间序列缺失数据处理: 时间序列数据可能会有缺失值,处理方法包括填充和插值。
  2. 重采样和频率转换: 通过改变时间序列的频率(如从日到月),可以更好地分析趋势。
  3. 滚动窗口和扩展窗口操作: 滚动窗口(rolling window)操作允许我们计算如移动平均等统计量,扩展窗口(expanding window)则从时间序列起点累积到当前点。

6.3.2 重点案例:金融市场趋势分析

假设你有一份金融市场的每日股价数据,需要分析股价的移动平均趋势。

数据准备

import pandas as pd
import numpy as np

# 示例股价数据
date_range = pd.date_range(start='2023-01-01', periods=90)
stock_prices = np.random.normal(100, 10, size=90).cumsum()
stock_df = pd.DataFrame({'price': stock_prices}, index=date_range)

处理时间序列数据

# 计算7日移动平均
stock_df['7_day_avg'] = stock_df['price'].rolling(window=7).mean()

# 计算30日移动平均
stock_df['30_day_avg'] = stock_df['price'].rolling(window=30).mean()

6.3.3 拓展案例一:能源消耗季节性分析

分析一份每小时记录的能源消耗数据,观察消耗量的季节性变化。

数据准备

# 示例能源消耗数据
hours_in_year = pd.date_range(start='2023-01-01', periods=8760, freq='H')
energy_consumption = np.random.normal(50, 15, size=8760).cumsum()
energy_df = pd.DataFrame({'consumption': energy_consumption}, index=hours_in_year)

季节性分析

# 按月重采样计算平均能源消耗
monthly_avg_consumption = energy_df.resample('M').mean()

6.3.4 拓展案例二:零售销售的扩展窗口分析

假设你有一份零售商每日销售额的数据,需要分析自年初以来销售额的累计总和。

数据准备

# 示例零售销售数据
days_in_year = pd.date_range(start='2023-01-01', periods=365)
daily_sales = np.random.randint(1000, 5000, size=365)
sales_df = pd.DataFrame({'sales': daily_sales}, index=days_in_year)

扩展窗口分析

# 计算累计销售额
sales_df['cumulative_sales'] = sales_df['sales'].expanding().sum()

通过这些案例,我们展示了时间序列数据分析的高级应用,包括处理缺失数据、重采样、以及滚动和扩展窗口操作。这些技巧可以帮助我们深入理解数据的时间维度,从而做出更准确的分析和预测。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/363843.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

022 do while循环

什么是do while循环 int i 0; do {System.out.println(i);i; } while (i < 100); 具体使用场景 int i; Scanner scanner new Scanner(System.in); do {System.out.print("请输入一个整数&#xff0c;如果为负数则结束循环&#xff1a;");i scanner.nextInt(…

基于极大似然法和最小二乘法系统参数辨识matlab仿真,包含GUI界面

目录 1.程序功能描述 2.测试软件版本以及运行结果展示 3.核心程序 4.本算法原理 1.极大似然法系统参数辨识 2. 最小二乘法系统参数辨识 5.完整程序 1.程序功能描述 分别对比基于极大似然法的系统参数辨识以及基于最小二乘法的系统参数辨识&#xff0c;输出起参数辨识收敛…

Scrum敏捷研发管理全流程/scrum管理工具

Leangoo领歌是一款永久免费的专业的敏捷开发管理工具&#xff0c;提供端到端敏捷研发管理解决方案&#xff0c;涵盖敏捷需求管理、任务协同、进展跟踪、统计度量等。 Leangoo领歌上手快、实施成本低&#xff0c;可帮助企业快速落地敏捷&#xff0c;提质增效、缩短周期、加速创新…

二进制、原码、反码、补码

一、 二进制在运算中的说明 二、原码、反码、补码 1、二进制的最高位是符号位&#xff1a;0表示正数&#xff0c;1表示负数 2、正数的原码、反码、补码相同&#xff08;三码合一&#xff09; 3、负数的反码它的原码符号位不变&#xff0c;其它位取反&#xff08;0变1,1变0&…

【leetcode】20. 有效的括号

有效的括号 题目链接 // 栈结构 typedef char valuetype; typedef struct {valuetype* arr;int top;int capacity; } Stack;void Init(Stack* stack);void Push(Stack* stack, valuetype value); void Pop(Stack* stack);valuetype Top(Stack* stack); int Size(Stack* stack…

数据结构+算法(第06篇):再不会“降维打击”你就Out了!

作者简介&#xff1a;大家好&#xff0c;我是smart哥&#xff0c;前中兴通讯、美团架构师&#xff0c;现某互联网公司CTO 联系qq&#xff1a;184480602&#xff0c;加我进群&#xff0c;大家一起学习&#xff0c;一起进步&#xff0c;一起对抗互联网寒冬 学习必须往深处挖&…

各类型判空操作

开发中经常遇到需要判空的地方&#xff0c;比如对字符串进行判空操作。 而有时候工具包太多不知道用哪个。 就像下图&#xff0c;光一个 StringUtils 就有十几个包弹出来。 怎么选&#xff1f; 其实用哪个都行。 最重要的是&#xff1a; 有一套自己用的顺手的工具。 或者…

Java基础数据结构之ArrayList源码分析

一.几个常量 这是默认容量 这两个是共享的空对象 这是真正存储元素的地方&#xff0c;现在还没有分配内存 二.构造方法 这是一个无参构造方法&#xff0c;此时让存储元素的数组指向了那个默认容量数组&#xff0c;此时该数组是一个空数组&#xff0c;长度为0. 这是给定初始容量…

C#使用OpenCvSharp4库读取电脑摄像头数据并实时显示

一、OpenCvSharp4库 OpenCvSharp4库是一个基于.Net封装的OpenCV库&#xff0c;Github源代码地址为&#xff1a;https://github.com/shimat/opencvsharp&#xff0c;里面有关于Windows下安装OpenCvSharp4库的描述&#xff0c;如下图所示&#xff1a; 二、C#使用OpenCvSharp4库…

杂题——试题-算法训练-P0604-runaround数

分析&#xff1a; 题目有三个关键点&#xff1a; 一&#xff1a;结束时&#xff0c;回到起始位置&#xff08;比较结束时和起始时的下标位置是否相同&#xff09;二&#xff1a;该整数的所有数字都必须遍历一遍&#xff0c;且只能遍历一遍&#xff08;把遍历过的数字做个标记&a…

【前端-VUE+TS】Vue3组件化-知识补充(六)

一. 动态组件 比如我们现在想要实现了一个功能&#xff1a; 点击一个tab-bar&#xff0c;切换不同的组件显示&#xff1b; 案例截图 这个案例我们可以通过两种不同的实现思路来实现&#xff1a; 方式一&#xff1a;通过v-if来判断&#xff0c;显示不同的组件&#xff1b;方式二…

周润发节俭,排队买廉价盒饭,身价56亿由此省出。

♥ 为方便您进行讨论和分享&#xff0c;同时也为能带给您不一样的参与感。请您在阅读本文之前&#xff0c;点击一下“关注”&#xff0c;非常感谢您的支持&#xff01; 文 |猴哥聊娱乐 编 辑|徐 婷 校 对|侯欢庭 周润发裸捐数十亿&#xff0c;但生活中的他却极度节俭。每一分…

基于SSM的高校社团管理系统

末尾获取源码作者介绍&#xff1a;大家好&#xff0c;我是墨韵&#xff0c;本人4年开发经验&#xff0c;专注定制项目开发 更多项目&#xff1a;CSDN主页YAML墨韵 我欲乘风归去 又恐琼楼玉宇 高处不胜寒 -苏轼 目录 一、项目简介 二、开发技术与环境配置 2.1 SSM框架 2.2 …

UGUI中Text和TextMeshPro实现图文混排方式

一些项目中实现图文混排是自定义一个脚本去继承Text类&#xff0c;然后文本中用富文本的方式进行图片和超链接的定义&#xff0c;在代码中用正则表达式匹配的方式把文本中图片和超链接给替换&#xff0c;如下&#xff1a; TextMeshPro实现是生成SpriteAsset进行图文混排的&…

杂题——试题 算法训练 试题3971 丑数

分析&#xff1a; 判断一个数 n 是否是丑数&#xff0c;分成三个部分 1、寻找因数&#xff0c;从2遍历到 n&#xff0c;如果该数 i 是 n 的因数&#xff0c;就进入下一步2、判断 i 是否是质数&#xff0c;这部分代码直接套用即可&#xff0c;见得较多3、最后判断 i 是否等于2或…

2024 springboot Mybatis-flex 打包出错

Mybatis-flex官网&#xff1a;快速开始 - MyBatis-Flex 官方网站 从 Mybatis-flex官网获取模板后&#xff0c;加入自己的项目内容想打包确保错&#xff0c;先试试一下方法 这里改成skip的默认是true改成false&#xff0c;再次打包就可以了

ATFX汇市:鲍威尔否认3月降息,晚间英央行决议大概率按兵不动

ATFX汇市&#xff1a;今日3:00&#xff0c;美联储公布利率决议结果&#xff0c;维持5.5%的联邦基金利率不变&#xff0c;美元指数五分钟内上涨0.19%&#xff0c;最高触及103.51点。半小时后的3:30&#xff0c;美联储主席鲍威尔开始讲话&#xff0c;美元指数分钟级别剧烈下跌&am…

【服务端性能测试】测试方案设计(实操需要准备的内容)

一般性能测试流程都是&#xff1a;获取测试需求——>测试需求分析——>测试方案设计——>压测环境搭建&#xff08;目前是线上&#xff09;——>测试数据准备——>测试脚本准备、调试——>测试脚本执行——>监控数据录入——>测试结果跟开发一起分析—…

设计模式——模板方法模式(Template Method Pattern)

概述 模板方法模式&#xff1a;定义一个操作中算法的框架&#xff0c;而将一些步骤延迟到子类中。模板方法模式使得子类可以不改变一个算法的结构即可重定义该算法的某些特定步骤。模板方法模式是一种基于继承的代码复用技术&#xff0c;它是一种类行为型模式。模板方法模式是结…

TCP 协议的相关特性

1. TCP格式 TCP特性&#xff1a;有连接&#xff0c;全双关&#xff0c;面向字节流&#xff0c;可靠传输。&#xff08;TCP安身立命的本钱&#xff0c;初心就是解决“可靠传输”问题&#xff09; 其实TCP的特征有很多这里我就简单的介绍几个。 2. 确认应答 其实用来确保可靠性&…