【数据挖掘】时间序列教程【二】

news2024/10/5 14:01:49

2.4 示例:颗粒物浓度

        在本章中,我们将使用美国环境保护署的一些空气污染数据作为运行样本。该数据集由 2 年和 5 年空气动力学直径小于或等于 3.2017 \(mu\)g/m\(^2018\) 的颗粒物组成。

        我们将特别关注来自两个特定监视器的数据,一个在加利福尼亚州弗雷斯诺,另一个在密苏里州圣路易斯。

        以下是随时间绘制的数据外观。

        首先,尝试描述这些时间序列,考虑到我们对它们的了解(很少):

  • 它们是2017-2018年美国两个城市空气污染水平的每日时间序列。

  • 加利福尼亚州弗雷斯诺系列的总体平均值似乎高于密苏里州圣路易斯系列。

  • 弗雷斯诺系列似乎比圣路易斯系列更“尖锐”。

  • 在弗雷斯诺,似乎有一种季节性趋势;从1月到7月水平稳步上升,之后变化较大,下降幅度较大;一般来说,夏季较高,冬季较低。

  • 圣路易斯系列在全年的水平上似乎非常稳定;没有任何强烈的上升或下降趋势,似乎也没有表现出强烈的季节性

        当然,我们有数据,因此我们可以尝试验证其中一些说法。

        每个城市的总体均值和方差值。

# A tibble: 2 x 3
  city           mean variance
  <chr>         <dbl>    <dbl>
1 Fresno, CA    10.6      74.5
2 St. Louis, MO  9.07     17.0

我们可以使用季度平均值来检查季节性趋势。

# A tibble: 8 x 4
# Groups:   city [2]
  city          season  mean    sd
  <chr>          <int> <dbl> <dbl>
1 Fresno, CA         1  6.81  7.69
2 Fresno, CA         2  7.73  3.09
3 Fresno, CA         3 15.1  10.1 
4 Fresno, CA         4 12.5   9.06
5 St. Louis, MO      1  9.16  4.25
6 St. Louis, MO      2  8.47  3.56
7 St. Louis, MO      3 10.3   4.19
8 St. Louis, MO      4  8.52  4.26

从这里我们可以看到弗雷斯诺的平均增长直到第三季度,然后略有下降。圣路易斯的平均值实际上在第二季度略有下降,然后在第三季度回升。请注意,该列显示数据的标准偏差,而不是平均值的标准偏差。sd

我们可以表示上表的另一种(可以说更好)方法是作为总体平均值和偏差。

# A tibble: 8 x 4
# Groups:   city [2]
  city          season overall     dev
  <chr>          <int>   <dbl>   <dbl>
1 Fresno, CA         1   10.6  -3.76  
2 Fresno, CA         2   10.6  -2.84  
3 Fresno, CA         3   10.6   4.53  
4 Fresno, CA         4   10.6   1.94  
5 St. Louis, MO      1    9.07  0.0912
6 St. Louis, MO      2    9.07 -0.599 
7 St. Louis, MO      3    9.07  1.18  
8 St. Louis, MO      4    9.07 -0.546 

在这里,很明显哪些季节“低于平均水平”,哪些季节高于平均水平。

到目前为止,我们已经根据以下方面对上述数据进行了表征:

  • 随时间变化的线性趋势(增加和减少)

  • 季节性,随时间推移的年度时期

  • 随时间变化的总体水平(平均值)

  • 随时间变化(辣度)

这四个特征可能看起来简单而基本,但它们是理解许多时间序列结构的关键组成部分。

2.5 趋势-季节-残差分解

常用的探索性工具是将时间序列分解为

  1. 平滑的长期趋势

  2. 季节变化

  3. 残差变化

查看长期趋势和季节性变化的主要好处是它们是高度可解释的并且非常普遍。

检查时间序列的趋势、季节和残差是许多时间序列分析中关键任务的开始,即时间尺度分析

2.6 示例:过滤捐赠支出规则

大学捐赠基金通常面临两个相互冲突的目标。一方面,期望它们永远持续下去,以便为后代学生提供支持。但是,另一方面,他们有望为在校学生提供支持。前一个目标建议专注于承诺更高长期回报的风险较高的投资,而后一个目标建议专注于能够提供稳定收入(但从长远来看可能会被通货膨胀超越)的保守投资。

        典型的大学捐赠基金有一个目标支出率,大约是从捐赠基金中提取并转移到大学运营预算的总捐赠基金的百分比。目标利率通常在捐赠价值的4%-6%之间。两种极端策略是

  1. 每年准确支出捐赠基金的目标比率(例如4%)。这一策略显然完全实现了目标利率,但使大学的运营预算受到股票和债券市场每年潜在剧烈波动的影响。由于大学无法合理地每年大幅削减和提高员工工资,因此这样的捐赠支出策略将使预算计划变得困难。

  2. 每年花费固定金额(根据通货膨胀进行调整),无论捐赠价值如何。这种策略为支出计划带来了稳定性,但完全忽略了捐赠基金市场价值的潜在收益或损失。如果捐赠基金增加,大学可能会错过投资新的和令人兴奋的领域的机会。如果捐赠基金下降(例如2008-2009年美国经济衰退期间的急剧下降),大学可能会超支并损害捐赠基金的长期健康。

        一些大学(最著名的是耶鲁大学捐赠基金)采用的一种策略是互补滤波器,有时被称为指数平滑。这里的想法是获取当前和过去观测值的加权平均值,并在新数据传入时将其纳入其中。

        假设(y_1,y_2 \dots,y_{t-1} )是截至 (t-1 )年的年度捐赠市场价值,并设\(x_1,x_2,\dots,x_{t-1},)是大学从捐赠基金到 (t-1 )年度花费的年度金额。目标是确定在时间  t 花费多少捐赠基金,即我们对 (x_t )的估计是多少?

        互补滤波方法基本上采用两种极端方法之间的加权平均值。使用固定支出规则,我们对年份 \(t\) 的预测为x_t^{t-1} = (1+\alpha) x_{t-1} ,其中 \alpha是通货膨胀率,因此对于 2% 的通货膨胀率,\alpha = 0.02 。一旦我们观察了捐赠基金市场价值 y_t(除了y_{t-1},y_{t-2}\dots ),我们应该如何更新我们的估计?如果\beta 是目标支出率(例如,4% 的支出规则有\beta=0.04 ),那么严格的支出规则将使大学支出\beta y_t   在t 年。

        互补过滤器的工作原理如下。给定一个调优参数\lambda\in( 0, 1)  ,

                x_t = x_t^{t-1} + (1 - \lambda)( \beta y_t - x_t^{t-1} )  

        这种方法在新数据 y_t出现时合并了它们,但也将这些数据拉向固定支出规则的整体稳定性。显然,如果\lambda=0 ,我们只是遵循严格的支出规则,而如果 \lambda=1,我们遵循固定支出规则。因此,互补过滤器既允许极端支出规则,也允许介于两者之间的许多支出规则。

        下图是耶鲁捐赠基金如果坚持每年花费市值4%的(假设的)严格支出规则,他们将花费多少钱。捐赠基金的市场价值数据取自耶鲁捐赠基金的年度报告。

     虽然在18年期间似乎普遍增加,但在2008年至2009年期间支出急剧下降,在此期间出现了严重的衰退。这一损失约为260. 亿美元,即使对于耶鲁这样的大型大学来说,这也是每年的巨大变化。另一方面,从2006年到2007年,大幅增加约180亿美元。虽然这种支出的增加似乎是有益的,但很难负责任地在一年内将如此大幅度的增加纳入预算。

        上图显示了基于严格的 4% 支出规则(“严格”)、与通货膨胀挂钩的固定支出规则(“固定”)以及使用带有\lambda = 0.8   的补充过滤器(“筛选”)的过滤支出规则的支出模式。显然,过滤规则相对于捐赠基金的年度市场价值支出不足,但比固定规则更接近于跟踪它,并消除了市场价值的大部分变化。

        互补滤波器在这里的应用有时在工程应用中被称为“传感器融合”。一般的想法是,我们希望“融合”两种类型的测量。一个来自固定支出规则,该规则非常流畅和可预测,但不能适应市场条件。另一个严格按照市场价值支出,但每年都非常嘈杂。严格的支出规则在某种意义上不那么有偏见(因为它直接针对支出规则),但噪音更大。固定支出规则基本上没有噪音,但随着时间的推移变得非常有偏见。

        通常,互补滤波器使我们能够利用噪声测量的无偏性以及偏置测量的平滑性。这个想法的推广将表述为卡尔曼滤波器,在后面的章节中描述。互补滤波器的另一个好处是它非常简单,除了乘法和加法之外,不需要任何复杂的计算。虽然当计算可以在功能强大的计算机上完成时,这不是问题,但在嵌入式应用程序中非常重要,在这些应用程序中,算法通常在非常小或低容量的计算机(例如Arduino或Raspberry Pi)上实现。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/705349.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

认识GCC

GNU GNU是Linux系统下的一些工具包&#xff0c;GNU是GNU is Not Unix的缩写&#xff0c;因为当年Unix收费后&#xff0c;理查德马修斯托曼打算做一套GNU操作系统&#xff0c;当时GNU的工具包已经写好&#xff0c;就差内核即可组装成一个完整的操作系统&#xff0c;正好Linux写…

跨链 vs 多链

跨链 dApp 可以在部署在多个不同区块链上的多个不同智能合约上运行&#xff0c;而多链 dApp 则可以在不同网络上以多个单独的版本部署。 由于对区块空间的需求不断增加&#xff0c;Web3 应用层现在存在于数百个不同的区块链、二层网络和应用链上。这种现实催生了两个新术语——…

【教程】解决php微擎中的goto加密解密,一键解密工具

今天&#xff0c;我将向大家揭秘一款神奇的工具——goto解密工具&#xff0c;轻松解密这个看似棘手的问题。 无数开发者都曾因为php中的goto功能而头疼不已。goto解密工具其中之一就是解密goto代码。通过精妙的算法和强大的解析能力&#xff0c;它能够解密被goto加密的代码段&…

Vue项目设置网站小徽标

一、预期效果 自定义Vue项目的网站小徽标&#xff0c;用于显示网站的logo&#xff0c;效果大致如下 二、制作 .ico文件 2.1 打开比特虫官网 比特虫官网&#xff1a;https://www.bitbug.net/ 2.2 操作步骤如图 三、引入Vue项目 3.1 将生成的 .ico文件放入我们的 Vue 项目 3.…

servlet+JSP与SpringBoot+Vue项目交互——servlet请求SpringBoot接口

问题 servletJSP与SpringBootVue项目交互——servlet请求SpringBoot接口 详细问题 笔者前一段时间开发一个项目&#xff0c;使用的技术框架是servletJSP&#xff0c;现阶段开发的项目技术框架为SpringBootVue&#xff0c;笔者现在需要输入servletJSP请求SpringBoot接口&…

C语言编程—递归

递归指的是在函数的定义中使用函数自身的方法。 举个例子&#xff1a;从前有座山&#xff0c;山里有座庙&#xff0c;庙里有个老和尚&#xff0c;正在给小和尚讲故事呢&#xff01;故事是什么呢&#xff1f;"从前有座山&#xff0c;山里有座庙&#xff0c;庙里有个老和尚&…

2024考研408-计算机组成原理第六章-总线学习笔记

文章目录 前言初识总线一、总线概述1.1、总线的概述1.1.1、认识总线1.1.2、设计总线需要的特性1.1.3、总线的分类①按照数据传输格式分&#xff08;串行、并行&#xff09;②按照总线功能连接的总线&#xff08;片内总线、系统总线、通信总线&#xff09;③按照时序控制方式&am…

css新特性(五)

css基础&#xff08;一&#xff09;css基础&#xff08;一&#xff09;_上半场结束&#xff0c;中场已休息&#xff0c;下半场ing的博客-CSDN博客Emmet语法Emmet语法_上半场结束&#xff0c;中场已休息&#xff0c;下半场ing的博客-CSDN博客css基础&#xff08;二&#xff09;c…

Retrofit注解

1. 注解类型 Retrofit路径结合的规则 2. 网络请求方法 2.1 Get请求 完整地址&#xff1a;http://mock-api.com/2vKVbXK8.mock/getUserInfo?iduserid 2.1.1 Query 创建Retrofit实例必须传入baseurl(http://mock-api.com/2vKVbXK8.mock/)&#xff0c;在GET("getUserIn…

Android跨平台语言分析

跨平台技术发展的三个阶段 第一阶段是混合开发的web容器时代 为了解决原生开发的高成本、低效率&#xff0c;出现了Hybrid混合开发原生中嵌入依托于浏览器的WebViewWeb浏览器中可以实现的需求在WebView中基本都可以实现但是Web最大的问题是&#xff0c;它的性能和体验与原生开发…

Mybatis面试题--MyBatis执行流程

首先我们知道Mybatis是目前最流行的持久层框架&#xff0c;当我们了解了执行流程&#xff0c;可以让我们理解各个组件的关系&#xff0c;以及Sql的执行过程&#xff08;参数映射、sql解析、执行和结果处理&#xff09; 1首先我们需要读取框架的核心配置文件 2接下来我们就要去操…

chatgpt赋能python:Python编程的好玩儿之处:介绍几个有趣的Python程序

Python编程的好玩儿之处&#xff1a;介绍几个有趣的Python程序 Python已经成为了一种非常受欢迎的编程语言&#xff0c;除了其在Web开发和数据科学领域的应用&#xff0c;它还能够完成很多好玩儿的事情&#xff01;接下来&#xff0c;我将介绍几个有趣的Python程序&#xff0c…

【零基础入门学习Python---Python多线程和多进程】

&#x1f680; Python &#x1f680; &#x1f332; 算法刷题专栏 | 面试必备算法 | 面试高频算法 &#x1f340; &#x1f332; 越难的东西,越要努力坚持&#xff0c;因为它具有很高的价值&#xff0c;算法就是这样✨ &#x1f332; 作者简介&#xff1a;硕风和炜&#xff0c;…

基于SpringBoot+vue前后端分离的相机销售系统

文章目录 项目介绍主要功能截图&#xff1a;首页相机详情个人中心 部分代码展示设计总结项目获取方式 &#x1f345; 作者主页&#xff1a;Java韩立 &#x1f345; 简介&#xff1a;Java领域优质创作者&#x1f3c6;、 简历模板、学习资料、面试题库【关注我&#xff0c;都给你…

Centos7.9 磁盘分区、挂载

常用命令&#xff1a; fdisk /dev/vdb 创建分区 mkfs.ext2 /dev/vdb3 文件系统&#xff08;ext2&#xff0c;ext4&#xff0c;xfs&#xff09;格式化 mkfs.ext4 /dev/vdb3 mkfs.xfs /dev/vdb3 df -T 命令查看格式化是否成功&#xff08;要先把分区挂载到目录&#xff0c;否则df…

18. WebGPU 计算着色器

本文接续基础知识文章。我们将从一些基本的计算着色器开始&#xff0c;然后希望继续讨论解决现实世界问题并写一些示例。 在上一篇文章中&#xff0c;制作了一个非常简单的计算着色器&#xff0c;可以将数字加倍。 这是着色器 group(0) binding(0) var<storage, read_wri…

Java安装

Java Downloads | Oracle 一直往下拉 配置环境变量 第二部分&#xff1a;idea旗舰版下载安装配置 1. 字号 file-settings-editor-font-23 &#xff0c;还有菜单字号

边坡变形监测主要用到哪些仪器

在建筑行业中&#xff0c;边坡安全问题一直备受关注&#xff0c;尤其是在地质灾害频发地区。为了预防和控制边坡失稳&#xff0c;降低对人民生命财产的危害&#xff0c;保障工程建设的顺利进行&#xff0c;边坡变形监测工作就显得尤为的重要。边坡变形监测仪器可以实时动态监测…

GSM模块(SIM900)详解

GSM模块&#xff08;SIM900&#xff09; 0. GSM概述1. 常用的GSM模块2. SIM900系列3. STM32使用SIM900系列通信方法AT指令示例代码 0. GSM概述 GSM&#xff08;全球系统移动通信&#xff09;是一种数字移动通信技术&#xff0c;是世界上最常用的移动通信标准之一。它是由欧洲电…

[Unity][疑难杂症]Mac电脑打开工程unity attempt to write a readonly database

报错的根本原因&#xff1a; 你Unity项目所在的硬盘&#xff0c;格式不是MacOS或者APFS格式&#xff0c;我的是ExFAT所以报这个错。 可能出现的问题&#xff1a; 1、删除unity项目中的c#之类的文件就会报错&#xff0c;并且强制退出 2、新项目压根打不开&#xff0c;在生成资源…