开启你的时间序列分析之旅：一步步教你学会HyperTS

news2026/2/16 8:51:56

前言

HyperTS是一个开源的时间序列分析库，主要用于处理和分析时间序列数据。

一、HyperTS介绍

HyperTS是一个开源的时间序列分析库，是 DataCanvas Automatic Toolkits(DAT) 针对于时间序列任务推出了一款涵盖自动机器学习(AutoML) 与自动深度学习(AutoDL) 的全Pipeline学习工具。主要用于处理和分析时间序列数据。它提供了一系列功能强大的工具和算法，它涵盖了数据清洗、数据预处理、特征工程、模型选择、超参数优化、模型评估、预测可视化等一系列自动化的操作, 轻松几行代码便可以完全端到端地处理多种场景下的时间序列任务。

以下是关于HyperTS的一些详细介绍：

HyperTS支持常见的时间序列分析任务，如平滑、滞后、差分等。它提供了一系列的函数和方法，可以方便地对时间序列数据进行处理和转换。例如，你可以使用smooth函数对时间序列进行平滑处理，使用lag函数对时间序列进行滞后处理。
HyperTS提供了多种特征提取方法，用于从时间序列中提取有用的特征。这些特征可以用于构建机器学习模型和预测任务。例如，你可以使用autocorrelation函数计算自相关系数，使用fft函数进行快速傅里叶变换，以及使用wavelet函数进行小波变换。
HyperTS支持多种常见的时间序列模型，如ARIMA、GARCH、VAR等。这些模型可以用于时间序列的建模和预测。例如，你可以使用arima函数建立ARIMA模型，使用garch函数建立GARCH模型，以及使用var函数建立VAR模型。
HyperTS还提供了一些评估指标和可视化工具，用于评估模型的性能和结果的可视化。例如，你可以使用mse函数计算均方误差，使用plot函数绘制时间序列的图表。

总的来说，HyperTS是一个功能强大的时间序列分析库，可以帮助你处理和分析时间序列数据。你可以使用它进行时间序列的预处理、特征提取、模型建立和预测等任务。

HyperTS的功能特性清单如下：
在这里插入图片描述

二、HyperTS安装、使用

2-1、安装

安装：

pip install prophet
pip install hyperts

可能会发生的是Numpy版本的一个兼容问题，更新Numpy：

pip install --upgrade numpy

**其他:可选择安装tensorflow **：

# 如果使用到深度学习时，需要安装
pip install tensorflow

2-2、HyperTS使用

主要是通过make_experiment函数来训练一个模型：

在这里插入图片描述

Time Series Task：确定时间序列任务是什么，输入规范后的数据，确定相对应的模型。
make_experiment：通过make_experiment函数的训练，run之后最终得到了一个训练好的模型。
predict、evaluate：使用训练好的模型，去做预测任务、评估模型性能以及作图等。

三、案例

3-0、通用工作流程

通用工作流程：

导入所需要的库
加载数据集
使用train_test_split来分割训练集和验证集。
使用make_experiment函数来创建实验，确定任务、数据、模型，进行训练，run之后得到训练后的模型。
评估模型。

其他注意事项：

对于划分训练集和测试集，由于数据存在时间上的先后顺序，因此为了防止信息的泄露，我们设置shuffle=False，即不打乱数据集。

3-1、时间序列预测

时间序列预测：在时间序列任务中，我们除了按照惯例的流程外，我们还需要向make_experiment中传入参数timestamp，即指定时间戳。如果存在协同变量，我们也需要指定协同变量covariates。

from hyperts import make_experiment
from hyperts.datasets import load_network_traffic

from sklearn.model_selection import train_test_split

data = load_network_traffic()
train_data, test_data = train_test_split(data, test_size=0.2, shuffle=False)

model = make_experiment(train_data.copy(),
                        task='multivariate-forecast',
                        mode='stats',
                        timestamp='TimeStamp',
                        covariates=['HourSin', 'WeekCos', 'CBWD']).run()

X_test, y_test = model.split_X_y(test_data.copy())
# 使用predict方法来执行结果的预测。
y_pred = model.predict(X_test)

scores = model.evaluate(y_test, y_pred)

model.plot(forecast=y_pred, actual=test_data)

输出：
在这里插入图片描述

3-2、时间序列分类

from hyperts import make_experiment
from hyperts.datasets import load_basic_motions

from sklearn.metrics import f1_score
from sklearn.model_selection import train_test_split

data = load_basic_motions()
train_data, test_data = train_test_split(data, test_size=0.2)

model = make_experiment(train_data.copy(),
                        task='classification',
                        mode='dl',
                        tf_gpu_usage_strategy=1,
                        reward_metric='accuracy',
                        max_trials=30,
                        early_stopping_rounds=10).run()

X_test, y_test = model.split_X_y(test_data.copy())

y_pred = model.predict(X_test)
y_proba = model.predict_proba(X_test)

scores = model.evaluate(y_test, y_pred, y_proba=y_proba, metrics=['accuracy', 'auc', f1_score])

print(scores)

输出：
在这里插入图片描述

3-3、时间序列异常检测

from hyperts import make_experiment
from hyperts.datasets import load_real_known_cause_dataset

from sklearn.model_selection import train_test_split

data = load_real_known_cause_dataset()
ground_truth = data.pop('anomaly')

detection_length = 15000
train_data, test_data = train_test_split(data, test_size=detection_length, shuffle=False)

model = make_experiment(train_data.copy(),
                        task='detection',
                        mode='stats',
                        reward_metric='f1',
                        max_trials=30,
                        timestamp='timestamp',
                        early_stopping_rounds=10).run()

X_test, _ = model.split_X_y(test_data.copy())
y_test = ground_truth.iloc[-detection_length:]

y_pred = model.predict(X_test)
y_proba = model.predict_proba(X_test)

scores = model.evaluate(y_test, y_pred, y_proba=y_proba)

model.plot(y_pred, actual=test_data, history=train_data, interactive=False)

输出：

在这里插入图片描述

四、高级应用

4-1、模型的保存和加载

模型的保存：

model.save(model_file="./xxx/xxx/models")

# 或者是
from hyperts.utils.models import load_model

pipeline_model = load_model(model_file="./xxx/xxx/models/dl_models")

模型的加载：

from hyperts.utils.models import load_model

pipeline_model = load_model(model_file="./xxx/xxx/models/dl_models")

参考文章：
HyperTS官方文档.
github.

总结

明天是端午节啦~ 想她🥹

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/670497.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

开启你的时间序列分析之旅：一步步教你学会HyperTS

目录

前言

一、HyperTS介绍

二、HyperTS安装、使用

2-1、安装

2-2、HyperTS使用

三、案例

3-0、通用工作流程

3-1、时间序列预测

3-2、时间序列分类

3-3、时间序列异常检测

四、高级应用

4-1、模型的保存和加载

总结

相关文章

K8S 云集群安装纯享版 - 傻瓜式一键教程全自动脚本文件

【计算机视觉】CVPR 2023 上的分割论文真的是神仙打架（介绍前12篇，图像分割，全景分割，语义分割，实例分割）

CUDA介绍

SIFT算法简介

腾讯安全杨光夫：企业需改变“头痛医头”现状，构建持续进化的安全免疫力

【MySQL】MVCC是如何解决快照读下的幻读问题的

StarRocks 统一 OLAP 引擎在滴滴的探索实践

随风摇曳的她——美蕨（matlab实现）

Idea批量删除空行

fl studio for window 21.0.3.3517 官方中文版免费下载及新功能介绍

每隔一段时间重试，重试n次 java 工具类

ASP.NET Core 依赖注入系列一

剑指offer45 把数组排成最小的数

Selenium教程__使用switch_to.window方法处理窗口切换（12）

CMake 编译并链接动态库

Python基础（20）——Python函数讲解二

pytest和ValueError: Expect x to not have duplicates（个人笔记）

Bean属性校验

软考A计划-系统集成项目管理工程师-信息化系统的生命周期-下

Mysql数据库操作总结