tslearn,一个实用的 Python 库!

news2024/12/25 23:28:43

更多资料获取

📚 个人网站:ipengtao.com


大家好,今天为大家分享一个实用的 Python 库 - tslearn。

Github地址:https://github.com/tslearn-team/tslearn


在数据科学领域,时间序列分析是一项至关重要的任务,涵盖了诸多领域,如金融、气象、生物学、工业生产等。Python 中的 tslearn 库为时间序列分析提供了丰富的工具和功能,使得用户能够轻松地处理、分析和建模时间序列数据。本文将深入探讨 tslearn 库的特性、用法以及应用场景,并提供丰富的示例代码,帮助更好地理解和应用这一强大工具。

tslearn 是什么?

tslearn 是一个专注于时间序列分析的 Python 库,提供了一系列用于处理时间序列数据的工具和算法。

tslearn 主要特点包括:

  • 提供了丰富的时间序列处理和分析工具,包括距离度量、时间序列降维、时间序列分类和聚类等功能。
  • 支持多种时间序列数据类型和格式,包括等长时间序列、不等长时间序列、多变量时间序列等。
  • 提供了高效的实现和并行计算功能,使得用户能够快速处理大规模时间序列数据。

安装 tslearn 库

要开始使用 tslearn 库,首先需要安装它。

可以通过 pip 来进行安装:

pip install tslearn

安装完成后,就可以开始使用 tslearn 来进行时间序列分析了。

使用示例

1. 加载和可视化时间序列数据

import numpy as np
from tslearn.datasets import UCR_UEA_datasets
import matplotlib.pyplot as plt

# 加载数据集
X_train, y_train, X_test, y_test = UCR_UEA_datasets().load_dataset("TwoPatterns")

# 可视化部分时间序列数据
plt.figure(figsize=(10, 6))
for i in range(5):
    plt.subplot(5, 1, i+1)
    plt.plot(X_train[i].ravel())
    plt.title("Class: {}".format(y_train[i]))
plt.tight_layout()
plt.show()

2. 时间序列降维和可视化

from tslearn.preprocessing import TimeSeriesScalerMeanVariance
from tslearn.shapelets import ShapeletModel
from tslearn.shapelets import grabocka_params_to_shapelet_size_dict

# 时间序列标准化
scaler = TimeSeriesScalerMeanVariance(mu=0., std=1.)  # 标准化
X_train_std = scaler.fit_transform(X_train)

# 训练形状模型
shapelet_sizes = grabocka_params_to_shapelet_size_dict(n_ts=X_train_std.shape[0],
                                                       ts_sz=X_train_std.shape[1],
                                                       n_classes=len(set(y_train)),
                                                       l=0.1, r=1)
shp_clf = ShapeletModel(n_shapelets_per_size=shapelet_sizes,
                        optimizer="sgd", weight_regularizer=0.01,
                        max_iter=200, verbose_level=0)
shp_clf.fit(X_train_std, y_train)

# 可视化形状模型
plt.figure(figsize=(10, 6))
for i, sz in enumerate(shapelet_sizes.keys()):
    plt.subplot(len(shapelet_sizes), 1, i + 1)
    plt.title("%d shapelets of size %d" % (shapelet_sizes[sz], sz))
    for shp in shp_clf.shapelets_:
        if tslearn.utils.common.num_cuts(shp) == sz:
            plt.plot(shp.ravel())
plt.tight_layout()
plt.show()

3. 时间序列分类

from sklearn.metrics import accuracy_score
from tslearn.neighbors import KNeighborsTimeSeriesClassifier

# K最近邻分类器
knn = KNeighborsTimeSeriesClassifier(n_neighbors=1, metric="dtw")
knn.fit(X_train, y_train)

# 预测并评估分类器性能
y_pred = knn.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)

tslearn 库的应用场景

Python tslearn 库是一个专门用于处理时间序列数据的强大工具,提供了丰富的功能和算法,适用于多种应用场景。

1. 时间序列分类

时间序列分类是识别时间序列数据中的不同类别或模式的任务,例如识别运动传感器数据中的不同运动类型。

from tslearn.datasets import CachedDatasets
from tslearn.preprocessing import TimeSeriesScalerMeanVariance
from tslearn.shapelets import ShapeletModel, grabocka_params_to_shapelet_size_dict
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# 加载数据集
X_train, y_train, X_test, y_test = CachedDatasets().load_dataset("Trace")
X_train, X_valid, y_train, y_valid = train_test_split(X_train, y_train, test_size=0.2)

# 标准化时间序列
scaler = TimeSeriesScalerMeanVariance()
X_train = scaler.fit_transform(X_train)
X_valid = scaler.transform(X_valid)
X_test = scaler.transform(X_test)

# 训练形状模型
shapelet_sizes = grabocka_params_to_shapelet_size_dict(n_ts=X_train.shape[0],
                                                       ts_sz=X_train.shape[1],
                                                       n_classes=len(set(y_train)),
                                                       l=0.1, r=1)
shp_clf = ShapeletModel(n_shapelets_per_size=shapelet_sizes,
                        optimizer="sgd", weight_regularizer=0.01,
                        max_iter=200, verbose_level=0)
shp_clf.fit(X_train, y_train)

# 预测并评估分类器性能
y_pred = shp_clf.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)

2. 时间序列聚类

时间序列聚类是将相似的时间序列数据聚集到一起,发现数据中的群集结构和模式的任务,例如识别用户行为数据中的不同行为簇。

from tslearn.clustering import TimeSeriesKMeans
from tslearn.datasets import CachedDatasets

# 加载数据集
X_train, y_train, X_test, y_test = CachedDatasets().load_dataset("Trace")

# 使用 TimeSeriesKMeans 聚类器
km = TimeSeriesKMeans(n_clusters=3, metric="dtw", verbose=True)
y_pred = km.fit_predict(X_train)

# 可视化聚类结果
import matplotlib.pyplot as plt
plt.figure()
for cl in range(3):
    plt.subplot(3, 1, cl + 1)
    for i in range(len(X_train[y_pred == cl])):
        plt.plot(X_train[y_pred == cl][i].ravel(), "k-", alpha=0.3)
    plt.title("Cluster %d" % (cl + 1))
plt.tight_layout()
plt.show()

3. 时间序列降维

时间序列降维是将高维的时间序列数据降低到低维空间的任务,例如可视化高维传感器数据。

from tslearn.datasets import CachedDatasets
from tslearn.preprocessing import TimeSeriesScalerMeanVariance
from tslearn.utils import to_time_series_dataset
from tslearn.shapelets import ShapeletTransform
from sklearn.manifold import TSNE
import matplotlib.pyplot as plt

# 加载数据集
X_train, y_train, X_test, y_test = CachedDatasets().load_dataset("Trace")

# 时间序列标准化
scaler = TimeSeriesScalerMeanVariance()
X_train_scaled = scaler.fit_transform(X_train)

# 将数据转换为时间序列数据集
X_train_ts = to_time_series_dataset(X_train_scaled)

# 应用形状转换器
st = ShapeletTransform(n_shapelets_per_size={20: 5},
                       time_contract_in_mins=0.5)
st.fit(X_train_ts, y_train)

# 降维并可视化
X_train_transformed = st.transform(X_train_ts)
X_embedded = TSNE(n_components=2).fit_transform(X_train_transformed)
plt.scatter(X_embedded[:, 0], X_embedded[:, 1], c=y_train)
plt.colorbar()
plt.title("Shapelet transform of the Trace dataset")
plt.show()

总结

通过本文的介绍,对 tslearn 库有了更深入的了解。tslearn 提供了丰富的功能和工具,使得用户能够轻松地处理和分析时间序列数据。无论是在时间序列分类、聚类、降维还是预测方面,tslearn 都能够为用户提供强大的支持,成为时间序列分析的得力助手。希望本文能够帮助大家更好地掌握 tslearn 库的用法,并将其应用到实际的时间序列分析和建模工作中。


Python学习路线

在这里插入图片描述

更多资料获取

📚 个人网站:ipengtao.com

如果还想要领取更多更丰富的资料,可以点击文章下方名片,回复【优质资料】,即可获取 全方位学习资料包。

在这里插入图片描述
点击文章下方链接卡片,回复【优质资料】,可直接领取资料大礼包。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1520868.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

11个销售心理学方法,帮你搞定老外!销售高手教你第一次见客户聊什么?

PART01 客户的疑问 销售心理学中,站在客户的角度,客户都会有以下几个疑问: 1、你是谁? 2、你要跟我介绍什么? 3、你介绍的产品和服务对我有什么好处? 4、如何证明你介绍的是真实的? 5、为…

Java多线程实战-异步操作日志记录解决方案(AOP+注解+多线程)

🏷️个人主页:牵着猫散步的鼠鼠 🏷️系列专栏:Java全栈-专栏 🏷️本系列源码仓库:多线程并发编程学习的多个代码片段(github) 🏷️个人学习笔记,若有缺误,欢迎评论区指正…

商家转账到零钱 场景模板怎么下载

商家转账到零钱是什么? 【商家转账到零钱】功能整合了微信支付之前的【企业付款到零钱】【批量转账到零钱】功能,支持批量对外转账,对有批量对用户付款需求的应用场景更友好,操作便捷。如果你的应用场景是单付款场景的话&#xf…

数据安全之认识数据库加密系统

文章目录 一、什么是数据库加密系统二、数据库加密系统的工作原理三、数据库加密系统的核心功能四、数据库加密系统的特点和优势五、数据库加密系统的部署方式1、在线透明部署2、旁路代理模式 六、数据库加密系统的应用场景 数据库作为计算机信息系统的核心组成部分&#xff0c…

使用vscode——配置vue3用户代码片段

一、 设置/配置用户代码片段 二、点击新建全局代码片段文件输入vue.json 三、配置代码片段、 {"Print to console": {"prefix": "vue3","body": ["<template>"," <div></div>","</te…

JAVA22 FFM实战之HelloWorld

前言 JDK22即将发布&#xff0c;Java Foreign Function & Memory API将会退出预览&#xff0c;是时候开始学习一波了。 FFM API介绍 FFM API由两大部分组成&#xff0c;一个是Foreign Function Interface&#xff0c;另一个是Memory API。前者是外部函数接口&#xff0c…

数据结构 之 队列(Queue)

​​​​​​​ &#x1f389;欢迎大家观看AUGENSTERN_dc的文章(o゜▽゜)o☆✨✨ &#x1f389;感谢各位读者在百忙之中抽出时间来垂阅我的文章&#xff0c;我会尽我所能向的大家分享我的知识和经验&#x1f4d6; &#x1f389;希望我们在一篇篇的文章中能够共同进步&#xff0…

双指针算法_移动零_

题目&#xff1a; 给定一个数组 num &#xff0c;编写一个函数将数组内部的数字0都移动到数组的末尾&#xff0c;同时保持非零元素的相对顺序&#xff01; 同时不能通过复制数组&#xff0c;开辟新的数组空间的情况下原地对数组进行操作 示例&#xff1a; 本题的原理&#x…

掘根宝典之C++普通迭代器和反向迭代器详解

简介 迭代器是一种用于遍历容器元素的对象。它提供了一种统一的访问方式&#xff0c;使程序员可以对容器中的元素进行逐个访问和操作&#xff0c;而不需要了解容器的内部实现细节。 C标准库里每个容器都定义了迭代器&#xff0c;这迭代器的名字就叫容器迭代器 迭代器的作用类…

谷歌浏览器运行vue项目。 控制台打印cjs.js,如何解决

当浏览器运行vue项目。 控制台打印cjs.js&#xff0c;如何解决 &#xff1a;

oracle基础-子查询 备份

一、什么是子查询 子查询是在SQL语句内的另外一条select语句&#xff0c;也被称为内查询活着内select语句。在select、insert、update、delete命令中允许是一个表达式的地方都可以包含子查询&#xff0c;子查询也可以包含在另一个子查询中。 【例1.1】在Scott模式下&#xff0…

Java项目企业设备管理系统

java项目企业设备管理系统javaweb项目ssm框架项目 运行环境:idea/eclipse tomcat jdk mysql navicat 系统用户分为员工和管理员两类用户。两类用户都可以进行系统的登录&#xff0c;虽然进入的系统主页结构相似&#xff0c;但是在功能上有不同。员工的密码可以自己进入系统后…

DirectShowPlayerService::doSetUrlSource: Unresolved error code 0x800c000d

报出这个问题&#xff0c;应该是对给的url解析不正确&#xff0c;我给的是rtsp的视频流地址&#xff0c;应该是对该格式解析异常。 所以参考两篇文&#xff1a; QT无法播放视频&#xff1a;报错&#xff1a;DirectShowPlayerService::doRender: Unresolved error code 0x8004…

2024年3月16日云仓酒庄广西发布会圆满举行

原标题&#xff1a;云仓酒庄广西发布会圆满举行&#xff0c;致敬经销商团队共谋未来发展 2024年3月16日&#xff0c;备受瞩目的云仓酒庄广西发布会在广西南宁隆重举行。此次发布会旨在感谢广西地区经销商团队的长期支持&#xff0c;并共同推进未来发展蓝图。活动现场氛围热烈&…

总要有一次,为自己疯狂

机会其实不多 最近一口气看了《飞驰人生》以及《飞驰人生2》&#xff0c;过去是以看喜剧的心态去看沈腾的电影&#xff0c;当如今二刷时发现这不就是生活吗&#xff0c;只不过用喜剧的外壳做了层包装。两部电影给我影响最深的就是最后的那段对白&#xff0c;“张弛&#xff0c…

【大模型系列】统一图文理解与生成(BLIP/BLIPv2/InstructBLIP)

文章目录 1 BLIP(2022, Salesforce Research)1.1 简介1.2 数据角度1.3 模型角度1.4 BLIP预训练的目标 2 BLIP2(ICML2023, Salesforce)2.1 简介2.2 模型架构2.3 训练细节 3 InstructBLIP(2023, Salesforce)3.1 指令微调技术(Instruction-tuning)3.2 数据集准备3.3 Instruction-a…

数据结构——动态顺序表

数据结构的动态顺序表有以下几个操作&#xff1a;创建&#xff0c;销毁&#xff0c;初始化&#xff0c;增删查改和打印以及内存空间不够时的扩容 本文的宏定义&#xff1a; #define SeqTypeData int 1.动态顺序表的创建 typedef struct SeqListInit{//动态顺序表的创建SeqT…

双指针算法_复写零

题目&#xff1a; 给一个固定长度的数组arr&#xff0c;将数组中出现的每一个0都复写一遍&#xff0c;并且将其余元素都往右移动 且不要再超过数组长度的位置写入元素&#xff0c;在数组上直接修改 示例&#xff1a; 双数组模拟操作&#xff1a; 从示例来看&#xff0c;因为…

【状态压缩DP】第十三届蓝桥杯省赛C++ B组《积木画》(C++)

【题目描述】 小明最近迷上了积木画&#xff0c;有这么两种类型的积木&#xff0c;分别为 I 型&#xff08;大小为 2 个单位面积&#xff09;和 L 型&#xff08;大小为 3 个单位面积&#xff09;&#xff1a; 同时&#xff0c;小明有一块面积大小为 2N 的画布&#xff0c;画布…

模板进阶:非类型模板参数,特化

一、非类型模板参数 非类型模板参数&#xff0c;就是用一个常量作为 类/函数 的模板参数&#xff0c;在 类/函数 中可以被当成常量使用。 template<class T, size_t N>// N 为一个非类型模板参数 class Stack { public:Stack(){_a new T[N];} protected:T* _a; };int m…