论文学习——多度量水文时间序列相似性分析

news2024/10/6 0:35:16

文章目录

  • 摘要
  • 1 研究背景
    • 1.1 主要研究内容
    • 1.2 研究背景
    • 1.3 启发
  • 2 基于改进BORDA投票法的多度量水文时间序列相似性分析
    • 2.1 研究方法
    • 2.2 BORDA投票法的改进
      • 2.2.1 BORDA 的缺点
      • 2.2.2 改进的BORDA投票法
  • 3 实验验证与分析
    • 3.1 实验数据
    • 3.2 实验结果分析
  • 4 结语

多度量组合可以提高相似性分析的准确性。

在这里插入图片描述

摘要

  1. 多度量组合可以提高相似性分析的准确性
  2. 本文方法:首先使用多个单一相似度量分别计算相似时间子序列;然后采用改进的BORDA投票法对各度量分析得到的相似子序列进行组合和排序,得到最终的相似时间子序列。

1 研究背景

1.1 主要研究内容

主要是研究水文时间序列相似性;
目前是k个最近邻水文过程发现,特别是洪水过程的相似性。

1.2 研究背景

众多学者结合水文时间序列的特点,进行了水文时间序列相似性的研究。

  1. 李薇 《水文时间序列相似性查询的分析与研究》
    抽取时间序列的模式特征(包括长度和斜率),然后借鉴动态弯曲的思想定义序列之间的动态模式匹配距离(DPM)

  2. 欧阳如琳《水文时间序列的相似性搜索研究》
    采用DTW距离计算流域内多水文站之间相似性洪水过程,发现流域的洪水过程形态。

  3. 朱跃龙《基于语义相似的水文时间序列相似性挖掘》
    提出基于语义的水文时间序列相似性度量,定义水文时间序列的上升、保持和下降等语义模式,在此基础上,定义序列的语义距离描述序列的相似程度。

在这里插入图片描述

  1. 李士进 《基于BORDA计数法的多元水文时间序列相似性分析》
    针对多维水文时间序列相似性,李士进首先逐维进行一元时间序列相似性分析,然后采用BORDA投票法对各维的相似子序列进行组合和排序,获取多维相似子序列。
    在这里插入图片描述

1.3 启发

目前水文时间序列相似性所示大多采用单一相似度量来评价序列之间的相似性。

[11-12]文献提出多度量相似性分析,采用启发式搜索确定各度量的权重,相似距离为各度量距离的加权和

在这里插入图片描述


2 基于改进BORDA投票法的多度量水文时间序列相似性分析

2.1 研究方法

  • 串行组合处理

  • 并行组合处理

在这里插入图片描述

  • 本文关注h近邻搜索问题,即查询与指定序列最相似的前k个子序列从分类角度来看,k近邻相似搜索可以视为采用相似度量将时间子序列划分为第1相似子序列、第2相似子序列…,第h相似子序列以及不相似子序列。(也就是说,前k个都是相似的,后面都是不相似的)

  • 本文采用改进的BORDA投票法,对多个单一相似度量算法计算得到的相似子序列进行并行组合,得到最终的k近邻子序列。

2.2 BORDA投票法的改进

2.2.1 BORDA 的缺点

本文指定:针对每个投票人的排序,给每个候选人设定一个排序分数,规定排在最后的候选人的排序分数为1分,倒数第2位的候选人为2分,依次类推,排在第1位为p分,候选人的排序分数的累积称为BORDA分数,BORDA分数进入前m名的候选称作BORDA胜者。

BORDA投票法只考虑所有候选人排序先后,没有考虑前后候选人差距的大小,这样可能造成无法计算出真实的排序。【啥意思啊,看不懂啊,候选人差距的大小?感觉根据例子是投票人差距大小吧阿巴阿巴】

如假设,有A、B.C、D四匹马进行四场比赛,四场比赛名次排序分别为:A、B C、D,B、A、D、C,D、C、A、B和C、D、B、A。四匹赛马BORDA分数都为10分,出现了四匹赛马并列第一名的情况,因为BOR-DA投票法仅考虑四匹马的名次排序,而没有考虑各匹马在比赛时成绩的具体差异。

2.2.2 改进的BORDA投票法

在这里插入图片描述
在这里插入图片描述

  • 那么我就自然地提出我的问题了:第一d1 、d2、d3等等是如何确定的?第二 候选人差距是否可以量化是如何确定的?

在这里插入图片描述


在各单一相似度量的查询结果中,出现次数越多,说明其被越多的相似度量认可为相似子序列,其改进BORDA分数将可能越高;若只是在单一相似度量的查询结果靠前,说明可能只是被单一的度量认为是相似子序列,其改进BORDA分数可能不高。

因此,相比于单一相似度量,多度量组合可以在结果中包含参与组合的多个单一相似度量结果中的优秀结果,从而提高相似搜索的准确性。


3 实验验证与分析

  • 为什么选择这一流域的这一个水文站?
    在这里插入图片描述

3.1 实验数据

  • 这里的实验数据介绍的还是很清楚的。

在这里插入图片描述

  • 首先可以看到是11年间的,6-9这四个月的流量数据(标题中的水文序列就是指的是流量序列,水文数据包括了流量数据、水文数据、降水量数据等等),每天是四个检测时间点,也就是说(这里是大概算了一下数据量)11年 * 4个月 * 30天 * 4个时间点 = 5280个数据点 这些数据都是连续的记录型数据,但是要注意的是,这里是洪水过程相似性分析,应该是要对5千个数据点按照一场洪水为单位去划分的,每场洪水大概持续多少天然后大概几十到一百多的流量数据能刻画出一场洪水。

3.2 实验结果分析

  • 这里介绍了查询序列,任务就是在数据库中查询出与之相似的序列。
  • 可以看到这个洪水是7月31日到8月29日,30天*4个数据点,流量序列的长度就是120
    在这里插入图片描述

  • 看表1,这里可以看出洪水的流量序列是被等长切分的,也就是说没有按照单场洪水来划分,而是简单处理成30天的长度,应该是作者想要方便实现和方便计算。

在这里插入图片描述

  • 实验二:双洪峰M型洪水相似性分析

在这里插入图片描述

在这里插入图片描述

  • 分析就不放上来了,无非就是这四种方法不好,然后自己提出的改进BORDA方法好。

4 结语

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/5047.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

关于使用GB28181协议实现与大华摄像机的语音对讲功能小记

目前只测试了与大华摄像机的语音对讲功能,在此记录下对接工程中遇到的问题和收获。 首先我们需要理清下思路: 第一步要熟悉语音对讲的协议流程,下图为国标28181中的参考图: 这里我们可以简化下流程,只参与与摄像机的…

计算机网络第二章知识点回顾(自顶向下)

第二章知识点回顾1.应用层1.1网络应用架构1.1.1客户-服务器架构1.1.2P2P架构1.1.3两种架构的对比1.2不同终端上的进程通信1.3进程与网络的接口:套接字1.4进程如何标识自己:进程编址1.5因特网提供的传输服务小结1.6Web应用画像1.7 HTTP协议1.7.1HTTP使用T…

大数据技术基础实验十三:Kafka实验——订阅推送示例

大数据技术基础实验十三:Kafka实验——订阅推送示例 文章目录大数据技术基础实验十三:Kafka实验——订阅推送示例一、前言二、实验目的三、实验要求四、实验原理1、Kafka简介2、Kafka使用场景五、实验步骤1、配置各服务器之间的免密登录2、安装ZooKeeper…

【C++】优先级队列 priority_queue的使用模拟实现 | 仿函数

🌈欢迎来到C专栏~~优先级队列的使用 & 模拟实现 (꒪ꇴ꒪(꒪ꇴ꒪ )🐣,我是Scort目前状态:大三非科班啃C中🌍博客主页:张小姐的猫~江湖背景快上车🚘,握好方向盘跟我有一起打天下嘞&#xff01…

聚乙二醇衍生物MAL-PEG-NH2,Maleimide-PEG-amine,CAS:1207751-12-9​

英文:MAL-PEG-NH2,Maleimide-PEG-amine 中文:马来酰亚胺-聚乙二醇-氨基 2、CAS编号:1207751-12-9 3、所属分类:Amine PEG Maleimide PEG 4、分子量:可定制,5000、2000、3400、20000、10000、…

【附源码】Python计算机毕业设计汽车租赁网站

项目运行 环境配置: Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术: django python Vue 等等组成,B/S模式 pychram管理等等。 环境需要 1.运行环境:最好是python3.7.7,…

eBPF学习笔记(一)—— eBPF介绍内核编译

eBPF学习笔记(一)—— eBPF介绍&内核编译eBPF介绍eBPF基础代码验证即时编译eBPF开发工具BCCbpftracelibbpf C/C库eBPF Go库内核编译查看内核版本下载内核源码安装依赖项安装最新版llvm和clang配置内核编译内核BPF示例程序常见问题问题一:…

C++ 堆、大顶堆、小顶堆、堆排序

目录一、什么是堆?1.1 大顶堆1.2 小顶堆1.3 自定义greater1.4 堆索引的特点1.5 堆操作添加元素删除最大元素检查序列是否是堆检查部分序列为堆对堆进行排序升序降序问题:sort()和sort_heap()有什么区别二、排序算法:堆排序2.1 堆排序原理创建…

Bootstrap框架(全)

Bootstrap中文网:点我直达 Bootstrap菜鸟教程:点我直达 目录:(一)Bootstrap标准模板:(二)CSS样式区:一、布局容器:二、栅格系统:1.列组合&#x…

<Linux> 软件包管理器yum及编辑器vim的使用

文章目录一、yum的背景知识1. 商业生态2. 开源生态3. 软件生态本土化二、yum 的基本使用1. 查看软件包2. 安装、卸载、搜索软件实现Windows下和Linux下文件互传三、vim的基本使用1. vim 的基本概念2. vim 的基本操作2.1.模式间切换2.2.插入模式2.3.命令模式2.4.底行模式四、vim…

nginx(四十二)access阶段的模块学习

一 ngx_http_access ① 基本描述 场景: 限制某些ip来源的访问;基于ip进行限制细节点: 基于$remote_addr进行判断的 ② allow deny ③ 官方案例 说明: 按照配置文件中allow|deny的先后顺序,只要匹配上则停止继续匹配 ④ 经典应用场…

Rust机器学习之ndarray

Rust机器学习之ndarray 众所周知,Python之所以能成为机器学习的首选语言,与其丰富易用的库有很大关系。某种程度上可以说是诸如numpy、pandas、scikit-learn、matplotlib、pytorch、networks…等一系列科学计算和机器学习库成就了Python今天编程语言霸主…

Vue项目实战——【基于 Vue3.x + NodeJS】实现的课程表排课系统二(week-title)

文章目录基于 Vue3.x NodeJS实现的课程表排课系统(二)初始化样式封装axios处理数据表格头部(周几)子组件写入根组件App.vue浅拿一下数据基于 Vue3.x NodeJS实现的课程表排课系统(二) 初始化样式 src/ass…

当 AI 遇上 web3,会碰撞出什么火花?

2020 年之前,Web3 的路是创造者们铺好的。但 Web3 遇上了金融,这出乎了每个创造者的意料之外,稳定币、AMM 和借贷突其来地点燃了2020年的那个夏天。之后 Web3 又遇到了 NFT、游戏和元宇宙。不过因为技术限制,除了金融之外&#xf…

AVL树详解(附带旋转步骤图,手把手带你上分)

文章目录👍 AVL树的概念先了解一下😁AVL树节点的定义😊AVL树插入节点🤞AVL树为什么要旋转😍AVL树的四种旋转左单旋右单旋左右双旋右左双旋❤️结语关于AVL树的讲解 👍 AVL树的概念先了解一下 它的左右子树…

Scala005--Scala中的数据结构【集合】之数组

Scala中的数据结构和Java中一样,都有数组,列表,集合,映射。在Scala中与Java不同的是数组可以有可变数组,而不是一旦定义就不可以进行更改。我们来认识数组,并使用相应的代码去查看具体的实现效果。 目录 …

Linux命令从入门到实战 ----进程管理

文章目录kill终止进程pstree查看进程树netstat网络状态和端口占用信息crontab定时任务进程(process): 是正在执行的一个程序或命令,每一个进程都是一个运行的实体,都有自己的地址空间,并占用一定的系统资源 服务(service):启动之后…

深度学习 Day 18——利用卷神经网络实现猫狗识别 Ⅱ

深度学习 Day 18——利用卷神经网络实现猫狗识别 Ⅱ 文章目录深度学习 Day 18——利用卷神经网络实现猫狗识别 Ⅱ一、前言二、我的环境三、前期工作1、导入依赖项并设置GPU2、导入数据四、数据预处理1、加载数据2、检查数据3、配置数据集并进行归一化处理4、可视化数据五、构建…

xv6源码解析(三)——内存管理

01 内存管理 内存管理:通过编写物理页分配器,以链表管理所有空闲页帧, 实现了对物理页帧的回收与分配;在xv6系统sbrk内存管理方式的基础上,添加了进程用户空间非连续分区的分配。 内存管理参考链接 mmap 02 sbrk机制…

猿创征文|【Linux】Linux中的gdb调试器的使用

目录 一、什么是gdb? 二、gdb的安装 三、gdb的使用 1、只有debug版可以被调试 2、gdb的常用指令 2.1显示代码:l指令(list指令) 2.2设置断点:b指令(break指令) 2.3显示断点/禁用断点/开启…