大数据实验三

news2024/12/29 2:03:42

Python and anaconda

实验三数据预处理和轨迹聚类参考地址:

https://www.hifleet.com/wp/communities/data/hangyundashujujishukechengshiyanzhinanshujuyuchulijiguijijuleichixugengxinzhong#post-2212
https://www.hifleet.com/wp/communities/data/hangyundashujujishukechengshiyanzhinanshujuyuchulijiguijijuleichixugengxinzhong#post-2025

相关anaconda以及python环境配置

https://blog.csdn.net/hold_time/article/details/144631254?spm=1001.2014.3001.5501

1.Python环境配置

1.1下载anaconda,Pycharm

1.2Pycharm虚拟环境创建

在这里插入图片描述
在这里插入图片描述
到这里anaconda环境已经创建好了,并且能够在终端环境下进行conda。可以看到的是已经pycharm终端已经为anaconda环境了,python解释器也是默认到该虚拟环境下的python.exe解释器

1.3 conda基本操作

1.3.1 信息查看

conda info -e

在这里插入图片描述

1.3.2 下载源修改为清华源

修改镜像源为下图所示,不然下载速度很慢:
这个可以查看conda的镜像源

conda config --show channels

在这里插入图片描述
给conda添加国内镜像源

  conda config --add channels   https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/pro
  conda config --add channels   https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free
  conda config --add channels   https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys2
  conda config --add channels   https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r
  conda config --add channels   https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
  conda config --add channels   https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/condaconda config --add channels  forge/
  conda config --add channels   https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
  conda config --add channels   https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/

1.3.3 虚拟环境创建,开启,关闭

在base的conda虚拟环境中可以创建虚拟conda环境

conda create -n yolov11

这边也可以修改为指定位置创建
注意win11默认生成的虚拟环境在C:\Users\Admin.conda\envs
如果想要创建虚拟环境再指定的文件位置,使用以下命令,比如我想在D盘中的.conda/envs路径下创建虚拟环境

conda create --prefix=D:/.conda/envs/yolov11 python=3.9
或者
conda create --p D:/.conda/envs/yolov11 python=3.9

激活conda环境

conda activate D:/.conda/envs/yolov11

移除conda 环境

conda remove --p D:/.conda/envs/yolov11 --all

这是时候环境名就是这个路径D:/.conda/envs/yolov11

虚拟环境开启与关系

conda activate anaconda_env_foryolov11

在这里插入图片描述
虚拟环境关闭

conda deactivate

虚拟环境移除
移除conda 环境

conda remove yolov11

2.数据预处理

AIS数据,584,463行,涉及1000个不同航次下的298条船的轨迹数据,,除了表提供的动态字段,还包含voyage_id和length,
分别是航次编号和船舶长度
在这里插入图片描述
通过QGIS显示去噪前显示,通过QGIS进行Point to path,依照这个船舶的id,voyage_id进行连接成线,如下图所示
在这里插入图片描述
再Clean.py下面增加以下代码

if __name__ == "__main__":
    sample_ais_path="sample_ais_15.csv"
    sample_ais=pd.read_csv(sample_ais_path,usecols=["mmsi","updatetime","lon","lat","course","speed","length","voyage_id"])
    #print(sample_ais)
    sample_ais["updatetime"]=pd.to_datetime(sample_ais["updatetime"])#把ais中的updatetime列读取过来的数据转换成datatime格式
    preprocess_lst=[]#预处理为空
    for name,group in sample_ais.groupby("voyage_id"):#按照船舶的id进行分组排序
        #其中name是组的值,也就是voyage_id,group是书每组的数据帧
        group = group.reset_index(drop=True)
        #移除重复行
        group = group.drop_duplicates(subset=["lon","lat","course","speed"],keep="last").reset_index(drop=True)
        #速度speed明显异常的数据超过30标记为nan
        group.loc[group[group["speed"] > 30].index, "speed"] = np.nan
        # group["speed"] = group.groupby("voyage_id")["speed"].transform(lambda x: x.fillna(method="ffill"))
        group["speed"] = group.groupby("voyage_id")["speed"].transform(lambda x: x.ffill())
        preprocess_lst.append(group)
    preprocess_ais=pd.concat(preprocess_lst).reset_index(drop=True)
    preprocess_ais.to_csv('preprocess_ais.csv', index=False)

处理后为584,139行

2.1 轨迹分段

在这里插入图片描述
分段前
在这里插入图片描述
分段后

在这里插入图片描述

2.2 去噪

去噪后

2.3 压缩

在这里插入图片描述

3.聚类

聚类族

"voyage_id" ||'_'||"label"

在这里插入图片描述

regexp_substr("group",'_([a-z]+)')

在这里插入图片描述
在这里插入图片描述
效果如图所示
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2267203.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【python因果库实战14】因果生存分析3

标准化生存分析 参见《因果推断》一书第17.5节(“参数化的g公式”)。 在参数化标准化中,也称为“参数化g公式”,时间步k处的生存率是对协变量X水平和处理分配a条件下的条件生存率的加权平均,权重为每个分层中个体的比…

云边端一体化架构

云边端一体化架构是一种将云计算、边缘计算和终端设备相结合的分布式计算模型。该架构旨在通过优化资源分配和数据处理流程,提供更高效、更低延迟的服务体验。 下面是对这个架构的简要说明: 01云计算(Cloud Computing) — 作为中心…

C/C++ 数据结构与算法【哈夫曼树】 哈夫曼树详细解析【日常学习,考研必备】带图+详细代码

哈夫曼树(最优二叉树) 1)基础概念 **路径:**从树中一个结点到另一个结点之间的分支构成这两个结点间的路径。 **结点的路径长度:**两结点间路径上的分支数。 **树的路径长度:**从树根到每一个结点的路径…

2、C#基于.net framework的应用开发实战编程 - 设计(二、三) - 编程手把手系列文章...

二、设计; 二.三、构建数据库; 此例子使用的是SQLite数据库,所以数据库工具用的SQLiteStudio x64,这个是SQLite专用的数据库设计管理工具,其它的数据库管理工具比如DBeaver的使用请见实战工具系列文章。 1、…

Edge SCDN酷盾安全重塑高效安全内容分发新生态

在数字化浪潮不断推进的今天,互联网内容的分发效率与安全性已成为企业业务发展的关键要素。酷盾安全推出的Edge Secure Content Delivery Network(Edge SCDN),不仅集成了分布式DDoS防护、CC防护、WAF防护及BOT行为智能分析等安全加…

JAVA HTTP压缩数据

/*** 压缩数据包** param code* param data* param resp* throws IOException*/protected void writeZipResult(int code, Object data, HttpServletResponse resp) throws IOException {resp.setHeader("Content-Encoding", "gzip");// write到客户端resp…

工厂+策略模式之最佳实践(疾病报卡维护模块API设计)

目录 💻业务场景 🔧应用技术 ⚙概要流程 ❗开发注意 服务类上标注了 自定义注解 却无法直接利用getDeclaredAnnotation 获取 *Spring代理机制 代理机制的工作原理 代理的工作机制 代理的使用场景 已获取EmrXXXServiceImpl 的Class,如…

帧缓存的分配

帧缓存实际上就是一块内存。在 Android 系统中分配与回收帧缓存,使用的是一个叫 ION 的内核模块,App 使用 ioctl 系统调用后,会在内核内存中分配一块符合要求的内存,用户态会拿到一个 fd(有的地方也称之为 handle&…

StarRocks元数据无法合并

一、先说结论 如果您的StarRocks版本在3.1.4及以下,并且使用了metadata_journal_skip_bad_journal_ids来跳过某个异常的journal,结果之后就出现了FE的元数据无法进行Checkpoint的现象,那么选择升级版本到3.1.4以上,就可以解决。 …

图像处理-Ch2-空间域的图像增强

Ch2 空间域的图像增强 文章目录 Ch2 空间域的图像增强Background灰度变换函数(Gray-level Transformation)对数变换(Logarithmic)幂律变换(Power-Law)分段线性变换函数(Piecewise-Linear)对比度拉伸(Contrast-Stretching)灰度级分层(Gray-level Slicing) 直方图处理(Histogram …

c# 2024/12/27 周五

6《详解类型、变量与对象》36 详解类型、变量与对象 _1_哔哩哔哩_bilibili

云手机+Facebook:让科技与娱乐完美结合

移动互联网时代,Facebook作为全球最大的社交媒体平台之一,早已成为企业、品牌和组织竞相角逐的营销阵地。而云手机的出现,则为Facebook营销注入了新的活力,其独特的优势让营销活动更加高效、精准且灵活。本文将深入探讨云手机在Fa…

【蓝桥杯——物联网设计与开发】拓展模块4 - 脉冲模块

目录 一、脉冲模块 (1)资源介绍 🔅原理图 🔅采集原理 (2)STM32CubeMX 软件配置 (3)代码编写 (4)实验现象 二、脉冲模块接口函数封装 三、踩坑日记 &a…

【再谈设计模式】享元模式~对象共享的优化妙手

一、引言 在软件开发过程中,我们常常面临着创建大量细粒度对象的情况,这可能会导致内存占用过高、性能下降等问题。享元模式(Flyweight Pattern)就像是一位空间管理大师,它能够在不影响功能的前提下,有效地…

Unity 读Excel,读取xlsx文件解决方案

Unity读取表格数据 效果: 思路: Unity可以解析Json,但是读取Excel需要插件的帮助,那就把这个功能分离开,读表插件就只管读表转Json,Unity就只管Json解析,中间需要一个存储空间,使用…

WebRTC服务质量(11)- Pacer机制(03) IntervalBudget

WebRTC服务质量(01)- Qos概述 WebRTC服务质量(02)- RTP协议 WebRTC服务质量(03)- RTCP协议 WebRTC服务质量(04)- 重传机制(01) RTX NACK概述 WebRTC服务质量(…

STM32完全学习——FATFS0.15移植SD卡

一、下载FATFS源码 大家都知道使用CubMAX可以很快的将,FATFS文件管理系统移植到单片机上,但是别的芯片没有这么好用的工具,就需要自己从官网下载源码进行移植。我们首先解决SD卡的驱动问题,然后再移植FATFS文件管理系统。 二、SD…

Ollama+OpenWebUI+llama3本地部署

引言 llama3在4月19日刚刚发布,官方的对比结果中在开源模型中堪称世界第一,整好周六日有时间,在魔搭社区上测试一下 2 安装Ollama 2.1 下载Ollama 登录Ollama官网下载Ollama安装包 GitHub:https://github.com/ollama/ollama?t…

新品:SA628F39大功率全双工音频传输模块

SA628F39是一款高集成度的8W大功率全双工无线数据语音一体通话模块,专为高效、稳定的远程通信设计。该模块内置高速微控制器、高性能射频芯片、功率放大器、ESD静电保护和硬件看门狗芯片,具备反接保护、过流过压保护和防死机保护等多重安全功能&#xff…

Unity EasyAR入门教程

文章目录 Easy不用下载盗版安装SDK注册应用ID最简单的识别注意点 Easy不用下载盗版 EasyAR可以免费试用,如果不在乎水印,直接去官网下载即可 EasyAR官网 安装SDK 先下载,官网找到下载页,如下选择 下载后不是普通的unityPackag…