Day6 —— 电商日志数据分析项目部署流程

news2024/10/6 6:05:01

项目二 _____(电商日志数据分析项目)

项目部署过程

以IDEA 2023版本为例

步骤一:创建一个空项目,命名为demo_2,并指定语言类型和构建工具,这里选择Java和Maven,选择自己的JDK版本,推荐使用1.8,在下方的Advanced Setting中的GroupId以及ArtifactId默认即可,点击Create创建。

在这里插入图片描述

在IDEA上方File—>New—>Project可以找到创建New Project。

在这里插入图片描述

创建成功如图所示,这里的Main.java可以删除。

在这里插入图片描述

在pom.xml文件中加入新的Hadoop依赖,点击右上角进行刷新。

在这里插入图片描述

加载成功会出现如下的图示。

在这里插入图片描述

我们需要导入本地的maven路径,这应该是在创建完项目后就要进行的,
点击File—>Settings。

在这里插入图片描述

在最上方搜索框输入maven,或者在Build,Execution,Deployment—>Build Tools—>Maven,在Maven home path设置自己的maven安装路径,User setting file 首先点击一下Override,然后选择自己maven路径下中的conf文件夹下的settings.xml文件,Local repository 新建一个文件夹作为本地仓库地址,命名为localRepository。

在这里插入图片描述

在src—>main—>java—>org—>example目录下,创建一个名为PageCount的Java Class,如图所示。

在这里插入图片描述

并向其中填写代码。

在这里插入图片描述

在编写ETL解析代码之前,我们需要导入工具类,复制粘贴即可,注意导入目录

在这里插入图片描述

继续创建一个名为ETL和PageProvince的Java Class,并向其中填入代码。

在这里插入图片描述
在这里插入图片描述

点击IDEA右侧栏中的maven—>Lifecycle—>package,进行打包。

在这里插入图片描述

在下方出现BUILD SUCCESS,表示打包成功。

在这里插入图片描述

在生成的target目录中包含demo_2-1.0-SNAPSHOT.jar就是我们的目的jar包

在这里插入图片描述

将jar包上传到Linux操作系统的本地上,通过Xftp工具,Windows路径(左侧)为你生成的jar包路径,Linux路径(右侧)就是你操作系统的当前路径,点击一下即可上传。

在这里插入图片描述

上传成功后,可以通过ls命令或者ll命令在当前目录下找到上传的jar包

在这里插入图片描述

进行在Linux中操作运行,
通过命令start-all.sh,启动Hadoop集群,
并通过命令hdfs dfs -put /trackinfo_20130721.txt /pageFlum将需要处理的数据文件上传到HDFS上。

首先需要创建/pageFlum目录,hdfs dfs -mkdir /pageFlum,
通过命令hadoop jar demo_2-1.0-SNAPSHOT.jar org.example.PageCount /pageFlum 运行jar包。

之后ETL类和PageProvince类分别运行,通过修改org.example后的类名即可。
hadoop jar demo_2-1.0-SNAPSHOT.jar org.example.ETL /pageFlum
hadoop jar demo_2-1.0-SNAPSHOT.jar org.example.PageProvince /ETL/etl

在output/PageCountOut查看结果文件part-r-00000,即为统计页面浏览量的结果
在ETL/etl查看结果文件part-r-00000,即为日志ETL解析结果
在output/PageProvinceOut查看结果文件part-r-00000,即为省份浏览量的结果

相关依赖

<dependencies>
        <!-- https://mvnrepository.com/artifact/org.apache.hadoop/hadoop-client -->
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-client</artifactId>
            <version>3.2.0</version>
        </dependency>
    </dependencies>

<groupId>:指定依赖的组织ID,这里是 org.apache.hadoop,表示 Apache Hadoop 组织。

<artifactId>:指定依赖的项目ID,这里是 hadoop-client,表示 Apache Hadoop 的客户端库。

<version>:指定依赖的版本号,这里是 3.2.0,表示您要使用的 Apache Hadoop 客户端库的版本是 3.2.0。

运行结果截图

统计页面浏览量

在这里插入图片描述

日志的ETL操作

在这里插入图片描述

统计各个省份的浏览量

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1853003.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

oracle 主从库中,从库APPLIED为YES ,但是主库任然为NO

主库 从库 从库已经APPLIED但是主库为APPLIED&#xff0c; 主数据库和备用数据库之间的ARCH-RFS心跳Ping负责更新主数据库上v$archived_log的APPLICED列。 在主数据库上有一个指定的心跳ARCn进程来执行此Ping。如果此进程开始挂起&#xff0c;它将不再与远程RFS进程通信&#…

2024-06-23 编译原理实验4——中间代码生成

文章目录 一、实验要求二、实验设计三、实验结果四、附完整代码 补录与分享本科实验&#xff0c;以示纪念。 一、实验要求 在词法分析、语法分析和语义分析程序的基础上&#xff0c;将C−−源代码翻译为中间代码。 要求将中间代码输出成线性结构&#xff08;三地址代码&#…

STM32F103ZET6基于HAL库实现CAN回环测试和中断接收

简介 在野火STM32F103ZET6开发板上基于HAL库实现了CAN回环测试&#xff0c;并通过PCAN客户端工具和串口打印的方式&#xff0c;分别验证了CAN数据发送成功和CAN数据中断接收成功。 STM32F1开发板测试 STM32测试程序 发送函数 /** 函数名&#xff1a;CAN_SetMsg* 描述 &am…

Windows安全中心打开白屏的解决方法

Windows安全中心打开白屏的解决方法&#xff1a; 1. 复制以下内容&#xff0c;打开记事本粘贴并保存&#xff0c;同时将记事本文件的【txt后缀名改为reg】: Windows Registry Editor Version 5.00 &#xff3b;HKEY_LOCAL_MACHINE\SOFTWARE\Policies\Microsoft\Windows Defende…

RTA_OS基础功能讲解 2.10-调度表

RTA_OS基础功能讲解 2.10-调度表 文章目录 RTA_OS基础功能讲解 2.10-调度表一、调度表简介二、调度表配置2.1 同步三、到期点配置四、启动调度表4.1 绝对启动4.2 相对启动4.3 同步启动五、到期点处理六、停止调度表6.1 重新启动被停止的调度表七、切换调度表八、选择同步策略8.…

NSIS 入门教程 (三)

引言 在教程的第二部分中&#xff0c;我们为安装程序增加了一个卸载程序&#xff0c;并查看了一些其他的向导页面以及安装部分的选择。第三部分的目标是使安装程序的外观更加现代化。 更现代的外观 为了给安装程序一个更现代的外观&#xff0c;我们要启用现代用户界面。要提…

UnityShader——基础篇之UnityShader基础

UnityShader基础 UnityShader概述 材质和UnityShader 总的来说&#xff0c;在Unity中需要配合使用材质(Material)和 Unity Shader 才能达到需要的效果&#xff0c;常见流程为&#xff1a; 创建一个材质创建一个 Unity Shader&#xff0c;并把它赋给上一步中创建的材质把材质…

AcWing算法基础课笔记——求组合数4

求组合数Ⅳ 用来解决求 C a b C_a^b Cab​的问题&#xff08;没有模运算&#xff09; 解决办法&#xff1a;分解质因数&#xff0c;实现高精度乘法。 C a b a ! b ! ( a − b ) ! C_a^b \frac{a!}{b!(a - b)!} Cab​b!(a−b)!a!​ 其中 a ! a! a!可以用 p p p的倍数来表示…

自动驾驶仿真:Carsim转向传动比设置

文章目录 一、转向传动比概念二、设置转向传动比1、C factor概念2、Steer Kinematics概念3、传动比计算公式 三、转向传动比验证 一、转向传动比概念 转向传动比&#xff08;Steering Ratio&#xff09;表示方向盘转动角度与车轮转动角度之间的关系。公式如下&#xff1a; 转向…

计算机网络 动态路由OSPF

一、理论知识 1.OSPF基本概念 ①OSPF是一种链路状态路由协议&#xff0c;使用Dijkstra算法计算最短路径。 ②OSPF使用区域&#xff08;Area&#xff09;来组织网络&#xff0c;区域0&#xff08;Area 0&#xff09;是主干区域。 ③路由器通过通告直连网络加入OSPF域。 ④反…

QT中制作带有界面的静态库

1、可参考以下文章 QT中制作带有界面的动态库 2、相比动态库&#xff0c;静态库就更简单了&#xff0c;&#xff0c;&#xff0c; 1&#xff09;创建静态库项目 2&#xff09;直接右键创建同名窗口类进行覆盖 3&#xff09;编译生成静态库 4&#xff09;使用

人工智能导论笔记

目录 ​编辑 绪论篇 有关知识表示和推理的零碎知识点 机器学习篇 K-近邻算法&#xff08;KNN&#xff09; 人工神经网络与深度学习篇 人工神经元模型 人工神经网络 BP神经网络 卷积神经网络 搜索策略 状态空间表示法 盲目搜索 启发式图搜索策略 绪论篇 3个学派&a…

实战篇:GY-906红外测温模块 + 万年历(定时器计数中断版本) -STM32篇

本文章基于兆易创新GD32 MCU所提供的2.2.4版本库函数开发 向上代码兼容GD32F450ZGT6中使用 后续项目主要在下面该专栏中发布&#xff1a; https://blog.csdn.net/qq_62316532/category_12608431.html?spm1001.2014.3001.5482 感兴趣的点个关注收藏一下吧! 电机驱动开发可以跳转…

视频批量剪辑新境界:一键转码MP4至MP3并自动删除原文件,轻松优化存储空间与播放体验

随着数字媒体的飞速发展&#xff0c;视频文件已成为我们生活中不可或缺的一部分。然而&#xff0c;大量视频文件的累积不仅占据了宝贵的存储空间&#xff0c;而且在某些情况下&#xff0c;我们更希望提取视频中的音频内容。为了满足这一需求&#xff0c;我们推出了全新的视频批…

LLVM——安装多版本LLVM和Clang并切换使用(Ubuntu)

1、描述 本机&#xff08;Ubuntu22&#xff09;已经安装了LLVM-14&#xff0c;但是需要使用LLVM-12。安装LLVM-12和Clang-12并切换使用。 2、过程 安装LLVM-12和Clang-12。 sudo apt-get install llvm-12 sudo apt-get install clang-12 【注】运行 sudo apt-get install ll…

django学习入门系列之第三点《CSS基础样式介绍2》

文章目录 文字对齐方式外边距内边距往期回顾 文字对齐方式 水平对齐方式 text-align: center;垂直对齐方式 /* 注意&#xff0c;这个只能是一行来居中 */ line-height:/*长度*/ ;样例 <!DOCTYPE html> <html lang"en"> <head><meta charset…

【Oracle】实验一 安装和使用Oracle数据库

【实验目的】 掌握Oracle软件安装过程&#xff0c;选择安装组件掌握建立Oracle数据库&#xff0c;配置网络连接使用SQL*Plus&#xff0c;登录到实例和数据库掌握命令方式的关闭和启动实例及数据库 【实验内容】 安装Oracle19c&#xff0c;记录安装过程。切记&#xff1a;创建…

Jenkins定时构建自动化(二):Jenkins的定时构建

目录 ​编辑 一、 jenkins定时构建语法&#xff1a; 1. 语法规则&#xff1a; 2. 常见用法举例 3. 再次举例 接上一篇&#xff1a;Jenkins定时构建自动化(一)&#xff1a;Jenkins下载安装配置&#xff1a;Jenkins定时构建自动化(一)&#xff1a;Jenkins下载安装配置-CSDN博客 …

HTML静态网页成品作业(HTML+CSS)——故宫介绍网页(4个页面)

&#x1f389;不定期分享源码&#xff0c;关注不丢失哦 文章目录 一、作品介绍二、作品演示三、代码目录四、网站代码HTML部分代码 五、源码获取 一、作品介绍 &#x1f3f7;️本套采用HTMLCSS&#xff0c;未使用Javacsript代码&#xff0c;共有4个页面。 二、作品演示 三、代…

【教学类-36-09】20240622钓鱼(通义万相)-A4各种大小的鱼

背景需求&#xff1a; 用通义万相获得大量的简笔画鱼的图片&#xff0c;制作成不同大小&#xff0c;幼儿用吸铁石钓鱼的纸片&#xff08;回形针&#xff09;&#xff0c;涂色、排序等 补一张通义万相的鱼图 素材准备 &#xff08;一&#xff09;优质的鱼图片 &#xff08;二&a…