【Flink实战】新老用户分析:按照操作系统维度进行新老用户的分析

news2025/1/22 21:37:07

🚀 作者 :“大数据小禅”

🚀 文章简介 :新老用户分析:按照操作系统维度进行新老用户的分析

🚀 欢迎小伙伴们 点赞👍、收藏⭐、留言💬


目录导航

      • 同类产品参考
      • 日志的数据格式
      • 需求:按照操作系统维度进行新老用户的分析
      • 分析结果

同类产品参考

在这里插入图片描述

日志的数据格式

{
"deviceType":"iPhone 10",
"uid":"user_1",
"product":{
"name":"宝马",
"category":"车"
},
"os":"iOS",
"ip":"171.11.85.21",
"nu":1,
"channel":"华为商城",
"time":1735419335423,
"event":"browse",
"net":"WiFi",
"device":"4759947c-cd47-433c-ac8f-ae923a6d38b6",
"version":"V1.2.0"
}

需求:按照操作系统维度进行新老用户的分析

  • 关键字:操作系统 OS 老用户nu

  • 维度先从单一的开始 扩展:操作系统 省份的维度

  • 写入数据到Redis 官方文档https://bahir.apache.org/docs/flink/current/flink-streaming-redis/

  •     <dependency>
            <groupId>org.apache.bahir</groupId>
            <artifactId>flink-connector-redis_2.11</artifactId>
            <version>1.0</version>
        </dependency>
    
  • 代码

public class OsUserCntAppV1 {
    public static void main(String[] args) throws Exception {
        StreamExecutionEnvironment environment = StreamExecutionEnvironment.getExecutionEnvironment();
        DataStreamSource<String> stream = environment.readTextFile("data/access.json");
        environment.setParallelism(1); //设置并行度为1方便观察
        SingleOutputStreamOperator<Access> filter = stream.map(new MapFunction<String, Access>() {
            @Override
            public Access map(String s) throws Exception {
                // json 转 Access
                try {
                    return JSON.parseObject(s, Access.class);
                } catch (Exception e) {
                    e.printStackTrace();
                    return null;
                }
            }
            //这里是只要不为空的数据  x != null等于把上面的空的数据过滤掉
        }).filter(x -> x != null).filter(new FilterFunction<Access>() {
            @Override
            public boolean filter(Access access) throws Exception {
                //只过滤出来 event='startup'的数据
                return "startup".equals(access.event);
            }
        });
        //Access{device='6d27244c-b5e5-4520-9c6d-c4e17e2391fe', deviceType='iPhone 9', os='iOS', event='startup', net='4G', channel='华为商城', uid='user_36', nu=0, nu2=0, ip='123.232.241.201', time=1735419335573, version='V1.2.0', province='null', city='null', product=null}
        // 操作系统维度  新老用户
        //返回三元组 (操作系统 新老用户 数字1)
        SingleOutputStreamOperator<Tuple3<String, Integer, Integer>> sum = filter.map(new MapFunction<Access, Tuple3<String, Integer, Integer>>() {
            @Override
            public Tuple3<String, Integer, Integer> map(Access access) throws Exception {
                return Tuple3.of(access.os, access.nu, 1);
            }
            //根据OS操作系统 与 字段nu新老用户分组  传入三元组返回二元组  
            //因为是按照Tuple2<String, Integer>这两个进行keyby 所以进入三元组出去二元组
        }).keyBy(new KeySelector<Tuple3<String, Integer, Integer>, Tuple2<String, Integer>>() {
            @Override
            public Tuple2<String, Integer> getKey(Tuple3<String, Integer, Integer> value) throws Exception {
                return Tuple2.of(value.f0, value.f1);
            }
            /**
             * (Android,1,1)
             * (iOS,1,1)
             * (iOS,0,1)
             */
            //根据第三个字段进行聚合
        }).sum(2);
        //结果
        /**
         * (Android,1,23)
         * (Android,0,13)
         * (iOS,0,20)
         */

        //单机redis  出现连接超时->修改redis.conf配置文件 bing IP
        FlinkJedisPoolConfig conf = new FlinkJedisPoolConfig.Builder().setHost("192.168.192.100").build();

        sum.addSink(new RedisSink<>(conf,new RedisSinkForV1()));
        environment.execute("OsUserCntAppV1");
    }
}

分析结果

在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1007064.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

vue 检查指定路由是否存在

今天路由跳转报错了 RangeError: Maximum call stack size exceeded 但显然 我的代码只有一个简单的路由跳转 并没有很大的的堆栈数据操作 所以 我就联想到了 会不会是因为路由不存在 我们可以通过 console.log(this.$router.options.routes)输出整个路由对象类看一下 或者…

HttpServletRequest是什么,有什么作用

HttpServletRequest是Java Servlet规范中定义的一个接口&#xff0c;它提供了与HTTP请求相关的方法和属性。在Java Web应用程序中&#xff0c;当客户端发送HTTP请求时&#xff0c;容器&#xff08;例如Tomcat&#xff09;会创建一个HttpServletRequest对象&#xff0c;该对象包…

华为云云耀云服务器L实例评测|搭建WordPress网站

&#x1f482; 个人网站:【工具大全】【游戏大全】【神级源码资源网】&#x1f91f; 前端学习课程&#xff1a;&#x1f449;【28个案例趣学前端】【400个JS面试题】&#x1f485; 寻找学习交流、摸鱼划水的小伙伴&#xff0c;请点击【摸鱼学习交流群】 在当今数字化时代&#…

云养殖模式:让养殖业走向智慧化、高效化、绿色化

养殖业是我国农业的重要组成部分&#xff0c;也是农民增收的重要来源。然而&#xff0c;传统的养殖方式存在着许多问题&#xff0c;如水环境污染、病害频发、市场风险高、管理落后等&#xff0c;导致养殖效益低下&#xff0c;难以适应现代消费者的需求。如何改变这种局面&#…

90%测试人不知道的快速入门秘籍——接口自动化神器 apin(一)

一、apin 介绍及安装 1、什么是 apin apin是柠檬班——木森老师开发的一个无需写代码、就可以进行接口自动化测试的框架。 只需要通过json或yaml文件编写非常简洁的用例数据&#xff0c;即可完成接口自动化测试&#xff0c;并生成自动化测试报告。 apin旨在帮助更多不会写代…

IPIDEA代理-如何解决使用代理IP后网速变慢的问题

代理IP是一种常见的网络技术手段&#xff0c;它可以被广泛应用于数据采集与分析、网络营销、舆情监测、SEO等诸多场景&#xff0c;帮助用户获取更多的网络资源&#xff0c;提高采集效率。但是&#xff0c;使用代理IP也会带来一些问题&#xff0c;其中最常见的就是网速变慢。在本…

IDEA(2023)修改默认缓存目录

&#x1f607;作者介绍&#xff1a;一个有梦想、有理想、有目标的&#xff0c;且渴望能够学有所成的追梦人。 &#x1f386;学习格言&#xff1a;不读书的人,思想就会停止。——狄德罗 ⛪️个人主页&#xff1a;进入博主主页 &#x1f5fc;专栏系列&#xff1a;无 &#x1f33c…

Redis-渐进式遍历scan的使用

目录 1、为什么使用渐进式遍历&#xff1f; 2、scan的使用 3、渐进式遍历的缺点 4、补充知识点&#xff1a;redis中也区分database 1、为什么使用渐进式遍历&#xff1f; 前面的博客中&#xff0c;我们有提到使用keys *来获取所有的key&#xff0c;但这种办法&#xff0c;…

MySQL最新版8.1.0安装配置教程

目录 目录 前言 安装流程图 1&#xff0c;MySQL数据库是什么? 2&#xff0c;下载zip压缩包 3&#xff0c;解压到要安装的目录 4,添加环境变量 4.1,找到环境变量 4.2,进行环境变量的添加 5.新建mysql 配置文件 6、安装mysql服务 7、初始化数据文件 8、启动mysql …

Java学习day01:数据类型、运算符、分支结构

声明&#xff1a;该专栏本人重新过一遍java知识点时候的笔记汇总&#xff0c;主要是每天的知识点题解&#xff0c;算是让自己巩固复习&#xff0c;也希望能给初学的朋友们一点帮助&#xff0c;大佬们不喜勿喷(抱拳了老铁&#xff01;) Java学习&#xff1a;数据类型、运算符、分…

手把手教你搭建会员运营体系

越来越多商家开始重视会员运营、今日就从以下加点展开聊聊&#xff1a; ①搭建会员体系的原因 ②会员运营的作用 ③会员标签 ④会员模型 ⑤成长体系 ⑥搭建会员运营体系的方法

C# OpenVino Yolov8 Pose 姿态识别

效果 项目 代码 using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; using System.Drawing; using System.Linq; using System.Text; using System.Windows.Forms; using OpenCvSharp;namespace OpenVino_Yolov8_Demo {public…

一起解读,从凌乱到智能,两种仓库物流管理的区别

百世慧与达索系统合作&#xff0c;为海量客户提供数字化转型。我们主要围绕仿真驱动创新和数字化精益两个板块进行实施。 在数字化精益板块中&#xff0c;产品全生命周期管理PLM、制造运营系统MOM这两个产品实施过的大型客户有宁德新能源、诺德股份、天津大众、中海寰宇等企业…

React使用useImperativeHandle实现父组件触发子组件事件

相关知识&#xff1a; useImperativeHandle forwardRef 相关代码&#xff1a; 获取子组件实例&#xff0c;由于这是函数组件&#xff0c;没有this因此不能整体获取&#xff0c;我们可以通过useImperativeHandle获取想要的变量或者方法。 父组件import React, { useRef } fro…

华为“通卫星”,苹果“好奇心”,终端之争供应商受益

9月13日凌晨&#xff0c;苹果新品发布会如期举行&#xff0c;苹果正式发布了包括iPhone 15、15 Plus、15 Pro、15 Pro Max四款机型。 值得一提的是&#xff0c;这场科技界的“春晚”&#xff0c;不再是苹果的独角戏&#xff0c;会后的报道里&#xff0c;彭博社、华尔街日报等一…

Vmware Workstation安装说明

目录 一、下载二、安装 一、下载 下载地址&#xff1a;https://www.vmware.com/cn/products/workstation-pro.html 二、安装 双击下载下来的安装包&#xff0c;按提示一步步操作&#xff1a; 点击【许可证】输入许可证密钥&#xff0c;确认后点击【完成】完成安装。…

常用API(基础)

1.API 1.1 API概述-帮助文档的使用 什么是API ​ API (Application Programming Interface) &#xff1a;应用程序编程接口 java中的API ​ 指的就是 JDK 中提供的各种功能的 Java类&#xff0c;这些类将底层的实现封装了起来&#xff0c;我们不需要关心这些类是如何实现的&a…

数据结构Map-Set和哈希表

目录 概念 模型 Map Map的常用方法 对于Map的总结 Set Set的常见方法 关于Set的总结 哈希表 概念 冲突 概念 哈希函数设计原则 常见的哈希函数 1.直接定制法(常用) 2.除留余数法(常用) 3.平方取中法 4.折叠法 5.随机数法 6.数学分析法 冲突避免-负载因子调…

【数据库】数据库系统概论(二)— 关系

关系数据库 关系数据库是支持关系模型的数据库系统。 关系模型的数据结构&#xff1a;关系&#xff1b;逻辑结构&#xff1a;扁平的二维表 域 是一组具有相同数据类型的值的集合。 例如&#xff1a;{a,b,c}、{0,1,2,3}等等 笛卡尔积 定义 笛卡尔积是域上的一种集合运算…

抓准时机,成为亚马逊,速卖通,国际站的领军者

下半年即将接踵而至的万圣节、黑色星期五、圣诞节等大型节日&#xff0c;不仅仅是海外消费者的重要消费节假日&#xff0c;也是中国出海企业势在必得的流量战场。 那么对于下半年重头戏&#xff0c;卖家该如何把握好黄金时机&#xff0c;赢得一年大丰收 旺季卖家怎么掠夺竞争…