数据大佬的成长经验分享 | ​我的非典型数据分析之路

news2024/11/22 22:46:09

d9185a6cee5cd2879caab5b2638d198a.jpeg


小飞象·交流会

哪有什么错过的人,会离开的都是路人。哪有什么命运不公,都是懒惰让你变得无能。

46743b5cdf50c949edc503a9ffad5f87.gif

25da82c50ca94eb4620891598141f201.png

内部交流│19期

数据大佬的成长经验分享

我的非典型数据分析之路

data analysis

●●●●

分享人:夏宇

在大数据、人工智能热、5G、物联网的时代,相信也有许多对数据分析非常感兴趣且要转行的小伙伴。但是,有些朋友对于是否该转行一直抱有迟疑态度,转行是不是要重新学,怎么学,如何入行等等一系列的问题···

而他们并不知道进入数据分析行业需要学什么,也不太清楚数据分析相关岗位平时工作都在干什么,还有一些已经入行的不知道如何进阶。而之前交流分享的一直都是硬核的数据分析知识,那么,本期交流会邀请了小飞象数据大佬,来将从入行、初始、进阶三个方面,让大家了解一下大佬是如何从数据小白到数据大神一步步成长的。

那么,小飞象夏宇,8年数据分析大佬,现在是转行数据产品经理,专门为数据分析和产品运营设计开发称手的工具。对数据分析、可视化比较有兴趣,公众号【可以叫我才哥】,将为自己的数据分析非典型的成长之路。

(夏宇个人公众号)

a3bd63d67e6887bd71e298e79d474ab2.png

数据分析学习,在于将别人的知识转化成自己的知识,食之化尽,举一反三。今天将会从3个方面来深⼊了解《数据大佬的成长经验分享 | 我的非典型数据分析之路》。

这一部分:入行—初识数据领域

第二部分:初期—打开认知,发现新的世界

第三部分:进阶—把握机会,开启新的挑战

为了更好的后面做好小飞象内部交流会,需要您帮忙做两件事情:第一,您想想这次为什么想参加这一期的交流会,以及希望在交流会中希望收获到什么?第二,在交流会结束后,请和我说一下您的收获和感受。(可以在公众号留言交流,小飞象内部交流会往期回顾

做一个对世界充满好奇的人!在分享之前,我们可以先思考几个问题:

★你觉得数据分析入门难点在哪里?

★实际工作中数据分析有什么岗位,工作内容是什么?

★数据分析到底要如何学习和进阶?你觉得难么?

......

这次分享将为大家打开一扇窗,希望能对零基础转行数据分析的小伙伴们有所启发、对数据分析的从业人员的技能进阶一些借鉴在分享的过程中,建议全程认真听,带着思考来听(去看),希望通过本次分享,来给大家做一次系统的数据分析可视化分享,来解答大家对于可视化的疑点,并给做数据分析的人员提供一些思路,有任何问题都可以随时交流哦!

正式分享

—▼—

bd3de0f1eed044bcd1e5c7f58ebcb54a.png

大家好,我将结合自身的经验,和大家一起聊聊自己的非典型数据成长之路,希望能通过自己过往经验,给大家对数据分析有所新的启发,将从入行,初期,进阶3个方面,来梳理总结自己的数据分析入行、成长、进阶等的一些经验。

第一部分,主要讲我是怎么入行,以及我是怎么去认识数据分析,第二部分,当我接触到数据分析之后,又会接触到很多数据分析相关一些工具,可能会逐渐地去打开我的一些认知,有很多新的工具或者新的一些方式。第三部分,基于自己早期的一些工作经验以及认知,通过自己的摸索,把自己的想法如何更好的实现,把一些数据分析进阶的学习经验分享给大家。

以下是我个人的从业经历:

ed6467841eb28d1cead394dd1932c444.png

(我的个人从业经历)

1、入行-择业的逻辑

731953dd54f41ceeacbcc98bad951835.png

·选择互联网行业。在从宏观上,一切行业互联网化是未来的大趋势,薪资福利更高····

·期望岗位数据分析。随着数字化社会发展,带来的是人才缺口,互联网企业对人才的需求,每年以20%的速度增长,其中以“数据分析”人才缺口最为突出,也是各家企业互相争抢的高技能人才。未来是大数据时代,数据分析的发展空间更巨大,且数据领域的发展是令人兴奋的····

·入行原因:主要大学是数学系的,但是实际上并没有接触过太多数据分析相关内容,对Excel基本只是停留在用过的阶段,也就是会填写表格做基础的四则运算。

那个年代互联网也没有如今这么发达,尤其是自媒体这块,所以网上能找到的学习资料也基本都是一些机构产出的,不像现在各种行业都有大佬或者资深热衷于知识的传播分享,我们可以接触非常之多知识!

因为自己是数学系的自认为对数据敏感。所以选择了数据分析,入行后有一个很好的领导,但是在数据分析上并没有老师带,基本都是在工作中学习在学习中工作。当时是负责游戏的数据分析,公司有比较完善的数据分析平台和数据支持部门,我的分析工作大多数都是对已加工过的数据进行二次加工然后形成日报周报之类的,再就是根据实际的分析场景找数据支持部门发起提数需求(他们会写sql提数给我),我再二次加工形成想要的指标。这个阶段我用到的工具就是Excel,做图表。

2、入行-数据领域相关岗位

a7c82f296cb63253fc15ff7f9678504d.png

其实这些岗位贯穿我们整个数据分析过程。数据的收集、加工、处理,再做一些数据分析,做一些数据可视化,再把数据的一些结论进行一些应用,其实它是一个流式化的过程,在每一个过程其实都会去引申出各种相对比较匹配的一些岗位。同样,其实不同的数据分析的岗位,它可能也会覆盖不同的流失过程的一些工作。如我现在做的数据产品,其实我们就会涉及到数据收集的逻辑,也会涉及到数据加工的内容,另外就是数据应用。大家其实可以简单了解一下。

拆分“数据分析”可以为:数据收集—数据处理—数据运营—数据应用。因此,按照这个流程,数据领域相关岗位如下:

数据收集负责收集各种各样的原始数据,比如用户何时何地做了什么事情。它依赖于埋点采集系统,而埋点采集,需要收集什么类型数据,属于【数据产品经理】确定规范数据运营和数据分析师根据公司组织架构也可以兼任)

收集上来的数据需要存储,往往因为高吞吐量,需要保证数据和日志的稳定性,会采用Flume+Kafka,如果有实时统计要求,也得考虑流数据。这块则是【数据工程师】的范畴,包括原始数据的再加工,数据清洗,都是专门的数据团队完成。

当获得数据后,首先第一点是讲各种明细数据处理业务指标,没有指标不成方圆,这里由【数据分析师】定义的。有了指标,配合各种数据产品输出,如用户画像用户标签、BI报表,这些数据产品都由【数据产品经理】统筹排期…另外一方面,【数据挖掘工程师】【算法专家】则凭各种数据建立模型,进行实时或离线运算。

模型可能会预测用户会不会购买某个商品,可能是做出一系列的推荐,可能是判断用户属于哪个类型,不一而足。更上面一层是业务相关,【数据分析师】会监控和分析BI上指标的波动,【数据挖掘工程】是通过用户反馈数据,衡量算法的优劣、【数据产品经理】按AB测试的结果改进产品。数据工程师保证系统的稳定。

所有层次一环扣一环,每个岗位在其中都发挥特有的作用。数据工程偏底层技术,数据分析偏上层业务,数据挖掘和数据产品处于中间形态。不同公司虽然业务形态不一致,架构会有差异,但是职责不会偏差太大。这也是数据分析为什么会有四个方向。

讲到这里,你大概对数据分析的职业规划有了明晰的了解。当然,它们彼此间并不完全独立,到后期,很多界限会变得模糊。

3、入行-数据的工作内容

009d6bf6752b1a90fb0151149a6a7a0f.png

在我入行的时候,从事的游戏行业的数据分析,因为在很早期的时候,游戏或者互联网的做运营策略、版本更迭等工作,其实很多时候是拍脑袋的。有一些经验丰富前辈们,凭借自身经验,通过一些数据指标波动,可能需要做一个什么样的运营策略,刺激一下收入的增长,留存的增长,但基本上都是拍脑袋的一种行为。数据分析、数据运营、数据精细化也在那个时候启蒙的,很多互联网公司开始逐步重视数据分析的价值。

当时我的主要工作内容基本上是要形成产品的数据报表。业务的基础数据监控,一二级指标,如 DAU、新增、留存、付费率等相关数据,主要是给老板看的,让老板清晰的了解整个项目的运营状况。

第二,根据业务线的产品特性,会进行与传统一二级指标不太一样的专项数据指标体系。

第三,我们会去做一些所谓的预警,其实就是数据发生一些波动或异常的时候,做简单的模型预警,如超过之前多少值或者低于之前多少值,给出预警,并提出解决方案。

第四,其实有一些专属的功能或者特殊的一些功能,我们需要做一些专项分析,去找出一些问题点。比如,游戏相关的一些产品,游戏其实会有新手引导,其实每个步骤特别细,我们就会去做新手引导,各个流程的分析,去找到流失的一些卡点,针对这些卡点去做更深度的分析。基于数据,定位的原因,再会给我们产品或者我们的策划去提醒,给建议,告诉这里需要去做一些优化了,应该怎么去优化等。

总之,数据分析岗位一般工作内容:

·负责和支撑各部门相关的报表;

·建立和优化指标体系;

·监控数据的波动和异常,找出问题;

·优化和驱动业务,推动数据化运营;

·找出可增长的市场或产品优化空间;

·输出专题分析报告;

·····

4、入行-自我提升

为了提高工作效率,自己买了基本Excel的教程,主要学习了函数、数据透视表、快捷键和图表制作。

63c70eaf346e1f5533745a45681445f5.png

为了提升对业务的理解,自己和同事体验了很多同类产品,同时也把当时网络上能找到的相关的数据分析知识都做了收藏与学习,主要是数据指标体系如定义、关联关系和分析价值等等。

9122f5c0757b3639fc2c3e65fa9712f2.png

比如以下就是自己当时结合对业务理解和数据指标的理解整理的文档部分内容,现在看来会发现写的还是比较浅,但是作为学习思考与总结还是很不错的。

e2247cc4b500497c98f1ff645ccd3ddd.png

5、入行-数据分析框架

7bf6045f783c4dafb9a6d0a538050ac0.png

所谓的数据敏感度:

·看到数据后能一眼看出来数据靠不靠谱

·看到数据后能一眼思考出数据背后的原因或者意义

总之,做数据分析的人基本上是需要自己不断地去摸索,是一个被动学习的过程,一开始我并不知道我要做什么,需要掌握什么,由上级给我安排一些任务。我在做这些任务的时候,我发现我都不会。我也是在摸索,找同事,找前面去咨询,去了解,他们会告诉我你可以怎么去做,但他们不会去指导我。为什么?因为他们更忙。

尤其是在工作中,没人愿意,没人他是有义务去指导教导你的,只能自己去想我应该怎么办。然后我就需要自己去思考怎么做,其实就是一个非常好的点,给自己去规划一下我应该怎么去做。在学习中,不断成长。

—▼—

f6dc40088129ecc80d4f1c0c0f684d1e.png

大概 1 到 2 年之后,我开始接触到一个新的工具tableau,也是被动接收的tableau。当时想法就是它好像可视化能力比较强一些,图表展现效果很酷。

98e13363e8e138cce566c00e8e2a34a5.png

记得公司购买了某三方的数据,他们的周期性数据是以Tableau展示的,为了更好的将这些数据按照我们期望的数据指标进行报表化,我也开启了Tableau的学习,这个学习也基本是自学了,方式也比较简单就是买了一本Tableau的书籍,在学中做,在做中学。

Tableau让我打开了新世界,拖拽操作和数据可视化让我非常之欢喜,但是其实这个阶段我的所做的数据分析工作也基本都是对数据支持部门加工过的数据进行二次加工而已,只是形成了好看的图和表。

好在Tableau一定程度上让我的很多数据分析工作半自动化。

那时候,我觉得数据分析实可能还有更多的工具值得我去探索,我已经不再是只局限在 Excel 层面。

—▼—

b329afaf05a9a53f40ded2c4a4f24968.png

在入行的前四年里面,从最早的数据分析到后面做运营,再到后面负责一个项目的过程中,我培养了自己的两个亮点。

第一个就是数据分析,数据运营的能力,第二块其实就是对于整个游戏运营模块通盘业务理解能力。

到后来因为工作变动,不再有数据支持部门的强力支援,我需要自己面对原始日志数据,一开始我会将他们导入到Tableau再进行运算处理(比较excel支持的数据量比较有限),直到发现数据量和处理复杂度远超我的预期。

于是乎,在找外部支援的同时我也开始了自己的数据分析技能进阶—Sql和Python相关的学习。

·对于Sql,主要是用于初步的数据处理;

·对于Python,主要是用于深度加工和一些模型的使用,比如预测、同期群等等。此外就是一些自动化的流程,比如自动化输出分析报告等等

1、关于SQL的学习

74b75837bd21ab06600c2cdee73117b7.png

2、Python学习路径

a5a0fa26ee3f64ccfa7274268c4e387a.png

760577f2cee01e51ad5db6c4de2010db.png

3、自动化报表流程

1f13875ba6123c6a9c3dc9e24a72f912.png

4、数据埋点设计经验

之前我们公司的数据中台,没有现成的体系埋点,我需要自己去做,没有地方去展示这些一二级的数据指标。我需要自己去整理数据报表,根据我的看板,它展示的指标内容,它展示的一些功能有哪些筛选项,数据应该怎么展示?这些数据计算逻辑是什么?完全是由我自己去设计埋点,去整理这些计算逻辑,甚至是去画一些原型图给到数据中台的同学,他们去帮我们去做一些定制化的开发,再去形成了我们的数据的一些报表看板。

这里简单介绍一下,不去扩展了

所谓的数据埋点是数据采集领域的术语,指的是针对用户行为或者特定事件进行元数据上报采集。在此过程中收集所需信息,用于后续数据分析了解用户的使用情况,为迭代产品或者运营工作提供数据支撑。

89f5b759bc3f2aee1749c42f835438fa.png

ccfa9282639c441c7e767a03b565ccc5.png


总结

以上就是本次分享的全部内容!也是我个人非典型的野蛮成长的数据之路。总之,一定要用细心、耐心、和平静的心态去做数据分析。数据分析是个细活,根据二八原则,其中数据的处理将占去数据分析中的八成时间,如果数据处理不当将影响接下来的分析,需要良好的心态减少犯错误的概率。

希望能通过我的数据分析成长经历,给到大家一起启迪和思维上的扩展!

‍‍

‍(更多数据分析学习,可以关注【可以叫我才哥】)‍

‍ ‍

042efcf17eba0bd87325fac70f3cd866.png


其实数据分析并不仅仅是为了完成一些业务上面的数据需求和论证。数据分析者应该在理解业务的基础上,要有自己独特的见解,扩大自己的思考范围,提升洞察力。同时要换位思考,从多角度看待数据和使用数据。不同的人,不同的角度看问题都能得到不同的效果。入门、学习、进阶等数据分析方面的问题不是一次分享能全部了解的。我们最终的目的是要解决问题,就是发现问题,解决问题就是发现业务中的问题,然后并去解决。学贵在行,需要我们在以后的学习工作中不断地积累经验掌握工具,学以致用。能站在多方角度,发现问题,分析问题,解决问题,总结问题。

后期小飞象会继续为邀请各业的精英分享数据领域的内容。祝愿大家都能在自己所在的领域内,用数据思维,成就更好的自己,在可预见的未来,遇到更好的自己。谢谢大家!

b6684614d4bb973369227aca93447172.png

ec494d0a5b1f3450db5510eb0ed065a0.png

······

敬请期待下一期

本次分享到此结束,再次感谢大家的收听,我们下期再会!

(本文由木兮整理,可能与演讲时略有遗漏,但整体思路精华都在)

图片来源于网络

若好的建议和想法,欢迎在下方留言

我们将尽其所能打造数据分析交流的理想之地

0f039dfea4bc66a85844a7e8c7af97e5.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/165682.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

1、Mavan项目管理工具

1.1 什么是 Maven 1.1.1 什么是 Maven Maven 的正确发音是[ˈmevən],而不是“马瘟”以及其他什么瘟。Maven 在美国是一个口语化的词 语,代表专家、内行的意思。 一个对 Maven 比较正式的定义是这么说的:Maven 是一个项目管理工具&#xff0…

Spring Boot学习篇(十)

Spring Boot学习篇(十) shiro安全框架使用篇(二)——登录实例(密码以密文方式存储,不含记住密码) 1.模拟注册时,生成密文到数据库中 1.1 在zlz包下创建util包,并在下面创建SHAUtil01类(初始里面无方法)和SHAUtil02类,其目录结构如下所示 1.2 两种生成密文的方式 1.2.1 自己…

一篇文章彻底搞懂折半查找法[二分查找法]算法~

算法实现的要求: 折半查找法又称为二分查找法,这种方法对待查找的列表有两个要求: 1:必须采用顺序存储结构 2:必须按关键字大小有序排列算法思想: 将表中间位置记录的关键字与查找关键字进行比较&#x…

性能测试时那些「难以启齿」的问题-CPU相关

NO.1 为什么cpu使用率可以>100%? 小白的我在进行压测的时候,查看服务的cpu总使用率如下,总使用率会超过100%,这个数据是怎么来的呢,为什么会有大于100%的情况呢? 作为小白的我刚开始觉得这个问题应该很基础&#x…

Go语言实现猜数字小游戏

目录 前言 一、设计思路 二、代码编写 2.1 产生随机数 2.2 用户输入数据 2.3 核心代码 三、 全部代码 四、效果图 总结 前言 最近在学习go语言,刚刚学完go语言的基础语法。编写了一个猜数字的小游戏来练习循环、分支语句、变量定义、输入输出等基础的go语…

4、变量与常量

目录 一、标识符和关键字 1.标识符 2.关键字 二、声明变量 三、声明常量 四、变量的有效范围 1. 成员变量 2. 局部变量 一、标识符和关键字 1.标识符 Java语言规定标识符由任意顺序的字母、下画线(_)、美元符号($)和数字…

【数据结构】手撕八大排序算法

作者:一个喜欢猫咪的的程序员 专栏:《数据结构》 喜欢的话:世间因为少年的挺身而出,而更加瑰丽。 ——《人民日报》 目录 1.排序的概念: 2.八大排序的思路及其细节 2.1直接插入排序 …

适合编程初学者的开源项目:小游戏2048(安卓Compose版)

目标 为编程初学者打造入门学习项目,使用各种主流编程语言来实现。 2048游戏规则 一共16个单元格,初始时由2或者4构成。 1、手指向一个方向滑动,所有格子会向那个方向运动。 2、相同数字的两个格子,相遇时数字会相加。 3、每次…

SpringMVC面试题

概述 什么是Spring MVC?简单介绍下你对Spring MVC的理解? Spring MVC是一个基于Java的实现了MVC设计模式的请求驱动类型的轻量级Web框架,通过把模型-视图-控制器分离,将web层进行职责解耦,把复杂的web应用分成逻辑清…

如何在Linux上搭建C++开发环境

工欲善其事,必先利其器!我们要在Linux上开发C程序,就要先搭建好它的开发环境。 搭建环境步骤安装Linux安装开发工具写一个demo在项目根目录创建一个构建脚本build.sh使用CodeLite IDE打开项目安装Linux Linux的发行版本很多,萝卜…

测试开发——测试分类

目录 一、 有关测试用例的回顾 二、 测试用例的划分 1、 按照测试对象来划分 可靠性测试 容错性测试 内存泄漏测试 弱网测试 2、按照是否查看代码划分 3、按照开发阶段划分 一、 有关测试用例的回顾 万能测试用例设计公式 如何根据需求去设计测试用例? …

计算机视觉OpenCv学习系列:第三部分、滚动条操作

第三部分、滚动条操作第一节、滚动条操作1.事件响应函数(1)UI组件时间响应过程(2)事件响应函数(3)创建窗口函数(4)调整图像亮度2.滚动条操作3.代码练习与测试学习参考第一节、滚动条…

Python 协程学习有点难度?这篇文字值得你去收藏

Python 协程在基础学习阶段,属于有难度的知识点,建议大家在学习的时候,一定要反复练习。 Python 中的协程是一种用户态的轻量级线程。它与普通的线程不同,普通线程是由操作系统调度的,而协程是由程序自己调度的。因此&…

【ESP 保姆级教程】玩转emqx篇③ ——认证安全之使用内置数据库(Mnesia)的密码认证

忘记过去,超越自己 ❤️ 博客主页 单片机菜鸟哥,一个野生非专业硬件IOT爱好者 ❤️❤️ 本篇创建记录 2023-01-15 ❤️❤️ 本篇更新记录 2022-01-15 ❤️🎉 欢迎关注 🔎点赞 👍收藏 ⭐️留言📝&#x1f64…

Transformer模型详解相关了解

文章目录Transformer模型详解1.前言1.1 Transformer 整体结构1.2 Transformer 的工作流程2. Transformer 的输入2.1 单词 Embedding2.2 位置 Embedding3. Self-Attention(自注意力机制)3.1 Self-Attention 结构3.2 Q, K, V 的计算3.3 Self-Attention 的输…

《神经网络与深度学习》 邱希鹏 学习笔记(一)

一、机器学习的基本要素 机器学习的基本要素: 模型 学习准则 优化算法 其中模型分为线性和非线性。学习准则有用损失函数来评价模型的好坏,还有经验风险最小化准则,大概意思就是在平均损失函数中获得最小的损失函数,但是因为样本可能很小&…

Goodbye 2022,Welcome 2023 | 锁定 2023

引言又是一年春来到,新年应比旧年好。旧岁已辞,新年已到,新旧更迭之际,真想剪个头发换身行头,就能重新出发。但终究是要回头看看啊,那一路而来的荆棘与芬芳,才是成长的印记啊。那就回拨记忆&…

和涤生大数据的故事

1自我介绍 大家好,我是泰罗奥特曼,毕业于东北的一所不知名一本大学,学校在一个小城市里面,最热闹的地方是一个四层楼的商城,专业是信息管理与信息系统,由于是调剂的,所以我也不知道这个专业是干…

一篇文章带你学完JavaScript基础知识,超全的JavaScript知识点总结

目录 内置函数 alert警告框 promopt提示框 console控制台 字面量 数字型 字符串型 变量 声明与赋值 类型检测 类型转换 比较运算符 逻辑运算符 条件句 if else switch break,continue while 赋值运算符 函数 关键字形式函数 变量认知 作用域 表达式…

什么样的故障让阿里云换了总裁?

📣📣📣📣📣📣📣 🎍大家好,我是慕枫 🎍前阿里巴巴高级工程师,InfoQ签约作者、阿里云专家博主,一直致力于用大白话讲解技术知识 &#x…