十年数据分析经验分享

news2024/11/27 5:32:45

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

在过去的十年里,作者在多个公司担任分析角色,从德国的小型金融科技初创公司到高增长的预IPO企业(如Rippling)和大型科技公司(如Uber和Meta)。每家公司都有其独特的数据文化,每个职位都有其挑战和经验。以下是作者过去十年里积累的十大关键经验,这些经验在不同公司阶段、产品或商业模式下都适用:

  1. 用数据讲故事
    想想你的受众是谁。如果在研究型组织工作,或主要向技术利益相关者(如工程团队)展示,学术风格的分析可能是合适的。但如果受众是非技术业务团队或高管,则需重点关注关键见解,而不是技术细节,并将工作与所影响的业务决策联系起来。沟通不是分享自己觉得有趣的内容,而是分享受众需要听到的内容。最知名的这种洞察导向、由上而下的沟通方法是由麦肯锡顾问Barbara Minto开发的金字塔原理。
  2. 商业敏锐度是优秀与卓越数据科学家的最大区别
    在一家要求很高的公司,如果你是高级数据科学家,可以预期所有同事都具备很强的技术能力。你不会通过逐步改进技术技能脱颖而出,而是通过确保你的工作为利益相关者(如产品、工程、业务团队)带来最大影响力。商业敏锐度在此发挥作用:为了最大化影响力,你需要深入了解业务的优先事项和利益相关者面临的问题,制定直接帮助这些优先事项的分析解决方案,并以受众理解的方式传达见解和建议。
  3. 做一个客观的真理追寻者
    许多人会选择性地挑选数据以适应他们的叙述。这是有道理的:大多数组织奖励人们实现目标,而不是最客观的表现。作为数据科学家,有奢侈的条件推翻这种做法。数据科学团队通常不直接掌握业务指标,因此比销售等团队面临的短期目标压力小。利益相关者有时会迫使你找到支持他们预先创建的叙述的数据。虽然迎合这种做法在短期内可能会赢得一些分数,但从长远来看,坚持真理的态度会使你脱颖而出,并成为高管们在需要无过滤和无偏见观点时的首选对象。
  4. 数据与初级研究的结合
    数据人员通常对“轶事证据”不屑一顾,但它是严格定量分析的必要补充。进行实验和分析大数据集可以提供统计上显著的见解,但往往会错过一些信号。深入研究关闭交易的笔记、与客户交谈、阅读支持票据等有时是揭示某些问题或真正理解根本原因的唯一途径。例如,在B2B SaaS业务中,可能会在数据中看到企业交易的获胜率下降,甚至可以缩小到某种类型的客户。但要真正理解发生了什么,必须与销售代表交谈,深入研究他们的交易笔记,甚至与潜在客户交谈。
  5. 如果数据看起来好得令人难以置信,那通常是有问题的
    当人们看到指标急剧上升时,他们往往会兴奋,并将这一变化归因于自己做的某件事。不幸的是,当指标变化看起来异常积极时,往往是因为数据问题或一次性影响。例如,最近时期的数据不完整,指标会在所有数据点进入后平稳下来;或者一次性顺风不会持续(如1月初销售激增,这只是节假日积压的订单清理)。需要保持怀疑态度、好奇心和经验,以避免陷阱并生成可靠的见解。
  6. 愿意改变主意
    如果你从事数据工作,经常改变观点是很自然的。例如,你向高管推荐了一个行动方案,但在获得更多数据后失去了对其的信心;或者你以某种方式解释了指标变化,但进行了额外分析后认为另有原因。然而,大多数分析人员由于害怕看起来不称职或惹恼利益相关者,往往不愿意收回过去的声明。尽管这可以理解,但不应仅仅因为害怕失面子而坚持先前的建议。
  7. 务实
    在分析领域工作时,很容易形成完美主义。尽管科学方法训练了我们理想的分析或实验方法,但商业现实常常带来严重的限制。作为数据人员,需要帮助业务团队完成任务,而不是坚持完美的方法。与其追求完美,不如优先完成任务。
  8. 避免数据科学家因临时请求而精疲力竭
    雇用全能数据科学家来主要构建仪表板或执行临时数据提取和调查是一条通向精疲力竭和团队流失的捷径。许多公司,尤其是高增长初创公司,不愿意专门雇用数据分析师或BI人员进行指标调查和仪表板构建,因为他们希望团队具备灵活性。然而,这种做法往往导致数据科学家花费大量时间在这些任务上,从而难以在大型战略项目上取得进展。
  9. 并非所有情况都需要复杂的仪表板
    公司往往认为从电子表格转向BI解决方案是成熟强大的数据文化的标志。尽管关键决策的仪表板应该放在受管控的BI工具中,但许多情况下,Google Sheets能更快速地提供所需结果。团队总会利用日常使用的软件(如Salesforce)和电子表格的分析功能,因为他们需要快速行动。鼓励这种灵活的、分散的分析方法,而不是强制所有分析都通过BI工具进行,可以节省数据科学团队的资源,并为团队提供成功所需的工具(如基本SQL培训、数据建模和可视化最佳实践)。
  10. 实现全公司范围内的指标标准化是不现实的
    在快速增长的初创公司中,强制执行完美的治理是不可能的。尽管数据科学家对不匹配的指标定义感到困扰,但实际上这并不是世界末日。只要关键报告得到严格处理并遵循标准化定义,公司的数据稍微混乱是可以接受的。团队总会通过在BI工具外进行黑客式分析来解锁自己,从而难以强制执行共享数据模型。

这些经验将帮助数据科学家在分析领域脱颖而出,成为真正的思维伙伴。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1796797.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

小熊家务帮day10-day12 门户管理(缓存,主页,定时任务)

门户管理 1 门户介绍1.1 介绍1.2 常用技术方案 2 缓存技术方案2.1 需求分析2.1.1 C端用户界面原型2.1.2 缓存需求2.1.3 使用的工具 2.2 项目基础使用2.2.1 项目集成SpringCache2.2.2 测试Cacheable需求Service测试 2.1.3 缓存管理器(设置过期时间)2.1.4 …

我的python管理

目前环境 Anaconda:python3.9 python2.7 IDA:python3.8 pycharm:?? 以后应该会补吧… 因为某些文件似乎用的python2决定整个python2 安装python2.7 打开anaconda命令行输入 conda create --name python27 python2…

RuoYi 使用达梦数据库 MySQL迁移达梦数据库

达梦数据库使用 达梦数据库安装路径:/home/aite/dmdbms 达梦数据库版本 RuoYi-Vue V3.8.7版本达梦数据库目录说明 cd /home/aite/dmdbms ls -l总用量 80 drwxr-xr-x 10 aite aite 12288 5月 31 14:41 bin drwxr-xr-x 2 aite aite 4096 5月 31 14:37 bin2 drwx…

计算机网络-OSI七层参考模型与数据封装

目录 一、网络 1、网络的定义 2、网络的分类 3、网络的作用 4、网络的数据传输方式 5、网络的数据通讯方式 二、OSI七层参考模型 1、网络参考模型定义 2、分层的意义 3、分层与功能 4、TCP\IP五层模型 三、参考模型的协议 1、物理层 2、数据链路层 3、网络层 4…

【Endnote】如何在word界面加载Endnote

如何在word界面加载Endnote 方法1:方法2:从word入手方法3:从CWYW入手参考 已下载EndNote,但Word中没有显示EndNote,应如何加载显示呢? 方法1: 使用EndNote的Configure EndNote.exe 。 具体步骤为&#x…

使用MFC DLL

本文仅供学习交流,严禁用于商业用途,如本文涉及侵权请及时联系本人将于及时删除 应用程序与DLL链接后,DLL才能通过应用程序调用运行。应用程序与DLL链接的方式主要有如下两种:隐式链接和显式链接。 隐式链接又称为静态加载&…

pw备份问题

1、手动build,dn gs_ctl build -D /database/panweidb/data 或 gs_ctl build -D /database/panweidb/data -b full 2、拉起2节点cm cm_ctl start -n 2 3、启动cm_server服务 cm_ctl start 4、 netstat -anop|grep 17700 5、

代码随想录——删除二叉搜索树中的节点(Leetcode450)

题目链接 递归 /*** Definition for a binary tree node.* public class TreeNode {* int val;* TreeNode left;* TreeNode right;* TreeNode() {}* TreeNode(int val) { this.val val; }* TreeNode(int val, TreeNode left, TreeNode right) {* …

在k8s中部署Logstash多节点示例(超详细讲解)

🐇明明跟你说过:个人主页 🏅个人专栏:《洞察之眼:ELK监控与可视化》🏅 🔖行路有良友,便是天堂🔖 目录 一、引言 1、Logstash简介 2、在K8s中部署Logstash多节点实例…

每日题库:Huawe数通HCIA——13

所有资料均来源自网络,但个人亲测有效,特来分享,希望各位能拿到好成绩! PS:别忘了一件三连哈! 今日题库: 186. 下列协议中属于动态IGP路由协议的是?-单选 A.stA.tiC. B.OSPF c…

GraphQL(3):参数类型与参数传递

1 基本参数类型 (1)基本类型:String,Int,Float,Boolean和ID。可以在shema声明的时候直接使用。 (2)[类型]代表数组,例如:[int]代表整型数组 2 参数传递 (1)和js传递参数一样,小括…

Sentinel1.8.6更改配置同步到nacos(项目是Gateway)

本次修改的源码在:https://gitee.com/stonic-open-source/sentinel-parent 一 下载源码 地址:https://github.com/alibaba/Sentinel/releases/tag/1.8.6 二 导入idea,等待maven下载好各种依赖 三 打开sentile-dashboard这个模块&#xf…

Linux 服务查询命令(包括 服务器、cpu、数据库、中间件)

Linux 服务查询命令(包括 服务器、cpu、数据库、中间件) Linux获取当前服务器ipLinux使用的是麒麟版本还是cenos版本Linux获取系统信息Linux获取CPU 的详细信息Linux查询nignx版本(非容器) Linux获取当前服务器ip hostname -ILinux使用的是麒麟版本还是…

SFML 小demo

文章目录 项目搭建代码实现main.cppobject.hsnake.hcommon.h 使用 demo 做到最后的话其实就只是验证了以前自己的一个想法,但是没有做成一个真正的游戏,可以算是一个 demo 而已吧,没做游戏的界面和关卡,不过完成了核心显式机制和功…

Day32 实现登录注册接口服务

​ 本章节,实现登录和注册接口服务 一.完善登录注册接口 完善登录和注册接口,对登录明文密码获取到MD5 字符串后,进行对比校验或注册明文密码进行MD5 加密后再插入到数据库。在MyToDo.Shared 项目中创建一个Extensions 文件夹,并创建一个 StringExtensions 静态扩展类,其中…

Redis学习(十二)Redis的三种删除策略

目录 一、背景二、Redis 的三种删除策略2.1 定时删除(用CPU换内存空间)2.2 定期删除2.3 惰性删除(用内存换CPU性能) 三、总结 一、背景 我们都知道 Redis 是一种内存数据,所有的数据均存储在内存中,可以通…

用于精准治疗和预防细菌感染的生物功能脂质纳米颗粒

引用信息 文 章:Biofunctional lipid nanoparticles for precision treatment and prophylaxis of bacterial infections. 期 刊:Science Advances(影响因子:13.6) 发表时间:2024年4月5日 作 者&a…

Deploy PostgreSQL12 for Centos 7

介绍 PostgreSQL是一种对象-关系型数据库管理系统,由加州大学伯克利分校计算机系开发,以POSTGRES,4.2版本为基础。 PostgreSQL支持大部分的SQL标准并且提供了很多其他现代特性,如复杂查询、外键、触发器、视图、事务完整性、多版…

C++ - 查找算法 和 其他 算法

目录 一. 查找算法: 1.顺序查找: 2.二分查找: 二. 其他算法: 1.遍历算法: 2.求和、求平均值等聚合算法。 a.求和算法: b.求平均值算法: 一. 查找算法: 1.顺序查找&#xff1…

【十大排序算法】冒泡排序

在排序的大海上,冒泡排序像一朵花朵般绽放, 每个元素都像是水珠,跃动在涟漪的波浪中。 它们轻轻上浮,与周围的元素相比较, 若自身更大,便悄然交换位置。 这是一场缓慢的舞蹈,每一步都小心翼翼&…