宏观行业心得

news2024/9/24 15:28:20

OLAP的特点

电商这样的OLTP场景大家更熟悉。相比之下,OLAP的特点:

  • 读相对多,1000row以上大批写入,不改已有数据
  • 查询时输出很多行、很少列,结果被过滤或聚合后能够在一台服务器的内存中
  • 单台服务器qps数百,但吞吐量每秒数十亿行
  • 宽表,列总数多
  • 事务不必须,数据一致性要求低

大数据的工作范畴、业务地位

大数据的研究对象,主要是通用分布式计算框架。任务调度(定时执行、相互依赖)和集群管理(选举、通信等)也算。

数据库应该做存储相关的事情。现在的互联网的大流量冲击下,如果把业务处理及计算放在数据库上,数据库的负载压力会特别大。现在大数据一般外置,由专门的集群负责业务处理及计算。从写sql存储过程,到写spark sql(sql + scala/python)和flink代码(java/scala)。

程序化广告

在CCTV黄金时段打洗脑广告的时代已经过去了。现在出现了很多小微流量主,私域不容小觑。
广告主想打广告,流量主想接广告。称为需求方和供给方。需要有一个“中介”,否则洽谈将无休无止。
广告主对不同的用户群体有不同的预算。“中介”需要考虑广告主的出价,用户的特征,广告位的上下文,来决定“你打开手机看见的是哪个广告”。能感觉到这是一个优化问题。

下面是singular公司对程序化广告的解释:
广告库存的实时拍卖发生在访问者登陆网页或应用程序加载屏幕的那一刻。使用数据和机器学习算法向用户提供最相关的广告。将用户个人资料或广告将放置的上下文中的任何已知数据与广告商对相关兴趣或受众人口统计数据的出价进行匹配,确保广告商能够为其营销工作带来回报。

移动营销的一种部门分工

工程

前后端的数据交互。用户加载、点击一个广告,观看、安装、充值/购买、更新app,都会产生日志,日志会发送到日志服务器。日志是最原始、最丰富的数据。比如事件信息(如日期时刻,点击位置)、用户信息(安装的其它app列表,设备信息)、广告信息(素材编号、图片/视频/可交互)、包信息(app类型,评分)。

数据中台

从上述日志中提取字段。设计表的字段(有点特征工程的意思)。也负责反作弊。

数分/运营

熟悉各类指标,比如日活、次留。他们工作一般面对BI软件,生产报表。

大数据平台

按不同粒度(比如日期,地区,事件类型)聚合数据,存储供查询。开发/维护存储和查询时需要用到的工具/集群,监控硬件指标以外的服务指标。解答用户使用时的问题。成本核算。自动化数据质量检测。

算法工程

开发/维护ABtest实验平台。目标是方便、快速比较哪个算法好,记录实验结果。

算法

生成算法提供广告素材,推荐算法给广告素材排序。目标是提高广告点击率。

未来趋势

感觉目前的云厂商有统一天下的野心。我这里仅举出我在这家公司亲眼看见的例子,想必只是冰山一角。之所以现在还没有一统,是因为目前在成本上:养人、开源二次开发、自己运维 < 云厂商服务。部门kafka评估出的全托管成本百万/月,目前用人还是更划算一些。

AWS Athena

AWS Athena是一种交互式查询服务,用户可以使用标准SQL直接在S3上轻松分析数据。也就是说,企业不需要养数据库(存储研究人员、DBA),也不再需要spark集群运维,bi运维。细分市场的BI服务提供商,比如帆软、tableau这种,也会受到冲击。

阿里云PAI

在这里插入图片描述
从上图可以看出,企业用户只需要提供数据集和配置,就能一键微调定制自己的大语言模型。可能只需要招1个人就够了。

AWS也提供类似的服务。amazon bedrock,model as a service,企业用户可以直接选择某一种模型(比如meta llama,amazon titan,anthropic等),打造自己公司的问答机器人,用的是公司自己提供的数据,以解决隐私合规等问题。他们提供了几种评估方式,帮助企业用户来做选择,playground手测,公开benchmark自动测,使用自己的数据集测,委托aws团队测。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1440196.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

222. 完全二叉树的节点个数 - 力扣(LeetCode)

题目描述 给你一棵 完全二叉树 的根节点 root &#xff0c;求出该树的节点个数。 完全二叉树 的定义如下&#xff1a;在完全二叉树中&#xff0c;除了最底层节点可能没填满外&#xff0c;其余每层节点数都达到最大值&#xff0c;并且最下面一层的节点都集中在该层最左边的若干…

Python中的HTTP代理与网络安全

在当今数字化的世界里&#xff0c;网络安全已经成为我们无法忽视的重要议题。无数的信息在网络上传递&#xff0c;而我们的隐私和敏感数据也在这个过程中可能面临被窃取或滥用的风险。在Python编程中&#xff0c;HTTP代理作为一种工具&#xff0c;能够在网络安全方面发挥重要的…

Markdown:简洁高效的文本标记语言

引言 在当今信息爆炸的时代&#xff0c;我们需要一种简洁、高效的文本标记语言来排版和发布内容。Markdown应运而生&#xff0c;它是一种轻量级的文本标记语言&#xff0c;以其简单易学、易读易写的特点&#xff0c;成为了广大写作者的首选工具。本文将介绍Markdown的语法优缺…

CODE V的API 之 PSF数据的获取(3)

PSF的获取 文章目录 PSF的获取前言一、主要代码总结 前言 主要利用buf语句进行传递&#xff0c;在worksheet中有收藏。 一、主要代码 Sub OnRunPSF() Dim session As CVCommand Set session CreateObject("CodeV.Command.102") session.SetStartingDirectory (&q…

EasyRecovery2024免费版具体下载步骤的详细信息

关于EasyRecovery具体下载步骤的详细信息&#xff0c;但一般来说&#xff0c;你可以通过访问EasyRecovery的官方网站或者在一些知名的软件下载网站上找到下载链接。在下载时&#xff0c;请确保选择与你电脑系统相匹配的版本&#xff0c;并注意软件的安全性和来源的可靠性。 Eas…

【数据结构】堆(创建,调整,插入,删除,运用)

目录 堆的概念&#xff1a; 堆的性质&#xff1a; 堆的存储方式&#xff1a; 堆的创建 &#xff1a; 堆的调整&#xff1a; 向下调整&#xff1a; 向上调整&#xff1a; 堆的创建&#xff1a; 建堆的时间复杂度&#xff1a; 向下调整&#xff1a; 向上调整&#xff…

FANUC机器人外部远程启动的相关参数设置示例

FANUC机器人外部远程启动的相关参数设置示例 如下图所示,在MENU---设置---选择程序中,设置程序选择模式:RSR(这个根据自己实际使用的自动启动方式来决定,你用RSR选RSR,用PNS就选PNS), 自动运行开始方法:选择UOP,即RSR1-RSR8的启动信号分别对应UI9-UI16, 最后,点击…

《合成孔径雷达成像算法与实现》Figure6.8

clc clear close all参数设置 距离向参数设置 R_eta_c 20e3; % 景中心斜距 Tr 2.5e-6; % 发射脉冲时宽 Kr 20e12; % 距离向调频率 alpha_os_r 1.2; % 距离过采样率 Nrg 320; % 距离线采样数 距离向…

【Linux】缓冲区与缓冲区的刷新策略

目录 1.缓冲区基础 1.1缓冲区的刷新策略 1.1.1三种刷新策略 1.1.2.两种强制刷新策略 2.用户级语言层缓冲区 2.1.默认在显示器输出 2.2.重定向到文件输出 2.3.write调用没有显示两份的原因 3.模拟实现文件缓冲区 3.1 myFileBuffer.h 3.2 myFileBuffer.c 4.系统内核缓…

flutter go_router 官方路由(一)基本使用

1 项目中添加最新的依赖 go_router: ^13.1.0如下图所示&#xff0c;我当前使用的flutter版本为3.16.0 然后修改应用的入口函数如下&#xff1a; import package:flutter/material.dart; import package:go_router/go_router.dart;void main() {runApp(const MyApp()); }cla…

【EEG信号处理】时频图与时频图的观察

非常快速和松散的介绍频谱和时频分析 当我们看到一个时频图时&#xff0c;我们应该考虑什么&#xff0c;应该有什么样的问题 什么是time-frequency plots 我们知道&#xff0c;左边是在时间维度上&#xff0c;根据电极的变化来绘制的折线图&#xff0c;他在时间维度上的&#…

Unity2D 学习笔记 0.Unity需要记住的常用知识

Unity2D 学习笔记 0.Unity需要记住的常用知识 前言调整Project SettingTilemap相关&#xff08;创建地图块&#xff09;C#脚本相关程序运行函数private void Awake()void Start()void Update() Collider2D碰撞检测private void OnTriggerStay2D(Collider2D player)private void…

react中hook封装一个table组件

目录 react中hook封装一个table组件依赖CommonTable / index.tsx使用组件效果 react中hook封装一个table组件 依赖 cnpm i react-resizable --save cnpm i ahooks cnpm i --save-dev types/react-resizableCommonTable / index.tsx import React, { useEffect, useMemo, use…

【数据结构】数据结构

本文是基于中国MOOC平台上&#xff0c;华中科技大学的《数据结构》课程和浙江大学的《数据结构》课程所作的一篇课程笔记&#xff0c;便于后期讲行系统性查阅和复习。 从个人角度出发&#xff0c;两个课程的讲解都有点不太易懂&#xff0c;好在多处可以互补&#xff0c;搭配进…

Backtrader 文档学习- Plotting -Plotting on the same axis

Backtrader 文档学习- Plotting -Plotting on the same axis 1.概述 在同一轴上绘图&#xff0c;绘图是在同一空间上绘制原始数据和稍微(随机)修改的数据&#xff0c;但不是在同一轴上。 核心代码&#xff0c;data数据正负50点。 # The filter which changes the close pri…

markdown加载自定义字体

写讲义&#xff0c;如果没有个像样 的字体多少有点难受。 最终的结果是劝退。 一、需要特定的markdown编辑器&#xff0c;我用的vscode 如果使用joplin、gitee的md文件是无法加载、渲染的。 二、 使用vscode想要渲染的话&#xff0c;似乎只能渲染一部分字体文件。下面不多…

【PyQt】09-控件提示信息、Lable标签

文章目录 前言一、控件提示信息1.1 代码1.2 解释 < b >在HTML标签中的作用1.3 添加按键后的代码运行结果 二、QLabel控件介绍2.1 内容2.2 常用的事件2.3 代码结果展示 总结 前言 1、控件提示信息 2、QLabel控件介绍 一、控件提示信息 关键点在于 效果如图所示&#x…

vFavorites

快速访问资产和文件夹的快捷方式 将您最常用的项目放入vFavorites中&#xff0c;以便立即访问 vFavorites中的项目与项目选项卡中的常规项目类似&#xff1a; - 单击文件夹以打开它 - 单击资产以选择它 - 双击脚本以进行编辑 - 拖放材料或预制件以将其添加到场景中 下载&#…

Qt网络编程-TCP与UDP

网络基础 TCP与UDP基础 关于TCP与UDP的基础这里就不过多介绍了&#xff0c;具体可以查看对应百度百科介绍&#xff1a; TCP&#xff08;传输控制协议&#xff09;_百度百科 (baidu.com) UDP_百度百科 (baidu.com) 需要知道这两者的区别&#xff1a; 可靠性&#xff1a; TC…

部署一个在线OCR工具

效果 安装 1.拉取镜像 # 从 dockerhub pull docker pull mmmz/trwebocr:latest 2.运行容器 # 运行镜像 docker run -itd --rm -p 10058:8089 --name trwebocr mmmz/trwebocr:latest 使用 打开浏览器输入 http://192.168.168.110:10058/ 愉快滴使用吧