分享一个用AI降本的思路,不懂代码也能上手

news2025/2/24 14:01:06

如何用AI解决实际的业务问题?

生财圈友@我来利用ChatGPT做算法建模,每年为公司省下6万元。

今天他将分享通过ChatGPT进行数据分析的思路,从最开始定义问题到最终数据论证。

上手的实操过程门槛并不高,但可以实现把官方电商平台的流量指数,转化为真实的销量等我们想要的数据。

希望今天的这篇分享,对大家有所启发。

图片

大家好,我是我来。

最近使用GPT,为公司每年省下了至少6万元。

原因是拟合出生意参谋(淘宝数据)&罗盘策略(抖音数据),行业竞争版块指数与真实值之间的函数关系,帮助公司获取真实的市占率等数据。

希望给大家带来一些思考,如果你能用在自己业务中也降低成本就更好了。

有一些数据分析的逻辑,对不熟悉这个领域的同学有些硬核,没关系,大家可以参考我解决问题的思路来处理自己的业务问题。

这个案例,是我如何使用GPT解决问题的全过程,从最开始定义问题到最终数据论证。

Part 1

背景信息

做电商的老板,一般都很关注自己品牌在行业内的市占率。市占率的数据获取,一般有2种途径。

01 官方平台

生意参谋、罗盘策略、京东商智等官方平台,会有行业竞争版块。

但平台方不希望品牌方拿到竞品的真实销售额,给的都是指数,没有办法看到实际的市占、竞品销售情况。

只能看到处理后的:交易指数、金额指数、流量指数等信息。

图片

图片

图片

(向右滑动以查看)

02 第三方平台

购买第三方平台的数据,如情报通、飞瓜。

第三方平台往往比较贵,比如情报通两个类目三个平台一年至少20w,且还是按周更新的。并且,第三方平台的稳定性和准确性,都不算太好。

所以说,能选官方当然选官方。之前生意参谋行业竞争数据,还可以用店透视、小旺神等插件进行转换,从而拿到真实数据。

图片

但最近,官方平台的指数算法升级,不同店铺的账号,看到同一个品牌的指数是不一样的,风控更严了。导致第三方插件逐渐无法使用。

图片

(点击查看大图)

但是,大盘销售额、本竞品市占率,又都是品牌方非常关注的指标,怎么办啊?

Part 2

探寻解法

遇事不决GPT,这事儿当然要找GPT,我就去找了它。

图片

GPT回答的第一点让我眼前一亮,困扰我们的问题的解法找到了!

通过找出历史数据中的销售额与相应时期的指数关系,建立数据模型,就可以测算出指数对应的大概销售额。

这题我会啊,不就是找y和x之间的函数关系,指数看成自变量x,实际成交金额看成因变量y。

只要能找出y与x之间的函数关系,我们可以去平台上获取指数x,通过函数关系计算出y的值,这题也就有解了。

此时的我,看到了希望······

然后,又陷入了绝望。这函数关系,咋找呢?我是数据产品经理,又不是算法工程师,要搞数据拟合,还要准确,这题咋解?

遇事不决GPT,我又把眼光投向了GPT,人我是PUA不了的,但GPT我可以无限PUA啊。

图片

唉,这个流程和数据分析很接近啊,数据分析我熟,这题大概能解了。

合并了一下思路,接下来要做三步:

1、数据收集与预处理

2、数据探查与模型建立

3、模型评估与验证

Part 3

实现过程

下面结合抖音-罗盘策略的品牌榜为例,来说说我的实现过程。生意参谋和京东商智也是一样的道理。

01 数据收集与预处理

之前明确过,测算的本质是:基于本品牌的历史数据,寻找指数与实际成交金额之间的函数关系,拟合出一个函数公式。

所以我们需要两部分数据:

1、本品牌的历史销售数据

2、行业竞争品牌榜的本品牌每日的指数值

把这两部分数据找出来之后,做个数据透视,留下需要的字段和数据。注意做好数据脱敏,最好把品牌相关信息去掉。

1、历史销售数据,保留以下字段:日期、品牌名称、销售额。

2、行业竞争品牌榜指数,筛选出自己品牌的指数数据,其他删掉,保留一下字段:日期、品牌名称、指数。

然后将这两部分数据,使用VLOOKUP函数合并到一张表格中。得到下图这样一张表,接下来就是寻找指数与销售额之间的函数关系了。

图片

可能有朋友在这一步就卡住了,Vlookup函数只能针对指定的一列做处理,没有办法处理两列啊。

没关系,遇事不决GPT,不妨我们把这个问题也丢给GPT看看。

你是一位excel处理专家。接下来需要问你一个excel问题,

我有两张数据表:

1)历史销售数据,字段有:日期、品牌名称、销售额。

2)行业竞争品牌榜指数,字段有:日期、品牌名称、指数。

我需要将第一张表的销售额拼到第二张表,根据日期和品牌名称拼,就是说,这两个字段一样时,拼过来。

我应该怎么操作?

图片

(向右滑动以查看)

再来看看更高阶的玩法,让GPT-4的代码解释器处理好给到我们。

在这里插入图片描述

(向右滑动以查看)

聊聊代码解释器

23年,GPT-4上线了代码解释器,它有一个很好用的地方是:允许模型自动生成代码,并且能够运行代码,当发现代码运行出错时,能自动修改代码继续运行。

这对于不会编程或者编程能力较弱的人来说是一个很大的福音,可以通过提示词来让GPT运行程序帮助自己处理一些问题。尤其是后来GPT又升级了一次,可以输入文件和导出文件。

这就意味着,我可以丢给GPT几个文件,然后让它处理,处理好之后把文件输出出来,整个过程相当丝滑。

就好比:我们提了一个数据处理的需求给Python工程师,工程师帮我们处理好了之后,然后又丢给我了。相当于有了一个可以无限PUA的Python工程师,让它干啥它就干啥,还从来不和你争论,一个月的工钱还不到200元。

代码解释器做数据处理有啥好处?

1、GPT-4做数据处理的原理是先自动编写Python脚本,通过Python做数据处理,所以不用担心它发生胡说

2、GPT-4可以上传多个文件,这样使得我们可以把数据文件上传给GPT-4,让它做处理

3、GPT-4可以输出文件,这样使得我们可以直接下载GPT-4处理好的文件

使用代码解释器的注意事项

1、代码解释器在封闭的环境下运行,且没有办法安装新的库(库在Python可以简单理解为一个个插件),也就是说如果没有这个库,可能Python是没有办法运行的。当然常用的一些库肯定是有的,比如数据分析、图表可视化、图像处理、机器学习等

2、注意数据脱敏,毕竟数据是需要上传给GPT的

3、提示词的写法,需要清晰、明确、具体

4、代码解释器目前的算力有限,且计算时间很小,如果数据量级过大目前还不太能处理。

使用Python做数据处理的注意点

1)一维数据、二维数据

一维数据:一般从各个平台下载下来的数据都是一维的,比如下图这种,字段(维度or指标)在一行,然后就是一条一条的数据

在这里插入图片描述

二维数据:一般是最终处理后的报表,比如下图,行与列均有对应的字段(维度or指标)
在这里插入图片描述

使用Python一般处理一维数据会比较好,二维数据,Python也能处理,但复杂度会高很多。所以,建议只给一维数据做处理。

2)数据处理类提示词写法注意点

数据类指令对清晰和明确要求会更高,所以在写此类指令要写清楚:有什么(输入),希望怎么处理(处理步骤),最后希望得到什么样的结果(输出)。

比如我这一段指令:

(角色设定)**你是一位Python处理专家,

输入)**接下来我会给你发两个文件:本品牌销售额、本品牌指数。

1)本品牌销售额字段有:日期、品牌名称、销售额

2)本品牌指数有:日期、品牌名称、指数

(处理过程)我希望你讲这两个文件合到一起,将本品牌销售额表中的销售额按照日期和品牌名称拼到本品牌指数表中

(输出)处理完之后,输出excel给我。

注释:

付费读书会产品的设计和销售

《视频号直播卖读书会 | 4小时进账2W+》@阿猫

付费减脂训练营的设计和实操

《0元投入变现4.5W,复购率超50%线上减脂营项目复盘》@小达

1、尽可能清晰明确,会发现我把字段全部列出来了,并告诉对方要怎么处理,“将本品牌销售额表中的销售额按照日期和品牌名称拼到本品牌指数表中”,这在数据逻辑中其实是左关联。

如果不明确,GPT也可以理解为另一种含义,“将本品牌指数表中的指数按照日期和品牌名称拼到本品牌销售表中。”

其实这是两种不同的含义,可能会导致结果出错。

2、如果处理步骤过多,最好描述清楚每一步的操作,减少大模型的思考,更容易得到自己需要的结果,比如下面这个提示词:

图片

总结 | 基于GPT-4的3种数据处理方式

图片

(点击查看大图)

大家可能到这一步,基本的数据处理能力就具备了,接下来会和大家分享稍微硬核点的内容,如何用GPT做算法调教。

这里涉及一些数据分析的逻辑,算法复杂不复杂都不重要,因为最后都是投喂给GPT去做的。

02 数据探查与算法建模

这部分是最重要的,需要我们通过GPT拟合出这两者之间的函数关系。

这部分需要对算法有一些基本的理解,先分享一些我理解的基本逻辑(我没有搞过算法,以下均是我个人在这次调教过程中总结的一些经验)

算法拟合基本的逻辑:数据预处理 >> 选择合适的算法模型 >> 调教模型,确定参数 >> 数据验证。

在这里插入图片描述

(点击查看大图)

关键点:

模型选择:模型有很多种,线性回归、多项式回归、决策树等等,需要根据我们当前面临的问题选择合适的模型,比如回归问题适合使用线性回归,分类问题适合决策树。

评估指标确定:一个判断什么样的模型是合格的标准,基于这个标准,我们可以选择到合适的模型。

这里带大家回忆一下高中数学学习过的线性回归,就是一个算法模型的处理过程。

数据探查:我们一般会先画散点图,观察趋势

模型选择:然后再使用线性回归方程求出参数

效果评估:计算R^2的值来评估模型拟合的好坏

图片

(向右滑动以查看)

本次可能用到的算法模型:

图片

(点击查看大图)

好了,我们回头来看看这次的案例。

数据探查 | 先让GPT预处理

我们可以先让GPT自己处理一下,看看GPT的效果:

图片

图片

(向右滑动以查看)

处理的时候会发现,GPT虽然拟合的效果不错,但与我们最终的目标还是差了点。

算法建模 | 反复调教GPT来修正结果

就像我们刚刚讲的,有两个关键点,我们来看看:

模型选择:不妨先从线性回归模型尝试,然后再尝试多项式回归(这里直接和大家说结论,指数测算需要使用分段函数,每一段内分别用一次项、二次项、三次项进行拟合)

评估指标:使用R^2和差值率(计算公式为:(测算金额-实际金额)/实际金额)。选择这两个指标的原因如下:

R^2,是统计学中用来评估模型的重要标准

差值率,是我们判断拟合效果的核心指标(最后会计算差值率作为监控的指标)

这里给大家贴一下我当时调教的记录:

图片

(向右滑动以查看)

按照这样的方式不断调教,每次让GPT给我们15种方案,直到我们能找到R^2>99% ,-5%< 差值率 < 5%的函数关系。

03 模型效果评估

测算完之后,需要验证这套公式是否可以使用。

验证方法如下:

验证标准:将实际成交金额与用指数计算出来的成交金额做差值比对。

1)通过GPT拟合出来的公式,计算成交金额

2)计算两个值,差值 = 计算成交金额 - 实际成交金额,差值率 = (计算成交金额 - 实际成交金额)/实际成交金额

图片

最后会得到类似于上图的数据,可以看出来误差很小,基本上就可以判断:指数测算成功。

Part 4

最后效果

用GPT测算的结果怎么样?

根据上面找到的拟合方法,我们先来看看最终实现的结果:

天猫 / 抖音 / 京东,均可以测算出指数与实际金额之间的关系,误差在5%以内,且数据量越大、数据质量越高,误差越小。

下图是三个平台能否测算的结论:

图片

** 注释:最新消息,生意参谋行业竞争版块在4月30日发生调整,行业大盘会下线,其余变成区间值。

然后和大家分享一下,目前实现的效果:

在一张电子表格中,每天监控天猫/京东/抖音,三大平台的指定类目下的行业销售额、本竞品市占率,每天上午可自动生成监控报表。

图片

总结 | 目前AI大模型在数据层面的应用

图片

如何学习AI大模型?

现在社会上大模型越来越普及了,已经有很多人都想往这里面扎,但是却找不到适合的方法去学习。

作为一名资深码农,初入大模型时也吃了很多亏,踩了无数坑。现在我想把我的经验和知识分享给你们,帮助你们学习AI大模型,能够解决你们学习中的困难。

我已将重要的AI大模型资料包括市面上AI大模型各大白皮书、AGI大模型系统学习路线、AI大模型视频教程、实战学习,等录播视频免费分享出来,需要的小伙伴可以扫取。

在这里插入图片描述

一、AGI大模型系统学习路线

很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,我下面分享的这个学习路线希望能够帮助到你们学习AI大模型。

在这里插入图片描述

二、AI大模型视频教程

在这里插入图片描述

三、AI大模型各大学习书籍

在这里插入图片描述

四、AI大模型各大场景实战案例

在这里插入图片描述

五、结束语

学习AI大模型是当前科技发展的趋势,它不仅能够为我们提供更多的机会和挑战,还能够让我们更好地理解和应用人工智能技术。通过学习AI大模型,我们可以深入了解深度学习、神经网络等核心概念,并将其应用于自然语言处理、计算机视觉、语音识别等领域。同时,掌握AI大模型还能够为我们的职业发展增添竞争力,成为未来技术领域的领导者。

再者,学习AI大模型也能为我们自己创造更多的价值,提供更多的岗位以及副业创收,让自己的生活更上一层楼。

因此,学习AI大模型是一项有前景且值得投入的时间和精力的重要选择。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1691244.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ts 字符串不能做索引异常提示 type because expression of type ‘string‘

Element implicitly has an any type because expression of type string cant be used to index type 例子 let a{b:"1",c:"1" } var b"b"; let ca[b] let ca[b]就会爆这个错误&#xff0c;因为在编译器看来b是一个未知的东西&#xff0c;它不…

生物识别技术存在的问题及需要考虑的关键事项

微信关注公众号网络研究观获取更多。 对数字身份验证不太了解的人通常认为生物识别技术是我们所有身份验证问题的答案。 许多人认为身份验证的终极是面部识别&#xff0c;甚至可能是 DNA 分析。 生物识别技术&#xff08;例如指纹、面部、虹膜、视网膜、静脉、几何、语音、…

148.【Windows DOS命令脚本文件】

Window待处理脚本 (一)、批处理编程初步体验1.什么是批处理程序&#xff1f;(1).批处理程序的定义(2).如何编辑批处理程序 2.批处理程序可以做什么&#xff1f;(1).匹配规则删除文件(2).新建文件&#xff0c;日志等(3).创建计算机病毒等 3.一个基本的批处理文件(1).带盘符的输出…

Java_多线程

有了多线程&#xff0c;我们就可以让程序同时做多件事情 作用&#xff1a; 提高效率 应用场景&#xff1a; 只要想让多个事情同时运行就需要用到多线程 比如&#xff1a;软件中的耗时操作、所有的聊天软件、所有的服务器... 并发和并行 并发&#xff1a;在同一时刻&#xff0…

一文详解逻辑越权漏洞

1. 逻辑越权 1.1. 漏洞原理 逻辑越权漏洞就是当用户跳过自己的权限限制&#xff0c;去操作同等级用户或者上级用户。正常的情况下&#xff0c;当一个用户去访问某个资源的时候&#xff0c;首先需要去登录验证自己的权限&#xff0c;其次是对数据的查询&#xff0c;最后返回数…

2024年学浪视频怎么下载到手机相册

随着2024年的到来&#xff0c;学浪平台继续为广大学习者提供优质的在线教育资源。然而&#xff0c;如何将这些宝贵的视频内容下载到手机相册&#xff0c;方便随时离线观看呢&#xff1f;无论您是想在旅途中学习&#xff0c;还是希望在没有网络的情况下复习课程&#xff0c;本文…

Linux之单机项目部署

1、虚拟机&#xff08;VMware&#xff09;创建Linux系统 1.1、创建虚拟机 1.2、配置虚拟机IOS映射文件 1.3、虚拟机内部相关配置 等待加载即可&#xff0c;加载完后会弹出图形化界面&#xff0c;如图&#xff1a; 注意&#xff1a;一般我们做为管理员使用ROOT账号来操作&#x…

Java之SpringSecurity使用心得

文章目录 一、内存身份认证二、jdbc身份认证三、自定义登录页 一、内存身份认证 添加pom依赖 <!-- Spring Security提供的安全管理依赖启动器 --> <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-s…

串口服务器在工业控制领域的应用:深度解析与前沿实践

在工业控制领域&#xff0c;随着技术的不断发展&#xff0c;传统的串口通信方式已经难以满足现代工业系统对高效、稳定、安全通信的需求。此时&#xff0c;串口服务器作为一种先进的通信技术解决方案&#xff0c;正在逐步改变工业控制领域的通信格局。本文将深度解析串口服务器…

第十届水利、土木工程国际学术会议暨工程安全与防灾论坛 (ICHCE ESDP 2024)

文章目录 一、会议详情二、重要信息三、会议简介四、组织单位五、出席嘉宾六、大会议程七、咨询 一、会议详情 二、重要信息 会议官网&#xff1a;www.ichce.org 大会时间&#xff1a;2024年8月9-11日 最后一轮截稿时间&#xff1a;2024年6月30日 报名截止时间&#xff1a;2…

得物小程序逆向+qt可视化(不含sku)

声明 本文章中所有内容仅供学习交流使用&#xff0c;不用于其他任何目的&#xff0c;抓包内容、敏感网址、数据接口等均已做脱敏处理&#xff0c;严禁用于商业用途和非法用途&#xff0c;否则由此产生的一切后果均与作者无关&#xff01;wx a15018601872 本文章未…

linux-配置服务器之间 ssh免密登录

前言 在管理多台Linux服务器时,为了方便操作和自动化任务,实现服务器之间的SSH免密登录是非常有必要的。SSH免密登录可以避免每次远程连接时输入密码,大大提高效率。本文将详细介绍SSH免密登录的原理和实现步骤。 一、原理解释 SSH免密登录的实现依赖于SSH密钥对,主要是利用…

为什么手机冬天续航短 – 锂电池的温度特性曲线

原文出自微信公众号【小小的电子之路】 相信大家都有这样的经历&#xff1a;手机的续航能力在寒冷的冬天会有一定程度的降低&#xff0c;有些手机甚至充不进去电。在这种情况下&#xff0c;有些人可能会在手机上贴一个暖宝宝。其实这个问题不止出现在手机上&#xff0c;大家如果…

Mybatis Cache(一)MybatisCache+Redis

前面提到了&#xff0c;使用mybatis cache&#xff0c;一般是结合redis使用。 一、demo 1、数据表 create table demo.t_address (id int auto_incrementprimary key,address_name varchar(200) null,address_code varchar(20) null,address_type int n…

Java进阶学习笔记4——Static应用知识:代码块

代码块&#xff1a; 代码块是类的五大成员之一&#xff08;成员变量、构造器、方法、代码块、内部类&#xff09;。 Java类生命周期&#xff1a;加载、验证、准备、初始化、卸载。 代码块分为两种&#xff1a; 静态代码块&#xff1a; 格式&#xff1a;static {} 特点&…

Linux--网络通信(一)概述

网络通信概述 网络通信本质上是一种进程间通信&#xff0c;是位于网络中不同主机上的进程之间的通信&#xff0c;属于 IPC 的一种&#xff0c; 通常称为 socket IPC。所以网络通信是为了解决在网络环境中&#xff0c;不同主机上的应用程序之间的通信问题。 大概可以分为三个层…

物联网应用开发--STM32与机智云通信(ESP8266 Wi-Fi+手机APP+LED+蜂鸣器+SHT20温湿度传感器)

实现目标 1、熟悉机智云平台&#xff0c;会下载APP 2、熟悉新云平台创建产品&#xff0c;项目虚拟调试 3、掌握云平台生成MCU代码&#xff0c;并移植。机智云透传固件的下载 4、具体目标&#xff1a;&#xff08;1&#xff09;注册机智云平台&#xff1b;&#xff08;2&…

转行3年涨薪300%,我总结了一套产品经理快速入门指南!

想转行的产品小白&#xff0c;初期一定会遇到这个问题——我要如何 0 基础转行产品经理&#xff1f; 要想 0 基础快速转行产品经理&#xff0c;我通过个人实践总结了 5 个关键点&#xff0c;可以参考。 一、熟悉产品经理的工作全流程 转行的产品小白&#xff0c;首先要建立产…

mninst数据集图片下载

//不需要在官网下载&#xff0c;直接通过python代码&#xff0c;利用pytorch下载即可 from icecream import ic from torchvision import datasets from tqdm import tqdm import ostrain_data datasets.MNIST(root"./data/", trainTrue, downloadTrue) test_data …

VMware虚拟机桥接无线网卡上网(WIFI)

一、打开VM点击【编辑】-【虚拟网络编辑器】 二、点击【桥接模式】- 点击【自动设置】- 选择自己的无线网适配器 - 【确定】 三、开机之后会弹出提示连接网络&#xff0c;就能看见网络已经连上了