LLM赋能产业数智化业务系统升级的思考

news2024/10/6 8:29:04

1概述

  • 2022年是人工智能的一个分水岭,ChatGPT,DALL E[ DALL E:是一款可以根据文本描述创建图像的AI工具。]和Lensa[ Lensa:是一款AI美图软件。]等几个面向消费者的应用程序发布了,它们的共同主题是使用生成式人工智能(AI Generated Content,简称AIGC),这是人工智能领域的一次范式转换。当前的人工智能使用模式检测或遵循规则来帮助分析数据和做出预测,而Transformer[ Transformer:是特征抽取器,用于特征抽取的一种深层级网络结构。可以完成自然语言处理领域研究的典型任务:如机器翻译,文本生成等,同时又可以构建预训练语言模型,用于不同任务的迁移学习。]架构的出现则开启了一个新领域:生成式人工智能可以通过创建类似于其所训练的数据的新颖数据来模仿人类的创造过程,将人工智能从“赋能者”提升为(潜在的)“协作者”。

  • 从城市智慧化发展需求来看,借助智慧城市技术体系补齐城市公共服务短板,促进产业高质量发展,推进城市治理精准化,是实现“设备互联、数据互联、业务互联、产业互联、产城融合”新型智慧城市的重要手段;从产业数字转型来看,发展技术替代劳动是人类社会生产力大幅提升的重要动力,借助新一代核心技术体系建立产业智慧化支撑技术体系,高效地采集、传输、处理、共享海量信息,是将“信息获取-运算-决策-反馈”流程变得更加高效的重要路径。
    在这里插入图片描述

  • 大模型呈现出来的涌现能力将代替数据成为新的基础设施,而且拐点以ChatGPT发布为基线已经到来。从整个创新行业来看,新技术的迭代速度大大加快,以技术引领的重塑行业应用生态已然是进行时。因此建立一个创新技术研究机构和体系越来越重要,紧密跟进前沿技术研究与发展趋势,快速响应技术给行业、业务、应用带来的影响,建立创新研究平台在创新技术研究、技术耦合产业应用、技术变革业务需求将成为科技服务提供者的重要支撑平台。笔者理解的大模型在产业数智化领域的应用落地体现出来的基本能力为:理解人类语言、语言解析+搜索结合下的实时信息获取、代码生成、理解文本重点内容、理解图表。
    在这里插入图片描述

大模型如何创新产业数字化业务系统

当前产业数字化的各业务系统解决了一部分产业端设备、数据、人、组织等的互联协作问题,也带来了一些额外的工作和问题,比如数据采集端,物联设备协议的维护、业务系统(如ERP)数据填报、数据分析工作中查询挑选报表、审批流程的更改替换等,上述工作目前的业务系统还需要靠手工方式,费时费力且极容易造成数据录入的不精准、不及时。另一方面大量重复的工作集中在数据录入、流程调整、异常数据的整理等,而不是基于数据做分析与决策。
大模型与产业数字化业务系统的结合将一方面解决传统业务系统面对的一些痛点问题、解决产业三存在的顽疾;另一方面将大模型作为一个基础设施,通过类chatGPT的对话大模型作为统帅,进一步打通各业务系统的壁垒,调度各类业务系统解决产业协同不足的问题,将多智能体嵌入到产业中。大模型作为基础设施与数据中台、OA系统、ERP系统的结合模式,创新人机交互的模式。
在这里插入图片描述

  • 数据中台与大模型的结合
    当前数据中台的主要功能一般有:数据集成、数据调度、数据建模、BI展示和分析报告,是一个将产业数字化各业务系统以数据链接在一起、数据集中之后发掘数据价值的中间件,对于产业端来说,是产业数字化、解决产业各链条协作问题的关键部件。但是当前数据中台往往成为一个数据管理的构件,建立分析模型发掘数据价值,解决产业问题方面发挥的作用有限,其中主要的问题是对于当前的数据中台,数据分析师的大量工作师在找数据、处理异常数据、撰写数据分析报告中的事实性(趋势描述)描述,而非建立数据分析流程和数据分析模型的建立与优化工作。
    在这里插入图片描述
    借助大模型在语言理解、代码生成、数据聚合、文本生成等方面的优势,可以解决数据中台在数据获取、报表聚合、数据分析建模、文档生成方面存在的痛点。详情如下:
    在这里插入图片描述

2实践

大模型赋能数据中台,做数据获取、数据清洗、数据聚合及分析、数据报告生成。

  • 数据获取-爬虫
#数据爬虫
from tempfile import template
from langchain.chains.llm import LLMChain
from langchain import prompts
from langchain.prompts import PromptTemplate
from langchain.llms import OpenAI
from langchain.chains import LLMRequestsChain,LLMChain
from langchain.agents import create_csv_agent
from langchain.llms import OpenAI,OpenAIChat
import os

#你申请的openai的api_key
os.environ["OPENAI_API_KEY"] = ""

#定义openai的语言模型llm
llm=OpenAI(model_name="gpt-3.5-turbo-16k-0613",temperature=0)

#定义提示词
template = """在 >>> 和 <<< 之间是网页的返回的HTML内容。

网页是全国生猪市场数据表格。

请抽取参数请求的信息。获取每个产地的生猪市场报价;

>>> {requests_result} <<<
请使用如下的JSON格式返回数据
{{
  "province": [
    {{
      "规格": "a",
      "单位":"元/公斤",
      "报价": "50",
      "报价提供方":"b",
      "发布时间":"b"
    }},
    {{
      "规格": "a",
      "单位":"元/公斤",
      "报价": "50",
      "报价提供方":"b",
      "发布时间":"b"
    }},
  ]
}}

例如,province为湖南长沙,JSON数据应该是如下形式:

{{
  "湖南长沙": [
    {{
      "规格": "a",
      "单位":"元/公斤",
      "报价": "50",
      "报价提供方":"b",
      "发布时间":"b"
    }},
    {{
      "规格": "a",
      "单位":"元/公斤",
      "报价": "17.0",
      "报价提供方":"b",
      "发布时间":"b"
    }},
  ]
}}
Extracted:"""

PROMPT = PromptTemplate(
    input_variables=["requests_result"],
    template=template,
)

chain = LLMRequestsChain(llm_chain = LLMChain(llm=llm, prompt=PROMPT,verbose=True))

inputs = {
    "url": "http://pig.100ppi.com/price/"
}
response = chain(inputs)
print(response['output'])

在这里插入图片描述

  • 数据清洗-正则式
from langchain.agents import create_csv_agent
from langchain.llms import OpenAI,OpenAIChat
import os

#你申请的openai的api_key
os.environ["OPENAI_API_KEY"] = ""
#定义openai的语言模型llm
llm=OpenAI(model_name="text-davinci-003",temperature=0)
#创建一个csv代理
agent = create_csv_agent(llm=llm,path = ['/content/drive/MyDrive/结构化数据/正则式1.csv'],verbose=True)
agent.run('提取表内容的7月28日、7月31日猪肉、牛肉、羊肉价格,整理成表格,保存为csv文件')

在这里插入图片描述

  • 数据聚合分析
from langchain.agents import create_csv_agent
from langchain.llms import OpenAI,OpenAIChat
import os

#你申请的openai的api_key
os.environ["OPENAI_API_KEY"] = ""

#定义openai的语言模型llm
llm=OpenAI(model_name="text-davinci-003",temperature=0)
#创建一个csv代理
agent = create_csv_agent(llm=llm,path = '/content/drive/MyDrive/结构化数据/分析数据1.csv',verbose=False)
agent.run('汇总统计东升猪场每年月死亡育肥猪数量、死亡生产母猪数量,并输出一段该数据每年度的月度趋势分析的描述,绘制生产数据的趋势图,并保存到本地')

在这里插入图片描述

思考

**大模型成为新的基础设施:**大模型呈现出来的涌现能力将代替数据成为新的基础设施,而且拐点以ChatGPT发布为基线已经到来。
**”模型系统“:**人类思考协作本质上是一个模型系统,借助于大模型底层研发逻辑,更多的模型系统将通向大模型。
**产品应用的开发需与大模型深度结合:**以后的产品研发逻辑是借助大模型的基础能力做深度的融合,在解决长期未解决的业务痛点上存在可能。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/913398.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【日常积累】Cookie和Session的区别

背景 会话&#xff08;Session&#xff09;跟踪是Web程序中常用的技术&#xff0c;用来跟踪用户的整个会话。常用的会话跟踪技术是Cookie与Session。Cookie通过在客户端记录信息确定用户身份&#xff0c;Session通过在服务器端记录信息确定用户身份。 本章将分享一些关于Cooki…

【高危】MarkText<=0.17.1 存在DOM型XSS漏洞 (CVE-2023-2318)

漏洞描述 MarkText 是热门的开源Markdown编辑器&#xff0c;覆盖Windows/Linux/MacOS平台。 MarkText 0.17.1及之前版本中的 pasteCtrl 类未对用户可控的 HTML 内容进行过滤&#xff0c;当用户将攻击者可控的 HTML 代码粘贴至 MarkText 编辑器中时&#xff0c;攻击者可利用DO…

鸿蒙应用开发之基础组件

一、组件简介 组件&#xff08;Component&#xff09;是界面搭建与显示的最小单位&#xff0c;HarmonyOS ArkUI声明式开发范式为开发者提供了丰富多样的UI组件&#xff0c;我们可以使用这些组件轻松的编写出更加丰富、漂亮的界面。 组件根据功能可以分为以下五大类&#xff1…

Leetcode---359周赛

题目列表 2828. 判别首字母缩略词 2829. k-avoiding 数组的最小总和 2830. 销售利润最大化 2831. 找出最长等值子数组 一、判断首字母缩略词 纯模拟&#xff0c;代码如下 class Solution { public:bool isAcronym(vector<string>& words, string s) {string tmp…

如何将pdf文件转换成word文档?

如何将pdf文件转换成word文档&#xff1f;PDF文档是我们日常办公中最为常用的电子文档格式的文件&#xff0c;也是在会议、教育培训以及商业营销中经常使用的文档格式。所以说PDF文档的功能较强&#xff0c;且应用场景较多。但是也有例外的时候&#xff0c;比如我们需要将PDF文…

vue项目中使用ts的枚举类型

vue项目中要使用ts的枚举类型需要为script标签的lang属性添加ts属性值 <script lang"ts" setup> </script > 声明枚举类型&#xff1a; //语法 /* enum 枚举名称 {可能的值 }*/ enum scenic_status {"正常" 1,"审核中","暂停…

Prometheus 监控系统---你值得拥有

目录 一&#xff1a;Prometheus 1、Prometheus 概述 2、应用场景 3、Prometheus 的特点 4、Prometheus 的生态组件 &#xff08;1&#xff09;Prometheus server&#xff1a;服务核心组件 &#xff08;2&#xff09;Client Library: 客户端库 &#xff08;3&#xff0…

c语言(12)

第一题 容易下意识认为这个判断是ASCII码值在0到9之间&#xff01; 第二题 第三题 第四题 第五题 第六题 用递归很容易就解决了 第七题

合规试制“精准狙击”秘籍——趣味浅析16949五大质量管理工具

在极其重视产品质量的汽车行业&#xff0c;如何制造出一件合格的产品进而获得主机厂的青睐&#xff0c;就像狙击手射出的子弹是否能命中目标&#xff0c;“百发百中”是每一个汽配供应商的最终梦想。 目前&#xff0c;汽配零部件企业必须通过质量管理体系的认证&#xff0c;才有…

“MyBatis入门及环境搭建“

目录 引言1. 什么是MyBatis2.MyBatis的优势与特点3. MyBatis环境搭建3.1 安装 Java 开发工具包 &#xff08;JDK&#xff09;3.2 下载我的MyBatis插件3.3 创建 MyBatis项目3.4 MyBatis的配置文件 4. MyBatis基本操作5. MyBatis增删改查测试类 6. MyBatis总结 引言 在现代的软件…

网络安全在医疗行业中的重要性

不可否认&#xff0c;现代世界见证了技术和医疗行业的交织&#xff0c;塑造了我们诊断、治疗和管理健康状况的新方式。随着电子健康记录取代纸质文件&#xff0c;远程医疗缩短了患者和医疗服务提供者之间的距离&#xff0c;数字化转型既是福音&#xff0c;也是挑战。最近的全球…

【正点原子STM32连载】第十九章 通用定时器输入捕获实验 摘自【正点原子】APM32F407最小系统板使用指南

1&#xff09;实验平台&#xff1a;正点原子stm32f103战舰开发板V4 2&#xff09;平台购买地址&#xff1a;https://detail.tmall.com/item.htm?id609294757420 3&#xff09;全套实验源码手册视频下载地址&#xff1a; http://www.openedv.com/thread-340252-1-1.html# 第十…

一个例子看懂IO模型

1.用户态和内核态 现代操作系统将空间划分为用户空间和内核空间。 用户态&#xff1a;一般都是些应用程序&#xff0c;不能直接的访问内核空间和硬盘。 内核态&#xff1a;操作系统的核心&#xff0c;只有切换到内核态才能操作磁盘。 2.同步、异步、阻塞、非阻塞 我们使用前后…

Java请求webservice踩过的坑

最近项目对接过程中&#xff0c;因为对方系统比较旧&#xff0c;我们和对方进行交互使用webservice方式进行&#xff0c;对方给出相关文档&#xff0c; 接口地址&#xff1a;http://ip:port/abc/def/xxxService?wsdl 接口名称&#xff1a;methodA 1-springboot配合CXF使用 …

智慧水务建设项目可研报告-222页【可研报告】

导读&#xff1a;原文《智慧水务建设项目可研报告-222页【可研报告】》&#xff08;获取来源见文尾&#xff09;&#xff0c;本文精选其中精华及架构部分&#xff0c;逻辑清晰、内容完整&#xff0c;为快速形成售前方案提供参考。 部分内容&#xff1a; 业务需求分析 3.3.1业…

CentOS7中使用Docker进行MySQL主从复制【论文式教程】

1、安装Docker 卸载docker sudo yum remove docker*安装 yum-utils 工具集&#xff0c;它提供了一些额外的命令和功能&#xff0c;帮助你更好地管理 YUM 软件包管理器。其中包含了一个工具叫做 yum-config-manager&#xff0c;它用于管理 YUM 配置&#xff0c;包括软件仓库源…

计算机视觉:比SAM快50倍的分割一切视觉模型FastSAM

目录 引言 1 FastSAM介绍 1.1 FastSAM诞生 1.2 模型算法 1.3 实验结果 2 FastSAM运行环境构建 2.1 conda环境构建 2.2 运行环境安装 2.3 模型下载 3 FastSAM运行 3.1 命令行运行 3.1.1 Everything mode 3.1.2 Text prompt 3.1.3 Box prompt (xywh) 3.1.4 Points p…

Docker容器学习:部署安装Docker基础使用

目录 1、安装Docker-CE 1&#xff09;参考阿里云的yum安装 2&#xff09;二进制安装docker&#xff08;推荐、生产环境使用较多&#xff09; 3&#xff09;配置Docker镜像加速 2、下载系统镜像&#xff08;Ubuntu、 centos&#xff09; 1&#xff09;先查看我们所需的镜像…

如何通过人工智能和自动化提高供应链弹性?

全球供应链中的数字化转型已经引起了广泛关注&#xff0c;尽管在过去的十年中&#xff0c;这一话题被广泛讨论&#xff0c;但许多公司仍然对如何实现这一不明确的目标感到困惑。人们普遍认识到这种转变的重要性&#xff0c;而新冠疫情及其带来的巨大影响也为行业向数字化转型方…

数字生意,经九长兴 | 带您一起回顾秦丝9年成长历程

今年是秦丝科技成立的第9年&#xff0c;9年前我国90%以上的商家处于原始手工记账状态&#xff0c;急需SaaS软件实现数字化转型&#xff0c;高效管理门店&#xff0c;秦丝科技创始人主动扛起了帮中小商家数字化转型的重任。 经过9年的发展&#xff0c;秦丝目前已经成功帮助200万…