企业本地部署大型语言模型(LLMs)构建本地垂直领域知识库的策略|空天防御

news2024/9/27 6:46:04

0 引言

在数字化转型的浪潮中,传统企业面临着前所未有的机遇与挑战。随着大数据、云计算和人工智能技术的发展,企业积累的私有数据成为了潜在的金矿,等待着被挖掘和利用。大型语言模型(LLMs)作为当前人工智能领域的前沿技术,能够帮助企业从海量数据中提取有价值的信息,优化决策流程,提升服务质量。

然而,如何在企业本地环境中充分利用私有数据发挥大模型的能力,是许多企业亟需解决的问题。大型语言模型(LLMs)在专有领域依然存在知识幻觉、答非所问等问题,距离行业应用落地依然面临不小挑战。企业内部具有丰富的领域场景,高质量、大规模的领域数据,而在互联网场景下,企业面临极大的数据安全与隐私挑战。如何利用企业内部数据发挥大模型能力,在利用大模型能力的过程中保证数据安全,避免任何的数据隐私泄露以及安全风险,成为一个当前研究的热点议题。

本文将简要介绍企业如何通过一系列策略和步骤,在本地部署和利用大模型,构建企业本地垂直领域知识库。

1 明确业务需求

在本地部署私有大型语言模型(LLMs)之前,企业首先需要明确其业务需求和目标。通过业务流程分析、痛点识别、资源评估、技术选型以及预期成果等步骤,识别哪些业务流程可以通过大型语言模型(LLMs)技术得到改进,例如代码生成、内容创作、数据分析和信息检索等。

2 数据收集与整理

数据是大型语言模型(LLMs)学习的基础,企业私有数据的质量和数量直接影响模型训练的效果。企业在长期运营过程中,积累了大量的私有数据。首先,企业需要确定哪些业务环节和操作中会产生有用的数据。常见的数据来源包括人力资源信息,财务信息、体系文件和试验数据等等。

企业需要对私有数据进行预处理和清洗,确保数据质量。这包括去除无关信息、纠正错误、标准化格式等,大型语言模型(LLMs)能够更好地理解和处理数据。

同时,企业需要投入资源,建立专业的数据科学团队,或者与专业的数据服务公司合作,以确保数据整理工作的专业性和效率。

3 模型选择和训练

企业在选择模型时需要考虑到模型的复杂性、性能和适用性。对于私有大模型的部署,可以选择从头开始训练一个模型,或者在现有开源模型的基础上利用企业私有数据进行微调,或者采用检索增强生成技术(RAG)。

关于训练大模型的具体成本,目前似乎尚无明确答案。大模型训练需要多少算力?OpenAI在GPT-4的训练中,动用了大约25000个A100 GPU,历时近100天,并采用分布式计算以加速模型的训练过程,从而使GPT-4表现出卓越性能。而一张英伟达A100的价格十万人民币以上,由此可见,想要训练出大模型,需要投入大量的成本。

微调虽然显著降低了成本,但是对模型进行微调并没有解决知识截止问题,因为它只是将知识截止推迟到了更晚的日期。因此,建议仅在数据更新的速度较缓的情况下通过微调技术来更新 LLMs 的内部知识。除了知识截止问题,目前微调还可以帮助减轻幻觉,但不能完全消除它们。一方面原因在于大模型在提供答案时没有引用其来源。因此,你不知道答案是来自预训练数据、微调数据集,还是大模型编造的。另一方面,如果我们使用 LLMs 创建微调数据集,则可能存在另一个可能的虚假来源。最后,经过微调的模型无法根据提出问题的用户自动提供不同的响应。同样,不存在访问限制的概念,这意味着与大模型互动的任何人都可以访问其所有信息,所以对于机密信息的处理就成为问题。

图片

图1 检索增强生成技术(RAG)和微调的对比[1]

检索增强生成技术(RAG)通过大型语言模型+知识召回的方式,解决通用大语言模型在专业领域回答缺乏依据、存在幻觉的问题,是各类基于大模型的知识问答应用的常用技术。RAG 有效地缓解了幻觉问题,提高了知识更新的速度,并增强了内容生成的可追溯性,使得大型语言模型在实际应用中变得更加实用和可信。并且,不同的用户可以根据自己的需求建立自己独特的知识库,保障了信息的知悉范围。

4 模型部署

首先选择对中文支持良好的开源大模型进行本地部署,以7B参数为例,国内开源大模型第一梯队当属阿里的通义千问Qwen 1.5,以及清华大学和智谱AI联合开发的ChatGLM3。

一方面可以通过部署开源工具进行本地大模型部署,Ollama是一个旨在简化大型语言模型本地部署和运行过程的工具。它提供了一个轻量级、易于扩展的框架,让开发者能够在本地机器上轻松构建和管理LLMs。通过Ollama,可以访问和运行一系列预构建的模型,或者导入和定制自己的模型,无需关注复杂的底层实现细节。

图片

图2 检索增强生成技术(RAG)[1]

另一方面,当前检索增强生成技术(RAG)有LangChain和 LlamaIndex 等流行框架。这些框架先从广泛的文档数据库中检索相关信息,把企业私有知识文档进行切片然后向量化后续通过向量检索进行召回,再作为上下文输入到大语言模型进行归纳总结。然后大模型利用这些信息来引导生成过程,极大地提升了内容的准确性和相关性。

企业可以利用开源大模型和开源工具将大模型部署到生产环境中,也可以与现有的IT基础设施和业务系统集成。通过整合内部文档、报告、用户手册和试验数据等资料,构建庞大企业知识库。这个知识库可以用来增强大模型的检索能力,使其在回答问题时能够引用更准确的信息。提供创新的智能搜索、智能问答、辅助创作、辅助阅读等认知能力,真正帮助企业实现内容管理“智能化”,进一步释放数据内容的价值。

5 持续监控和优化

部署私有大型语言模型(LLMs)并不是一次性的任务,而是一个持续的过程。企业需要持续监控模型的性能,收集用户反馈,并根据业务发展和市场变化结合RAG,同时对模型进行微调或者更新,提升大模型在企业垂直领域知识的精度。此外,企业还应定期评估模型输出的准确性,不断优化知识库内容。通过持续的监控和优化,企业可以确保其私有大模型始终处于最佳状态,为企业带来持续价值。

6 结论

本地部署大型语言模型(LLMs)构建企业垂直领域知识库是一个复杂的过程,需要企业在多个方面进行投入和规划。通过明确业务需求、合理处理数据、选择合适的模型、有效部署和持续优化,充分利用大模型的潜力,提升业务效率和企业的核心竞争力。随着AI技术的不断进步,本地部署的私有大模型将成为企业数字化转型的重要推动力。

如何学习AI大模型?

作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

img

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

img

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img

四、AI大模型商业化落地方案

img

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2077341.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于深度学习的手势识别系统

基于深度学习网络的手势识别系统 完整源码数据集报告PPT全套信息 【python设计开发】基于深度学习的手势图像识别处理系统 【包括】代码 PPT 报告 2 需求分析 2.1要求 (1)用Python语言实现程序设计; (2)初识深度学习…

个人网站无缝切换图片格式到 webp 或 avif

当你点进来,恭喜你来对地方了,我写的东西从来都是小白向的(把自己当小白),不会故作厉害写的云里雾里让人看不懂,既然发出来就会有人看到,不是每个人都是程序员懂技术的。 项目 为什么图片格式要…

QT绘制折现图

做一个小工具,需要根据数据绘制折线图,同时拥有方法缩小拖到等功能 运行结果: 原图: 滚轮缩小 滚轮放大 左移右移 鼠标悬停显示点的坐标 源代码 实现 .pro 使用QChart 加入其对应的模块 QT charts customchartview:继承chartView 重写了鼠标点击,鼠标释放,鼠标移…

MAC +win10 笔记本, OBS 桌面音频不起作用 问题 总结

现象: MAC+WIN10笔记本,音频是好好的,可以听,但是OBS使用的时候,桌面音频条,保持静止,录制的视频,也没有系统声音。 问题排查 1、通常的OBS无法捕获音频解决方法 1)、 驱动问题,更新到最新驱动 2)、声音参数配置问题 3)、右侧小喇叭,音量合成器中, 4)、设…

Midjourney Describe API 的对接和使用

Midjourney Describe API 的对接和使用 Midjourney Describe API 的主要功能是通过上传图片,获取对图片的描述。使用该 API,只需要传递图片文件地址,API 会返回图片的详细描述。无需繁琐的参数设置,即可获得高质量的图片描述。 …

VBA技术资料MF180:将某个文件夹中的某类图片导入Word

我给VBA的定义:VBA是个人小型自动化处理的有效工具。利用好了,可以大大提高自己的工作效率,而且可以提高数据的准确度。“VBA语言専攻”提供的教程一共九套,分为初级、中级、高级三大部分,教程是对VBA的系统讲解&#…

ssrf实现

一、SSRF (Server-side Request Forge, 服务端请求伪造) 1、概念: 它是一种由攻击者构造形成由服务端发起请求的一个安全漏洞。一般情况下,SSRF攻击的目标是从外网无法访问的内部系统。正是因为它是由服务端发起的,所…

SpringBoot项目如何使用和打包本地第三方jar包

有时候我们引用了maven仓库不存在的第三方jar,项目打包后jar包里没有引用的jar,解决方法往下看。 一、目录介绍 SpringBoot项目通过idea打成jar包部署。 将项目打成jar包后,所有引用的jar都存在于BOOT-INF\lib下: 如果存在本地…

HTML静态网页成品作业(HTML+CSS+JS)——迪士尼公主介绍(6个页面)

🎉不定期分享源码,关注不丢失哦 文章目录 一、作品介绍二、作品演示三、代码目录四、网站代码HTML部分代码 五、源码获取 一、作品介绍 🏷️本套采用HTMLCSS,使用Javacsript代码,共有6个页面。 二、作品演示 三、代码…

大白话【8】WindowsServer2016搭建DNS服务

1.DNS服务功能介绍 2.DNS服务器搭建 2.0准备环境 2.1把该DNS服务器设置成静态IP 2.2修改主机名(可省略) 2.3安装DNS服务 DNS服务器名为www;IP为192.168.2.100 3.客户机测试 在网内可网络连通的客户机如何验证DNS服务器域名解析有效性&#…

SparkShop开源商城 uploadFile 任意文件上传漏洞复现

0x01 产品简介 SparkShop开源商城(也被称为星火商城)是一款基于ThinkPHP6和Element UI的开源免费可商用的高性能商城系统。适用于各类电商场景,包括但不限于B2C商城、新零售、分销商城等。无论是初创企业还是成熟品牌,都可以通过SparkShop快速搭建个性化独立商城,实现线上…

机器学习:SVM的代码实现

目录 前言 一、完整代码 二、输出结果 三、实现步骤解析 1.读取数据 2.创建模型并训练 3.可视化SVM结果 总结 前言 支持向量机(SVM,Support Vector Machine)是一种用于分类和回归的监督学习算法。它的核心思想是通过在特征空间中找到…

全网最适合入门的面向对象编程教程:39 Python 常用复合数据类型-集合

全网最适合入门的面向对象编程教程:39 Python 常用复合数据类型-集合 摘要: 在 Python 中,集合(set)是一种常用的复合数据类型。集合是一组无序且不重复的元素。与列表和元组不同,集合中的元素是无序的&am…

Webpack中的 HTTP 压缩

http压缩介绍 http压缩,是指一种内置在服务器和客户端之间改进传输速度和带宽利用率的方式。 http 压缩的流程: http 数据在服务器发送前,通过 webpack配置进行压缩;兼容的浏览器在向服务器发送请求时,在请求头中会…

JS Java Script知识简单记录

JS 参考 导入方式 内联样式,和css(style)很像 script标签导入,可以放在head或body标签中 外联样式 打印内容方式 console.log:在控制台显示 alert:网页弹窗 JS变量 var函数作用域,let是块作用域…

OpenCV杂项图像变换(2)线性混合函数blendLinear()的使用

操作系统:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 编程语言:C11 算法描述 执行两个图像的线性混合: dst ( i , j ) weights1 ( i , j ) ∗ src1 ( i , j ) weights2 ( i , j ) ∗ src2 ( i , j ) \texttt{…

FaceFormer嘴形同步论文复现

一、项目地址 https://github.com/EvelynFan/FaceFormer 二、复现过程 1、项目环境 系统:Ubuntu 18.04.1 python版本:Python 3.7 使用conda创建一个虚拟环境,安装requirements.txt中所需要的库 2、安装ffmpeg 教程网址:http…

kafka 入门

kafka 有分区和副本的概念,partition 3 表示有3个分区,replication 2 表示有2个副本 通过 --describe --topic test命令可以知道 test这个 主题的分区和副本情况,途中的replicas 表示 其他副本分区的情况,如第一条,t…

Docker 安装 Zookeeper + Kafka 保姆级教程

1.创建 docker-compose.yml 创建一个名为 docker-compose.yml 的文件,并添加以下内容: version: 3.6services:zookeeper:image: zookeeper:3.6container_name: zookeeperports:- "2181:2181"networks:- kafka-networkenvironment:ZOO_STANDA…

策略路由与路由策略

1.策略路由与路由策略 1.1 策略路由(Policy Routing) 1.1.1 定义 策略路由是一种根据特定策略或条件(如源地址、目的地址、协议类型、接口、QoS等)来决定网络包转发路径的技术,而不是单纯依赖传统的最短路径或最优路…