大模型相关学习

news2025/2/22 12:54:43

知识科普

  1. 为什么不直接使用网页版 DeepSeek?

    • 我们的需求:绝对的隐私保护和个性化知识库构建。
    • 场景:若希望大模型能根据企业规章制度来回答问题,一般需上传企业规章制度的附件,但仍可能面临问题。
      • 数据隐私问题:联网使用时大型数据隐私性无法得到绝对保证。
      • 上传文件的限制问题:网页版 AI 对于文件上传的数量、大小一般有限制并且通常需要付费。
      • 仅通过附件扩展上下文功能有限:每次在新对话中提问相关问题时,仍需要重新上传附件;修改删除对话中已有的附件困难。
  2. 如何实现网页版 DeepSeek 不能实现的需求?

    • 隐私保护:通过对话大模型(如 DeepSeek)的本地部署解决隐私问题。
    • 个性化知识库构建:使用 RAG 技术(Retrieval - Augmented Generation,检索增强生成)构建个人知识库。为此需要:
      • 本地部署 RAG 技术所需要的开源框架 RAGFlow。
      • 本地部署 Embedding 大模型(或者直接部署自带 Embedding 模型的 RAGFlow 版本)。

为什么使用RAG技术

  • 模型微调:在已有预训练模型基础上,结合特定任务数据集进一步训练,让模型在该领域表现更好,类似考前复习。
  • RAG 技术
    • 原理:在生成回答前,通过信息检索从外部知识库查找相关知识,增强生成过程信息来源,提升生成质量和准确性,解决模型幻觉问题。
    • 流程
      • 检索:用户提问时,系统从外部知识库检索相关内容。
      • 增强:将检索信息与用户输入结合,扩展模型上下文,再传给生成模型(如 DeepSeek)。
      • 生成:生成模型基于增强后的输入生成最终回答,因参考外部知识库内容,更准确可读。

什么是 Embedding?为什么除了 DeepSeek、RAGFlow 外我还需要 “Embedding 模型”?

  • 检索(Retrieval)的详细过程
    • 准备外部知识库:外部知识库可能来自本地的文件、搜索引擎结果、API 等。
    • 通过 Embedding(嵌入)模型,对知识文件进行解析:Embedding 的主要作用是将自然语言转化为机器理解的高维向量,并且通过这一过程捕获到文本背后的语义信息(比如不同文本之间的相似关系)。
    • 通过 Embedding(嵌入)模型,对用户的提问进行处理:用户的输入同样会经过嵌入(Embedding)处理,生成一个高维向量。
    • 拿用户的提问去匹配本地知识库:使用这个用户输入生成的高维向量,去查询知识库中相关的文档片段。在这个过程中,系统会利用某些相似度度量(如余弦相似度)去判断相似度。
  • 模型的分类:Chat 模型、Embedding 模型;
    • 简言之,Embedding 模型是用来对上传的附件进行解析的。

本地部署的全流程

  1. 下载 ollama,借助 ollama 将 DeepSeek 模型下载到本地运行。
  2. 下载 RAGflow 源代码和 Docker,利用 Docker 本地部署 RAGflow。
  3. 在 RAGflow 中构建个人知识库,并实现基于个人知识库的对话问答。

Ollama安装以及配置

下载

 官网:Ollama

注册并下载,下载完成后直接运行exe程序进行安装。

安装完成后

添加系统配置

 OLLAMA_HOST将ollama的端口暴露出来。

OLLAMA_MODELS配置ollama下载模型的存储位置(配置完重启电脑才能生效)

下载大模型(以deepseek r1 1.5b为例)

 复制命令

ollama run deepseek-r1:1.5b

打开cmd执行命令完成下载

下载RAGflow源代码

GitHub的中文文档的 

iragflow/README_zh.md at main · infiniflow/ragflowinfiniflow/ragflow: RAGFlow is an open-source RAG (Retrieval-Augmented Generation) engine based on deep document understanding.

 如果不会用git的话可以直接跳到code页面下载压缩包

 

下载 Docker

Docker 镜像是封装好的环境,含运行 RAGflow 所需依赖、库和配置。

若安装遇问题可自行搜索报错或询问 gpt;

若镜像拉不下来,可尝试修改 docker 的镜像源。

修改RAGflow的docker配置

 

如何不修改配置,docker会默认下载轻量的版本,轻量级的版本是没有embedding的。

进行修改

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2301197.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于Java(JSP)+MySQL设计与实现的 MVC 鲜花订购系统

基于MVC的鲜花订购系统的设计与实现 摘 要 摘 要:鲜花订购系统与网络相结合,给用户提供更加周到和人性化的服务。网站模式为MVC模式,基于MySql数据库,采用Jsp,Session绘画跟踪、JavaScript等技术,实现了普通用户可以浏览、查看鲜…

网络原理-

文章目录 协议应用层传输层网络层 数据链路层 协议 在网络通信中,协议是非常重要的概念.协议就是一种约定. 在网络通信过程中,对协议进行了分层 接下来就按照顺序向大家介绍每一种核心的协议. 应用层 应用层是咱们程序员打交道最多的一层协议.应用层里有很多现成的协议,但…

解码 NLP:从萌芽到蓬勃的技术蜕变之旅

内容概况: 主要讲述NLP专栏的内容和NLP的发展及其在现代生活中的广泛应用。课程强调实践为主、理论为辅的学习方法,并通过多个生活场景展示了NLP技术的实际应用,如对话机器人、搜索引擎、翻译软件、电商推荐和智能客服等。 这边我就不多做自我…

Word中的文档信息域

Word中的文档信息域 DocProperty包含文档信息的多个属性, 也可以自定义属性. 查看文档预定义的自定义属性 【文件】→【信息】→【属性】→【高级属性】 参考链接 WORD中文档属性域DocProperty的应用-CSDN博客 第06套 Word_哔哩哔哩_bilibili

java机器学习计算指标动态阈值

java机器学习计算指标动态阈值 最近听到有的人说要做机器学习就一定要学Python,我想他们掌握的知道还不够系统全面。本文作者以动态阈值需求场景给大家介绍几种常用Java实现的机器学习库,包括使用开源库如Weka或Deeplearning4j(DL4J&#xf…

Note25021902_TIA Portal V18 WinCC BCA Ed 需要.NET 3.5 SP1

TIA Portal V18 WinCC BCA Ed 需要.NET 3.5 SP1 在安装TIA Portal V18时,遇到TIA Portal V18 WinCC BCA Ed 需要.NET 3.5 SP1. 请在此PC上中启用.NET 3.5 SP1; 检索: 电脑上如何启用 .NET 3.5 SP1 参考资料1: https://baijiahao.…

CHARMM-GUI EnzyDocker: 一个基于网络的用于酶中多个反应状态的蛋白质 - 配体对接的计算平台

❝ "CHARMM-GUI EnzyDocker for Protein−Ligand Docking of Multiple Reactive States along a Reaction Coordinate in Enzymes"介绍了 CHARMM-GUI EnzyDocker,这是一个基于网络的计算平台,旨在简化和加速 EnzyDock 对接模拟的设置过程&…

阅读论文笔记《Translating Embeddings for Modeling Multi-relational Data》

目录 一、模型核心原理剖析二、实验设计与数据集选择三、实验结果深度解读(一)链接预测实验(二)关系分类实验(三)链接预测示例(四)泛化实验 四、模型优缺点总结(一&#…

​实在智能与宇树科技、云深科技一同获评浙江省“人工智能服务商”、 “数智优品”​等荣誉

近日,浙江省经信厅正式公布《2024 年浙江省人工智能应用场景、应用标杆企业、人工智能服务商及 “数智优品” 名单》。 实在智能获评浙江省“人工智能服务商”,核心产品 “实在 Agent 智能体” 入选 “数智优品”。一同获此殊荣的还有宇树科技、云深处科…

跳表(Skip List)详解

一、什么是跳表? 跳表是一种基于有序链表的高效数据结构,通过建立多级索引实现快速查询。它在平均情况下支持O(log n)时间复杂度的搜索、插入和删除操作,性能接近平衡树,但实现更为简单。 二、核心原理 1. 层级结构 底层为完整…

轻松搭建本地大语言模型(一)Ollama安装与使用

Ollama 是一款开源的本地大语言模型运行框架,支持在 Windows、macOS 和 Linux 系统上运行,能够帮助用户轻松下载和使用各种大语言模型(例如deepseek、llama、qwen)。本文将详细介绍 Ollama 的安装步骤,帮助你快速搭建本…

kafka消费能力压测:使用官方工具

背景 在之前的业务场景中,我们发现Kafka的实际消费能力远低于预期。尽管我们使用了kafka-go组件并进行了相关测试,测试情况见《kafka-go:性能测试》这篇文章。但并未能准确找出消费能力低下的原因。 我们曾怀疑这可能是由我的电脑网络带宽问题或Kafka部…

[STM32 - 野火] - - - 固件库学习笔记 - - - 十六.在SRAM中调试代码

一、简介 在RAM中调试代码是一种常见的嵌入式开发技术,尤其适用于STM32等微控制器。它的核心思想是将程序代码和数据加载到微控制器的内部RAM(SRAM)中运行,而不是运行在Flash存储器中。这种方法在开发过程中具有显著的优势&#…

雷军推荐:WPS 与 Pastemate 联用,效率飞升新高度

在当今快节奏的工作与学习环境中,效率提升成为了每个人都在追求的目标。而雷军,这位科技界的领军人物,凭借其敏锐的洞察力,为我们推荐了一组强大的工具组合 ——WPS 与 Pastemate,它们携手合作,能够为我们的…

轴承故障特征—SHAP 模型 3D 可视化

往期精彩内容: Python-凯斯西储大学(CWRU)轴承数据解读与分类处理 基于FFT CNN - BiGRU-Attention 时域、频域特征注意力融合的轴承故障识别模型-CSDN博客 基于FFT CNN - Transformer 时域、频域特征融合的轴承故障识别模型-CSDN博客 P…

斐波那契数列模型:在动态规划的丝绸之路上追寻斐波那契的足迹(上)

文章目录 引言递归与动态规划的对比递归解法的初探动态规划的优雅与高效自顶向下的记忆化搜索自底向上的迭代法 性能分析与比较小结 引言 斐波那契数列,这一数列如同一条无形的丝线,穿越千年时光,悄然延续其魅力。其定义简单而优美&#xff…

智能选路+NAT实验

1.实验拓扑: 二.实验配置 1、防火墙ip配置和信任区域配置: 2.导入地址库:先下载模板--->进入模板修改地址信息--->导入地址: 3配置链路接口: 4.配置真实DNS服务器信息 5.创建虚拟服务,虚拟DNS服务…

电商API接口数据与市场趋势分析的深度融合

一、电商API接口数据的价值 电商API接口是连接电商平台与外部系统(如数据分析工具、ERP系统等)的桥梁。通过API接口,企业可以获取海量的交易数据、用户行为数据、商品信息等。这些数据具有以下价值: 数据实时性:API接…

SMOJ 种植玉米/铺地砖 题解

最近练了轮廓线dp的题目 1.种植玉米 题意 农夫有一个被划分成 m m m行 n n n列的农田。 每个格子的数字如果是 1 1 1则表示该格子的土地是肥沃的,可以种植玉米;如果该格子的数字是 0 0 0则表示该格子不能种植玉米。 但是还有一个条件:不…

沃丰科技大模型标杆案例 | 索尼大模型智能营销机器人建设实践

AI大模型发展日新月异,国内外主流大模型每月必会升级。海外AI大模型市场由美国主导, 各模型已形成“多强竞合”的局面。中国积极响应全球大模型技术的发展趋势,高校、研究院所等科研机构、互联网企业,人工智能企业均不同程度地投入…