Ollama拉起本地模型以及rag系统部署。

news2024/11/13 4:59:34

什么是 Ollama ?

Ollama 是一个简明易用的本地大模型运行框架。能在本地启动并运行 Llama、qwen、Gemma 及其他大语言模型,没有GPU资源照样可以拉起模型,和LocalAI 比较类似,但是加载模型更容易。

1.安装

在这里插入图片描述
安装后运行,执行:http://127.0.0.1:11434/,返回:Ollama is running表示成功

2.拉取模型:

在这里插入图片描述

3.运行模型

ollama run qwen2(mac电脑加载的7b),执行后开始提问,如下图:

4.open-webui,更加方便web方式提问。

什么是 Open WebUI ?
Open WebUI 是针对 LLM 的用户友好的 WebUI,支持的 LLM 运行程序包括 Ollama 和 OpenAI 兼容的 API。
Open WebUI 系统旨在简化客户端(您的浏览器)和 Ollama API 之间的交互。此设计的核心是后端反向代理,可增强安全性并解决 CORS 问题。
参考:https://github.com/open-webui/open-webui

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

可以选择本地模型:
在这里插入图片描述
在这里插入图片描述

搭建简单的tag系统

下载

地址:https://anythingllm.com/

配置

在这里插入图片描述
embed及向量数据库选默认
在这里插入图片描述
新建工作区,然后上传文档,然后向量化存储。
在这里插入图片描述

基于文档,对话,如下可以看到部分文档被引用到。
在这里插入图片描述

其他

rag系统:fastgpt

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2103915.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

带你0到1之QT编程:四、打地基QHash的高效用法

此为QT编程的第四谈!关注我,带你快速学习QT编程的学习路线! 每一篇的技术点都是很很重要!很重要!很重要!但不冗余! 我们通常采取总-分-总和生活化的讲解方式来阐述一个知识点! 码…

安泰功率放大器应用领域:铁电材料极化测试

铁电材料是一种非常重要的电介质材料,不仅具有较高的介电常数,还有显著的热释电效应和压电效应,因此也被广泛应用于从日常生活到高端技术的多个领域。功率放大器作为铁电材料极化测试中常用的测试仪器之一,在该领域也有着良好应用…

【系统方案】网络空间安全态势感知与大数据分析平台建设方案(Doc完整版)

1.1 网络空间态势感知系统系统建设 1.1.1 安全监测子系统 1.1.2 态势感知子系统 1.1.3 通报预警子系统 1.1.4 等保管理子系统 1.1.5 追踪溯源子系统 1.1.6 威胁情报子系统 1.1.7 指挥调度子系统 1.1.8 侦查调查子系统 1.1.9 应急处置子系统 1.1.10 移动APP 1.1.11 运…

html发送邮件的服务器怎么配置?如何设置?

html发送邮件如何保障安全性?HTML发送邮件链接方法? 配置一个能够高效处理html发送邮件的服务器,不仅可以提升邮件的美观性和互动性,还能增强邮件的专业度和吸引力。AokSend将详细介绍如何配置服务器以支持html发送邮件。 html发…

Aigtek功率放大器的基本要求是什么

功率放大器是电子电路中的关键元件,用于增加输入信号的幅度,以便有效地驱动负载。为了确保功率放大器在不同应用中能够可靠地工作,需要满足一系列基本要求。下面安泰电子将详细介绍功率放大器的基本要求,以帮助读者了解其设计和应…

echarts关系图报错Graph nodes have duplicate name or id

生成的关系图,数据有了,展示报错nodes have duplicate name or id,提示节点有重复的名称或id,意思是可能有重复的节点,echarts graph 它不支持所以报错了。如下图 有几百条数据,要找到那条重复的&#xff…

kubernetes集群部署Confluence 7.2.0+mysql 5.7(自测有效)

背景介绍: Confluence是一个专业的企业知识管理与协同软件。使用简单,但它强大的编辑和站点管理特征能够帮助团队成员之间共享信息、文档协作、集体讨论,信息推送。 这里介绍的使用的是Confluence 7.2.0版本的。 一、在kubernetes集群部署 1…

申请SSL证书审核失败的原因和解决方法(DNS验证篇)

如果用户在提交SSL证书审核时使用DNS验证方式进行验证,检查配置时可能会收到未检测到DNS配置内容的返回结果。这种情况下的数字证书审核申请失败是由多个原因造成的。 为了更清楚了解失败的原因,建议使用以下方式查询DNS解析记录值,分析域名…

LNMP环境搭建(Linux+nginx+Mysql+PHP)超详细攻略

目录 一.LNMP简介 1.1LNMP架构的特点 二.详细安装步骤 2.1MySQL安装 2.1-1Yum安装 2.1-2 编译安装 2.1-3二进制安装 2.1-4 RPM安装 2.2Nginx安装 2.2-1编译安装nginx 2.2-2yum安装nginx 2.3验证Nginx安装 2.4PHP安装 2.4-1编译安装PHP 2.4-2yum安装PHP 2.5 Nginx 配…

OpenCSG all in one 安装

https://github.com/OpenCSGs/CSGHub/tree/main/deploy/all_in_one 先下载下来 记得前提是docker 和docker-compose 已经安装好了 进入到deploy 中得all_in_one中 修改.env 中得domain 地址本机地址 修改权限后 运行startup.sh $sudo ./startup.sh 运行相应得docker 信息 可以…

基本放大电路

以输入、输出信号的位置为判断依据: 信号由基极输入,集电极输出——共射极放大电路 信号由基极输入,发射极输出——共集极放大电路 信号由发射极输入,集电极输出——共基极放大电路 三种组态的特点及用途:共射极放大电…

软件设计之JDBC(1)

软件设计之JDBC(1) 此篇应在MySQL之后进行学习: 路线图推荐: 【Java学习路线-极速版】【Java架构师技术图谱】 尚硅谷2024最新JDBC教程 | jdbc基础到高级一套通关! 资料可以去尚硅谷官网免费领取 学习内容: 前言JDBCPreparedStatement实现…

IAR查看程序占用的内存空间

参考:IAR分析内存重要的神器 - map文件全解析-CSDN博客 IAR软件*.map文件查看程序占用ROM和RAM大小_iar 通过map文件查看占用内存空间-CSDN博客 编译工程后,可以在MAP文件的最后面查看,程序占用空间的大小 readonly code和readonly data使用…

OPenCV结构分析与形状描述符(1)近似多边形轮廓顶点的函数approxPolyDP()的使用

操作系统:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 编程语言:C11 算法描述 按指定的精度近似一个多边形曲线 cv::approxPolyDP 函数使用另一条曲线或多边形来近似一条曲线或多边形,新曲线或多边形的顶点数较少…

PYTHON发送邮件详细流程

不求别的你要是觉得有用给我一个关注攒攒❤ 安装第三方库 dos命令窗口 pip install pyEmail 两个邮箱准备齐: 我让我的163邮箱做服务器向qq邮箱发邮件 互联网上的两个软件要想通信要有协议,因此开启协议 import smtplib #协议包 from email.mime.t…

【路径规划】2D/3D RRT* 算法 - 使用快速探索随机树进行最优路径规划

摘要 本文介绍了快速探索随机树星(RRT* )算法在2D和3D空间中的实现,用于最优路径规划。RRT*算法通过增量采样的方法,不断优化路径,以收敛到全局最优解。2D版本结合避障功能,能够有效避开给定的障碍物&…

IP地址与物理地址:‌区别解析及在网络通信中的作用

在网络通信的广阔领域中,‌IP地址与物理地址是两个至关重要的概念。‌尽管它们在网络连接和数据传输中都扮演着举足轻重的角色,‌但二者之间存在着本质的区别。‌下面一起跟着虎观代理小二了解IP地址与物理地址的区别,‌并解析它们在网络通信…

ActiViz实战:使用Actor2D画一个二维网格

文章目录 一、效果预览二、交互三、C#源码示例一、效果预览 二、交互 1、能实现等比缩放 2、不允许平移和旋转 3、能够与三维坐标大小匹配 三、C#源码示例 private void AddCudeAxes2D() {double scale =

SprinBoot+Vue餐厅点餐系统的设计与实现

目录 1 项目介绍2 项目截图3 核心代码3.1 Controller3.2 Service3.3 Dao3.4 application.yml3.5 SpringbootApplication3.5 Vue 4 数据库表设计5 文档参考6 计算机毕设选题推荐7 源码获取 1 项目介绍 博主个人介绍:CSDN认证博客专家,CSDN平台Java领域优质…

【自动驾驶】控制算法(七)离散规划轨迹的误差计算

写在前面: 🌟 欢迎光临 清流君 的博客小天地,这里是我分享技术与心得的温馨角落。📝 个人主页:清流君_CSDN博客,期待与您一同探索 移动机器人 领域的无限可能。 🔍 本文系 清流君 原创之作&…