【AI大模型】Ollama+OpenWebUI+llama3本地大模型

news2024/12/28 19:56:51

本地部署大模型

  • 0.引言
  • 1.部署安装
    • 1.1部署工具
    • 1.2 概念介绍
    • 1.3 ollama安装后的基本使用
    • 1.4 大模型权重下载
      • 1.4.1 ollama在线下载
      • 1.4.2 huggingFace下载大模型权重及如何使用ollama进行调用
  • 2.带有UI界面的使用
  • 3.参考

0.引言

(1)目的
本教程主要关于开源AI大模型部署在个人电脑上,能够让用户轻松在本地运行大模型,这里的本地既可以指完全杜绝网络的个人PC,也可以指能够进行网络连接的PC;
(2)部署后的使用预览
这里有两种使用方式,首先是cmd终端,其次是带有WebUI界面的;
在这里插入图片描述

cmd终端使用
在这里插入图片描述
在这里插入图片描述

1.部署安装

1.1部署工具

  • 大模型管理工具:ollama;
  • 大模型权重:ollama(在线下载),huggingFace权重(主要GGUF格式)
  • Web-UI(利用docker以及open-web-UI库进行web端使用大模型)

1.2 概念介绍

(1)什么是ollama以及ollama安装
重点是部署和管理,在这里插入图片描述
本教程环境为win11系统,ollama在win系统就跟安装软件一样,下载ollama.exe文件进行安装即可 win安装地址,这里需要说明的是ollama.exe默认只能安装在C盘,但调用的大模型权重文件位置可以放在其它盘(详见后续教程)。
在这里插入图片描述

1.3 ollama安装后的基本使用

安装完成后可以在cmd终端查看使用(类似docker使用一样)
在这里插入图片描述
指令说明

ollama -h		# 查看ollama帮助使用
ollama list    #查看已有大模型
ollama pull+大模型模型    #下载大模型
ollama run +大模型        # 运行大模型
ollama create +大模型配置文件  #ollama配置其它途径下载的权重文件,如huggingFace
ollama rm yi:8b        #卸载yi:8b大模型
ollama cp yi:   
#ctrl+d退出

1.4 大模型权重下载

常用的模型如llama3,通义千问(qwen)等部分模型权重可以通过两种方式下载:

  • ollama在线下载:ollama模型地址
  • huggingFace下载:huggingFace网站镜像,受限与国内网络,huggingFace需要梯子官网链接,这里的网站镜像功能跟官网一样,不需要梯子。

1.4.1 ollama在线下载

在ollama网站中models,利用cmd终端命令进行下载:ollama pull llama3:8b
在这里插入图片描述
在这里插入图片描述
下载完成后cmd终端查询已有大模型命令:ollama list
运行使用:ollama run llama3:8b

1.4.2 huggingFace下载大模型权重及如何使用ollama进行调用

(1)首先是模型权重下载
如何从hugging Face官网下载大模型权重,参考本链接教程:huggingFace模型权重下载教程
需要注意的是:推荐下载大模型格式为gguf或者GGUF,因此这里在搜索大模型时,最好加上gguf,如下图
在这里插入图片描述
(2)huggingFace下载的大模型如何配置使用
下载到本地的模型文件不能直接导入到Ollama,需要编写一个配置文件,随便起个名字,如config.txt,配置文件内容如下

# 主要是FROM需要改成自己从hugging face上面下载的路径
FROM "/Users/liaoxuefeng/llm/llama3-8b-cn-q6/Llama3-8B-Chinese-Chat.q6_k.GGUF"

TEMPLATE """{{- if .System }}
<|im_start|>system {{ .System }}<|im_end|>
{{- end }}
<|im_start|>user
{{ .Prompt }}<|im_end|>
<|im_start|>assistant
"""

SYSTEM """"""

PARAMETER stop <|im_start|>
PARAMETER stop <|im_end|>

最后cmd调用命令:
ollama create llama3-cn -f ./config.txt #即可将下载的模型导入ollama中

2.带有UI界面的使用

这里主要安装不管是大模型还是stableDiffusion文生图等常用的网页交互库:open-webUI
,安装webUI需要先安装docker ,然后利用docker安装webUI并运行。
(1)具体安装教程
参考链接教程的第3部分docker以及webUI安装
部署后使用:在docker 容器点击进入,见下图
在这里插入图片描述
(2)注意!!!
此外关于链接教程的3.4 离线部署部分重点!!!!

3.参考

(1)ollama的默认路径地址
在这里插入图片描述
(2)未完待续

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1991541.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

数据科学和临床数据科学的发展​​​​​​​

内容来自&#xff1a;专栏《R探索临床数据科学&#xff1a;1章1节&#xff1a;数据科学与临床数据科学的发展历程&#xff1a;为何 R 备受青睐及我们专栏的独特之处》的部分 为帮助大家更出色地掌握临床统计、数据挖掘以及人工智能建模的入门知识和应用&#xff0c;由于众多同学…

Thinkphp框架漏洞(附修复方法)

ThinkPHP是为了简化企业级应用开发和敏捷WEB应用开发而诞生的&#xff0c;是一个快速、兼容而且简单的轻量级国产PHP开发框架&#xff0c;诞生于2006年初&#xff0c;原名FCS&#xff0c;2007年元旦正式更名为ThinkPHP&#xff0c;遵循Apache2开源协议发布&#xff0c;从Struts…

27集28集 ESP32 AIchat cmake编译解密-《MCU嵌入式AI开发笔记》

27-28集 ESP32 AIchat cmake编译解密-《MCU嵌入式AI开发笔记》 我们这集讲解学习cmake编译流程。 为了更好的理解&#xff0c; 我们要先了解几个cmake的内部变量&#xff1a; CMAKE_SOURCE_DIR&#xff1a;整个CMake工程最顶层的CMakeLists.txt文件所在路径。 CMAKE_CURRENT…

MyBatis:Maven,Git,TortoiseGit,Gradle

1&#xff0c;Maven Maven是一个非常优秀的项目管理工具&#xff0c;采用一种“约定优于配置&#xff08;CoC&#xff09;”的策略来管理项目。使用Maven不仅可以把源代码构建成可发布的项目&#xff08;包括编译、打包、测试和分发&#xff09;&#xff0c;还可以生成报告、生…

Find My Device技术|谷歌Find My Device网络支持的功能

谷歌新的" Find My Device " 网络覆盖了全球超过数十亿台活跃设备&#xff0c;谷歌 " Find My Device " 也和苹果 " Find My " 一样&#xff0c;支持防追踪功能&#xff0c;当检测到身边有未知蓝牙防丢器跟随移动时&#xff0c;会进行警报提醒。…

【C++题解】1084. 因子求和

欢迎关注本专栏《C从零基础到信奥赛入门级&#xff08;CSP-J&#xff09;》 问题&#xff1a;1084. 因子求和 类型&#xff1a;sqrt函数入门 题目描述&#xff1a; 已知一个正整数 N&#xff08; 20≤N≤800000000 &#xff09;&#xff0c;请你编写程序求出该数的全部因子&…

论文解读(15)-UrbanGPT

加油&#xff0c;这一篇也是感受一下大语言模型的力量&#xff01; 原文&#xff1a; UrbanGPT: Spatio-Temporal Large Language Models UrbanGPT: Spatio-Temporal Large Language Models (arxiv.org) 参考&#xff1a; 时空预测与大语言模型的奇妙碰撞&#xff01;UrbanG…

网卡与Linux网络结构(上)

原本是想借着之前学习的中断进一步拓展到网卡与中断的&#xff0c;标题都写好了&#xff0c;结果低估了其中的知识面和难度。。。。。于是调整为了网卡与Linux网络结构&#xff08;上&#xff09;&#xff0c; 没错&#xff0c;仅仅只是上。。。我还是进一步低估了学习需要花费…

Zookeeper的监听机制及原理解析

系列文章目录 手把手教你安装Zookeeper 及可视化插件ZooInspector、ZKUI Zookeeper入门篇&#xff0c;了解ZK存储特点 使用Zookeeper的监听及原理解析 系列文章目录前言一、监听机制的基本概念二、Zookeeper监听原理1. 事件类型2. 监听模式与监听器类型&#xff08;1&#xff…

深入理解计算机系统 CSAPP lab:bomb

实验资源下载地址&#xff1a;csapp.cs.cmu.edu/3e/labs.html 请先查看writeup 解压后 当我们运行bomb时,发现该程序要求我们输入行,如果输入错误,程序就会返回BOOM!!!提示我们失败了. 所以我们的目标是输入正确的行.以解开bomb程序. 实验前先详细阅读bomb.c //bomb.c /*****…

6.1 模块的导入与使用:Python的秘密武器

欢迎来到我的博客&#xff0c;很高兴能够在这里和您见面&#xff01;欢迎订阅相关专栏&#xff1a; 工&#x1f497;重&#x1f497;hao&#x1f497;&#xff1a;野老杂谈 ⭐️ 全网最全IT互联网公司面试宝典&#xff1a;收集整理全网各大IT互联网公司技术、项目、HR面试真题.…

Java语言程序设计基础篇_编程练习题*16.12(演示TextArea的属性)

目录 题目&#xff1a;*16.12&#xff08;演示TextArea的属性&#xff09; 习题思路&#xff1a; 代码示例 结果展示 题目&#xff1a;*16.12&#xff08;演示TextArea的属性&#xff09; 编写一个程序&#xff0c;演示文本域的属性。程序使用复选框表明文本是否换行&#xf…

Java面试题--JVM大厂篇之JVM监控与GC日志分析:优化Parallel GC性能的重要工具

目录 引言&#xff1a; 正文&#xff1a; 1. 理解GC日志的重要性 2. 启用GC日志 3. GC日志解析 4. JVM监控工具 5. 调优Parallel GC的实战技巧 痛点一&#xff1a;长时间停顿 痛点二&#xff1a;频繁的GC 痛点三&#xff1a;内存溢出 6. 实战案例分享 结束语&#…

linux进程----匿名管道和命名管道

linux进程----匿名管道和命名管道 在Linux中&#xff0c;管道是用于进程间通信的一种机制&#xff0c;可以分为两种类型&#xff1a;匿名管道&#xff08;也称为匿名fifo&#xff09;和命名管道&#xff08;也称为命名fifo或named pipe&#xff09;。 匿名管道&#xff08;An…

如何解决整数溢出问题?

1、问题解析 当以整数数据类型&#xff08;包括字节、短、长和其他类型&#xff09;存储的值过大&#xff08;大于变量可容纳的最大值&#xff09;的值时&#xff0c;将发生整数溢出&#xff08;或环 绕&#xff09;。整数的最高有效位丢失&#xff0c;而其余值则相对于最小值…

Centos安装OpenSearch

Centos安装OpenSearch 下载并安装OpenSearch下载OpenSearch RPM包导入公共GNU Privacy Guard&#xff08;GPG&#xff09;密钥。此密钥验证您的OpenSearch实例是否已签名安装RPM包安装完设置开机自启动OpenSearch启动OpenSearch验证OpenSearch是否正确启动 测试OpenSearch向服务…

【lvs】超干货,包含理论+实验(详细步骤)

lvs理论部分 LVS&#xff08;Linux Virtual Server&#xff09;是Linux虚拟服务器的简称&#xff0c;是一个基于Linux操作系统的虚拟服务器集群系统。LVS主要用于实现负载均衡和高可用性&#xff0c;通过将客户端的请求分发到多台后端服务器上&#xff0c;从而提高整体服务的处…

JSON + AJAX + ThreadLocal

JSON数据交换 规则 JSON对象和字符串转换 <script type"text/javascript">var jsonPerson {"name": "jack","age": 20}console.log(jsonPerson);var strPerson JSON.stringify(jsonPerson);//对jsonPerson没有影响console.lo…

文件系统 --- 软硬链接

序言 经过上一篇的学习 在磁盘中的文件&#xff0c;我们大致了解了磁盘的物理结构&#xff0c;逻辑抽象结构以及文件在磁盘上的存储方式。在这篇文章中&#xff0c;我们会基于上一篇文章的部分知识点来介绍软链接&#xff0c;硬链接。 1. 软链接 1.1 软链接的概念 软链接是一个…

vue3+vite+ts 颜色选择器组件支持颜色吸取,透明度

ciw-color-picker-vue&#xff1a; vue3 vite ts 颜色选择器,支持颜色吸取,透明度&#xff0c;与浏览器原生颜色选择器相似,与饿了么颜色选择器相似 使用了ciw-color-picker-vue npm i ciw-color-picker-vue 安装 npm i ciw-color-picker-vue 全局引入方式 main.ts 或 m…