一文彻底整明白,基于Ollama工具的LLM大语言模型Web可视化对话机器人部署指南

news2025/4/8 10:30:43

在上一篇博文中,我们在本地部署了Llama 3 8B参数大模型,并用 Python 写了一个控制台对话客户端,基本能愉快的与 Llama 大模型对话聊天了。但控制台总归太技术化,体验不是很友好,我们希望能有个类似 ChatGPT 那样的 Web 聊天对话界面,本博文就安排起来……

上一篇Llama 3 8B大模型部署和 Python 对话客户端博文:[玩转 AI,笔记本电脑安装属于自己的 Llama 3 8B 大模型和对话客户端]
因为本博文介绍的Web 可视化对话机器人,涉及到前文的Llama 3 8B大模型(并不是强依赖),因此建议提取安装前文部署好Llama 3 8B大语言模型。

为了方便把我们的大模型对话机器人分享出去,聊天机器人最后是基于Web网站,可通过浏览器访问,本文正是通过OllamaWebUI在本地部署Llama 3Web 版聊天机器人,本文包括如下部分:

  1. 什么是Ollama,它与Llama是什么关系?
  2. 安装Ollama大语言模型工具
  3. 安装Node.js编程语言工具包(为接下来的 Web 可视化聊天界面做好准备)
  4. 基于Llama 3 8BGGUF 模型文件创建Ollama模型文件
  5. 部署Ollama大模型 Web 可视化聊天界面
  6. 愉快的与Llama 3大模型俩天对话
  7. 最后,Ollama大模型工具的其他用法

什么是Ollama,它与Llama是什么关系?

Ollama是一个开源的 LLM(大型语言模型)服务工具,用于简化在本地运行大语言模型,降低使用大语言模型的门槛,使得大模型的开发者、研究人员和爱好者能够在本地环境快速实验、管理和部署最新大语言模型,包括如Llama 3Phi 3MistralGemma等开源的大型语言模型。

Ollama目前支持以下大语言模型:https://ollama.com/library

图片Ollama支持的大模型列表

因此,OllamaLlama的关系:Llama是大语言模型,而Ollama是大语言模型(不限于Llama模型)便捷的管理和运维工具

安装Ollama大语言模型工具

Ollama提供了MacOSLinuxWindows操作系统的安装包,大家可根据自己的操作系统,下载安装即可:

图片Ollama下载页面

安装包下载之后的安装过程,和日常安装其他软件没有差别,包括点击Next以及Install等安装ollama到命令行。安装后续步骤中,我们可无需安装任何模型(默认是Llama 3),因为我们在上文中已经安装了Llama 3 8B大模型,后面可以直接使用。

当然,假如没有根据我的前面博文安装Llama 3 8B模型,在安装Ollama过程中,也可以一起进行安装。

安装Node.js编程语言工具包

安装Node.js编程语言工具包和安装其他软件包一样,下载安装即可:https://nodejs.org

图片Node.js下载页面

安装完成之后,可以验证一下 Node.js 的版本,建议用目前的最新v20版本:

node -v

我安装的版本:v20.13.1(最新版本)

基于Llama 3 8BGGUF 模型文件创建Ollama模型

在我们存放Llama 3 8B的 GGUF 模型文件目录中,创建一个文件名为Modelfile的文件,该文件的内容如下:

FROM ./Meta-Llama-3-8B-Instruct.Q4_K_M.gguf

然后在控制台,使用这个文件创建Ollama模型,这里我把Ollama的模型取名为Llama-3-8B

$ ollama create Llama-3-8B -f ./Modelfile
transferring model data
using existing layer sha256:647a2b64cbcdbe670432d0502ebb2592b36dd364d51a9ef7a1387b7a4365781f
creating new layer sha256:459d7c837b2bd7f895a15b0a5213846912693beedaf0257fbba2a508bc1c88d9
writing manifest
success

最后,通过Ollama启动我们刚创建的大语言模型:

ollama run Llama-3-8B

图片Ollama启动成功输出

启动完毕,其实我们已经有了一个控制台聊天界面,可以通过控制台与Llama-3-8B聊天了

如果我们不想要这个模型了,也可以通过命令行删除模型文件:ollama rm Llama-3-8B

Ollama`存放模型文件根目录:`~/.ollama

部署Ollama大模型 Web 可视化聊天界面

控制台聊天对话界面体验总归是不太好,接下来部署 Web 可视化聊天界面。

首先,下载ollama-webuiWeb 工程代码:git clone https://github.com/ollama-webui/ollama-webui-lite

然后切换ollama-webui代码的目录:cd ollama-webui-lite

设置 Node.js 工具包镜像源,以接下来下载 Node.js 的依赖包更加快速:npm config set registry http://mirrors.cloud.tencent.com/npm/

安装 Node.js 依赖的工具包:npm install

最后,启动 Web 可视化界面:npm run dev

图片Web对话机器人部署成功输出

如果看到以上输出,代表 Web 可视化界面已经成功了!

愉快的与Llama 3大模型俩天对话

浏览器打开 Web 可视化界面:http://localhost:3000/

可以看到Ollama的初始化页面,默认没有模型,需要选择,我们选择刚创建并部署的Llama-3-8B模型:

图片选择大模型

图片选择大模型

底部就是聊天输入框,至此可以愉快的与Llama 3聊天对话了:

图片Web对话

Web 对话聊天机器人的设置,大家可以基于 Web 网站设置,这里不在介绍,有需要的网友可以私信一起研究进步!

禅定:Ollama工具的其他用法

从上文的介绍可以看到,基于Ollama部署一个大模型的 Web 可视化对话机器人,还是非常方便。下面整理了部分Ollama提供的用法或者。

Ollama 命令工具

# 查看当前Ollama的模型
ollama list

# 增量更新当前部署的模型
ollama pull Llama-3-8B

# 删除一个模型文件
ollama rm Llama-3-8B

# 复制一个模型
ollama cp Llama-3-8B Llama-newModel

Ollama API结果返回

curl http://localhost:11434/api/generate -d '{
  "model": "Llama-3-8B",
  "prompt":"为什么天空是蓝色的?"
}'

Ollama API聊天对话

curl http://localhost:11434/api/chat -d '{
  "model": "Llama-3-8B",
  "messages": [
    { "role": "user", "content": "为什么天空是蓝色的?" }
  ]
}'

如何学习AI大模型?

作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

img

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

img

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img

四、AI大模型商业化落地方案

img

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2229644.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

BES2600WM---HiLink RM56 EVK

0 Preface/Foreword 1 环境搭建 1.1 安装依赖工具 sudo apt-get install build-essential gcc g make zlib* libffi-dev e2fsprogs pkg-config flex bison perl bc openssl libssl-dev libelf-dev libc6-dev-amd64 binutils binutils-dev libdwarf-dev u-boot-tools mtd-utils…

Leetcode21:合并两个有效链表

原题地址:. - 力扣(LeetCode) 题目描述 将两个升序链表合并为一个新的 升序 链表并返回。新链表是通过拼接给定的两个链表的所有节点组成的。 示例 1: 输入:l1 [1,2,4], l2 [1,3,4] 输出:[1,1,2,3,4,4]示…

51c嵌入式~IO合集1

我自己的原文哦~ https://blog.51cto.com/whaosoft/12383193 一、单片机通信数据接收解析方法 前阵子一朋友使用单片机与某外设进行通信时,外设返回的是一堆格式如下的数据: AA AA 04 80 02 00 02 7B AA AA 04 80 02 00 08 75 AA AA 04 80 02 00 9B E2…

java或c#是如何对数据库的表字段加密的处理的?

对于表格数据的加密处理,通常涉及到对数据库中存储的数据进行加密,以保护敏感信息。 Java示例(使用AES算法加密数据库表数据) 首先,你需要一个数据库连接,这里假设你使用的是JDBC连接MySQL数据库。以下是…

Android Studio Dolphin 下载、安装与配置教程

文章目录 Android Studio Dolphin简介一、核心特性二、新增功能三、用户体验优化 一,下载百度网盘迅雷云盘 二,安装三,下载组件四,添加SDK五,创建项目六,安装 Device模拟器运行项目 Android Studio Dolphin…

java开发等一些问题,持续更新

微服务和单服务的区别 微服务(Microservices)和单体服务(Monolithic Architecture)是两种不同的软件架构风格,各有其特点和适用场景。 微服务架构: 模块化: 微服务架构将应用程序分解为一系列小…

全国分省灵活就业情况数据集(2015-2019年)

数据简介:就业是民生之本,是“六稳”“六保”之首,对于拥有14亿人口的中国而言,就业问题至关重要。“十四五”规划建议中指出,应强化就业优先政策,千方百计稳定和扩大就业,实现更充分更高质量就…

杂货 | 每日资讯 | 2024.10.31

注意:以下内容皆为AI总结 在2024年10月30日,人工智能领域涌现出一些重要的新发展和大事件。这些新进展涉及人工智能在金融、搜索技术以及大型科技公司业务扩展中的广泛应用。本文将详细解读当天的几大AI事件,以便大家更好地理解当今AI技术的…

分享几款开源好用的图片在线编辑,适合做快速应用嵌入

图片生成器是指一种工具或软件,用于自动生成图片或图像内容,通常依据用户设定的参数或模板进行操作。这种工具能够帮助用户快速创建视觉效果丰富的图像,而无需具备专业的设计技能。 在数字化时代,图片编辑已经成为日常工作和生活的…

elasticsearch 8.x 插件安装(四)之简繁体插件

elasticsearch 8.x 插件安装(四)之简繁体插件 elasticsearch插件安装合集 elasticsearch插件安装(一)之ik分词器安装(含MySQL更新) elasticsearch 8.x插件(二)之同义词安装如何解…

WPS查询函数VLOOKUP,匹配寻找值自动带入值

想实现在下表输入物料名称后,把上表中的单位自动带入 那就要用到VLOOKUP函数,获取第2个表第1列的值后去第1个表的第1列匹配,匹配到后得到行数值,把第1个表的第2列赋值给第2个表的第2列。 Vlookup函数参数为Vlookup(查找值&#…

burp靶场-User ID controlled by request parameter with password disclosure

Lab: 由具有密码泄露功能的请求参数控制的用户 ID 实验描述: This lab has user account page that contains the current user’s existing password, prefilled in a masked input. 此实验室具有用户帐户页面,其中包含当前用户的现有密码,…

Hive的数据存储格式

目录 一、前言 二、存储格式 2.1、文本格式(TextFile) 2.1.1、定义与特点 2.1.2、存储与压缩 2. 1.3、使用场景 2.2、行列式文件(ORCFile) 2.2.1、ORC的结构 2.2.2、ORC的数据类型 2.2.3、ORC的压缩格式 2.2.3、ORC存储…

银河麒麟v10 xrdp安装

为了解决科技被卡脖子的问题,国家正在大力推进软硬件系统的信创替代,对于一些平时对Linux操作系统不太熟练的用户来讲提出了更高的挑战和要求。本文以银河麒麟v10 24.03为例带领大家配置kylin v10的远程桌面。 最近公司为了配置信创开发新购了几台银河麒…

工作流管理是什么?5款企业工作流管理工具推荐!

一、工作流管理 工作流管理是一个被业界广泛应用并迅速发展的技术。它主要是使处理过程自动化,使人以及各种应用工具相互之间协调工作,以完成某项工作。其目的是让合适的人或软件在恰当的时间执行正确的工作。通俗来说,工作流管理就是对业务…

逗号运算符应用举例

在main.cpp里输入程序如下&#xff1a; #include <iostream> //使能cin(),cout(); #include <iomanip> //使能setbase(),setfill(),setw(),setprecision(),setiosflags()和resetiosflags(); //setbase( char x )是设置输出数字的基数,如输出进制数则用set…

小新学习k8s第四天之发布管理

一、金丝雀发布&#xff08;灰度发布&#xff09; Deployment控制器支持自定义控制更新过程中的滚动节奏&#xff0c;如“暂停(pause)”或“继续(resume)”更新操作。 ①比如等待第一批新的Pod资源创建完成后立即暂停更新过程&#xff0c;此时&#xff0c;仅存在一部分新版本的…

工业网络监控中的IP保护与软件授权革新

未来的智能工厂离不开稳定而高效的通信网络&#xff0c;这些网络在支撑生产流程的同时&#xff0c;也面临着复杂的管理与安全挑战。PROCENTEC推出了一系列硬件和软件产品&#xff0c;如Atlas、Mercury和Osiris&#xff0c;以提供全面的网络监控和故障排除能力。然而&#xff0c…

写在第六个“深圳企业家日”,看KPaaS如何助力企业数字化转型

每年的11月1日是“深圳企业家日”&#xff0c;这是深圳为表彰本地企业家精神而设立的纪念日。这一天&#xff0c;深圳的创业者和企业家们聚集一堂&#xff0c;总结过往&#xff0c;展望未来。企业家们在深圳的经济发展、技术创新和社会进步中扮演了重要角色&#xff0c;而这一天…

CVE-2024-51567 CyberPanel upgrademysqlstatus 远程命令执行

该漏洞源于upgrademysqlstatus接口未做身份验证和参数过滤&#xff0c;未授权的攻击者可以通过此接口执行任意命令获取服务器权限&#xff0c;从而造成数据泄露、服务器被接管等严重的后果。 影响版本 CyberPanel v2.3.5CyberPanel v2.3.6 目前官方已有可更新版本&#xff0…