有手就行,轻松本地部署 Llama、Qwen 大模型,无需 GPU

news2024/12/24 8:38:20

用 CPU 也能部署私有化大模型?

对,没错,只要你的电脑有个 8G 内存,你就可以轻松部署 Llama、Gemma、Qwen 等多种开源大模型。

非技术人员,安装 Docker、Docker-compose 很费劲?

不用,这些都不需要安装,就一个要求:有手就行~

今天主要为大家分享保姆级教程:如何利用普通个人电脑,本地私有化部署 Qwen 大模型。

一、Ollama 与 Qwen7B 安装和使用

(一)下载

进入下载地址,目前支持 Mac、Windows、Linux 以及 docker 部署,本次演示,主要针对 Mac

下载地址:https://github.com/ollama/ollama

我已经为大家提前下载好了 Mac、Windows 的安装包,公众号回复 ollama 领取。

图片

(二)安装 Ollama

1、下载到本地,并解压后,双击 Ollama 图标。

图片

2、点击 Move to Applications ,按照建议,将其移动到应用程序文件夹下。

图片

3、按照从左到右的顺序执行这三步。到这 Ollama 安装完成了。

图片

(三)安装模型

作为国内的优质大模型,Qwen 对于中文的支持力度还是很强的,最终选择用它来试手。

大家也可以尝试选择自己喜欢的模型,比如 Llama3、Gemma 等等。

1、进入模型仓库

地址:https://ollama.com/library

在这里插入图片描述

2、搜索对应模型。发现目前有 Qwen 0.5B ~ 110B 可供使用。

因为内存不够用,最终选择下载 Qwen:7b,大家可以按照自身硬件情况下载模型。

可以使用图中对应型号的命令,进行下载。7b 下载命令为:ollama run qwen:7b

官方建议: 至少有 8 GB 可用内存来运行 7 B 型号,16 GB 来运行 13 B 型号,32 GB 来运行 33 B 型号。

在这里插入图片描述

3、下载完成,开始对话,中文能力的确可以~

但是命令行对话总不是事儿啊,我们需要一个网页应用,这就得请出下一位主角:ChatGPT-Next-Web

图片

二、ChatGPT-Next-Web 安装和使用

(一)安装

进入 ChatGPT-Next-Web 仓库地址,选择对应版本下载。

地址:https://github.com/ChatGPTNextWeb/ChatGPT-Next-Web/releases/tag/v2.12.4

我选择了 NextChat_2.12.4_universal.dmg

我已经为大家提前下载好了 Mac、Windows 安装包,公众号回复 ollama 领取。

图片

下载完成后,可以直接安装,无需额外下载其他软件。

图片

(二)设置语言(可选)

按需选择语言偏好。

图片

(三)配置

1、点击图标,进行配置页面。

2、输入接口地址:http://localhost:11434

3、自定义模型名:qwen:7b

4、模型(model):qwen:7b() ,注意该选项在最下方。

在这里插入图片描述

四)对话测试

1、普通对话

效果还不错。

图片

2、面具对话

使用面具对话功能时,需要注意,软件模型忽略了自定义的 qwen:7b,每次利用面具对话时,需要重新选择模型

2.1、没有选择模型时,则会出错。

图片

2.2、点击图标,并选择正确的模型。

图片

图片

2.3、对话显示成功。

图片

三、总结

没有消费级的 GPU,竟然都可以拥有自己的本地大模型。

部署过程基本上没有卡点,一台普通的 Mac 就能搞定,太香了~

想学习什么,欢迎留言告诉我。

如何学习大模型

现在社会上大模型越来越普及了,已经有很多人都想往这里面扎,但是却找不到适合的方法去学习。

作为一名资深码农,初入大模型时也吃了很多亏,踩了无数坑。现在我想把我的经验和知识分享给你们,帮助你们学习AI大模型,能够解决你们学习中的困难。

我已将重要的AI大模型资料包括市面上AI大模型各大白皮书、AGI大模型系统学习路线、AI大模型视频教程、实战学习,等录播视频免费分享出来,需要的小伙伴可以扫取。

一、AGI大模型系统学习路线

很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,我下面分享的这个学习路线希望能够帮助到你们学习AI大模型。

在这里插入图片描述

二、AI大模型视频教程

在这里插入图片描述

三、AI大模型各大学习书籍

在这里插入图片描述

四、AI大模型各大场景实战案例

在这里插入图片描述

五、结束语

学习AI大模型是当前科技发展的趋势,它不仅能够为我们提供更多的机会和挑战,还能够让我们更好地理解和应用人工智能技术。通过学习AI大模型,我们可以深入了解深度学习、神经网络等核心概念,并将其应用于自然语言处理、计算机视觉、语音识别等领域。同时,掌握AI大模型还能够为我们的职业发展增添竞争力,成为未来技术领域的领导者。

再者,学习AI大模型也能为我们自己创造更多的价值,提供更多的岗位以及副业创收,让自己的生活更上一层楼。

因此,学习AI大模型是一项有前景且值得投入的时间和精力的重要选择。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1885358.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

方法重载与重写的区别

1.方法重载和重写都是实现多态的方式,区别在于重载是编译时多态,重写是运行时多态。 2.重载是在同一个类中,两个方法的方法名相同,参数列表不同(参数类型、顺序、个数),与方法返回值无关&#x…

springboot种草好物app-计算机毕业设计源码13151

摘要 随着电子商务的快速发展和智能手机的普及,越来越多的用户选择通过移动应用程序进行商品浏览、购买和分享体验。种草好物App作为一个专注于商品推荐和购物体验的平台,具有广泛的应用前景和商业价值。本研究旨在构建一个功能丰富、性能稳定的种草好物…

(vue)el-tabs选中最后一项后更新数据后无法展开

(vue)el-tabs选中最后一项后更新数据后无法展开 效果&#xff1a; 原因&#xff1a;选中时绑定的值在数据更新后找不到 思路&#xff1a;更新数据时把选中的v-model的属性赋为初始值 写法&#xff1a; <el-form-item label"字段选择"><el-tabsv-model&qu…

【计算机网络】传输层(作业)

1、OSI参考模型中&#xff0c;提供端到端的透明数据传输服务、差错控制和流量控制的层是&#xff08;C&#xff09;。 A. 物理层B. 网络层C. 运输层D. 会话层 2、运输层为&#xff08;B&#xff09;之间提供逻辑通信。 A. 主机B. 进程C. 路由器D. 操作系统 3、运输层面向连接…

【面试系列】技术支持工程师高频面试题及详细解答

欢迎来到我的博客&#xff0c;很高兴能够在这里和您见面&#xff01;欢迎订阅相关专栏&#xff1a; ⭐️ 全网最全IT互联网公司面试宝典&#xff1a;收集整理全网各大IT互联网公司技术、项目、HR面试真题. ⭐️ AIGC时代的创新与未来&#xff1a;详细讲解AIGC的概念、核心技术、…

JavaScript实现时钟计时

会动的时钟 1.目标 2.分析 1.最开始页面不显示时间&#xff0c;有两个按钮 开始 暂停。开始按钮是可以点击的&#xff0c;暂停按钮不能点击 2.当点击开始按钮后&#xff0c;设置开始按钮不可用&#xff0c;暂停按钮可用。然后将当前系统时间放到按钮上面。每隔1秒中更新一下…

国产操作系统麒麟v10、UOS在线打开excel文件并动态赋值

在实际的开发过程中&#xff0c;经常会遇到数据库中的数据填充到excel生成一份正式文件的功能&#xff0c;PageOffice客户端控件支持在线预览Excel文件时&#xff0c;通过Workbook对象来实现对Excel文件的数据填充功能&#xff0c;如果只是简单的填充一下数据&#xff0c;那么通…

通过容器启动QAnything知识库问答系统

QAnything (Question and Answer based on Anything) 是致力于支持任意格式文件或数据库的本地知识库问答系统&#xff0c;可断网安装使用。目前已支持格式&#xff1a;PDF(pdf)&#xff0c;Word(docx)&#xff0c;PPT(pptx)&#xff0c;XLS(xlsx)&#xff0c;Markdown(md)&…

洛必达法则在Android应用程序中的应用

洛必达法则在Android应用程序中的应用 前言 在高等数学中,洛必达法则(L’Hpital’s Rule)是一个用于计算未定式极限的有力工具。洛必达法则为我们提供了一种简便的方法,通过求导数来处理一些复杂的极限问题。在Android开发中,尽管我们通常不会直接遇到需要应用洛必达法则…

第二届重庆国际渔业博览会

The 2th Chongqing International Fisheries & Seafood Expo 时间&#xff1a;2024年10月25-27日 地点&#xff1a;重庆国际博览中心 同期举办&#xff1a;第十六届中国(重庆)火锅美食文化节暨第九届中国(重庆)国际火锅产业博览会 展会规模&#xff1a; 展出…

【C++知识点总结全系列 (06)】:STL六大组件详细介绍与总结(配置器、容器、迭代器、适配器、算法、仿函数)

STL六大组件目录 前言1、配置器(1)What(2)Why(3)HowA.调用new和delete实现内存分配与销毁B.STL Allocator (4)allocator类A.WhatB.HowC.allocator的算法 2、容器(1)What(2)Which&#xff08;有哪些容器&#xff09;(3)序列容器&#xff08;顺序容器&#xff09;A.WhichB.array&…

Unreal Engine@Jetson Orin Nano尚不支持

Unreal EngineJetson Orin Nano尚不支持 1. 源由2. Unreal Engine介绍3. 问题4. 编译方法5. 补充 1. 源由 最近在看SC-Explorer方面的内容&#xff0c;在模拟方面采用了Unreal Engine。 本打算跑下模拟&#xff0c;因此打算在JetsonOrin的板子上试试看。 2. Unreal Engine介绍…

【Python】已解决:urllib.error.HTTPError: HTTP Error 403: Forbidden

文章目录 一、分析问题背景二、可能出错的原因三、错误代码示例四、正确代码示例五、注意事项 已解决&#xff1a;urllib.error.HTTPError: HTTP Error 403: Forbidden 一、分析问题背景 在使用Python的urllib库中的urlopen或urlretrieve函数下载文件时&#xff0c;有时会遇到…

SAP 物料状态简介

在物料主数据中有个物料状态的栏位&#xff0c;这个栏位的作用就在于对涉及到相应物料主数据的各种事务进行不同形式的限制&#xff0c;从而达到对物料的用途进行管控的作用。在实际业务中&#xff0c;尤其是涉及到物料的生命周期管理时&#xff0c;当某个物料已经被禁用的时候…

报表-显示图片(logo、签名、签章等)

1、数据源 字段里面存图片url或base64 比如&#xff1a;https://img2.baidu.com/it/u99450198,2193994199&fm253 as img1 或data:image/png;base64&#xff0c;因为base64体积大&#xff0c;适用于图片尺寸小&#xff0c;并且数量小的情况 2、报表设计 使用ShowImage方…

【创建者模式-建造者模式】

概要 将一个复杂对象的构建与表示分离&#xff0c;使得同样的构建过程可以创建不同的表示。 建造者模式包含以下角色 抽象建造者类&#xff08;Builder&#xff09;&#xff1a;这个接口规定要实现复杂对象的那些部分的创建&#xff0c;并不涉及具体的部件对象的创建。具体建…

C++获取数组长度以及数组的函数传参获取数组长度

1、C获取数组长度----sizeof(array)/sizeof(array[0]) 定义一个数组&#xff0c;int arr[]{1,2,3,4,5,6,7,8,9}; sizeof&#xff08;&#xff09;方法用于统计变量的内存大小&#xff0c;sizeof&#xff08;arr&#xff09;用于获取数组arr占用的内存大小 sizeof&#xff08…

罗德和神牛、西圣无线麦克风哪个好用?罗德、西圣多方位实测对比

随着短视频行业的兴起&#xff0c;越来越多人开始加入自媒体创作的行业中&#xff0c;不过对于短视频而言&#xff0c;光有好的画面是不够的&#xff0c;还需要清晰、干净的声音。而无线领夹麦适用于唱歌、直播、吃播、短视频、访谈等场景使用&#xff0c;而且能够极大的提高声…

交通气象站:保障道路畅通的守护者

随着现代社会的飞速发展&#xff0c;交通网络日益密集&#xff0c;人们的出行越来越依赖于公路、铁路和航空等交通方式。然而&#xff0c;多变的天气条件常常给交通安全带来隐患&#xff0c;如大雾、雨雪、强风等恶劣天气不仅影响行车视线&#xff0c;还可能造成路面湿滑、结冰…

计算机硬件(考点篇)试题

波特率&#xff1a; 在电子通信领域&#xff0c;波特&#xff08;Baud&#xff09;即调制速率&#xff0c;指的是有效数据讯号调制载波的速率&#xff0c;即单位时间内载波调制状态变化的次数。波特&#xff08;Baud&#xff0c;单位符号&#xff1a;Bd&#xff09;。 波特率…