免费!快速!干货!手把手教你如何在个人电脑上搭建你自己的大模型服务!

news2025/2/23 11:37:11

大模型发展如火如荼,虽然大模型的能力强大,但是大模型也是非常昂贵的!不管是训练还是推理,都需要耗费大量的机器,而且机器的硬件资源,比如GPU、TPU等都有一定的要求。 因此,业界的同行们,最近半年很多人和组织都在研究如何将大模型轻量化,最极端的情况就是可以在个人电脑上训练、部署大模型。本文基于这个目的,手把手给你们演示一下如何在个人笔记本电脑上安装大模型,并进行基础的大模型问答推理。通过本文,你可以意识到:其实大模型并没有想象中的那么神秘,个人也可以轻松搭建。

今天要分享的在本地大件大模型服务的方法,就是使用上面这个开源项目Ollama,如今已经达到了6.7万颗星。

Ollama如今已经支持Mac和linux两个系统,windows正在开发中。我的个人电脑是Mac OS系统的(以下演示步骤都是在本笔记本电脑上亲自进行),系统配置如下:

图片

一、Ollama简介

Ollama官网:https://ollama.com/

Ollama的GitHub地址:https://github.com/ollama/ollama

Ollama是一个“支持在本地快速部署大模型服务”的解决方案,目前已经支持了很多开源的大模型,如下图所示,其中包括了Meta开源的最知名的大模型Llama,其他比如Mistral等也是享誉业内:

图片

Ollama的核心能力主要包括两个,从而才能让你轻松在本地部署大模型服务:

  • 简化、优化大模型参数配置,做到一键部署
  • 使用向量技术优化大模型推理性能,让大模型在本地的推理性能也能接受

二、安装Ollama

首先从官网下载Ollama安装包。

图片

下载下来的是一个压缩包,解压之后,双击ollama的图标,进行安装

图片

三、下载免费大模型

命令行执行命令:ollama pull llama3

模型总大小为4.7G,下载时间取决于你的网速。正常情况下最多十几分钟就可以下载完毕。

图片

查看已经下载的大模型列表:ollama list

图片

我这里演示的是下载最强大的开源大模型llama3,你也可以根据你的需要选择其他的大模型,比如Mistral。

四、启动大模型服务

命令行执行命令:ollama run llama3

启动成功之后,会出现如下的提示词,你可以输入你想要问的问题,大模型会通过推理给出回答。

图片

五、使用本地大模型服务

首先我们试一下在命令行直接提问。

比如我问了如下这个问题:“航空母舰一般最多可以载多少架飞机”

图片

图片

大模型给出了答案,时间上来讲,跟在网站或者APP上使用大模型服务的时间差不多。不过默认使用的英文回答的我,在我强烈要求下才使用中文回答了我。其实这个是模型训练的问题,你可以选择一个使用中文微调过的模型,比如llama2-chinese,这个模型会默认使用中文进行回答。

除了使用命令行工具,你还可以使用REST API进行调用。

curl http://localhost:11434/api/generate -d '{  "model": "llama3",  "prompt":"Why is the sky blue?"}'

REST API输出的内容,是一段格式化文本,你可以自己写一个简单的python程序,就可以解析出来了。当然,如果你的python程序可以对外提供问答服务,那么你就相当于在本地轻松搭建出一个大模型服务出来了。

图片

如何学习AI大模型?

作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

img

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

img

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img

四、AI大模型商业化落地方案

img

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1810958.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

远程工作岗位机会

电鸭:​​​​​​https://eleduck.com/?sortnew电鸭社区是具有8年历史的远程工作招聘社区,也是远程办公互联网工作者们的聚集地。在社区,我们进行有价值的话题讨论,也分享远程、外包、零活、兼职、驻场等非主流工作机会。「只工…

idea最新专业版安装+maven配置教程!

本教程适用于 J B 全系列产品,包括 Pycharm、IDEA、WebStorm、Phpstorm、Datagrip、RubyMine、CLion、AppCode 等。 (直接复制,拿走不谢) 9H1390TRAK-eyJsaWNlbnNlSWQiOiI5SDEzOTBUUkFLIiwibGljZW5zZWVOYW1lIjoi5rC45LmF5rA5rS7I…

Invalid keystore format,获取安全码SHA1值出错

AndroidStudio版本:Android Studio Electric Eel | 2022.1.1 项目运行JDK版本:11.0.15,查看方法如下: 在Terminal 窗口中,获取的Java版本是:1.8.0,修改Java系统环境变量,改成&#…

任务3.8.1 利用RDD实现词频统计

实战:利用RDD实现词频统计 目标 使用Apache Spark的RDD(弹性分布式数据集)模块实现一个词频统计程序。 环境准备 选择实现方式 确定使用Spark RDD进行词频统计。 Spark版本与Scala版本匹配 选择Spark 3.1.3与Scala 2.12.15以匹配现有Spar…

前端JS必用工具【js-tool-big-box】学习,获取当前浏览器向上滚动还是向下滚动,获取当前距离顶部和底部的距离

这一小节,我们说一下 js-tool-big-box 添加的最新工具方法,在日常前端开发工作中,如果网页很长,我们就需要获取当前浏览器是在向上滚动,还是向下滚动。如果向上滚动,滚动到0的时候呢,需要做一些…

树二叉树

树 ​ 树是 n(n≥0)个结点的有限集。当 n 0时,称为空树。在任意一颗非空树中应满足: (1)有且仅有一个特定的称为根的结点。 (2)当 n > 1时,其余结点可分为 m&…

管理的三大关键:定目标、抓过程、拿结果

第一板斧:定目标 想清楚,写清楚,讲清楚,才能干明白 没有见过伟大,谈何伟大?很多管理者之所以定不好目标,是因为他们根本不知道也没见过好目标是什么样的,谈何定出好目标&#xff…

无源晶振振荡电路失效问题分析与解决策略

无源晶振(晶体谐振器)在电子设备中扮演着至关重要的角色,为数字电路提供稳定的时钟信号。然而,振荡电路一旦失效,可能会导致整个系统运行不正常。晶发电子将从三个主要方面分析无源晶振振荡电路失效的问题,…

测试开发面经分享,面试七天速成

1. get、post、put、delete的区别 a. get请求: i. 用于从服务器获取资源。请求参数附加在URL的查询字符串中。 ii. 对服务器的请求是幂等的,即多次相同的GET请求应该返回相同的结果。 iii. 可以被缓存,可以被收藏为书签。 iv. 对于敏感数据不…

【回调函数】

1.回调函数是什么? 回调函数就是⼀个通过函数指针调用的函数。 如果你把函数的指针(地址)作为参数传递给另⼀个函数,当这个指针被用来调用其所指向的函数 时,被调用的函数就是回调函数。回调函数不是由该函数的实现方…

MySQL—多表查询—小结

一、引言 前面的博客已经全部学习完了关于多表查询。接下来对多表查询进行一个小结。 (1)多表查询主要是讲了两个方面 多表关系 (不管业务关系如何的复杂,最终多表的关系基本上可以分为三类) "一对多"、&qu…

每天一个数据分析题(三百五十九)- 多维分析模型

图中是某公司记录销售情况相关的表建立好的多维分析模型,请根据模型回答以下问题: 2)产品表左连接品牌表的对应关系属于? A. 一对多 B. 一对一 C. 多对一 D. 多对多 数据分析认证考试介绍:点击进入 题目来源于CD…

拯救学弟学妹计划之【论文帮手】是如何实现的?

功能介绍 概述 论文帮手是一款专为学术研究者设计的智能应用,旨在提供论文撰写和研究支持。应用通过深入了解用户的研究领域和需求,利用先进的搜索技术和人工智能,为用户提供定制化的学术资源和写作支持。 功能详述 1. 相关论文查找 此功…

Androidstudio项目加载不出来,显示Connect timed out

Android studio加载不出来所需要的环境依赖,99%的问题都是网络原因 解决办法有两个: 1.科学上网 2.使用国内的镜像 方法一自行解决,下面重点介绍方法二 在项目目录下找到gradle->wrapper->gradle-wrapper.properties 将项目的distributionUrl改为https://mirrors.cl…

SwiftUI七使用UI控件

代码下载 在应用中,用户可以创建一个简介来描述他们自已的个人情况。为了让用户可以编辑自己的简介,需要添加一个编辑模式并设计一个偏好设置界面。这里使用多种通用控件来展示用户的各种数据,并在用户保存他们所做的数据修改时更新地标数据…

【物料选型】东芝(Toshiba)车载器件选型和应用

东芝(Toshiba)拥有汽车电气化所需的丰富的半导体产品,专注于用于电动助力转向、电动水泵和电动空调风扇等应用的车载逆变器、电池管理系统和电机驱动。特别是高压和低损耗功率器件的表现优异。未来,东芝将继续提供面向未来的尖端半…

自动驾驶TPM技术杂谈 ———— 车用温度传感器

文章目录 介绍描述冷却液温度传感器进气温度传感器变速器油温传感器排气温度传感器EGR废气循环监测温度传感器车外温度传感器车内温度传感器日照温度传感器空调蒸发器出口温度传感器热敏铁氧体温度传感器 介绍 温度传感器是一种常见的传感器类型,广泛应用于温度检测…

Objective-C 学习笔记 | 回调

Objective-C 学习笔记 | 回调 Objective-C 学习笔记 | 回调运行循环目标-动作对(target-action)辅助对象通知回调与对象所有权深入学习:选择器的工作机制 参考书:《Objective-C 编程(第2版)》 Objective-C…

git服务器gitblit安装

1、下载 Gitblit 2、下载完后解压: 3、配制: 保存,退出编辑。 4、运行cmd,启用gitblit。 5、根据运行后的提示,也就是我们之间设置的port9990打开: 输入admin,admin就可以登录,这个账号密码&a…

LaTex中`\texorpdfstring`命令的使用方法

LaTex中\texorpdfstring命令的使用方法 \texorpdfstring命令 \texorpdfstring命令是hyperref包提供的一种替换宏,常用于标题中的公式显示。 命令后跟随两个参数: \texorpdfstring{TeXstring}{PDFstring}第一个参数TeXstring在正文标题中显示&#xf…