【LLM】一、利用ollama本地部署大模型

news2025/4/9 17:14:59

前言

一、Ollama 简介

1、什么是Ollama

2、特点：

二、Windows部署

1.下载

2.安装

3.测试安装

4.模型部署：

5.注意

三、 Docker部署

1.docker安装

2.ollama镜像拉取

3.ollama运行容器

4.模型部署：

5.注意：

总结

前言

最近，自己在学习一些大模型的相关知识，所以近期会不定时更新大模型的实操指南，这里为LLM系列第一篇文章，主要内容是在本地搭建自己的LLM服务。

随着AI的发展，越来越多的开软软件供我们选择，如：Hugging Face 、Transformers、LangChain、Ollama、vllm等，本篇以O llama为例，在本地搭建自己的大模型服务。话不多说，正文开始。

一、Ollama 简介

官网地址：ollama官网

1、什么是Ollama

Ollama 是一个开源框架，专为在本地机器上便捷部署和运行大型语言模型（LLM）而设计，极大地简化了大模型在本地运行的过程。对用户来说，只需要通过执行几条命令就能在本地运行开源大模型，如qwen、llama等。

2、特点：

简化部署：Ollama 目标在于简化在 Docker 容器中部署大型语言模型的过程，使得非专业用户也能方便地管理和运行这些复杂的模型。
轻量级与可扩展：作为轻量级框架，Ollama 保持了较小的资源占用，同时具备良好的可扩展性，允许用户根据需要调整配置以适应不同规模的项目和硬件条件。
API支持：提供了一个简洁的 API，使得开发者能够轻松创建、运行和管理大型语言模型实例，降低了与模型交互的技术门槛。
预构建模型库：包含一系列预先训练好的大型语言模型，用户可以直接选用这些模型应用于自己的应用程序，无需从头训练或自行寻找模型源。
跨平台支持：提供针对 macOS、Windows（预览版）、Linux 以及 Docker 的安装指南，确保用户能在多种操作系统环境下顺利部署和使用 Ollama。

二、Windows部署

1.下载

进入目录一中给出的ollama的官网，然后选择你安装的版本即可：

Windows下应该是

2.安装

windows下双击上边的exe文件，选择install安装即可.

3.测试安装

进入到cmd下，输入Ollama，出现下列内容则证明安装成功，安装成功后，该服务会开机自启，不需要每次手动运行

4.模型部署：

直接cmd命令行里输入ollama run xxx(xxx为你要部署的模型名字，如)即可。同时，大家也可以前往ollama官网查看支持的模型，如下：

在红框中搜索你想要部署的模型，如qwen2

选择模型大小，然后复制右侧命令到cmd中即可，运行成功的界面如下：

5.注意

Windows下模型默认下载到 C:\Users\%username%\.ollama\models下，如果你要更改，需要在电脑“高级环境变量”中创建一个新的变量OLLAMA_MODELS，如下：

模型将会保存在D:\ollama\models下

监听端口默认为11434，如果你要更改默认端口，同上，在环境变量中新增OLLAMA_HOST，如下：

这样修改之后，你本地请求ip:1006即可。

如果按照以上方式修改了环境变量，记得重启ollama服务，否则不会生效。

三、 Docker部署

1.docker安装

这部部分自行百度下，网上很多教程，需要注意的是，如果你电脑有gpu的话记得去安装docker的gpu版本。

2.ollama镜像拉取

docker pull ollama/ollama

3.ollama运行容器

CPU 下：

docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

GPU下：

docker run -d --gpus=all -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

其中， -v ollama:/root/.ollama表示你要将本地的ollama目录挂载到容器中，该目录可自己指定，是用来存放模型的。最好自己创建下。--name. ollama为容器名，也可以自己指定

4.模型部署：

部署方式同二.4中，即直接ollama run xxx即可，x x x是你要部署的模型型号。

5.注意：

当你想使用所有的gpu时，则执行3中的命令即可，如果要指定gpu，执行下列命令：

docker run -d --gpus "device=7"  -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

如果你更改监听端口，则执行下列命令：

docker run -d --gpus=all  -v ollama:/root/.ollama -p xxx:11434 --name ollama ollama/ollama

其中，x x x即为你要监听的本机端口号

总结

以上就是本篇全部内容，后续会不定时更新该系列文章，如果觉的有用的话，别忘了三连🐶

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1897851.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！