【开发心得】三步本地化部署llama3大模型

news2026/2/11 15:00:15

第一步：启动ollama

第二步：启动dify

第三步：配置模型（截图）

最近llama3很火，本文追击热点，做一个本地化部署的尝试，结果还成功了！

当然也是站在别人的肩膀上，文章最后有具体的参考文章，由于他们都是单独讲各自的部署，这里进行了整合。也就是说，如果你想本地化部署llama3大模型，本文是一套完整的部署方案。

第一步：启动ollama

ollama是可以本地部署的模型，其他模型，大多需要key才能进行连接。并不能做到本地化部署，而ollama作为轻量级，可本地化部署的模型，就是我们当下最好的选择了。

安装ollama很简单，只要你安装了docker，一条命令就可以了。

docker pull ollama/ollama

docker run -d -v  $PWD/ollama:/root/.ollama -p 11434:11434 \--name ollama ollama/ollama 

docker exec -it ollama /bin/bash

ollama run llama3

安装成功并且run以后，就可以看到下面的提示符，说明模型已经部署成功了！

需要注意的是：

如果已启动过，需要删除原有的容器，当你再次重启以后，这个容器是不会自动运行的，需要手动，如下代码。当然也可以采用docker compose的方式，这里就偷懒了。

docker restart ollama

docker exec -it ollama /bin/bash

ollama run llama3

还有一种方法就是把容器删除，重新启动，浪费时间就不推荐了。

docker rm 容器名称

第二步：启动dify

第一步完成以后，后面就是安装dify框架了，dify的介绍和功能，在下面的参考文章中都有，有兴趣可以去看看，这里就不多说了，直接上代码。

git clone https://github.com/langgenius/dify.git

cd /dify/docker

docker-compose up -d

当dify安装成功以后，首先要进行管理员配置，傻瓜式操作。

需要注意的是，当你添加新用户的时候，是采用邀请的方式，并不能直接设定用户的密码，这一点与其他平台有点儿不同。

第三步：配置模型（截图）

最后一步是在dify里配置ollama模型，如下图：

如果能够保存成功，就大功告成了！

需要注意的是，本文采用的是纯CPU模式，如果要上生产，还是要用到GPU的，否则生成回答的时候，会很慢很卡。

参考文章：

58k+star！ollama快速部署llama3大模型 - 大模型知识库|大模型训练|开箱即用的企业大模型应用平台|智能体开发|53AI

内网穿透的应用-如何使用Docker本地部署Dify LLM结合内网穿透实现公网访问本地开发平台_difydocker部署-CSDN博客

接入 Ollama 部署的本地模型 | 中文 | Dify

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1804360.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！