测试大语言模型在嵌入式设备部署的可能性-ollama本地部署测试

news2025/3/13 18:10:58

前言

当今各种大语言模型百花齐放,为了方便使用者更加自由的使用大模型,将大模型变成如同棒球棍一样每个人都能用,并且顺手方便的工具,本地私有化具有重要意义。

本次测试使用ollama完成模型下载,过程简单快捷。
1、进入ollama:https://ollama.com/下载对应系统的ollama
2、windows中使用cmd或powershell执行ollama server进入ollama命令行
3、ollama run llm-model即可检测是否下载模型,并运行模型

本次测试的大语言模型大小均在1GB左右,具体如下图所示:
在这里插入图片描述
以上使用的模型最大的是llama3.2:1b,大小达到了1.3GB
在ollam项目的github:https://github.com/ollama/ollama页面可以看到提示:
在这里插入图片描述
因此,考虑到边缘嵌入式设备的内存大小,并且如果需要大语言模型能够在嵌入式设备中运行,那么必须要要留足空间给大语言模型。此外,还要留出一部分空间给比如数据库、UI等各种资源的。
如果大语言模型占用了1GB,个人认为嵌入式设备的RAM大小至少要3GB可能才不会影响其他进程的运行。

测试过程

测试问题

从解释性编程语言编程、日常问题和长句问题,三个方向出问题测试:

  1. 使用python编写一个贪吃蛇游戏
  2. 天空为什么是蓝色的?
  3. 当今时代,大语言模型大行其道,大量的文员类工作可能很快被大语言模型替代,如果因此被辞退应该何去何从?

测试效果

qwen2.5:1.5b
问题1

在这里插入图片描述

问题2

在这里插入图片描述

问题3

在这里插入图片描述


qwen2.5-coder:0.5b
问题1

在这里插入图片描述

问题2

在这里插入图片描述

问题3

在这里插入图片描述


qwen2.5:0.5b
问题1

在这里插入图片描述

问题2

在这里插入图片描述

问题3

在这里插入图片描述


llama3.2:1b
问题1

在这里插入图片描述
测试过程中出现过中文全部乱码的问题。

问题2

在这里插入图片描述

问题3

在这里插入图片描述


deepseek-r1:1.5b
问题1

在这里插入图片描述
编写代码大概率(3次测试出现2次)出现编写代码循环重复和无法停止的问题。

问题2

在这里插入图片描述

问题3

在这里插入图片描述


结论

从反应速度(完成问题回答)、回答问题准确性(语言一致性,但不包括回答正确性),两方面进行比较,分别分为低中高三个档次。

模型模型大小反应速度准确性
qwen2.5:1.5b986 MB
qwen2.5-coder:0.5b531 MB
qwen2.5:0.5b397 MB
llama3.2:1b1.3 GB
deepseek-r1:1.5b1.1 GB

总体来说qwen2.5:1.5b在边缘嵌入式设备部署最具有综合竞争力。同时,qwen2.5:0.5b在除了代码编程当中比较不足,但qwen2.5-coder:0.5b又专门提供了这方面的能力,两者的总大小小于qwen2.5:1.5b。
可以考虑使用一个折中的方法,主模型使用qwen2.5:0.5b用户回答问题,在回答问题前先问是否是需要编程,或使用正则表达式判断问题当中是否有python,cpp,c++,c语言,java等字段。如果需要编程则转到作为子模型的qwen2.5-coder:0.5b回答问题。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2314429.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Ubuntu通过Ollama部署deepseek和千问

一、准备文件 本地服务器是Ubuntu20.04,输入命令uname -a即可查看 部署方式有多样,点击Ollama访问官网 可复制命令直接粘贴下载,但是过程比较慢,所以我推荐下面这种方式 从githubReleases ollama/ollama GitHub上下载ollama的…

第十一届蓝桥杯单片机国赛

什么?4T模拟赛和省赛做起来轻轻松松?不妨来挑战一下第十一届国赛,这一届的国赛居然没考超声波、串口通信!只要你正确地理解了题目的意思,规避出题人挖的坑,拿个国一轻轻松松。 附件:第十一届蓝桥…

【eNSP实战】MSTP与VRRP配合使用

拓扑图 要求: PC1划分在vlan10;PC2划分在vlan20;主机IP和网关如图所示,这里不做展示LSW1配置vlan10的根交换机,vlan20的备根交换机;LSW2配置vlan20的根交换机,vlan10的备根交换机LSW1配置vlan…

UVC摄像头命令推流,推到rv1126里面去

ffmpeg命令查询UVC设备 .\ffmpeg.exe -list_devices true -f dshow -i dummy 上图是查询UVC设备的效果图,画红框的部分是UVC设备的设备名称"USB2.0 PC CAMERA"和设备号 "device_pnp_\\?\usb#vid_1908&pid_2310&mi_00#8&39abfe5&0&a…

2025年主流原型工具测评:墨刀、Axure、Figma、Sketch

2025年主流原型工具测评:墨刀、Axure、Figma、Sketch 要说2025年国内产品经理使用的主流原型设计工具,当然是墨刀、Axure、Figma和Sketch了,但是很多刚入行的产品经理不了解自己适合哪些工具,本文将从核心优势、局限短板、协作能…

es-索引详解

在 Elasticsearch 中,**索引(Index)**是核心概念之一,类似于关系型数据库中的“表”。索引用于存储、组织和检索文档(Document)。以下是关于 Elasticsearch 索引的详细解析: 1. 索引的基本概念 …

SAP接口方式之HTTP请求发布Restful服务

SAP restful http 接口集中管理发布(SICF) 项目上有很多restful接口的需求,其中涉及到多个外围系统,就想着如何通过只发布一个服务,而不用通过Webservice,也不通过RFC方式,让个外围系统传入不同的报文,来决…

Spark-TTS:基于大模型的文本语音合成工具

GitHub:https://github.com/SparkAudio/Spark-TTS Spark-TTS是一个先进的文本到语音系统,它利用大型语言模型(LLM)的强大功能进行高度准确和自然的语音合成;旨在高效、灵活、强大地用于研究和生产用途。 一、介绍 Sp…

Netty基础—3.基础网络协议一

大纲 1.网络基础的相关问题总结 2.七层模型和四层模型 3.物理层(网线 光缆 01电信号) 4.数据链路层(以太网协议 网卡mac地址) 5.网络层(IP协议 子网划分 路由器) 6.传输层(TCP和UDP协议 Socket 端口) 7.应用层(HTTP协议 SMTP协议) 8.浏览器请求一个域名会发生什…

【mysql】centOS7安装mysql详细操作步骤!

【mysql】centOS7安装mysql详细操作步骤!—通过tar包方式 需要 root 权限,使用 root 用户进行命令操作。 1. 查看 CentOS 版本 cat /etc/redhat-release2. 安装rpm包,以8为例 打开 MySQL 官方 yum 仓库网站,获取与当前 CentOS …

使用Nodejs基于DeepSeek加chromadb实现RAG检索增强生成 本地知识库

定义 检索增强生成(RAG)的基本定义 检索增强生成(Retrieval-Augmented Generation,简称RAG)是一种结合了信息检索技术与语言生成模型的人工智能技术。RAG通过从外部知识库中检索相关信息,并将其作为提示&…

笔试刷题专题(一)

文章目录 最小花费爬楼梯(动态规划)题解代码 数组中两个字符串的最小距离(贪心(dp))题解代码 点击消除题解代码 最小花费爬楼梯(动态规划) 题目链接 题解 1. 状态表示&#xff1…

LeetCode977有序数组的平方

思路①:先平方,后快排,输出(基准元素,左小右大) 时间复杂度:O(nlogn) 思路②:双指针左右开弓,首先原数组已经是按照非递减顺序排序,那…

网络变压器的主要电性参数与测试方法(4)

Hqst盈盛(华强盛)电子导读:网络变压器的主要电性参数与测试方法(4).. 今天我们继续来看看网络变压器的2个重要电性参数与它的测试方法: 1.反射损耗(Return loss&…

Windows10 WSL又又又一次崩了 Docker Desktop - Unexpected WSL error

问题:Windows10 WSL又又又一次崩了 这回报错: 然后再打开WSL Ubuntu就卡住了,等很长时间没反应,就关掉了。 手动启动Docker Desktop,报错: An unexpected error occurred while executing a WSL comman…

【前端基础】:HTML

超链接标签: a href: 必须具备, 表示点击后会跳转到哪个页面. target: 打开方式. 默认是 _self. 如果是 _blank 则用新的标签页打开 <a href"http://www.baidu.com">百度</a>链接的几种形式: 外部链接: href 引用其他网站的地址 <a href"http…

JVM垃圾收集器合集

前言&#xff1a;JVM GC收集器的回顾与比较 JVM&#xff08;Java虚拟机&#xff09;中的垃圾收集器是自动管理内存的重要机制&#xff0c;旨在回收不再使用的对象所占用的内存空间。以下是JVM中几种常见的垃圾收集器的详细介绍&#xff1a; 一、新生代垃圾收集器 1.Serial收集…

Sourcetree——使用.gitignore忽略文件或者文件夹

一、为何需要文件忽略机制&#xff1f; 1.1 为什么要会略&#xff1f; 对于开发者而言&#xff0c;明智地选择忽略某些文件类型&#xff0c;能带来三大核心优势&#xff1a; 仓库纯净性&#xff1a;避免二进制文件、编译产物等污染代码库 安全防护&#xff1a;防止敏感信息&…

本地部署 OpenManus 保姆级教程(Windows 版)

一、环境搭建 我的电脑是Windows 10版本&#xff0c;其他的没尝试&#xff0c;如果大家系统和我的不一致&#xff0c;请自行判断&#xff0c;基本上没什么大的出入啊。 openManus的Git地址&#xff1a;https://github.com/mannaandpoem/OpenManus 根据官网的两种安装推荐方式如…

视频推拉流:EasyDSS平台直播通道重连转推失败原因排查与解决

视频推拉流EasyDSS视频直播点播平台&#xff0c;集视频直播、点播、转码、管理、录像、检索、时移回看等功能于一体&#xff0c;可提供音视频采集、视频推拉流、播放H.265编码视频、存储、分发等视频能力服务。 用户使用EasyDSS平台对直播通道进行转推&#xff0c;发现只要关闭…