【AI开发:语言】二、Qwen1.5-7B模型本地部署CPU和GPU版

news2024/11/26 4:35:07

前言

        之前文章,我们采用了Koblod运行Yi-34B大模型,本文采用LM Studio来运行千问模型。

LM Studio并没有开源,但是可以免费使用,他是目前本地进行模型测试最好的工具了。

        在这里,依然使用Windows 10进行部署和测试,没有GPU。

        注意:LM的运行速度相比较Kobold两者差不多,而且也提供WEB服务,稍后也研究下他的API功能,LM的功能更多一些有待开发。

一、LM Studio下载

下载地址:LM Studio - Discover, download, and run local LLMs

二、模型下载

下载地址:AI快站 - HuggingFace模型免费加速下载

我们要从这里选择需要的模型。其他模型资源如下:

1.其他模型资源

  • 国内厂商模型
序号厂商访问地址
1阿里通义千问AI快站 - HuggingFace模型免费加速下载
2百川智能AI快站 - HuggingFace模型免费加速下载
3CodeFuseAI快站 - HuggingFace模型免费加速下载
4上海人工智能实验室AI快站 - HuggingFace模型免费加速下载
5智谱AI快站 - HuggingFace模型免费加速下载
6智源人工智能研究院AI快站 - HuggingFace模型免费加速下载
7FlagAlphaAI快站 - HuggingFace模型免费加速下载
8零一万物AI快站 - HuggingFace模型免费加速下载
  • 海外厂商模型
序号厂商访问地址
1googleAI快站 - HuggingFace模型免费加速下载
2codefuse-aiAI快站 - HuggingFace模型免费加速下载
3mosaicmlAI快站 - HuggingFace模型免费加速下载
4bigcodeAI快站 - HuggingFace模型免费加速下载
5lmsysAI快站 - HuggingFace模型免费加速下载
6NousResearchAI快站 - HuggingFace模型免费加速下载
7OpenAssistantAI快站 - HuggingFace模型免费加速下载
8tiiuaeAI快站 - HuggingFace模型免费加速下载
9bigscienceAI快站 - HuggingFace模型免费加速下载
10diffusersAI快站 - HuggingFace模型免费加速下载
11microsoftAI快站 - HuggingFace模型免费加速下载
12runwaymlAI快站 - HuggingFace模型免费加速下载
13HuggingFaceH4AI快站 - HuggingFace模型免费加速下载
14garage-bAIndAI快站 - HuggingFace模型免费加速下载
15openaiAI快站 - HuggingFace模型免费加速下载

2.需要的模型

本次部署,我们依然选择4B,当然还是选择了GGUF格式,稍后我还要部署到服务器端。

三、安装和打开LM Studio

双击 LM Studio setup.exe,稍等片刻,它会自动安装到C盘,可以挪走,也可以不动。

四、加载和使用模型

1.创建模型文件夹        

        我们先把已经下载好的本地模型,放到它指定的目录下,否则就无法加载模型,其中有两个文件夹第一次可能需要手动建立Publisher和Repository,他俩是上下级关系 。

C:\Users\Administrator\.cache\lm-studio\models\Publisher\Repository

 将我们需要用的模型拷贝进来

2.重新启动LM

重启后,我们就可以去查看自己的模型了。

 3.修改模型文件夹

D:\LM-Studio\models\Publisher\Repository
#新建Publisher和Repository

在选择模型的时候,只选择到 models这一级就可以了,多选无效。

4.使用AI对话

五、LS的API功能

API文档:Local LLM Server | LM Studio

由于时间问题,稍后再做整理和测试。

六、最后

        Kobold和LM Studio各有千秋吧,一个是简单,另外一个就是功能多。所以在使用的时候我们可以根据自己的需求来选择。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1600171.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

GPT-3:NLP领域的革新者

在自然语言处理(NLP)领域,预训练模型一直是研究的热点。随着技术的不断进步,我们见证了从BERT到GPT等一系列模型的涌现。其中,GPT-3(Generative Pre-trained Transformer 3)以其卓越的生成能力和…

抗干扰1路|1通道触摸单按键触摸触控ICVK3601 SOT23-6适用于玩具,风扇,台灯等触摸IC

产品品牌:永嘉微电/VINKA 产品型号:VK3601 封装形式:SOT23-6 概述 VK3601具有1个触摸按键,可用来检测外部触摸按键上人手的触摸动作。该芯片具有较 高的集成度,仅需极少的外部组件便可实现触摸按键的检测。 提供了1路…

力扣周赛392复盘

3105. 最长的严格递增或递减子数组 题目 给你一个整数数组 nums 。 返回数组 nums 中 严格递增 或 严格递减 的最长非空子数组的长度。 思考: 返回什么:返回最长非空子数组的长度。return max(decs_len,incs_len); 但实际上我们只需要用一个变量ans就…

【优质书籍推荐】AI赋能100%提高项目管理效率

大家好,我是爱编程的喵喵。双985硕士毕业,现担任全栈工程师一职,热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。…

Vision GNN: An Image is Worth Graph of Nodes

感受野:在卷积神经网络中,感受野(Receptive Field)是指特征图上的某个点能看到的输入图像的区域,即特征图上的点是由输入图像中感受野大小区域的计算得到的。 感受野并非越大越好,反而可能因为过大而过于发散梯度下降(Gradient Descent GD&am…

在linux系统中启动pycharm

1.找到pycharm的安装路径,一般在下载文件夹中 2.进入pycharm的安装路径,进入bin目录 3.右击,打开终端,输入./pycharm.sh

民航电子数据库:[E14024]事务内变更操作次数超过最大许可值10000,可通过系统参数max_trans_modify适当调整限制

目录 一、场景二、异常情况三、原因四、排查五、解决 一、场景 1、对接民航电子数据 2、执行delete语句时报错 二、异常情况 三、原因 通过报错信息就可以看出,是系统参数max_trans_modify配置导致 当删除的数据量 > max_trans_modify时,删除就会…

【LeetCode每日一题】924. 尽量减少恶意软件的传播(并查集)

文章目录 [924. 尽量减少恶意软件的传播](https://leetcode.cn/problems/minimize-malware-spread/)思路:并查集代码: 924. 尽量减少恶意软件的传播 思路:并查集 构建并查集:首先,代码创建了一个 UnionFind 类来维护节…

AIGC教育行业全景报告:AI助教和家教成真,学习机迎来新机遇

原文:AIGC教育行业全景报告:AI助教和家教成真,学习机迎来新机遇 - AI新智界 图片来源:由无界AI生成 经过一年的快速迭代,业内对于生成式AI将会率先落地于哪些行业已经有了答案。 教育领域,不仅被OpenAI列…

leetcode1448.统计二叉树中的好节点数目

1. 题目描述 题目链接 2. 解题思路 首先看一下题目的“核心”,什么是好节点:从根到该节点 X 所经过的节点中,没有任何节点的值大于 X 的值。也就是说,我们只要知道了从根节点到该节点的所有的值,就可以判断该节点是…

【代理模式】静态代理-简单例子

在Java中,静态代理是一种设计模式,它涉及到为一个对象提供一个代理以控制对这个对象的访问。静态代理在编译时就已经确定,代理类和被代理类会实现相同的接口或者是代理类继承被代理类。客户端通过代理类来访问(调用)被…

iOS依赖库版本一致性检测:确保应用兼容性

一、背景 在 iOS 应用开发的世界里,每次 Xcode 更新都带来了新的特性和挑战。最近的 Xcode 15 更新不例外,这次升级引入了对 SwiftUI 的自动强依赖。SwiftUI最低是从 iOS 13 开始支持。 这一变化也带来了潜在的兼容性问题。如果您的项目在升级到 Xcode…

《大话数据结构》02 算法

算法是解决特定问题求解步骤的描述,在计算机中表现为指令的有限序列,并且每条指令表示一个或多个操作。 1. 两种算法的比较 大家都已经学过一门计算机语言,不管学的是哪一种,学得好不好,好歹是可以写点小程序了。现在…

为什么你不用懒人建站工具?套用这四个wordpress主题模板,1小时轻松搭建网站

懒人建站工具,凭借简单易用、快速上手和个性化定制的特点,为不熟悉代码和程序的人提供了搭建美观实用网站的便捷途径。无需专业的前端开发知识,无需雇佣专业开发人员,用户便能轻松实现网站搭建,满足个人或企业需求。懒…

【可实战】测试体系与测试方案设计(业务按公司实际情况,技术可参考通用测试方案)

一、如果我们要测试一个系统,首先我们要了解被测系统的架构 (一)业务架构-从需求里面去了解(角色和行为): 业务模型分析(是一个电商,还是一个企业的crm,还是一个网站&a…

高等数学——一文搞定二重积分

文章目录 二重积分的基本概念二重积分的性质累次积分计算二重积分的方法和技巧描点画图法对称性利用函数的奇偶性变量的轮换对称性 积分次序的选择积分区域的确认先看变量和先积变量基本原则穿线法确定先积变量的曲线范围 常见的曲线经典题目 二重积分的基本概念 定义&#xf…

ChatGPT 可以预测未来吗?

推荐 4月13日的一篇有趣的 paper,特来分享。 👉 当前的大型语言模型(LLMs)具有强大的数据合成和推理能力,但它们在直接预测尚未发生事件的准确性上常常受到限制。传统的预测方法依赖于直接询问模型关于未来的问题。 …

测出Bug就完了?从4个方面教你Bug根因分析

01 现状及场景 🎯 1.缺失bug根因分析环节 工作10年,虽然不是一线城市,也经历过几家公司,规模大的、规模小的都有,针对于测试行业很少有Bug根因环节,主流程基本上都是测试提交bug-开发修改-测试验证-发送报…

Spring学习(二)

图解: 2.核心容器总结 2.2.1 容器相关 BeanFactory是IoC容器的顶层接口,初始化BeanFactory对象时,加载的bean延迟加载 ApplicationContext接口是Spring容器的核心接口,初始化时bean立即加载 ApplicationContext接口提供基础的be…

为什么科拓停车选择OceanBase来构建智慧停车SaaS应用

本文来自OceanBase的客户——拓客停车的实践分享 科拓停车简介与业务背景 作为智慧停车行业的佼佼者,科拓停车致力于提供全方位的智慧停车解决方案。服务涵盖车场运营管理、互联网智慧停车平台以及停车场增值服务等。通过不断研发创新,打造出了多样化的…