只想简单跑个 AI 大模型,却发现并不简单

news2024/10/19 8:49:55

之前我用 Ollama 在本地跑大语言模型(可以参考《AI LLM 利器 Ollama 架构和对话处理流程解析》)。这次想再捣鼓点进阶操作,比如 fine-tuning

我的想法是:既然有现成的大模型,为什么不自己整理些特定领域的数据集,给模型“加点料”呢?这样最后就能得到一个针对特定领域优化过的模型了。

不过,我很快发现,事情并没有想象的那么简单。想要 fine-tune ?那得先能通过代码的方式跑起来模型再说吧!于是,这篇文章就诞生了,记录了我如何“简单”跑个 AI 大模型,结果问题不断的过程。

云环境还是本地?

众所周知,跑 AI 模型最好有 GPU。好吧,我没有 GPU。那怎么办?没关系!云环境来救场!Google ColabKaggle Notebooks 都挺香的,毕竟谁不喜欢“白嫖”呢?我果断选择了 Colab,心想资源丰富又强大。

然而,现实狠狠打了我的脸。空闲 GPU 资源?不存在的!对于免费用户,GPU 资源完全是看缘分,没有就是没有。不过,除此之外,Colab 还是很好用的。

由于拿不到更好的资源,以及环境存在限制,我还是决定回到我的“战五渣”本地环境。

Python 环境:折腾得头秃

进入 AI 领域,Python 是不可避免的老大哥,但也正是因为它,噩梦开始了。你会遇到各种 Python 版本问题,还有管理依赖包的问题。于是你就开始在虚拟环境、各种工具的泥潭中挣扎。Condapipenvpipxpoetry 各种工具轮番上场,最后传说中的“现代包管理器” poetry 装个 PyTorch 都失败了!这让我无比抓狂。

怎么办呢?还是得上 Docker!虚拟环境?各种工具?统统扔掉!我只需要一个干净的 Docker 环境,把代码目录挂载到容器里,简直不要太爽。

不过,还要处理下容器重启时需要重新下载依赖包的问题,有两种处理办法。第一种是弄镜像,选择一个包含各种依赖环境的大镜像,或者层层构建新的镜像,我嫌麻烦没这么做。第二种就是把依赖包直接持久化,存储到项目目录下(类似于 node.jsnode_modules),然后把 PYTHONPATH 设置好,指向这些依赖的位置就行了。

再加上 VSCode 的 Remote Development 插件,开发环境终于完美拉起!再也不用担心折腾环境问题了,感觉人生都轻松了不少。

模型选择:总有一个适合你

环境搞定了,接下来该挑模型了(Hugging Face 欢迎你)。兴致勃勃地我决定试试火热的 LLaMA,结果 —— 你得申请权限。我以为随便填填表格就行,结果直接被拒绝了!我猜是因为我填的地区不对……

没事,拒绝就拒绝,天涯何处无模型。换个别的!嗯……想想吧,模型种类那么多,挑个生成文本的模型就行。于是,我瞄上了 QwenQwenLLaMA 都是大家族,下面有多种不同参数的模型,为了不让我的电脑炸掉,最后挑了个小模型 Qwen/Qwen2.5-0.5B

来吧,写好 “Hello, world”,开跑!然后 ………… 小模型也不太行啊,苦等了十几分钟,才给我回消息!不过我也倍感欣慰,毕竟模型是真回消息,速度也比招聘软件的 HR 们快多了。

(关注我,无广告,专注技术,不煽动情绪,也欢迎与我交流)


参考资料:

  • https://huggingface.co/
  • https://huggingface.co/Qwen/Qwen2.5-0.5B

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2217490.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

如何捕捉行情爆发的前兆

在金融市场的激烈角逐中,每一次行情的爆发都是投资者获取丰厚回报的关键时刻。然而,如何识别并把握这些时刻,却是一门需要深厚金融专业知识和敏锐洞察力的艺术。今天,我们就来深入探讨行情爆发的初期信号,揭示那些能够…

锥线性规划【分布鲁棒、两阶段鲁棒方向知识点】

1 锥线性对偶理论 本部分看似和分布鲁棒、两阶段鲁棒优化没什么关系,但值得优先学习,原因将在最后揭晓。 二阶锥 二阶锥(second-order cone,又称ice-cream/Lorentz cone)的形式为: 非负象限锥 半正定锥 …

初入Linux网络

1.网络发展 独立模式:计算机之间相互独立——>网络互联:多台计算机连接在一起完成数据共享——>局域网LAN:更多的计算机通过交换机和路由器连接在一起——>广域网WAN:将相隔万里的计算机连在一起。 2.协议 计算机之间…

【AI论文精读5】知识图谱与LLM结合的路线图-P3

【AI论文解读】【AI知识点】【AI小项目】【AI战略思考】 P1,P2,P4 5 LLM增强的知识图谱 知识图谱(KGs) 以其结构化的方式呈现知识而闻名,它们已被广泛应用于许多下游任务,如问答系统、推荐系统和网页搜索等…

(一)Mysql篇---Mysql整体架构

MySql框架浅析 首先,上一张图先让各位看看大致结构: 从上到下,依次说一下结构: 连接层:这里主要是处理客户端和数据库连接的,直接使用的Tomcat的连接池,可以调整最大连接数; 服务…

OpenEuler 软件安装与服务管理全攻略

在 OpenEuler 操作系统的日常使用中,软件安装和服务管理是至关重要的操作环节。本文将以严谨的方式为大家详细阐述 OpenEuler 中安装软件的多种方法,涵盖 RPM、DNF 的概念与操作命令以及操作实验,同时还包括源代码软件的安装方法和使用 syste…

JDK-23与JavaFX的安装

一、JDK-23的安装 1.下载 JDK-23 官网直接下载,页面下如图: 2.安装 JDK-23 2.1、解压下载的文件 找到下载的 ZIP 文件,右键点击并选择“解压到指定文件夹”,将其解压缩到您希望的目录,例如 C:\Program Files\Java\…

react18中如何实现同步的setState来实现所见即所得的效果

在react项目中,实现添加列表项,最后一项自动显示在可视区域范围!! 实现效果 代码实现 import { useState, useRef } from "react"; import { flushSync } from "react-dom"; function FlushSyncRef() {con…

MySQL面试专题-索引

一、MySQL为什么要选择B树来存储索引? MySQL的索引选择B树作为数据结构来进行存储,其本质原因在于可以减少IO次数,提高查询效率,简单来说就是保证在树的高度不变的情况下可以存储更多的数据。 (一)IO角度 在…

【状态机DP】【记忆化搜索及翻译递推】【空间优化】力扣3290. 最高乘法得分

给你一个大小为 4 的整数数组 a 和一个大小 至少为 4 的整数数组 b。 你需要从数组 b 中选择四个下标 i0, i1, i2, 和 i3&#xff0c;并满足 i0 < i1 < i2 < i3。你的得分将是 a[0] * b[i0] a[1] * b[i1] a[2] * b[i2] a[3] * b[i3] 的值。 返回你能够获得的 最大…

Chromium form表单post提交过程分析c++

form表单get提交参考之前文章Chromium 前端form表单提交过程分析c-CSDN博客 一、表单post提交测试例子&#xff1a; <!DOCTYPE html> <html> <head> <meta charset"utf-8"> <title>菜鸟教程(runoob.com)</title> </head&…

【C++11】可变模板参数详解

个人主页&#xff1a;chian-ocean 文章专栏 C 可变模板参数详解 1. 引言 C模板是现代C编程中一个非常强大且灵活的工具。在C11标准中&#xff0c;引入了可变模板参数&#xff08;variadic templates&#xff09;&#xff0c;它为模板编程带来了革命性改变。它的出现允许我们…

第五课:Python学习之if语句

判断&#xff08;if&#xff09;语句 目标 开发中的应用场景if 语句体验if 语句进阶综合应用 01. 开发中的应用场景 生活中的判断几乎是无所不在的&#xff0c;我们每天都在做各种各样的选择&#xff0c;如果这样&#xff1f;如果那样&#xff1f;…… 程序中的判断 # 定义…

faust,一个神奇的 Python 库!

大家好&#xff0c;今天为大家分享一个神奇的 Python 库 - faust。 Github地址&#xff1a;https://github.com/robinhood/faust 在分布式系统和实时数据处理的世界里&#xff0c;消息流处理&#xff08;Stream Processing&#xff09;变得越来越重要。Faust 是一个 Python 库…

Linux 命令:每日一学,一文说尽打包压缩工具实践

[ 知识是人生的灯塔&#xff0c;只有不断学习&#xff0c;才能照亮前行的道路 ] 文章目录&#xff1a; 0x00 前言简述 前面&#xff0c;我们介绍了Linux中文件查找find命令以及与之联用最勤的xargs命令&#xff0c;作者以一个个简单的实例给各位看友展示了在运维中两个命令的使…

智慧供排水管网在线监测为城市安全保驾护航

一、方案背景 随着城市化进程的不断推进&#xff0c;城市供排水管网作为城市基础设施的关键组成部分&#xff0c;其安全稳定的运行对于确保城市居民的日常生活、工业生产活动以及整个生态环境的健康具有至关重要的作用。近年来&#xff0c;由于各种原因&#xff0c;城市供排水管…

Python基础:16、Python数据容器

1&#xff09;数据容器入门 一种可以存储多个元素的Python数据类型 数据容器&#xff1a;一种可以存储多个元素的Python数据类型数据容器包括&#xff1a;list&#xff08;列表&#xff09;、tuple&#xff08;元组&#xff09;、str&#xff08;字符串&#xff09;、set&…

k8s的安装与部署

一、部署 1、实验环境 k8s-master172.25.254.200k8s-node1172.25.254.10k8s-node2172.25.254.20docker-node1 172.25.254.100(harbor仓库&#xff09; 2、相关操作 1.基础配置 所有节点关闭selinux和防火墙 systemctl disabled firewalld systemctl stop firewalld grubb…

商贸物流产业大脑:打造“产-供-销,仓-运-配”全流程供应链

商贸物流产业大脑&#xff1a;打造“产-供-销&#xff0c;仓-运-配”全流程供应链 在全球化竞争日益激烈的今天&#xff0c;商贸物流产业的效率和创新力成为企业能否脱颖而出的关键因素。然而&#xff0c;信息不对称、资源配套不准确、系统独立运作等痛点严重阻碍了商贸物流产…

# LangGraph 入门(二)- ChatBot demo

在这个快速入门 demo 中&#xff0c;我们将会使用 langGraph 构建一个基本的对话机器人和可是使用网络搜索的机器人。通过这个 demo 我们来快速对 langgraph 有一定感知。 概念补充 顾名思义langGraph是基于图&#xff08;Graph Theory&#xff09;的&#xff0c;如果你学过图…