想转行AI大模型开发但不知如何下手?看这篇就够了!

news2025/1/6 20:01:03

原创

最近有很多小伙伴问我,之前从事的其他领域的编程,现在想要学习AI大模型开发的相关技能,不知道从哪下手,应该学习些什么,下面四个是我认为从事大模型开发,必须掌握的四个开源工具,大家可以作为参考:

1、Hugging Face(抱抱脸)

img

Hugging Face是现在最大的AI开源社区,里面提供了很多的预训练模型,是一个模型库,很多人会把自己训练好的模型上传上去,大家可以免费下载使用。下载下来之后,我们就可以在此基础之上,进行微调或者推理,不用从0去训练一个大模型。并且大家可能都知道,微调模型时,数据的准备是一件费时费力的事,而在Hugging Face上也有很多的数据集,可供大家下载使用。所以Hugging Face也被人称作:AI领域的GitHub。

2、PyTorch

img

现在你从Hugging Face下载了一个模型之后,下一步要开始微调了,此时就需要用到PyTorch了。PyTorch是一个基于Python的开源机器学习库,可以说现在已经成为最流行的机器学习和深度学习框架了,它提供了一套简洁且强大的API,使得模型的构建和操作更加直观,你只需通过几行代码就可以构建自己的大模型。

3、DeepSpeed

img

通过上面两步的操作,你已经从Hugging Face上下载了一个模型,用PyTorch写好了微调的代码,现在准备要在服务器上进行训练或微调了,这时候我们就需要用到下面的这个工具了:DeepSpeed。因为大模型在服务器上进行训练或微调时,不可能只在一台服务器上,而DeepSpeed的作用是可以将你的模型快速放在多台服务器上进行并行化的训练或推理,所以你还需要继续完善代码,添加对DeepSpeed的支持。

上面的步骤都完成之后,你可以真正的在服务器上去训练或微调你的大模型了。最后你会得到一个训练或微调后的大模型文件,自己可以推理测试下,看看被你用于微调的数据集,是不是可以被推理出来。

4、LangChain

img

大模型被训练后,主要的作用是要用来进行推理。而我们可以开发一些AI应用,去调用大模型完成推理,例如去构建一个结合RAG+LLM的企业内部知识库系统,去开发一个基于AI的聚合搜索引擎,去开发某个领域的AI智能体应用等等。这时候,我们需要用到这个框架:LangChain。LangChain的定位是一个用于构建基于LLM驱动的应用程序开源框架,方便我们快速构建基于LLM的应用程序。里面内置很多API,简化了对大模型的操作。所以如果要基于大模型去开发应用程序,LangChain必不可少。

------------------

通过上面介绍的四款开源工具,我们可以从0去构建一个大模型了,并且还可以在此基础上去开发应用程序。我相信,上面这四款工具,现在已经成为了从事AI领域开发从业人员必备的4件套了。

但是上面的四款工具,如果你不是搞大模型的,只是单纯的开发大模型应用程序,掌握LangChain就可以了,无需掌握其他三个。

如何学习AI大模型?

作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

img

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

img

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img

四、AI大模型商业化落地方案

img

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2160275.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

14张图深度解密大厂秒杀系统库存设计,不是所有的库存都能支持高并发!

作者:冰河 星球:http://m6z.cn/6aeFbs 博客:https://binghe.gitcode.host 源码获取地址:https://t.zsxq.com/0dhvFs5oR 沉淀,成长,突破,帮助他人,成就自我。 大家好,我是…

应用在多钥匙应用程序-门锁、遥控器等领域的电容式触摸芯片-GT308L

触摸IC是一种集成了触摸感应技术的芯片,具有快速响应、高精准度和耐用性强的优点。可以实现高灵敏度的触控和准确的指令响应。在智能门锁的设计中,触摸IC不仅可以实现密码输入、指纹识别等功能,还可以与智能家居系统进行联动控制,…

【编程底层原理】Java常用读写锁的使用和原理

一、引言 在Java的并发世界中,合理地管理对共享资源的访问是至关重要的。读写锁(ReadWriteLock)正是一种能让多个线程同时读取共享资源,而写入资源时需要独占访问的同步工具。本文将带你了解读写锁的使用方法、原理以及它如何提高…

行人3d目标检测-车辆3d目标检测-3d目标检测(代码+教程)

在计算机视觉领域,准确地识别并定位物体对于多种应用来说至关重要,比如自动驾驶、机器人导航以及增强现实等。其中,三维边界框(3D Bounding Box)估计是一项关键技术,它允许系统不仅能够检测到图像中的物体位…

JavaScript中Windows对象下的属性和方法

1.Windows对象概念 所有的浏览器都支持Windows对象。它表示浏览器窗口 2.Boom概念 Boom:是指浏览器对象模型,它使javaScript有能力与浏览器进行对话 3.DOM概念 DOM:是指文档对象模型,通过它可以访问HTML文档中的所有元素 HT…

达梦-华为鲲鹏ARM架构下性能测试最佳实践

一、测试综述 1.1 测试目的 本次测试的目的是验证达梦数据库,在鲲鹏服务器下,不同服务器参数基于sysbench性能压力测试的表现。本次参数是根据为华为鲲鹏arm服务器调优十板斧内建议值调整 成长地图-鲲鹏开发套件开发文档-鲲鹏社区 1.2 通用指标 指标…

SpringBootWeb响应

2. 响应 前面我们学习过HTTL协议的交互方式:请求响应模式(有请求就有响应) 那么Controller程序呢,除了接收请求外,还可以进行响应。 2.1 ResponseBody 在我们前面所编写的controller方法中,都已经设置了…

华为云长江鲲鹏深度赋能,大势智慧稳居“实景三维+AI”领域排头兵

本文转自长江日报大武汉客户端 走出象牙塔第10年,武汉大势智慧科技有限公司(以下简称“大势智慧”)已成长为国内三维技术创新及应用领域龙头企业,其自主研发的“重建大师”等三维测绘软件系统在各级测绘系统占有率达到87.5%。 这…

NLP 文本匹配任务核心梳理

定义 本质上是做了意图的识别 判断两个内容的含义(包括相似、矛盾、支持度等)侠义 给定一组文本,判断语义是否相似Yi 分值形式给出相似度 广义 给定一组文本,计算某种自定义的关联度Text Entailment 判断文本是否能支持或反驳这个…

Windows系统修改Tomcat虚拟机内存参数

文章目录 I 修改Tomcat虚拟机内存参数基于tomcat管理程序进行配置基于setenv文件进行配置II 查看服务器状态/manager/status 查看服务器状态manager/jmxproxy 查询Tomcat指标I 修改Tomcat虚拟机内存参数 基于tomcat管理程序进行配置 查看堆内存分配情况: jmap -heap pid jst…

【Kubernetes知识点】解读HPA的 thrashing(抖动)问题

【Kubernetes知识点】解读HPA的 thrashing(抖动)问题 目录 1 概念 1.1 什么是 Thrashing 现象?1.2 HPA 中 Thrashing 产生的原因1.3 解决 Thrashing 的优化措施 1.3.1 设置合适的阈值1.3.2 使用自定义指标和基于负载的自动扩缩1.3.3 增加扩…

增强GPT4v的Grounding能力,video-level

开源链接: appletea233/AL-Ref-SAM2: AL-Ref-SAM 2: Unleashing the Temporal-Spatial Reasoning Capacity of GPT for Training-Free Audio and Language Referenced Video Object Segmentation (github.com) In this project, we propose an Audio-Language-Refe…

力扣最热一百题——最小覆盖子串

目录 题目链接:76. 最小覆盖子串 - 力扣(LeetCode) 题目描述 示例 提示: 解法一:滑动窗口 1. 初始化 2. 构建 mapT 3. 滑动窗口 4. checkT 方法 5. 返回结果 Java写法: 运行时间 C写法&#x…

[Python学习日记-29] 开发基础练习2——三级菜单与用户登录

[Python学习日记-29] 开发基础练习2——三级菜单与用户登录 简介 三级菜单 用户登录 简介 该练习使用了列表、字典、字符串等之前学到的数据类型,用于巩固实践之前学习的内容。 三级菜单 一、题目 数据结构: menu { 北京: { 海淀: { …

纯css实现选项卡

<span class"flex tab" ><view :class"tabStyle(1)" click"tabClick(1)">变形监测</view><view :class"tabStyle(2)" click"tabClick(2)">渗流渗压</view></span>tabIndex:1tabClick…

src漏洞挖掘 | 记某学校网站的一次漏洞挖掘

&#x1f497;想加内部圈子&#xff0c;请联系我&#xff01; &#x1f497;文章交流&#xff0c;请联系我&#xff01;&#x1f36c; 博主介绍 &#x1f468;‍&#x1f393; 博主介绍&#xff1a;大家好&#xff0c;我是 hacker-routing &#xff0c;很高兴认识大家~ ✨主攻领…

【附实例】Python字典的各种操作

一、字典理解 Python 字典是一种可变容器模型&#xff0c;且可存储任意类型对象。字典的每个键值对用冒号 : 分割&#xff0c;每对之间用逗号 , 分割&#xff0c;整个字典包括在花括号 {} 中。 二、访问字典 ①.访问键名 my_dict {name: Alice, age: 30, city: New York} k…

显示数量以及坐标区间

import re import numpy as np import matplotlib.pyplot as plt from matplotlib.font_manager import FontProperties# 动态加载字体文件 font_path /usr/local/sunlogin/res/font/wqy-zenhei.ttc # 替换为实际字体路径 my_font FontProperties(fnamefont_path)# 定义日志…

【折腾笔记】雷池WAF+FRP+Nginx实现安全可靠的内网穿透

前言 在网上看了许多关于WAFFRPNginx的方式来保护内网穿透的Web服务&#xff0c;但是在网上搜寻的结果都是将WAF部署在了源站上面&#xff0c;由于我的Web服务都是部署在NAS上面&#xff0c;然后使用Frp来穿透访问的&#xff0c;我认为WAF应该部署在服务器上面比较合适&#x…

基于STM32F103C8T6单片机的农业环境监测系统设计

本设计是基于STM32F103C8T6单片机的农业环境监测系统&#xff0c;能够完成对作物的生长环境进行信息监测和异常报警&#xff0c;并通过手机APP来实现查看信息和设定阈值的功能。为了实现设计的功能&#xff0c;该系统应该有以下模块&#xff1a;包括STM32单片机模块、水环境PH值…