LLM技术全景图:技术人必备的技术指南,一张图带你掌握从基础设施到AI应用的全面梳理

news2024/10/7 1:33:57

LLM技术全景图:技术人必备的技术指南,一张图带你掌握从基础设施到AI应用的全面梳理

LLM 技术图谱(LLM Tech Map)是将 LLM 相关技术进行系统化和图形化的呈现,此图谱主要特点是“专注于技术人视角”,不求从 LLM 产业角度汇聚信息,而是希望让从事相关工作或是想了解 LLM 的技术人有一个快速感知。

LLM 技术图谱(LLM Tech Map)从基础设施、大模型、Agent、AI 编程、工具和平台,以及算力几个方面,为开发者整理了当前 LLM 中最为热门和硬核的技术领域以及相关的软件产品和开源项目。

核心价值:帮助技术人快速了解 LLM 的核心技术和关键方向。

1.基础设施

LLM 技术图谱(LLM Tech Map)的基础设施部分主要包括以下几个方面:

  • 向量数据库:向量数据库是专门用于存储和检索向量数据的数据库,它可以为 LLM 提供高效的存储和检索能力。
  • 数据库向量支持:传统数据库通常不支持向量数据的存储和检索,数据库向量支持可以为传统数据库添加向量数据的存储和检索能力。
  • 大模型框架、微调 (Fine Tuning):针对大模型的开发。
  • 大模型训练平台与工具

1.1向量数据库

  • Milvus
  • Pinecone
  • Weaviate
  • Chroma
  • Qdrant
  • Vespa
  • Vald
  • Faiss
  • ScaNN
  • Vearch
  • AquilaDB
  • Marqo
  • LanceDB
  • Annoy
  • NucliaDB
  • DeepLake
  • MongoDB

1.2数据库向量支持

  • pgvector
  • Redis Vector
  • Elastic
  • SingleStoreDB
  • Solr
  • OpenSearch
  • ClickHouse
  • Rockset
  • Cassandra
  • Lucene
  • Neo4j
  • Kinetica
  • Supabase
  • Timescale

1.3大模型框架、微调 (Fine Tuning)

  • OneFlow
  • LMFlow
  • LoRA
  • Alpaca-LoRA
  • PEFT
  • ChatGLM-Efficient-Tuning
  • LLaMA-Efficient-Tuning
  • P-tuning v2
  • OpenLLM
  • h2o-llmstudio
  • xTuring
  • finetuner
  • YiVal

1.4大模型训练平台与工具

  • Pytorch
  • BMtrain
  • colossalAI
  • Tensorflow
  • PaddlePaddle
  • MindSpore
  • Deepspeed
  • XGBoost
  • Transformers
  • Apache MXNet
  • Ray

2.大模型

LLM 技术图谱(LLM Tech Map)的大模型部分主要包括以下几个方面:

  • 备案上线的中国大模型:有牌照提供服务的大模型,需要注意的是大模型和相应的产品多半名称不同。
  • 知名大模型:在全球范围内,已经发布了多款知名大模型,这些大模型在各个领域都取得了突破性的进展。
  • 知名大模型应用:LLM 已经在多种应用场景中得到了应用,包括文本生成、机器翻译、问答、自然语言推理等。

2.1中国大模型

  • 文心一言
  • 云雀
  • GLM
  • 紫东太初
  • 百川
  • 日日新
  • ABAB 大模型
  • 书生通用大模型
  • 混元大模型

2.2知名大模型

  • Llama 2
  • OpenLLaMA
  • 百川
  • 通义大模型
  • 文心一言
  • StableLM
  • MOSS
  • Dolly
  • BLOOM
  • Falcon LLM
  • ChatGLM
  • PaLM 2
  • 盘古
  • GPT-4
  • Stable Diffusion
  • DALL·E 3

2.3 知名大模型应用

  • ChatGPT
  • Claude
  • Cursor
  • Mochi Diffusion
  • Midjourey
  • DragGAN
  • Bard
  • Bing

3.AI Agent(LLM Agent)

AI Agent是一种能够自主运作并完成特定任务的计算实体或程序。它能够通过传感器感知周围环境,并根据感知到的信息做出决策,然后通过执行器采取行动。LLM Agent 是指基于 LLM 技术构建的智能代理,它可以用于各种任务,比如让机器与 ChatGPT 交互,一层一层挖掘信息,自动化完成任务;比如由机器人构成的虚拟小镇。

  • 核心特点

    • 自主性:AI Agent具有独立思考和行动的能力,能够在没有人类直接指导的情况下完成任务。
    • 交互性:AI Agent能够与环境或其他Agent进行交互,这在游戏、对话系统、推荐系统等场景中尤为重要。
    • 目的性:AI Agent设计有明确的目标或意图,其行为是为了实现这些目标。
    • 适应性:AI Agent能够根据环境的变化调整自己的行为,以适应新的情境。
    • 进化性:随着技术的发展,AI Agent的功能和智能水平也在不断提升。
  • 技术特点

    • AI Agent与大模型的主要区别在于,大模型与人类之间的交互是基于prompt实现的,而AI Agent仅需给定一个目标,它就能够针对目标独立思考并做出行动。
    • AI Agent的核心驱动力是大模型,并在此基础上增加了规划(Planning)、记忆(Memory)和工具使用(Tool Use)三个关键组件。
  • 类型从工作模式来看,AI Agent可以分为以下三种类型:

    • 单Agent:侧重于执行单一任务或一系列相关任务,且不需要与其他智能体进行交互。
    • 多Agent:涉及多个智能体之间的协作和交互,以完成更复杂的任务。
    • 混合Agent(人机交互Agent):结合了人类和智能体的交互,以实现更高效的任务执行。
  • Rivet

  • JARVIS

  • MetaGPT

  • AutoGPT

  • BabyAGI

  • NexusGPT

  • Generative Agents

  • Voyager

  • GPTeam

  • GPT Researcher

  • Amazon Bedrock Agents

4.AI 编程

AI编程是指利用计算机编程语言和技术来创建、训练和优化人工智能算法的过程。它涵盖了数据的收集、清洗、转换以及算法的选择和应用。AI编程是构建未来智能系统的关键,通过模拟人类智能的能力,使计算机能够执行类似于人类的决策和任务。编程语言如Python因其强大的数据处理库和简洁的语法,成为AI编程的常用工具。

  • codeium.vim
  • Cursor
  • GitHub Copilot
  • Comate
  • StableCode
  • CodeGeeX
  • TabbyML
  • CodeArts Snap
  • Code Llama
  • CodeFuse
  • 姜子牙
  • CodeShell

5.工具和平台

LLM 技术图谱(LLM Tech Map)的工具和平台部分主要包括以下几个方面:

  • LLMOps:简单点说(大家当前在说的),就是“快速从大模型到应用”。
  • 大模型聚合平台:汇聚大模型能力,提供服务。
  • 开发工具:其它开发相关的 LLM 工具。

5.1 LLMOps

  • BentoML
  • LangChain
  • Dify.ai
  • Semantic Kernel
  • Arize-Phoenix
  • GPTCache
  • Flowise

5.2 大模型聚合平台(☆)

  • Gitee AI
  • SOTA!模型
  • 魔搭ModelScope
  • Hugging Face

5.3 开发工具

  • v0
  • txtai
  • Jina-AI
  • Deco
  • imgcook
  • Quest AI
  • CodiumAI
  • Codeium Vim
  • Project IDX
  • MakerSuite

6.算力

LLM 模型的训练和部署需要大量的算力,算力是 LLM 技术发展的关键因素。

  • 英伟达
  • 昇腾
  • AMD
  • 海光
  • 昆仑芯
  • 天数智芯

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1854966.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【吊打面试官系列-Mysql面试题】视图有哪些优点?

大家好,我是锋哥。今天分享关于 【视图有哪些优点?】面试题,希望对大家有帮助; 视图有哪些优点? 答: (1) 视图能够简化用户的操作; (2) 视图使用户能以多种角度看待同一数据; (3) 视…

深入学习Java1213新特性

一、关于Java生态圈 二、Java老矣,尚能饭否? 三、JDK各版本主要特性 四、JDK与IDE的下载与安装 五、Java12新特性 1.switch表达式(预览) 2.Shenandoah GC:低停顿时间的GC(预览) 3.JVM常量API 4.微基准测试套…

Vue76-路由对浏览器历史记录的影响

一、push模式 默认是push 二、replace模式 替换当前记录! (当前指针指向的那一条记录) 三、小结

Tobii Pro Lab 1.232是全球领先的眼动追踪研究实验软件

Tobii Pro Lab是全球领先的眼动追踪研究实验软件。软件功能强大且拥有友好的用户界面,使眼动追踪研究变得更加简单、高效。该软件提供了很高的灵活性,可运行高级实验,深入了解注意力和认知过程。 获取软件安装包以及永久授权联系邮箱:289535…

QT事件处理系统之二:窗口部件的事件拦截,以及事件的传递顺序

1、案例说明 在父窗口中为selfLineEdit窗口安装事件过滤器,这样我们可以在父窗口中首先拦截来自于selfLineEdit本身产生的事件,并且决定该事件最终是否继续传递到selfLineEdit窗口本身。 2、关键代码 selfLineEdit.cpp #include "selfLineEdit.h" #include &l…

getPhysicalNumberOfCells获取列数不是合并前实际列数

问题就是:有的导入复杂表头被合并的单元格有默认空字符串,有的直接不存在这个单元格 实际我需要下面这种情况 断点可以看到这个导入第一行合并了,被合并单元格还有默认的空字符串 解决办法就是在合并单元格里面判断,不是第一行第一列都设置…

软件培训方案(Word原件)

1. 培训目的 2. 培训方式 3. 培训内容 4. 培训讲师 5. 培训教材 6. 培训质量保证 软件全套资料:本文末个人名片直接获取或者进主页。

利用定时器1产生全双工软件串口

代码; /*《AVR专题精选》随书例程3.通信接口使用技巧项目:使用AVR定时器1和外中断实现全双工软件串口文件:softuart.c说明:软件串口驱动文件作者:邵子扬时间:2012年12月16日*/ #include "softuart.h"// 内部…

数据库的概念-数据库、数据库管理系统、数据库系统、数据库管理员、数据库设计人员、开发管理使用数据库系统的人员

一、数据库(DB) 1、数据库就是存储数据的仓库,只不过这个仓库是在计算机存储设备上 2、严格的说,数据库是长期存储在计算机内、有组织的、统一管理的、可共享的相关数据的集合 3、数据库应是为一个特定目标而设计、构建并装入数…

阅读笔记:明朝那些事儿妖孽横行的宫廷

明朝那些事儿第四部看完了,合上书本给我印象比较深刻的文臣要数王守仁,不愧为明朝的军事家,思想家,文学家,教育家,他经过多年的思索、磨难、追求,终于有一天,在穷乡僻壤,…

PBR网络数据流量分流+NQA联动静态路由

一、实验目的: 企业有两个网段,业务1网段和业务2网段,拓扑图如下, 二、实验要求 pc1报文走左侧链路到达ar1,pc2报文走右侧链路到达ar1,且当ar2或者ar3发生故障时候,可以通过另一个设备到达ar1…

终极解决方案,传统极速方案,下载软件的双雄对决!

在数字资源日益丰富的今天,下载管理器成为了我们日常生活中不可或缺的工具。市场上两款备受欢迎的下载管理软件——Internet Download Manager(IDM)和迅雷11,它们以各自的特色和优势,满足了不同用户群体的需求。 软件…

应届毕业之本科简历制作

因为毕设以及编制岗位面试,最近好久没有更新了,刚好有同学问如何制作简历,我就准备将我自己制作简历的流程分享给各位,到此也算是一个小的结束,拿了工科学位证书毕业去做🐂🐎了。 简历主要包含内…

Michael.W基于Foundry精读Openzeppelin第59期——Proxy.sol

Michael.W基于Foundry精读Openzeppelin第59期——Proxy.sol 0. 版本0.1 Proxy.sol 1. 目标合约2. 代码精读2.1 _delegate(address implementation) internal2.2 _implementation() internal && _beforeFallback() internal2.3 fallback() && receive() 0. 版本…

大电流一体成型电感CSEB1350系列,助力实现DC-DC转换器小尺寸、高效率

DC-DC转换器 , 转换器 , 科达嘉 DC-DC转换器作为一种电压转换装置,在电子产品、电源系统、工业控制、新能源等领域广泛应用。。。 DC-DC转换器作为一种电压转换装置,在电子产品、电源系统、工业控制、新能源等领域广泛应用。随着各行业用户对DC-DC转换器…

Mybatis plus:Wrapper接口

一、介绍 MyBatis-Plus 提供了一套强大的条件构造器(Wrapper),用于构建复杂的数据库查询条件。Wrapper 类允许开发者以链式调用的方式构造查询条件,无需编写繁琐的 SQL 语句,从而提高开发效率并减少 SQL 注入的风险。 …

【MySQL】Linux中MySQL的使用及配置

一、字符集修改 1、MySQL8.0之前,字符集都默认是latin1,从MySQL8.0开始,字符集utf8mb4,这意味着,在默认情况下,MySQL8.0之前都是不支持中文的 # 查看字符集信息,主要是character_set_server和…

2024全国各地高考录取分数线一览表(含一本、二本、专科)

2024年高考录取分数线陆续公布,上大学网(www.sdaxue.com)为大家整理全国31个省市高考录取分数线汇总,包括本科批、专科批和特殊类招生控制分数线汇总,来看看你的省份多少分能上大学吧。 一、2024年全国高考录取线一览表 1、宁夏 一本线&…

3d隐藏模型为什么就不见了?---模大狮模型网

在3D建模和设计过程中,经常会遇到需要隐藏某些模型的情况。然而,有时候隐藏之后再也找不到这些模型了。这种情况可能让人感到困惑和沮丧。本文将探讨3D隐藏模型后“消失”的原因,并提供一些解决方法,帮助您更好地管理和查找隐藏的…

Vue的Router?一个小demo秒了

效果展示 正文 登录页 <template><div><div class"login"><h3>图书管理系统</h3><div class"user"><span>账号&#xff1a;</span><input type"text" v-model"user" /></…