二、认识大模型

news2024/11/16 17:51:28

认识大模型

  • 什么是大模型?
  • 发展趋势
  • AGI是不是泡沫
  • 大模型对比【时效】
  • 大模型特点
  • 大模型技术原理
    • 向量化
    • 除了向量化,大模型还具有特征提取特点
  • 总结
  • 结语


什么是大模型?

大模型是大规模语言模型(Large Language Model)的简称。语言模型是一种人工智能模型,他被训练成理解和生成人类语言。“大”在“大语言模型”中的意思是指模型的参数量非常大。比如ChatGPT,文心一言等

发展趋势

更强大的模型: 未来AIGC将会使用更大规模、更强大的预训练模型。随着硬件技术的进步和模型设计的改进,模型的参数和能力将不断增加,使其能够处理更复杂的任务和生成更高质量的内容。
多模态生成: AIGC不仅限于文本生成,未来趋势将发展成为多模态生成,即同时生成文本、图像和音频等多种内容,GPT-4o就是多模态产物。这将为创意产业和多媒体应用带来更多的可能性。
个性化生成: 未来AIGC可能朝着更加个性化的方向发展,能够根据用户的偏好和需求生成内容,为用户提供定制化的体验。

当然最新的GPT-o1,主要是逻辑推理方面得到了很大的加强,具备自我规划、自我纠错、自我验证的能力,像一个超大的Agent,弥补了GPT-4逻辑推理方面的缺点。也给大模型发展除增加参数、增加算力之外开辟了一个新的发展道路。

AGI是不是泡沫

谷歌DeepMind提出了一个关于AGI发展的分级框架,让我们来看看这个框架:

  1. 涌现级(Emerging):这一阶段的模型技能相当于或略超过没有相关技能的人类。例如,像ChatGPT、Bard和Llama 2这样的大模型就属于这个阶段。
  2. 刚刚合格级(Competent):在技能上达到正常成年人50%的水平。例如,语音助手Sir和在短文写作/简单编码等任务中达到SOTA水平的大模型。
  3. 专家级(Expert):可以达到正常成年人90%的水平。这一阶段的模型包括拼写和语法检查器如Grammarly,以及图像生成模型Imagen。
  4. 大师级(Virtuoso):可达到正常人类99%的水平。AlphaGo和Deep Blue等模型属于这个阶段。
  5. 超人级(Superhuman):在技能上已经超越顶尖科学家的模型,例如AlphaFold和AlphaZero。

根据这个标准,目前大多数AI产品在技能水平上已经进入了不同的AGI阶段,但通用性方面仍有待提高。ChatGPT等模型已经完全合格,但仍处于最底层的“一级AGI”阶段。

总之,AGI的发展是一个复杂的过程,需要综合考虑技能和通用性。虽然目前还没有完全达到人类智能水平的AGI,但我们对其发展充满期待。

在这里插入图片描述

大模型对比【时效】

在这里插入图片描述

模型详细对比信息,可以参考:https://github.com/wgwang/awesome-LLMs-In-China

百度在AI方面布局多年,具有一定大模型先发优势。百度的文心一言API调用服务测试的企业已经上亿。在行业大模型上,已经与国网、浦发、人民网等有案例应用。

阿里通义大模型在逻辑运算、编码能力、语音处理方面见长,集团拥有丰富的生态和产品在线,在出行场景、办公场景、购物场景有广泛应用。

ChatGPT是目前最先进的模型之一,是最流行的模型

大模型特点

  • 知识丰富
  • 道德感强,法律边界清晰
  • 有记忆力,可联系上下文
  • 知错就改
  • 知人晓事

举例1:道德感强,法律边界清晰

在这里插入图片描述

举例2:知错就改

在这里插入图片描述

在这里插入图片描述

大模型技术原理

简单来说,就是将所有的信息(文字、图片等)转换为向量,转换为向量后,就可以使用任意的数学公式进行计算,通过大量的数据训练,模型学会如何在这些向量之间进行加、减、乘、除等操作,以达到理解、生成和预测的目的。其中的关键特点

向量化

向量化就是将各种信息转换为向量,用向量去表示原来的信息。

向量化就是为了方便计算机系统去运算处理,发现规律,从而推理出内容,完成智能任务。

向量化是来自Google发表的Word2vec算法来实现的,算法大家可以自行了解

除了向量化,大模型还具有特征提取特点

在这里插入图片描述

在本题中,传统的推理只是根据最近两个字进行推理,很有可能会推理出B,很明显是不对的

为了解决这个问题,Google发表的论文Attention Is All You Need,解决了自然语言特征提取的问题,简单理解为不仅从最近的词汇来推理,还从整个句子中获取多个关键词(如:直播、老师、喜爱),根据关键词还分析语义,从而进行推理(将多个关键词向量化进行运算)

总结

通过这篇文章大家可以对大模型有一个基础的认识,关于大模型的底层架构以及所涉及的算法,感兴趣的兄弟可以自行学习,确实具有一定的难度,本人作为运维出身,反复看了好几遍还是迷迷糊糊,后续如果理解的差不多了再考虑给大家分享。

结语

最后,引用数格科技AI网站上的一句话:“面对AI焦虑,你没必要跟汽车赛跑,而是应该考个驾照!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2162991.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

mysql如何替换数据库所有表中某些字段含有的特定值

目录 背景查询所有表名查询表的所有字段过虑特征字段替换字段中含有的特定值 背景 公司的测试域名更换了,导致存放在数据库中的域名也要跟着替换,当然把域名存放在数据库表中是不科学的,不建议这样做,但公司的同事就这样做了&…

由动静压之比求马赫数的MATLAB函数

函数介绍 输入:动静压之比 p r e pre pre 输出:马赫数 M a c h Mach Mach 【注】仅适合亚音速的情况,如果动静压之比过大或过小,会有相应的提示 函数源代码 function [m] pre2mach(pre) m(5*(pre1).^0.2857-5).^0.5; if pre&l…

Leetcode 螺旋矩阵

算法思想: 这个算法的目标是按照顺时针螺旋的顺序从矩阵中取出元素。为了做到这一点,整个思路可以分成几个关键步骤: 定义边界:首先需要定义四个边界变量: left:当前左边界的索引。right:当前右…

uniapp 实现3d轮播图,也就是中间的放大两边的缩小 用swiper和swiper-item就能实现

话不多说&#xff0c;直接上代码&#xff0c;无需引入外部资源&#xff0c; 用swiper和swiper-item就能实现 先上结构代码 <swiper class"header" circular previous-margin"80rpx" next-margin"60rpx" :current"current"change&…

点亮城市安全:高科技助力精准定位路灯漏电‘隐形杀手

在城市的每一个角落&#xff0c;路灯如同守夜人&#xff0c;默默照亮归家的路。然而&#xff0c;当这些守护者出现“漏电”隐患时&#xff0c;不仅威胁着行人的安全&#xff0c;还可能引发一系列电气故障。那么&#xff0c;如何精准快速地找出这些隐藏的漏电点&#xff0c;并有…

二叉树进阶oj题【二叉树相关10道oj题的解析和代码实现】

目录 二叉树进阶oj题1.根据二叉树创建字符串2.二叉树的层序遍历3.二叉树的层序遍历 II4.二叉树的最近公共祖先5.二叉搜索树和双向链表6.从前序与中序遍历序列构造二叉树7.从中序和后序遍历序列来构造二叉树8.二叉树的前序遍历&#xff0c;非递归迭代实现9.二叉树中序遍历 &…

防止电脑电池老化,禁止usb或者ac接口调试时充电

控制android系统&#xff0c;开发者模式&#xff0c;开启和禁止充电 连接 Android 手机到电脑的 USB 端口。 下载并安装 Android Debug Bridge (ADB) 工具[1]。 USB&#xff1a; 在命令行中输入 adb shell dumpsys battery set usb 0&#xff0c;以禁止 USB 充电。 在命令…

【AI创作组】Matlab中进行符号计算

提示:代码一定要自己运行过才算数…… 1. 符号计算工具箱介绍 1.1 工具箱功能 MATLAB的符号计算工具箱,即Symbolic Math Toolbox,是一套强大的数学软件工具,它使得MATLAB具备了符号运算的能力。该工具箱提供了一系列函数,用于求解、绘制和操作符号数学方程。用户可以直接…

[Linux]从零开始的Minecraft服务器搭建教程

一、前言 学习Linux有一段时间了&#xff0c;当然&#xff0c;我们要把学习的知识运用到实际生活中去。最近朋友们都在玩我的世界&#xff0c;网易版的我的世界联机非常不稳定&#xff0c;用起来也算是非常难受了。所以还是准备转战JAVA版。为了联机&#xff0c;可以考虑一个人…

ARM单片机的内存分布(重要)

ARM单片机的内存分布&#xff08;重要&#xff09; 一、S32K344的内存布局 MEMORY {int_pflash : ORIGIN 0x00400000, LENGTH 0x003D4000 /* 4096KB - 176KB (sBAF HSE)*/int_dflash : ORIGIN 0x10000000, LENGTH 0x00020000 /* 128KB …

PhpStudy | PhpStudy 安装

关注这个软件的其他相关笔记&#xff1a;PhpStudy —— README-CSDN博客 0x01&#xff1a;Windows 系统安装 PhpStudy 附件资源 PhpStudy - CSDN 配套资源&#xff1a;phpstudy_x64_8.1.1.3.zip PhpStudy - 官网地址&#xff1a;小皮面板-好用、安全、稳定的Linux服务器面板&a…

EfficientNet(2019):基于复合缩放的自动化架构搜索高效网络!

EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks EfficientNet&#xff1a;重新思考卷积神经网络的模型扩展 论文下载地址&#xff1a; https://arxiv.org/abs/1905.11946 学习笔记参考了这位大佬&#xff1a;https://blog.csdn.net/qq_37541097/ar…

在C#中实现WebSocket的单聊和分频道聊天

在C#中实现WebSocket的单聊和分频道聊天&#xff0c;可以利用System.Net.WebSockets库。以下是如何实现这个功能的具体方案和代码。 方案概述&#xff1a; WebSocket Server&#xff1a; 通过HttpListener或ASP.NET Core来承载WebSocket服务。维护每个客户端的连接&#xff0c…

基于贝叶斯优化CNN-GRU网络的数据分类识别算法matlab仿真

目录 1.算法运行效果图预览 2.算法运行软件版本 3.部分核心程序 4.算法理论概述 4.1卷积神经网络&#xff08;CNN&#xff09; 4.2 GRU网络 5.算法完整程序工程 1.算法运行效果图预览 (完整程序运行后无水印) 优化前&#xff1a; 优化后&#xff1a; 2.算法运行软件版…

Java网络编程、正则表达式、单例设计模式与Lombok

目录 Java网络编程、正则表达式、单例设计模式与Lombok Java网络编程 软件结构 网络基础知识 相关概念 IP地址 TCP协议和UDP协议介绍 TCP协议的三次握手和四次挥手 UDP协议编程 创建客户端 创建服务端 运行 TCP协议编程 创建客户端 创建服务端 运行 文件上传案例 创建客户端 创…

windows C++-同步数据结构与 Windows API

将并发运行时提供的同步数据结构的行为与 Windows API 提供的同步数据结构的行为进行比较。 并发运行时提供的同步数据结构遵循协作线程模型。 在协作线程模型中&#xff0c;同步基元显式将其处理资源传递给其他线程。 这与抢占式线程模型不同&#xff0c;其中处理资源由控制调…

Python | Leetcode Python题解之第434题字符串中的单词数

题目&#xff1a; 题解&#xff1a; class Solution:def countSegments(self, s):segment_count 0for i in range(len(s)):if (i 0 or s[i - 1] ) and s[i] ! :segment_count 1return segment_count

教授【优青】团队亲自指导-图解表观遗传学 | 组蛋白修饰!专业实验设计、数据分析、SCI论文辅助等全方位服务。精准高效,为农植物科研保驾护航!

教授【优青】团队亲自指导&#xff01;提供专业实验设计、数据分析、SCI论文辅助等全方位服务。精准高效&#xff0c;为医学科研保驾护航&#xff01; 专业实验外包服务&#xff0c;一站式解决您的所有需求&#xff1b; 还在犹豫&#xff1f;别让您的科研和论文停滞不前&#…

C# Socket 服务端

WPF 项目 引入 Socket using System.Net.Sockets; 声明 Socket 并创建对象等待客户端连接 开启线程等待客户端连接并接收消息 接收消息并解析 发送消息 完整代码

目标检测DOTA数据集

前言 ​ 之前对于xml格式的YOLO数据集&#xff0c;之前记录过如何用imgaug对其进行数据增强。不过DOTA数据集采用的是txt格式的旋转框标注&#xff0c;因此不能直接套用&#xff0c;只能另辟蹊径。 DOTA数据集简介 DOTA数据集全称&#xff1a;Dataset for Object deTection i…