那些在学习GPT的过程中学到的

news2024/11/16 1:54:44

1、大模型是什么

GPT横空出世之后,大模型火了,什么是大模型呐?

大模型通常指的是具有大规模参数和复杂结构的深度学习模型。它们的设计和结构可以因任务而异,但以下是一些常见的大模型结构:

  1. Transformer:Transformer 是一种用于处理序列数据的基础模型结构,由 Vaswani 等人在 2017 年提出。它广泛应用于自然语言处理任务,如机器翻译、文本生成和语言理解。Transformer 包括多个编码器和解码器层,每层由多头注意力机制和前馈神经网络组成。
  2. GPT(Generative Pre-trained Transformer):GPT 是一种基于 Transformer 结构的大模型,由 OpenAI 提出。GPT 使用了预训练-微调的方法,在大规模文本语料库上进行预训练,然后在特定任务上进行微调。它在自然语言处理任务中取得了很大的成功,例如问答、摘要和文本生成。
  3. BERT(Bidirectional Encoder Representations from Transformers):BERT 也是基于 Transformer 结构的大模型,由 Google 提出。它在预训练阶段使用了自编码器的方法,使模型能够学习上下文相关的词向量表示。BERT 在诸多自然语言处理任务中取得了重要突破,如命名实体识别、句子分类和语义相似度。
  4. CNN(Convolutional Neural Network):卷积神经网络在计算机视觉领域得到广泛应用。大规模的 CNN 模型,如 VGGNet、ResNet 和 InceptionNet,具有多个卷积层和池化层,能够有效地提取图像特征。这些模型经常在图像分类、目标检测和图像生成等任务中表现出色。

需要注意的是,大模型的结构不仅仅局限于上述提到的模型,还可以根据任务的需求进行定制。此外,大模型通常需要在高性能计算环境中进行训练和推断,因为它们的参数数量庞大,计算资源要求较高。

百度紧跟着发布的文心一言,拓展了图片生成,还记得鱼香肉丝的图片吗?

2、人工智能的方向有哪些

人工智能(Artificial Intelligence,AI)的方向非常广泛,涉及多个领域和应用。以下是一些常见的人工智能方向:

2.1机器学习(Machine Learning,简称ML):

机器学习是人工智能的核心领域之一。它关注如何设计和开发能够从数据中学习和改进的算法和模型。机器学习包括监督学习、无监督学习、半监督学习、强化学习等不同类型的学习方法。

2.2 深度学习(Deep Learning,简称DL)

深度学习是机器学习的一个分支,其基础是人工神经网络(Artificial Neural Networks)。深度学习通过构建具有多个隐层的神经网络,可以自动地从大规模数据中进行特征学习和表示学习,适用于图像识别、自然语言处理等领域。

2.3 计算机视觉(Computer Vision,简称CV):

计算机视觉涉及使用计算机和算法来解析、理解和处理图像和视频。这包括图像分类、目标检测、图像分割、人脸识别、姿态估计等任务。

2.4 自然语言处理(Natural Language Processing,NLP):

自然语言处理是处理和理解人类语言的领域。它包括文本分类、信息抽取、命名实体识别、语义分析、机器翻译等任务。

2.5 语音识别(Speech Recognition):

语音识别涉及将人类语音转化为文本或命令。它在语音助手、语音翻译、语音命令等应用中起着重要作用。

2.6 强化学习(Reinforcement Learning,简称RL):

强化学习关注智能体(agent)在与环境交互的过程中学习最优行为。通过奖励信号和策略优化,强化学习能够在复杂环境中自主学习并做出决策。

除了上述方向,人工智能还涉及知识图谱、推荐系统、智能交互、自动驾驶、机器人技术等众多应用领域。随着技术的不断发展,人工智能领域将继续扩展和演进。

3、一些热门的框架和工具

3.1 chatgpt

https://chat.openai.com/

不用说了,太火了

还有一些国内的大模型,百度文心一言、阿里通义千问到商汤、昆仑万维等推出大模型,到王小川的百川智能、王慧文的光年之外、李志飞的序列猴子等

3.2 midjourney

官网:Midjourney

Midjourney为用户提供了免费的绘画工具以及教授绘画技巧的平台。

用户可以在平台上自由选择品种丰富的工具,掌握各种不同的绘画技巧,快速的进行作品的创造。

同时,用户也可以通过软件学习到各种不同的绘画相关知识内容,与其他好友分享自己的绘画作品。

平台提供简单的步骤来进行操作,并且还提供了智能AI转化工具进行使用,让用户创作更加流畅,完美。

3.3 无界AI

官网:无界AI-人人都是艺术家

中国的图片生成,每天都可以免费生成一些图片

3.4 StableDiffusion

github 地址:GitHub - Stability-AI/stablediffusion: High-Resolution Image Synthesis with Latent Diffusion Models

Stable Diffusion是stability.ai开源的图像生成模型,可以说Stable Diffusion的发布将AI图像生成提高到了全新高度,其效果和影响不亚于Open AI发布ChatGPT。

3.5 DragGAN

github地址:GitHub - Zeqiang-Lai/DragGAN: Online Demo and Implementation of DragGAN - "Drag Your GAN: Interactive Point-based Manipulation on the Generative Image Manifold" (DragGAN 全功能实现,在线Demo,本地部署试用,代码、模型已全部开源,支持Windows, macOS, Linux)

DragGAN 类似于 Photoshop 中的扭曲变形(Warp)工具,但更加强大,因为它不是“挤压像素”,而是“重新生成物体”,甚至可以旋转三维图像。这种工具的潜力在于,从文本生成图像的人工智能并不总是能输出你想要的结果,所以你可以在生成图像之后再进行编辑,而不必重新生成一个新的图像


最后推荐一本AI的科普书籍

 一个 AI 的自白,以第一人称视角,通俗易懂地讲述 AI 的来龙去脉,生动活泼地表达 AI 的技术原理。从历史到未来,跨越百年时空;从理论到实践,解读AI大爆炸;从技术到哲学,穿越多个维度;从语言到绘画,落地实战演练。ChatGPT 的诞生,引发了奇点降临,点亮了 AGI(通用人工智能),并涉及大模型、深度神经网络、Transformer、AIGC、涌现效应等一系列技术前沿。 

 京东自营购买链接:https://item.jd.com/13737387.html#crumb-wrap

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/594097.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

交换求和顺序的条件

交换求和顺序 文章目录 交换求和顺序应用场景可以交换求和的条件(部分内容来源ChatGPT)不能交换的情况其他可以参考的资料 应用场景 在多重求和中,交换求和顺序的最常见情况是需要改变计算某个表达式(通常是连乘或连加&#xff0…

【软件】无联网情况下安装Win11 / 华为电脑更换Win11系统后触摸屏、声卡失效物理解决方案

一、提前备份好电脑驱动(华为电脑更换Win11系统后触摸屏、声卡失效物理解决方案) 1.电脑驱动备份方法: 1)通过管理员身份打开命令提示符。 2)输入命令:dism /online /export-driver /destination:"D…

极氪汽车 APP 系统云原生架构转型实践

作者:极氪汽车 前言 新能源汽车已经成为我国汽车市场再次崛起的关键支柱,随着新能源汽车市场的快速发展,不同类型的品牌造车厂商呈现出百花齐放的态势。极氪汽车是吉利控股集团旗下高端纯电汽车新品牌,2021 年 4 月极氪发布首款…

踩坑笔记 ---- 使用LocalDateTime开通会员到期时间与自动续费业务某天用户突然为0

写在前面 使用LocalDateTime的同学需要注意下,这东西的plusMonth可能会有点点超出你的认知,如果不慎掉坑里,希望这篇笔记可以给你提供思路 业务背景 此业务场景非常简单,自动续费业务,需要在用户会员到期前24小时执…

Linux 防火墙开启端口

文章目录 查看防火墙状态开启指定端口重启防火墙重新加载防火墙查看已开启的端口关闭指定端口临时关闭防火墙永久关闭防火墙(必须先临时关闭防火墙,再执行该命令,进行永久关闭)结语 以下是一些常用的 firewalld 命令: …

C++11中条件标量和互斥锁应用出现死锁思考

条件变量和互斥锁在多线程同步过程中经常被使用&#xff0c;以下测试程序测试其使用。 目录 1.测试程序1 2.测试程序2 3.运行结果思考 1.测试程序1 #include <mutex> #include <deque> #include <iostream> #include <thread> #include <condi…

5-网络初识——封装和分用

目录 1.数据封装的过程 2.数据分用的过程 PS&#xff1a;网络数据传输的基本流程&#xff08;以QQ为例&#xff0c;A给B发送一个hello&#xff09;&#xff1a; 一、发送方&#xff1a; 二、接收方&#xff1a; 不同的协议层对数据包有不同的称谓&#xff0c;在传输层叫做…

Linux:忘记root密码解决办法

如果你是虚拟机只要将光盘镜像连接到虚拟机上&#xff0c;以光盘iso镜像启动 如果你是真机或服务器那将实体u盘或实体光盘连接至设备并且以连接的设备启动 开机时候打断开机 使用 &#xff08;u盘|光盘&#xff09;引导启动 troubleshooting rescue a centos system 输入 1…

前后端分离式项目架构流程(爆肝两万字)

文章目录 &#x1f412;个人主页&#x1f3c5;JavaEE系列专栏&#x1f4d6;前言&#xff1a; 【&#x1f387;前端】先创建Vue-cli项目&#xff0c;请选择此项目【&#x1f380;创建路由】打开命令行工具&#xff0c;进入你的项目目录&#xff0c;输入下面命令。1.创建 router …

SimpleCG绘图函数(4)--绘制圆

在前一篇教程我们利用绘制矩形功能绘制了一个城市,接下来我们讲解另外一个同样重要且基础的图形----圆形。并一起看看该图形能绘制哪些应用呢。 绘制圆形相关函数如下&#xff1a; //圆心坐标(nXCenter,nYCenter),半径为nRatio//绘无填充制圆 void circle( int nXCenter, int …

KG-BERT: BERT for Knowledge Graph Completion 2019ACL

把BERT用在知识图谱补全上 提出KG-BERT模型&#xff0c;在预训练好的BERT基础上继续fine-tuning。 1.传统KGC方法 传统的KGC方法一般依赖于KGE&#xff0c;而KGE往往通过将KG中的三元组关系投影到某个表示空间中&#xff0c;然后使用打分函数对三元组的合理性进行评估&#x…

OA系统流程传出文档

泛微OA如何与第三方接口交互 注意: 1.对于泛微OA中不能作为节点后的自定义编码代码,可能有以下几种原因: 代码存在语法错误:节点后的自定义编码代码应该是正确的Java代码,如果代码中存在语法错误,如缺少分号或者括号不匹配等,将不能正常编译执行。 缺少必要的依赖:节点…

C++ 内存分区模型

C程序在执行时&#xff0c;将内存大方向划分为4个区域 代码区&#xff1a;存放函数体的二进制代码&#xff0c;由操作系统进行管理的 全局区&#xff1a;存放全局变量和静态变量以及常量 栈区&#xff1a;由编译器自动分配释放 , 存放函数的参数值 , 局部变量等 堆区&…

CS5366芯片方案|单芯片type-C转HMID+PD+U3拓展坞方案|CS5366设计电路原理图

CS5366是一款高性能USB Type-c/DisplayPort TM&#xff08;DP&#xff09;到HDMI2.0转换器&#xff0c;设计用于USB Type-c源到HDMI2.0sink。CS5366集成了符合DP1.4标准的接收器和符合hdmi2.0标准的发射器。还包括两个CC控制器用于CC通信&#xff0c;以实现DP Alt Mode和功率传…

目标检测中,DETR方法为何class设置为91+1,DINO中为91

基于DEtection TRansformer的DETR框架https://github.com/facebookresearch/detr因为end-to-end&#xff0c;无需后处理等优点&#xff0c;逐渐得到青睐。DINO方法https://github.com/IDEA-Research/DINO更是取得了在COCO2017的SOTA结果。 其中&#xff0c;在DETR方法中&#…

Revit简单的门族创建及CAD图纸翻模门窗

一、Revit简单的门族创建步骤 门是我们建筑模型中不可缺少的一个构件&#xff0c;如何在族中绘制一个自己的门族呢?下面教大家绘制一个简单的门族&#xff0c;让你了解门的构件绘制。 打开公制门族进行创建 首先我们要进行门框的创建&#xff0c;很多人会以为系统自带的这个是…

【数据结构】一篇文章带你彻底学会《后缀表达式》

创作不易&#xff0c;本篇文章如果帮助到了你&#xff0c;还请点赞 关注支持一下♡>&#x16966;<)!! 主页专栏有更多知识&#xff0c;如有疑问欢迎大家指正讨论&#xff0c;共同进步&#xff01; &#x1f525;c语言系列专栏&#xff1a;c语言之路重点知识整合 &#x…

什么是项目可交付成果?定义、示例及管理工具

项目产生可交付成果&#xff0c;这只是项目活动的结果。项目可交付成果可大可小&#xff0c;其数量也因项目而异。它们是由项目管理团队和利益相关者在项目规划阶段商定的。 换句话说&#xff0c;任何类型的项目都有投入和产出。投入是你投入到项目中的东西&#xff0c;如数据…

Pixhawk无人机-ArduPilot 软件SITL仿真模拟飞行(SITL+MAVProxy)

1 引言 本人是先看了多个博客实现了&#xff1a;在ubuntu下建立完整的ardupilot开发环境。 该文是基于搭建完编译环境后&#xff0c;也就是搭建好ardupilot的仿真环境实现的。 在文章: 《Pixhawk无人机扩展教程(5)—SITL仿真模拟飞行&#xff1a;开发环境搭建》.中指出&#…

究竟什么是CRM?一文带您了解

目录 一、什么是CRM&#xff1f;它是用来做什么的&#xff1f; 1、获取商机的源头&#xff1a;全渠道营销管理 2、业绩提升的核心&#xff1a;销售管理 3、有温度的触达&#xff1a;客户服务 二、企业为什么需要布局CRM 1、销售是一场没有硝烟的战争 2、信息孤岛存在&am…