从ChatGPT到大模型

news2024/11/14 15:23:50

AIGC

  • AIGC
    • 1. 关于ChatGPT
    • 2. 关于大模型
      • 模型即服务。现在大模型的两种:
      • 大模型发展趋势:
      • 大模型作用:
      • 大模型核心:
    • 3. 要复现一个ChatGPT需要的资源支持?
    • 4. ChatGPT的局限性
    • 5. 类ChatGPT 未来的发展
      • ChatGPT 体现的通用性,代表的新的交互形式的出现。
      • 今后的发展:
    • 6. 提示工程
      • 1P3T
      • Prompt 技巧:
    • 7. 更多工具


在这里插入图片描述
DataWhale AIGC主题学习(点击前往视频链接)学习记录,分享关于AIGC的背景、概念、前景、使用、工具等


AIGC

AIGC,全名“AI generated content”,又称生成式AI,意为人工智能生成内容。例如AI文本续写,文字转图像的AI图、AI主持人等,都属于AIGC的应用。

1. 关于ChatGPT

ChatGPT的出现不是一蹴而就的,是大模型的工程化实现。依赖于大模型、基础模型(Transformer)、云与算力。

以Tranformer(2017)为界,AI 1.0 迈入 AI 2.0 时代。

  • AI 1.0:单一领域数据集,诸多数据集和诸多模型各形成孤岛。劳动密集型的数据标注
  • AI 2.0:超级海量数据,无需人工标注。一个具有跨领域知识的“基础模型”,执行五花八门任务。

体现的是 传统深度学习基础模型“预训练 + 微调”范式 的区别

2. 关于大模型

模型即服务。现在大模型的两种:

  • 开源大模型: 如Meta
    • 如 BloombergGPT,针对金融领域,构建了一个迄今为止最大的领域特定数据集,赋能金融行业情感分析、命名实体识别和知识问答等自然语言工作
    • 如 Segment,Meta AI 发布的图像分割基础模型
  • 封闭式模型: 如OpenAI

大模型发展趋势:

  • 家族化:模型迭代
  • 多模态趋势:聚合多元数据信息(文本、语音、图片、图像),提高大模型表征空间的精确度
  • 知识融合趋势:解决常识、知识、逻辑推理等问题

大模型作用:

  • 提供预训练方案
  • 具备自监督学习功能,降低训练研发成本
  • 有利于精度提升

大模型核心:

大算力 + 强算法 + 大数据

3. 要复现一个ChatGPT需要的资源支持?

  • 算法:开源
  • 大模型工程支持
    • 扎实的分布式系统能力,现有的开源系统:Megatron-LM、DeepSpeed、OneFlow LiBai
  • 算力:购买
  • 数据
    • 背景:数据交易机制不健全,高质量数据难获得
    • 依靠核心业务积累数据、建设爬虫团队获取…

大模型时代引发的数据变革
数据起到了至关重要的作用。在大模型训练时,训练数据的数量(参数大小和训练数据大小比例)、训练数据的配比(数据的类别、质量)都影响最终的模型。因此,愈发凸显出数据价值
OpenDataLab:开放数据建设

4. ChatGPT的局限性

目前类ChatGPT在生成回答时可能会出现的问题:

  • 常识问题
  • 似是而非
  • 政治不正确
  • 与企业或行业对接时
  • 续写问题

大模型体现的是“暴力美学”,但不代表 符号和知识图谱 会被淘汰。

5. 类ChatGPT 未来的发展

ChatGPT 体现的通用性,代表的新的交互形式的出现。

互联网 → \rightarrow 移动互联网 → \rightarrow AI互联网
在这里插入图片描述

今后的发展:

继续做大模型,或者 做大模型和应用层中间的中间层:即各个垂直领域

  • 提效工具
  • 融入业务场景(如游戏内npc)
  • 形成新的业务,突破难的业务
  • 通过LLM获得新的战略增长点

LLM主要供给B端,对比C端,Single-Use APP可能是一个好的方向,这时,便体现了搭建平台的重要性

6. 提示工程

1P3T

  • prompt
  • temperature:尺度, 0.7(0~2)
  • max_tokens:长度,60min(1~2048/4000)
  • top_p:采样,1.0(0-1)

Prompt 技巧:

  1. 格式要求
    1. 生成 … 并用逗号分隔
    2. 生成的类别
    3. 生成段落/邮件/求助/报表
    4. 根据以下指令生成图片,使用Markdown,不要使用反引号或代码框
    5. 英文提示:Think in English and reply in Chinese
  2. 控制回复量
    1. 控制数量
  3. 假装和限定角色获得场景
    1. 作为XXX角色
    2. 提供上下文
  4. 重新整理数据
    1. 简洁表述,整理
    2. 扩展内容
    3. 转化为Markdown
  5. 限定内容
    1. 基于给定内容
    2. 描述场景
  6. 组合流水线
    1. 生成列表
    2. 对每个内容
    3. 。。。
  7. 突破个人限制

更多内容可参考吴恩达 ChatGPT prompt 课程

7. 更多工具

Notion AI:用于生成文本
阿里ModelScope创空:聊天机器人和绘画
Vega:AI绘画
Gamma:对话生成PPT
腾讯——数字人自动播放
口语练习:Voice Control for ChatGPT 插件
论文绘图
科研润色翻译:github.com/binart-husky/chatgpt_academic
科研助手:Scispace, Chatpaper


进一步了解可参考DataWhale内相关内容

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/536160.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java从高德地图获取全国地铁站数据

Java从高德地图获取全国地铁站数据。 数据来源(高德地图):http://map.amap.com/subway/index.html?&4401 采集代码 /*** 从高德地图地铁线路同步全国地铁站数据(非必要不调用)* 数据来源:http://ma…

【电厂用 JL-8D/3X2定时限电流继电器 复合继电器 功耗低 JOSEF约瑟】

JL-8D/3X2定时限电流继电器名称;定时限电流继电器型号:JL-8D/3X2触点容量250V5A功率消耗<5W返回系数0.90.97整定范围0.039.9A;0.130A辅助电源24220VDC/AC 系列型号: JL-8D/3X1定时限电流继电器; JL-8D/3X111A2定时限电流继电器&#xff1b…

深度操作系统 deepin V23 Beta 发布

深度操作系统 deepin V23 发布了首个 Beta 版本。 公告写道,它是 V23 Alpha 版本的一次升级,但不建议用于生产环境。作为一个专注于用户体验的系统,Deepin v23 beta 版本引入了许多新的特性,包括 DDE 新变化、终端、跨版本升级以…

Agilent安捷伦33522B任意波形发生器

Agilent安捷伦33522B任意波形发生器30兆赫 2通道 为您最苛刻的测量生成全方位信号的无与伦比的能力 具有 5 倍低谐波失真的正弦波,可提供更纯净的信号 脉冲频率高达 30 MHz,抖动减少 10 倍,可实现更精确的计时 具有排序功能的逐点任意波形功能…

Notepad++ 添加自定义右键菜单项

目录 1. 背景 020.添加右键菜单项 - “打开至” 030.添加右键菜单项 - “复制到剪切板” 效果图: 1. 背景 笔记本上使用Notepad,会因为存在标签栏,导致窗口能显示的行数减少。 去除标签栏后,又无法操作一些右键菜单。 转而开…

掌握企业核心:工商详细信息API 60多项全维度信息解读

引言 在当今竞争激烈的商业环境中,了解和评估企业的工商注册信息变得至关重要。无论是与供应商合作、寻找合作伙伴,还是进行市场调研和背景调查,我们都需要准确和全面的企业工商信息来做出明智的决策。但是,获取这些信息往往是一…

SpringBoot的常见配置

SpringBoot基础配置 1. 配置文件格式问题导入1.1 修改服务器端口1.2 自动提示功能消失解决方案1.3 SpringBoot配置文件加载顺序 2. yaml问题导入2.1 yaml语法规则2.2 yaml数组数据2.3 yaml数据读取 3. 多环境开发配置问题导入3.1 多环境启动配置3.2 多环境启动命令格式3.3 多环…

CloudCompare二次开发之如何通过PCL进行点云分割?

文章目录 0.引言1.CloudCompare界面设计配准(segment)按钮2.欧式聚类分割(Euclidean_Seg)3.基于区域生长的分割(Region_Seg) 0.引言 因笔者课题涉及点云处理,需要通过PCL进行点云数据一系列处理分析,查阅现…

【漏洞预警】泛微E-Cology ofsLogin任意用户登陆漏洞

泛微ofsLogin任意用户登陆漏洞 漏洞描述 泛微e-cology是一套兼具企业信息门户、知识文档管理、工作流程管理、人力资源管理、客户关系管理、项目管理、财务管理、资产管理、供应链管理、数据中心功能的企业大型协同管理平台。 泛微e-cology前台任意用户登录漏洞:…

Git 代码分支管理 | 京东云技术团队

作者:京东科技 周新智 一、引言 近日,IoT 研发团队加入了不少新同学,对 git 分支的命名和管理方式有些许的模糊,分支的命名规范以及管理方式对项目的版本发布至关重要,为了解决实际开发过程中版本发布时代码管理混乱…

大模型高效调参—PEFT库( Parameter-Efficient Fine-Tuning)

介绍 在面对特定的下游任务时,如果进行Full FineTuning(即对预训练模型中的所有参数都进行微调),太过低效;而如果采用固定预训练模型的某些层,只微调接近下游任务的那几层参数,又难以达到较好的…

Java 8 腰斩!Java 17 暴涨 430%!!

前言 New Relic 最新发布了一份 “2023 年 Java 生态系统状况报告”,旨在提供有关当今 Java 生态系统状态的背景和见解。该报告基于从数百万个提供性能数据的应用程序中收集的数据,对生产中使用最多的版本、最受欢迎的 JDK 供应商、容器的兴起等多方面进…

数据链路层讲解

目录 一、数据链路层解决的问题 二、以太网协议 2.1 认识以太网 2.2 以太网帧格式 2.3 MAC地址 2.3.1 认识MAC地址 2.3.2 对比MAC地址和IP地址 2.4 MTU 2.4.1 认识MTU 2.4.2 MUT对IP协议的影响 2.4.3 MTU对UDP协议的影响 2.4.4 MTU对TCP协议的影响 2.5 数据跨网络…

什么是npu算力盒子,算力是越大越好吗?

一、什么是npu算力盒子?该怎么选? NPU(神经处理单元)算力盒子是一种专门用于进行人工智能计算的硬件设备,其中集成了高性能的NPU芯片。NPU是一种针对深度学习任务进行优化的处理器,具备高度并行计算和低功…

MySQL高级_第07章_InnoDB数据存储结构

MySQL高级_第07章_InnoDB数据存储结构 1.数据库的存储结构:页 索引结构给我们提供了高效的索引万式,不过索引信息以及数据记录都是保存在文件上的, 确切说是存储在页结构中。另一方面,索引是在存储引擎中实现的,MySQL服务器上的存储引擎负责…

文章生成器-原创文章生成器

在网络营销领域,优质文章是吸引新客户和保留老客户的重要工具。然而,生成高质量且符合SEO优化的文章并不是一件容易的事情。这就是为什么网站文章生成器如今备受欢迎的原因。而在众多的文章生成工具中,147GPT批量生成文章软件是一款非常出色的…

apache doris自定义udf函数

环境准备 下载(https://doris.apache.org/zh-CN/download) 上传文件到节点,并解压 apache-doris-fe-1.2.4.1-bin-x86_64.tar.xzapache-doris-be-1.2.4.1-bin-x86_64-noavx2.tar.xzapache-doris-dependencies-1.2.4.1-bin-x86_64.tar.xz部署 官方部署文档(本文的端口均有修…

如何将 Confluence 数据自助迁移至 ONES|软件国产化替代

近日,ONES 升级了 Confluence 自助迁移工具,对迁移数据类型、迁移范围、迁移模式等多个维度的能力进行了提升,帮助企业更高效率、更低成本地将 Confluence 中的数据完整、准确地迁移至 ONES Wiki 中。 在 Confluence 与 ONES 服务资源充足的…

win下C++通过Clion部署yolov5——libtorch+yolov5

libtorchyolov5 一、环境配置二、下载官网例子三、测试3.1、创建项目3.2、cmakelist.txt编写3.3、运行测试 一、环境配置 需要配置libtorchOpenCV,此处参考博文:clion配置libtorchOpenCV环境配置。 环境解决后即可开始下一步啦。 二、下载官网例子 下…

【debug】分立式网络切片部署

文章目录 启动代码部署全流程网络配置配置静态IP 部署核心网部署基站部署基站1部署基站2部署基站3查看amf日志 问题routing-config的问题不加routing-config与加的对比调查 nr-binder功能测试基站1基站2ifconfig路由表方向解决 路由规则 启动代码 启动OAI核心网 #开启数据转发…