ChatGPT学习研究总结

news2025/1/11 5:41:58

目录

ChatGPT研究总结

一、程序接入用途不大

二、思考:如何构建一个类似ChatGPT的自定义模型

一些ChatGPT研究学习资料(来源网络)

(1)一文读懂ChatGPT模型原理

(2)MATLAB科研图像处理——基于ChatGPT编程

(3)ChatGPT发展历程、原理、技术架构详解和产业未来 (收录于先进AI技术深度解读)

(4)程序员浅用ChatGPT:替代还很远

(5)用ChatGPT 做硬件设计?

(6)chatGPT 的 49 种应用场景介绍,各开发语言接入 chatGPT 参考指南


ChatGPT研究总结

ChatGPT是一种由OpenAI训练的大型语言模型,它可以生成人类语言文本。在编写小段代码、书写描述功能介绍等等方面有一定的帮助,但因为工具本来存在一些错误现象,所以还需要人工审核,用其精华。同时,使用过程中还需注意对结果中可能存在的版权风险。

目前ChatGPT使用中主要存在如下问题:

  1. 慢:因为计算量巨大,速度较慢,通常一个问题需要几分钟才有答案
  2. 错:因为只是文本语言模型分析,存在回答结果错误现象
  3. 广度待提升:模型训练的领域广度还待提升

一、程序接入用途不大

程序接入的用途不大,因为通过sdk只是封装出一个软件界面,核心的计算代码还是部署在服务器上的训练代码,而目前通过微信公众号(ChatChatGPT)等接口输入也能达到使用ChatGPT,所以没有必要来接入程序,做一个“软件壳”,作用不大。

二、思考:如何构建一个类似ChatGPT的自定义模型

例如,能否构建一个压裂监测模型,根据监测的电磁信号来推测压裂缝隙的走向?

关于这个问题,先总监一下 ChatGPT 模型构建中的几个关键点:

1、大数据训练:

  1. 基于2021年所拥有的数据集,预训练数据量可能超过百T级,非常巨大
  2. ChatGPT参数量达到了1750亿,模型设定的参数非常多

2、人工对结果标注
ChatGPT进行了人工标反馈和奖励,以辅助人工智能程序不断优化(进化)

3、训练费用

“GPT-3 模型训练一次需要花费 460 万美元”

见附录:《chatGPT 的 49 种应用场景介绍,各开发语言接入 chatGPT 参考指南》一文。

综合这几点,我们可以构建出一个预测压裂监测缝隙的模型,但前提是有足够的数据,也需要人工来验证相应数据的结果,提供充足的资金,来进行模型训练。

一些ChatGPT研究学习资料(来源网络)

(1)一文读懂ChatGPT模型原理

一文读懂ChatGPT模型原理

一文读懂ChatGPT模型原理 - 知乎

不光是做人工智能、机器学习的人关注,而是大量的各行各业从业人员都来关注这个模型,真可谓空前盛世。
所谓语言模型的训练和学习,就是从大量的数据中学习复杂的上下文联系。

与此同时,OpenAI 早于 Bert 出品了一个初代 GPT 模型。

在 NLP 领域,人们使用语言一般包括三个步骤:
接受听到或读到的语言 -> 大脑理解 -> 输出要说的语言。

GPT-3 的模型所采用的数据量之大,高达上万亿,模型参数量也十分巨大,上千亿,学习之复杂,计算之繁复,
如此巨大的模型造就了 GPT-3 在许多十分困难的 NLP 任务,诸如撰写人类难以判别的文章,甚至编写SQL查询语句,React或者JavaScript代码上优异的表现。

ChatGPT 模型上基本上和之前 GPT-3 都没有太大变化,主要变化的是训练策略变了,用上了强化学习。
几年前,alpha GO 击败了柯洁,几乎可以说明,强化学习如果在适合的条件下,完全可以打败人类,逼近完美的极限。
强化学习非常像生物进化,模型在给定的环境中,不断地根据环境的惩罚和奖励(reward),拟合到一个最适应环境的状态。

这里重点是第二步中,如何构建一个 reward 函数,在alpha go 里,这个reward 函数就是下完一盘围棋之后判断谁输谁赢,只需要一个程序函数即可完成。
而在ChatGPT里,具体就是让那40名外包人员不断地从模型的输出结果中筛选,判断哪些句子是好的,哪些是低质量的,这样就可以训练得到一个 reward 模型。

一个语言文字训练的人工智能程序

存在问题:

  1. 仅限于语言标注
  2. 仅限于以前输入到系统中,训练的数据库,如果有新的数据还需要重新添加并训练
  3. 存在编程过程中,答案正确率较低的现象

(2)MATLAB科研图像处理——基于ChatGPT编程

MATLAB科研图像处理——基于ChatGPT编程

MATLAB科研图像处理——基于ChatGPT编程 - 知乎

ChatGPT是一个非常强大的语言模型,但它并不是万能的

(3)ChatGPT发展历程、原理、技术架构详解和产业未来 (收录于先进AI技术深度解读)

ChatGPT发展历程、原理、技术架构详解和产业未来 (收录于先进AI技术深度解读)

ChatGPT发展历程、原理、技术架构详解和产业未来 (收录于GPT-4/ChatGPT技术与产业分析) - 知乎

ChatGPT 是一种专注于对话生成的语言模型。它能够根据用户的文本输入,产生相应的智能回答。这个回答可以是简短的词语,也可以是长篇大论。
其中GPT是Generative Pre-trained Transformer(生成型预训练变换模型)的缩写。

目标是开发造福全人类的AI技术。

每一代GPT模型的参数量都爆炸式增长,堪称“越大越好”。2019年2月发布的GPT-2参数量为15亿,而2020年5月的GPT-3,参数量达到了1750亿。

ChatGPT 是基于GPT-3.5(Generative Pre-trained Transformer 3.5)架构开发的对话AI模型,是InstructGPT 的兄弟模型。ChatGPT很可能是OpenAI 在GPT-4 正式推出之前的演练,或用于收集大量对话数据。

因此它只能基于2021年所拥有的数据集进行回答
ChatGPT 通过算法屏蔽,减少有害和欺骗性的训练输入。

(4)程序员浅用ChatGPT:替代还很远

程序员浅用ChatGPT:替代还很远

程序员浅用ChatGPT:替代还很远|源代码|应用程序|编程语言_网易订阅

李智认为,ChatGPT并不能编写程序员角度的代码,而是从互联网收集庞大信息库并使用它来生成代码,解决问题还是要靠人。
对于软件程序,ChatGPT目前只有通用底层的能力,涉及电商、云服务等业务层面的能力尚有欠缺。比如要写一个小程序,是可以借用ChatGPT来找算法、写代码、写脚本

考虑到会侵犯知识产权。

(5)用ChatGPT 做硬件设计?

用ChatGPT 做硬件设计?

用ChatGPT 做硬件设计? - 知乎

(6)chatGPT 的 49 种应用场景介绍,各开发语言接入 chatGPT 参考指南

chatGPT 的 49 种应用场景介绍,各开发语言接入 chatGPT 参考指南

chatGPT的49种应用场景介绍,各开发语言接入chatGPT参考指南_Java_非喵鱼_InfoQ写作社区

分析了存在的问题:

  1. 广度待提升

api 注册使用流程
直接用 chatGPT 去创建一个程序要用的秘钥,
就可以使用 http 接口调用了。

程序接入到 chatGPT,所调用的接口,都是收费接口,不过还好的是每一个新注册的账号头 3 个月免费使用,总消费额度不超过 18 美元即可。另外下图 4 个方块就是 nlp 的模型,左边 ada 速度最快,右边达芬奇功能最强大。

转载于:杨杰

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/478116.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Windows更新【bug】

Windows更新【bug】 前言推荐Windows更新问题解决 最后 前言 以下内容源自【bug】 仅供学习交流使用 推荐 Win11安全更新问题 仍为解决 Windows更新 问题 完成更新以维护设备安全性 你的设备缺少重要的安全更新。请确保设备保持打开状态并接通电源,以便更新可…

评价基于GPT和Bert的方法并用于生信文本识别PPI

检测蛋白质-蛋白质相互作用(PPI)对于理解遗传机制、疾病发病机制和药物设计至关重要。然而,随着生物医学文献的快速增长,越来越需要自动和准确地提取PPI以促进科学知识发现。预训练语言模型,例如生成式预训练Transform…

学历:门槛还是机会?

目录 一、学历和职业之间的关系认知 二、不同的文化和传统也会对学历带来不同的解读 三、在学习、生活及工作中学历带来的局限性 四、造成“孔乙己长衫”现象的深层次原因 五、给与学弟学妹们一点毕业就业的建议 是否应该追求高学历一直是社会上热议的话题。有人认为学历代…

Splunk 转移数据之collect 命令

1: 背景: 有些数据的输出结果需要很长时间,原因是查询的数据量很大,还有就是搜索的时间范围很大:一年,或者要统计过去几个月的count / 或者是比例等。 那么在这种背景下,就需要转移查询的数据结构,进行转移到另外一个index, 用另外一个新的index 进行实时展示。 下面…

【一起撸的DL框架】5 实现:自适应线性单元

CSDN个人主页:清风莫追欢迎关注本专栏:《一起撸个DL框架》GitHub获取源码:https://github.com/flying-forever/OurDL 文章目录 5 实现:自适应线性单元🍇1 简介2 损失函数2.1 梯度下降法2.2 补充 3 整理项目结构4 损失函…

glibc 系统C文件库

下载时候经常会需要选择glibc glibc是GNU发布的libc库,即c运行库。 glibc是linux系统中最底层的api,几乎其它任何运行库都会依赖于glibc。glibc除了封装linux操作系统所提供的系统服务外,它本身也提供了许多其它一些必要功能服务的实现。 li…

tcpdump使用教程

一、概述 tcpdump是一个功能强大的,用于抓取网络数据包的命令行工具,与带界面的Wireshark一样,基于libpcap库构建。这篇文章主要介绍tcpdump的使用。关于如何使用tcpdump的资料中,最有用的就是tcpdump的两个手册。 tcpdump使用手…

CANOE入门到精通——CANOE系列教程记录2

本系列以初学者角度记录学习CANOE,以《CANoe开发从入门到精通》参考学习,CANoe16 demo版就可以进行学习 创建工程 在一个路径中,创建这几个文件夹 创建工程,将工程命名Vehicle_System_CAN.cfg 创建Database dbc文件 在实际开…

SignOff Criteria——OCV applied and results

文章目录 1. O v e r v i e w Overview Overview1.1 w h a t i s o c v what\ is\ ocv what is ocv?1.2 O C V . E f f e c t o n s i g n o f f OCV.\ Effect\ on\ signoff OCV. Effect on signoff1.3 H o w t o r e m o v e t h e e f f e c t s o f O C V Ho…

【hello Linux】可重入函数、volatile和SIGCHLD信号

目录 1. 可重入函数 2. volatile 3. SIGCHLD信号 Linux!🌷 1. 可重入函数 先来谈一下重入函数的概念:重入函数便是在该函数还没有执行完毕便重复进入该函数(一般发生在多线程中); 可重入函数&#xff1a…

C++程序设计——lambda表达式

一、问题引入 在C98中,如果想对一个数据集合中的元素进行排序,可以使用sort()方法,但如果待排序元素为自定义类型,就需要用户自己定义排序时的比较规则。 随着C语法的发展,人们开始觉得其编写比较复杂,每次…

Word2vec原理+实战学习笔记(一)

来源:投稿 作者:阿克西 编辑:学姐 视频链接:https://ai.deepshare.net/detail/p_5ee62f90022ee_zFpnlHXA/6 文章标题: Efficient Estimation of Word Representations in Vector Space 基于向量空间中词表示的有效估计…

【计算机网络】学习笔记:第四章 网络层(七千字详细配图)【王道考研】

基于本人观看学习b站王道计算机网络课程所做的笔记&#xff0c;不做任何获利 仅进行交流分享 特此鸣谢王道考研 若有侵权请联系&#xff0c;立删 如果本篇笔记帮助到了你&#xff0c;还请点赞 关注 支持一下 ♡>&#x16966;<)!! 主页专栏有更多&#xff0c;如有疑问欢迎…

安装chatglm

地址 下载源代码 下载完成后解压 安装cuda 输入nvcc -V查看是否安装cuda 输入nvidia-smi查看支持的最高版本&#xff0c;最高支持12.1 下载cudahttps://developer.nvidia.com/cuda-downloads 双击安装 同意之后点击下一步 选择精简模式即可 等待下载安装包 …

链接sqlite

一.sqlite库函数 1.sqlite3_open()函数 语法&#xff1a;*sqlite3_open(const char *filename, sqlite3 *ppDb) 作用&#xff1a;该例程打开一个指向 SQLite 数据库文件的连接&#xff0c;返回一个用于其他 SQLite 程序的数据库连接对象。 参数1&#xff1a;如果 filename …

如何在自己的Maven工程上搭建Mybatis框架?

编译软件&#xff1a;IntelliJ IDEA 2019.2.4 x64 操作系统&#xff1a;win10 x64 位 家庭版 Maven版本&#xff1a;apache-maven-3.6.3 Mybatis版本&#xff1a;3.5.6 目录 前言 一. 什么是Mybatis框架&#xff1f;1.1 框架是什么&#xff1f;1.2 什么是MyBatis &#xff1f;1…

3.11 C结构体及结构体数组

结构体的意义 问题&#xff1a;学籍管理需要每个学生的下列数据&#xff1a;学号、姓名、性别、年龄、分数&#xff0c;请用C语言程序存储并处理一组学生的学籍。 思考&#xff1a;如果有多个学生&#xff0c;该怎么定义 已学数据类型无法解决。 结构体概述 正式&#xff1a;…

【Sping学习详解】

重新学习Spring很久了&#xff0c;也看了不少的视频&#xff0c;但是没有系统总结&#xff0c;容易忘记&#xff0c;网上寻找相关博客&#xff0c;也没有找到按照路线总结的&#xff0c;只能说不顺我心&#xff0c;所以自己总结一下&#xff01;&#xff01;&#xff01; 从下…

vulnhub靶机dpwwn1

准备工作 下载连接&#xff1a;https://download.vulnhub.com/dpwwn/dpwwn-01.zip 网络环境&#xff1a;DHCP、NAT 下载完后解压&#xff0c;然后用VMware打开dpwwn-01.vmx文件即可导入虚拟机 信息收集 主机发现 端口发现 继续查看端口服务信息 打开网站发现只有Apache默认…

【Spring篇】IOC/DI注解开发

&#x1f353;系列专栏:Spring系列专栏 &#x1f349;个人主页:个人主页 目录 一、IOC/DI注解开发 1.注解开发定义bean 2.纯注解开发模式 1.思路分析 2.实现步骤 3.注解开发bean作用范围与生命周期管理 1.环境准备 2.Bean的作用范围 3.Bean的生命周期 4.注解开发依赖…