ChatGPT到底是个啥?它会让我们失业么?

news2024/11/18 11:24:38

谈起AI届,几家大公司是无论如何都不能不提及的,谷歌的GoogleX与DeepMind (下围棋那个)、Meta的FAIR (Resnet提出者恺明所就职的)、OpenAI (搞大模型的领先公司,代表作是GPT,对标谷歌的Bert)、亚马逊 (中国AI研究生的实际导师李沐大神曾经供职的公司) 以及微软 (亚洲研究院鼎鼎大名)。自从Attention Is All You Need这篇引用超过接近6万(本菜鸡学术生涯能有十分之一就心满意足了)的神文刊出后,直接引爆了AI新范式的研究。该文章提出了一种新的简单网络架构,即 Transformer,它完全基于注意力机制,完全摒弃了循环和卷积。同时可并行化计算程度更高,并且需要的训练时间明显减少。

img

以Transformer作为攻城利器,各大AI巨头开始了大模型的军备竞赛。模型越来越大,预训练模型所需要的资源也越来越夸张。Transformer最开始只在NLP(自然语言处理)领域大放异彩,例如谷歌的Bert,OpenAI的GPT,自监督模型成为现有AI研究的显学,训练GPT-3模型甚至花了1000万美元!自从发现Transformer模型在视觉领域同样具有较高精度(VIT),双流多模态模型层出不穷,看的我眼花缭乱,表示真的太卷了,学不动了!先是搞图片问答,又开始搞文本生成图像,又觉得二维图像跟静态图像不行,开始搞生成三维图像以及视频。

img

最近OpenAI又开始搞事了!推出了ChatGPT,可谓是最近IT圈的头条新闻,已经有11多万条网页相关信息了!

img

我们知道,目前的人工智能客服可以说是人工智障,其原因之一是缺乏大规模高质量的标注语料,且下游任务太多且太杂,你不能出现一个需求就训练一个新的模型,况且新需求的训练语料并不好找,这一直限制着智能对话的发展。我们知道虽然微软的COCO数据集,李飞飞大佬的ImageNet数据集虽然规模都很大,质量都很高,但是相较于人类知识库、百度谷歌的海量页面而言,数据规模翻不起一点浪花。自监督学习的范式可以使模型充分从大量开源无标注或低质量标注数据中学习到规律,这种范式以及基于该范式的transformer方法一经出现,持续成为计算机领域的热点,它似乎为我们提供了一种广泛适用的通用模型的希望 (关于预训练模型可以在Zhang Y, Zhang F, Chen N. Migratable urban street scene sensing method based on vision language pre-trained model[J]. International Journal of Applied Earth Observation and Geoinformation, 2022, 113: 102989.找到更多)。

img

无论哪种对话模型都需要编码器与解码器架构(Seq2Seq),OpenAI虽然还没有开源代码跟论文,但是他肯定也是采用了自监督的训练方法,不知道这次又氪金了多少呢~

言归正传,本文讨论的ChatGPT,这是一种新的对话语言模型 (LM),它基于GPT-3.5家族系列并且类似于InstructGPT(通过人类反馈与强化学习保持一致)。简而言之,ChatGPT 是一个聊天机器人,可以“回答后续问题,承认错误,挑战不正确的前提,并拒绝不适当的请求”。ChatGPT 是迄今为止世界上最好的聊天机器人。它可以写散文和诗歌。它可以为 AI 艺术模型找到很好的提示。它可以角色扮演。它可以编写代码,找到错误,解释它,解决它,并解释解决方案。它可以以最奇怪的方式组合想法。该模型的卓越能力和比基线 GPT-3 更好的对齐方式,使其感觉更人性化。反过来,这使它更可信——尽管这并不一定意味着它更可靠,因此更值得信赖。与所有其他 LM(例如 GPT、Galactica、LaMDA)一样,它会编造内容,产生歧视内容, 可能会产生有害的补全信息,并产生错误信息,这些缺陷都没有显著的改变(废话,人类网络上歧视谩骂的消息一点不少)。

img

自12.1OpenAI发布这条推特后,得到了6k多个喜欢。好像很多,其实也就是某KUN一条广告微博的1/300的点赞量吧,实锤300 OpenAI =1 KUN。不如我们中国人民亏一点,大幅让利给美帝,一换一,KUNKUN给美帝,OpenAI给我们img

img

网友也开始利用这个工具开始各种搞怪。假设一龙马(?)跟你说这周你干了啥?工作有啥进展?你这周摸鱼啥也没干,赶紧打开ChatGPT(话说我以后是不是可以不用自己写周报了?做个脚本每周五定时访问ChatGPT API填充内容img)。

img

Q: 你是 Twitter 的高级数据工程师。Elon 问你这周做了什么。

A1: 总的来说,该算法在Twitter内容审核系统的准确性方面有了显著提高。在最初的测试中, 该算法能够以95.6%的准确率对冒犯性内容进行准确分类,显著优于之前的系统,后者的准 确率仅为85.2%。算法准确性的提高将帮助Twitter更有效地识别和删除有害或冒犯性的内容,确保所有更安全和更积极的用户体验。此外,机器学习技术的使用允许算法随 着时间的推移不断适应和改进,因为它暴露于更多的数据和来自Twitter社区的反馈。该算法的实现需要结合数据工程、机器学习和自然语言处理方面的技术专长。通过利用最新的技术 和最佳实践,我能够在一周内开发并实现该算法,使其成为提高Twitter内容审核能力的高效解决方案。

A2: Logistic回归模型。然后根据测试数据对模型进行评估,并将各种性能指标打印到控制台,包括准 确性、F1评分、精确度和召回率。总的来说,该算法在Twitter内容审核系统的准确性方面有了显著提高。在最初的测试中,该算 法能够以95.6%的准确率对冒犯性内容进行准确分类,显著优于之前的系统,后者的准确率仅为 85.2%。算法准确性的提升将帮助Twitter更有效地识别并移除平台上的有害或冒犯性内容,确 保为所有人提供更安全、更积极的用户体验。此外,机器学习技术的使用允许算法随着时间的 推移不断适应和改进,因为它暴露于更多的数据和来自Twitter社区的反馈。该算法的实现需要结合数据工程、机器学习和自然语言处理方面的技术专长。通过利用最新技术和最佳实践,我能够在一周内开发并实现该算法,使其成为提高Twitter内容审核能力的高效解方案。

毫无违和感有没有!马哥肯定给你加工资!

好东西自然有人力推,有大佬推出了Chrome插件,短短几天就得到2k个star。

img

吃瓜群众如此热情,直接把OpenAI干懵逼了,临时关闭了注册窗口,“经历异常高的需求,扩展我们的系统”,翻译成人话,打钱!

img

申请API的地址: chat.openai.com,没事都去注册玩,薅资本主义羊毛~

我们看看它的其他具体应用:

1.写代码

img

2.回答奇怪的数字序列(考公必备?),甚至还可以给你解释,这是它最诱人的优点,可以解释自己为啥这个答案。

img

3.帮你写论文!最近正在写博士论文,要不试试?(大胆!天临暴怒,合着你在演我)

img

4.替代搜索引擎?(百度:我的医药广告还要挣钱呢)

img

5.还可以帮你算八字。

img

6.智能百科问答,但肯定会有错误,台湾肯定是中国的img

img

可以看到,OpenAI提供的这个聊天机器人可以写程序,可以算命,应用场景还是相对广阔的,未来基本上可以宣布百度知道这个产品的退役。但是在包含数字精确的场景,还是很粗糙的,这是因为完全自监督是很难完成学习,而知识图谱是一个不错的备选方案。OpenAI替代谷歌我认为为时过早,但是它的出现可以很好的炒一炒股价,赢得资本市场的青睐,也希望未来带来服务于公众的爆款产品。缺点是,我们知道人类的知识在不断的增量,如此大的模型,不可能每秒都进行一次训练(目前ChatGPT只包含2021年及之前的内容)。那每隔一段时间重新训练一下么?那就失了时效性,如何在大模型上增量学习相信也是下一个学术圈关注的点。

最后,多模态进展可谓是一日千里,未来会有相当多的行业可能会被替代,这些行业最主要集中在重复性和低水平劳动的行业。第一就是我们谈及的太多的自动驾驶,可能会消亡司机这个行业,未来自己驾驶汽车会成为一种运动方式,体验车辆的性能,而大部分人都可以享受科技带来的方便,而无需长时间的看着千篇一律的路面。如果说自动驾驶会对人类的生命带来一定的威胁的话,那么我认为设计行业是肯定会产生很大的变革,很快PS,AI,Word都会出现辅助ai插件,三年内就可以达到成熟,人人都可以享受算法进步带来的便利,你需要什么元素只需要告诉模型他就可以自动绘制你需要的内容。文字编辑也会省去大部分重复工作,例如我在写推送时,只需要输入一些关键点对文本生成的特征进行一定的把控,随后进行润色。语言模型进步如此明显,知网躺着挣查重的钱的日子估计也一去不复返。人的创造力会更加受到重视,请注意,电影中全智能的AI是在该范式下是完全没有可能的,自监督实际上是人类现有知识的再组织,并且对版权问题似乎也有一定的法律模糊。而全智能产生人类闻所未闻的新东西的AI恐怕需要生物仿生技术的进步,新范式的出现才有可能。

AI第一批替代的肯定是低水平的工作,例如AI可以设计海报,中国实际上已经是白菜价,任意一个打印店都可以几分钟内完成。例如做一个推送,你当然也可以去网上粘粘粘,AI的优势在于他永远不会累,只要有硬件与能源可以一直运行,技术再好的纺工也无法与简单的珍妮机比较速度。然而一些私人订制的,高精度我认为这一波不会被替代,例如设计建筑,AI再准确,但他是不可解释的,怕是没人敢直接应用上去。这一波AI主要替代的低水平工作,工资5000人民币左右的通用设计类工作可能会受到冲击,例如一个编辑,平面设计,再比如国内某生物院士及其学生的电镜工作(院士手下干活的博士生也只有几千块,似乎工作性质也差不多~赶紧替换掉博士的工作,手动狗头)。

img

OpenAI、谷歌、苹果这种硅谷大型科技公司,在拥有强大科技实力的同时,我认为强大的宣传能力也是不可避免的,酒香也怕巷子深,科技这块容易追,但是软实力(吹牛画大饼的实力,这个能力我认为也很重要)我暂时看不到追赶的希望,也期待我们共同努力。

点个关注再走吧~不说废话,坚持原创。更新时间不定,保存*星标及时阅读哦。*

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/72668.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

正厚干货 软件测试用例设计方法之一_等价类划分

今天开始我们学习关于软件测试用例的设计方法。其中较为常用的是等价类划分发,那么我们就从等价类划分开始吧。一、等价类划分的介绍1.定义 把所有可能输入的数据,即程序的输入域划分策划国内若干部分(子集),然后从每一…

数据处理技巧(9):MATLAB将多个矩阵放在同一行显示,并写入txt文件

MATLAB将多个矩阵放在同一行显示,并写入txt文件生成效果要打印的矩阵代码思路记录程序运行时间写入文档MATLAB程序生成效果相关链接记得点个赞再走~~~生成效果 将9个矩阵显示在MATLAB命令行窗口中,一行有3个矩阵,一列显示3个矩阵&#xff0c…

[附源码]JAVA毕业设计网上拍卖系统(系统+LW)

[附源码]JAVA毕业设计网上拍卖系统(系统LW) 项目运行 环境项配置: Jdk1.8 Tomcat8.5 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术&…

166.JWT简介与Django中使用JWT

1. JWT 1.1 JWT概述 基于django-rest-framework的登陆认证方式常用的大体可分为四种: BasicAuthentication:账号密码登陆验证SessionAuthentication:基于session机制会话验证TokenAuthentication: 基于令牌的验证JSONWebTokenAuthenticatio…

Python中使用国内源头下载依赖

有关更多的Python 开发内容,可访问:《 Python Flask开发指南》 Python开发中对于项目的依赖通常是用pip install命令进行下载,默认官网下载源为国外网络,会经常出现下载超时的问题。那么如何修改下载源使得我们能快速下载资源,如下介绍两种方式设置国内下载源。 国内下载源…

西湖大学张岳老师NLP课程笔记1 Introduction

西湖大学张岳老师NLP课程笔记1 Introduction 参考资料 B站链接课程主页 《Natural Language Processing: A Machine Learning Perspective 》 csdn大佬笔记 https://blog.csdn.net/qq_45645521/category_11685799.html 文章目录西湖大学张岳老师NLP课程笔记1 Introduction1.…

常用工具:介绍一款免费开源录屏工具-captura

网上能搜到的大部分录屏工具表面打着免费的旗号,实际上下载之后不是有水印就是限制分辨率和时长,介绍一款免费无水印的开源录屏截屏工具captura。 准备工作 要使用这个工具,必须事先在电脑上安装ffmpeg工具包,安装方式见&#x…

DRV8870/A4950/AT8870(3.6A单通道刷式直流电机驱动IC)

描述 AT8870是一款刷式直流电机驱动器,适用于打印机、电器、工业设备以及其他小型机器。两个逻辑输入控制H桥驱动器,该驱动器由四个N-MOS组成,能够以高达3.6A的峰值电流双向控制电机。利用电流衰减模式,可通过对输入进行脉宽调制(…

【电源专题】案例:电池存储40天电压从3.9V掉到了3.5V是什么异常?

本案例是在我休假过程中发现的。同事反馈说客户发现我们的一批产品有概率在存储40多天后发现电池从3.9V掉到了3.5V,并且制程、软件、硬件都有差异。会有可能存在什么异常? 首先我们要了解的是大多数带电池的产品在销售给客户时都会充好电(如手机/充电宝等),但不一定是充…

极市直播预告丨阿里达摩院:兼顾速度与精度的高效目标检测框架DAMO-YOLO

|极市线上分享第106期 | 一直以来,为让大家更好地了解学界业界优秀的论文和工作,极市已邀请了超过100位技术大咖嘉宾,并完成了105期极市线上直播分享。往期分享请前往http://bbs.cvmart.net/topics/149或直接阅读原文,也欢迎各位…

初学者如何学习FPGA?一文为你讲解清楚

想学习一门技术之前,我们先会从编程语言入手。就像学习FPGA,往往是从VHDL或者Verilog开始入手学习的。 当然,任何编程语言的学习都不能一劳永逸,因为任何经验技巧都是在实践的过程中才能学到,FPGA的学习当然也不例外。…

Python爬虫实战,Request+urllib模块,批量下载爬取飙歌榜所有音乐文件

前言 今天给大家介绍的是Python爬取飙歌榜所有音频数据并保存本地,在这里给需要的小伙伴们代码,并且给出一点小心得。 首先是爬取之前应该尽可能伪装成浏览器而不被识别出来是爬虫,基本的是加请求头,但是这样的纯文 本数据爬取…

C语言实现三子棋(超详解版本)

🚀write in front🚀 📝个人主页:认真写博客的夏目浅石. 🎁欢迎各位→点赞👍 收藏⭐️ 留言📝​ 📣系列专栏:鹏哥带我学c带我飞 💬总结:希望你看…

分布式电源接入对配电网影响的研究附Matlab代码

✅作者简介:热爱科研的Matlab仿真开发者,修心和技术同步精进,matlab项目合作可私信。 🍎个人主页:Matlab科研工作室 🍊个人信条:格物致知。 更多Matlab仿真内容点击👇 智能优化算法 …

springboot+easyexcel:导入excel表格

目录 前言 1.常规导入 2.读取到指定的列 3.读取全部的sheet页 4.日期、数字及其他自定义格式的转换 5.表头有多行的读取 前言 excel表格的导入与导出,可以说是业务系统里比较常见的功能了,早些时候相信很多人都是使用POI实现excel的导入与导出功能…

还有13天圣诞节,用python整个简易版的圣诞树玩一下.......

人生苦短 我用python 好像很久没发文章啦! 看一眼日历快到圣诞节了 , 现在就来用python整个圣诞树玩一下吧! 代码🎆 模块 源码、资料电子书点击此处 import turtle as t from turtle import * import random as r import time…

项目经理的需求常见分类总结

今天聊聊如何进行需求分类、需求规划和优先级排序。我们都会面临需求多,任务重,资源少的现状,在这种情况下,就需要产品人员对产品需求进行评估,找到在当前阶段最重要的功能进行开发,那么怎么来进行评估和判…

Spring整合Apollo的原理

Spring和Apollo源码涉及的类 Spring:ApplicationContextInitializer、BeanFactoryPostProcessor、BeanPostProcessor、Environment、CompositePropertySource Apollo:ApolloApplicationContextInitializer、PropertySourcesProcessor、ApolloProcessor、…

消息发布确认

描述:在消息投递的过程中可能会存在消息丢失的行为产生,生产者到交换机,交换机到队列的过程都有可能出现这个现象。所以我们要有个发布确认的操作来防止消息丢西。 确认机制方案: 配置文件配置交换机发布确认模式: p…

年终颁奖 | 建模助手年度产品经理正在评比当中!

大家好,我是建模助手。 12月来了,又到了激情总结,却发现flag倒被打脸的时刻!我就想问问在座各位:年初的定立的flag,完成得咋样了? 我们今年就有一张很优秀的成绩单:↓↓↓ 建模助手…