ChatGPT 走入大众视野之后,AIGC 行业迎来了爆发,尤其是上个月,仿佛每一天都可能是「历史性」的一天。
现在各大网站已经有非常多的优秀创作者进行总结和分析,都是值得一阅的好文。今天本文也分享了关于ChatGPT的看法,有谈到技术,也有关于ChatGPT的闲谈,看完这篇文章,相信你会对ChatGPT有更深度的了解。
GPT是什么?
GPT模型是生成式预训练模型,全称是Generative Pre-Training,GPT利用特定的下游任务进行微调(分类任务、自然语言推理、语义相似度、问答和常识推理),在预训练阶段,首先基于庞大的生语料训练一个生成式语言模型;在微调阶段,使用标注数据继续训练模型。
以此发散,GPT可以进行的任务其实有非常多,比如:文本生成、代码生成、问答等等,如果要扯上其他类型的数据,也不是不行,比如图像生成、视频生成等等,谁还不是些个高维向量嘛。
ChatGPT闲谈
这次的ChatGPT直接放开了一个对话框给大家玩,男女老少都能参与,而且效果不差,那可不得一下子就火起来。首先,ChatGPT 并不是一个算法,更像是一套方案,也就是综合了多种方法的一个有机系统,模型追溯其根本都是在之前的研究上搭建起来的。
GPT-3 到 ChatGPT的心路历程
上个月复旦大学发布国内第一个“对话式大型语言模型MOSS”的消息,大量访问一度造成服务器过载,最近整科技圈都卷起来了,简直是大模型的火越烧越旺了。
-
斯坦福发布LLaMA模型
-
清华发布ChatGLM-6B模型
-
OpenAI发布GPT4模型
-
谷歌给出PaLM API
-
微软发布Microsoft 365 Copilot
-
百度发布文心一言
很多吃瓜群众都会问:火出圈的为什么是 OpenAI,而不是国内的一线大厂?
人家OpenAI现在走的每一步,都是因为之前走的每一步。
从GPT模型提出以来,OpenAI就在不断进行模型优化。GPT3模型是ChatGPT的基石,拥有1750亿的参数,利用45TB的数据进行训练,其训练费用高达1200多万美元。
GPT3的本质还是通过海量的参数学习海量的数据,有着3个很重要的能力:语言生成、上下文学习、世界知识,但GPT3对于某些问题还是无能为力的,比如对于一些命题没有意义的问题、不能保证生成的一篇长文章或者一本书籍的连贯性,就连OpenAI的首席执行官都说,GPT3会犯愚蠢的错,GPT3只是人工智能领域非常早期的一瞥。
谷歌发布“通才”模型PaLM-E不仅可以理解图像,还能理解、生成语言,执行各种复杂的机器人指令而无需重新训练。
OpenAI携手微软于发布了GPT4,可以执行非常多的任务,而且在各种职业和学术考试上表现和人类水平相当。模拟律师考试,GPT4 取得了前 10% 的好成绩,做美国高考 SAT 试题,GPT-4 也在阅读写作中拿下 710 分高分、数学 700 分。
紧接着,微软拎着GPT4开过光的全家桶走来了,GPT4可太上头了。微软CEO纳德拉表示,今天是一个里程碑,意味着我们与电脑的交互方式迈入了新的阶段,从此我们的工作方式将永远改变,开启新一轮的生产力大爆发。
但ChatGPT 还是有一些诟病的
1)数据问题
ChatGPT 爬取的数据通常是在未经同意的情况下收集的,这会带来一系列的责任归属问题。
2)成本问题
不过GPT3还是给AI领域注入了一剂强心剂,代码生成是一个非常有利可图的市场,可以看到,当GPT3模型出世以后,OpenAI团队就将其用在了代码生成,不过,由于其高昂的计算代价也引发了一些垄断的讨论:
中小企业没钱搞,而形成AI巨头对算力要求高的算法的技术垄断。
客户有私有化部署要求,但这些模型非常大,对资源要求高,当前不太可能实现私有化部署。
对于企业和开发者来说,技术方面的试错成本太高。原生技术和低代码都是开发者手中的工具,工具变革和改革的意义相差甚大,工具的变革意味着生产方式的改进、生产效率的提高。也可以把目光放到另外一条赛道上——低代码,核心逻辑是利用代码库,将已有开发样例进行快速复写,整个开发过程中的人工成本趋近于0。
JNPF,立足于低代码开发技术,采用主流的两大技术Java/.Net开发,专注低代码开发,有拖拽式的代码生成器,灵活的权限配置、SaaS服务,强大的接口对接,随心可变的工作流引擎。支持多端协同操作,100%提供源码,支持多种云环境部署、本地部署。
基于代码生成器,可一站式开发多端使用Web、Android、IOS、微信小程序。代码自动生成后可以下载本地,进行二次开发,有效提高整体开发效率。
开源入口:https://www.yinmaisoft.com/?from=csdn
已经覆盖零售、医疗、制造、银行、建筑、教育、社会治理等主流行业,一站式搭建:生产管理系统、项目管理系统、进销存管理系统、OA办公系统、人事财务等等。可以节省开发人员80%时间成本,并且有以构建业务流程、逻辑和数据模型等所需的功能。
最后,最近吃瓜群众着急的是自己是不是要被人工智能替代了,人家深度学习巨头之一LeCun都急了:Calm down,还早呢,让子弹再飞一会儿吧。