大模型的威力,远不只是聊天框

news2025/1/12 8:03:50

自2022年底ChatGPT发布以来,我们真正看到了大模型的威力,也引发了技术圈种种畅想。有相当一部分观点认为,大模型是一种工业革命级的产物,相信更多的人会和笔者一样,认为大模型是一个操作系统级的产品,会彻底地改变,甚至颠覆现有的,我们使用机器的方式。诚然现在的大模型仍旧是算力杀手,想要让它真达到操作系统的使用规模,可能在硬件上、推理架构上还有一段路要走,但其前景是显而易见的。

所以我们看到,自2023年年初起,各家大模型粉墨登场,卷能力,卷榜单,卷价格,卷参数,让人不禁想问,然后呢?从市场情况上看,大模型应用仍旧处于极早期的阶段,而从产品形态上来看,哪怕是步入了智能体的时代,大模型依然被限制在那个聊天框里面,使用起来仍是相对低效的,对用户来讲仍旧是不那么方便的,自然用户使用的方式也被限制住了。

即便如此,我仍然坚持认为,大模型应当是操作系统,那么,就让我讲讲现状,开开脑洞,畅想一下未来应当是什么样子的。

掉书袋:鸿沟理论

去年,笔者读了一本名为《跨越鸿沟》的书,里面讲了技术采用的生命周期 ,名为鸿沟理论。这一理论将用户分为5类,分别为:创新者、早期采用者、早期大众、后期大众、落后者。

创新者热衷于一切比较新潮的技术,他们非常愿意尝试新鲜的事物,同时也对新技术的缺陷有着最大的包容,甚至愿意同技术开发者共同讨论优化这一技术。早期采用者则比创新者谨慎一些,他们如果相信这一技术未来会成为主流,早晚要拥抱它,才会去使用这个新技术,甚至为了新的特性,哪怕技术不够完善,也愿意用它去取代一些已有的东西,并提出这一技术应当怎么优化,成为一个好用的产品,所以他们也被称作有远见者。

3.5研究测试:
hujiaoai.cn
4研究测试:
askmanyai.cn
Claude-3研究测试:
hiclaude3.com这两批用户虽然很容易被吸引到,但也显然,相对于整个主流市场,他们的占比是很少的。

无论看当前用户的性质,使用的场景,还是单纯看数据,当前的大模型产品一定是处于极早期的,笔者判断,甚至可能没有突破到早期使用者。而主要原因,笔者认为就是当前的产品形态是相对低效的,或者说,当前大模型的产品形态、使用场景,远远达不到“操作系统级产品”的预期。

实际上,很多技术也是死在了前两批用户身上,从早期采用者到早期大众,实则是非常困难的。早期大众也被称作实用主义者,他们的特点是,新的技术形成的产品,得比现有的产品好用,让他们感觉到完成某一个任务变得更加方便,他们才会采用。而很多技术,从创新者和早期采用者那里得到的经验,极有可能是不适用于早期大众的。所以这一阶段,叫做“鸿沟”。

例如,笔者认为,大模型当前较主流的使用形态,即聊天框,是低效的,不符合大部分用户的使用习惯。或许我们应当去进一步探索,大模型怎么能真正渗透到日常的生活中。

顺带一提,正因当前大模型所处于的这一阶段,笔者认为,目前做大规模的投流一定是意义不大的,甚至可能损伤在早期大众用户中的第一印象。

大模型的威力

算法圈的人一直说,自然语言是皇冠,搞定了自然语言,就搞定了人工智能。从原理上讲,自然语言里面的信息量是非常大的,毕竟这是我们为了描述这个世界,创造出来的符号化的表示了。但是又由于我们自身的不确定性,世界的不确定性,则注定自然语言本身也是不确定的,即我们是无法将自然语言转换成一套逻辑表示的。虽然,语言学的专家们提出了一种理想化的模型,起初是很简洁的,当然也就有了大量的反例,为了兼容现实情况,这种逻辑语言模型也变得无比的臃肿,无论形式上还是功能上都难以使用。

但是我们需要借助机器来做的,又大多是确定性的事情,哪怕现在有一些系统(例如人脸识别),没有达到100%的确定性,但是它能够快速识别很多张人脸,比人快,还比人准,记忆还比人强,那么其确定性就是高于人工的,实则还是对确定性的追求。这就意味着,机器需要的语言,或者指令,也应当是确定性的。起初,我们使用指令,或者代码来让机器完成工作,后来,进一步地,我们使用图形化界面,借助鼠标、键盘、触摸屏来让机器完成工作。

移动互联网为什么能够崛起,笔者认为,在绝大多数用户任务上,它有着不亚于PC的性能,但携带方便,随时随地可用,并且,触摸屏上多元的交互在一定程度上也比键盘鼠标更加方便(虽然有时候精确程度不如鼠标),上手成本还低得多,总之,它让用户在生活中变得更加的方便了,所以大部分用户接受了它。

那么我们回过头来看大模型,大模型最大的价值就是,它搞定了自然语言问题啊!它架设起了人与机器交流的桥梁,它能够将自然语言转换成为机器语言,这意味着,我们可能不必去适应机器的交互语言,而是让机器来适应我们的使用方式。当然,可能有的朋友会有疑问,推来推去,不还是说我要和机器直接说话吗?那聊天框不还是一个直观的方式吗?

不是的,自然语言是我们描述这个世界的方式,那么我们很多日常行为所带来的意图,是否都可以用自然语言来表示呢?那么,大模型最为这样一个中枢,是可以大大简化我们和机器的交互的。更进一步想,一个充分学习了我的习惯的大模型,是不是能更好地充当我的个人助理,我可以不需要设置确定的指令,只是我说要干什么,它就能够帮我处理好很多事情,达到我的意图。

可能还有的朋友要问,现在大模型达到了那个能力吗?

其实我们想想,我上面开的这两个脑洞,实际上都是多阶段的,每一阶段其实都是很简单的命令,现在的大模型理解这种简单的命令,笔者是相当有信心的。真正有考验的,其实是记忆能力,以及对已有记忆的注意力,也就是说,我需要的是过往交互中哪一轮的信息,大模型是需要能够精准识别的。

事实上,人和人交流的时候,应当是不会写那么“不是人话”的复杂指令的,或者那么一长串的prompt,因为人也听不懂,也记不住(短时记忆空间根本没法支撑那些信息量,肯定得反复澄清),更多的还是一步一步培训,让人形成习惯,为什么到了比人弱一些的大模型(确切说,大模型的确在文本的阅读能力和“短时记忆”能力上一定程度是超过人的,但是理解能力嘛……),就一定要一轮就让模型精准完成需求呢?

所谓“重构,而不是整合”,我想应当是包含这种意思,也指明了大模型优化的方向。

所以回过头来看,大模型为什么非得像人呢?为什么要执着于做一些人在做的,非常终端的事情呢(比如画图、做视频)?为什么要参加高考呢?为什么要卷考卷呢?为什么要做数学题呢?为什么要搞那些形式逻辑呢(这本身就不是非确定性问题,大模型是搞不定的,人类其实不借助工具也无法搞定)?以及,为什么要做人形的机器人呢?

当然,前面笔者一直说聊天框是低效的,但它不是没有价值的,它是我们直接和大模型交互的媒介,就如同操作系统的终端,我们可以通过它直接让大模型去执行一些指令,去观察它的能力。

Agent的思考

最后就聊到了对当前agent现状的思考。我认为agent是基于大模型原始形态,向下一步的早期探索,其试图将一些用户任务标准化,将用户的需求转换成一个自动化的指令序列,来完成一些事情。并且agent这种形式应当是实现笔者上文所开的那些脑洞的必经之路,就如同在终端中调试代码一样(人人都是程序员,应该也是这个意思)。

不过,这也意味着,agent目前的探索不应当被当前用户的使用场景所裹挟,而是应当扩展到更加广大的领域,所以写这样一篇东西,笔者也是希望,能够扩大agent的范围,最终真的能催生出AI原生这个广大的生态。

去年OpenAI DevDay上,发布了GPT Store,当时笔者的言论是,他们的这个发布,看上去是让竞争对手们松了一口气的,因为它只是在预期内发布了那么一个东西,或者说它需要搞出来什么事情,但没有什么横空出世。这或许意味着,ChatGPT真的是一个意外的产物,而我们作为后来者,不能因为OpenAI是领头羊,就被它的开发思路裹挟了。现在或许也验证了笔者当初的想法。

我是真心希望,我们能够作为大模型产品的领头羊,创造出下一个奇迹。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2155312.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于波特图的控制系统设计算法

波特图(Bode Plot)是一种用于描述线性控制系统频率响应的图形表示方法,通常用于分析和设计控制系统。它以控制系统的传递函数(或频域传递函数)为基础,将系统的幅频特性(振幅-频率响应&#xff0…

统信服务器操作系统【刻录镜像制作U盘启动盘的工具】

统信服务器操作系统各版本上刻录镜像制作U盘启动盘的工具方案 文章目录 应用场景一、问题现象二、问题分析解决方案应用场景 硬件/整机信息:全平台 CPU架构:全架构 OS版本信息:服务器a版,e版,d版(其中d版遇到的刻录类问题较少) 软件信息:dd工具、Fedora Media Writer工…

每日学习一个数据结构-倒排表

文章目录 示意图倒排表的基本概念倒排表的数据结构示例 倒排表的优点应用场景 倒排表(Inverted Index),也称为反向索引或倒排文件,在信息检索系统中是一种重要的数据结构。它主要用于快速搜索文档中的关键词,并找到包含…

史上最全!!!大厂面试真题-SpringBoot自动装配的原理是什么?

我想你也在真实面试中被问过无数次这个问题了,我也是,但是不管你怎么搜,都只有那几篇八股文的答案,你问GPT它都解释不清楚,我决定自己写一篇详细的,避免遗忘也想帮助一下患难中的兄弟姐妹们,能把…

读取t x t文件生成exce

读取t x t文件生成excel package com.moka.api.custom.core.controller; import com.google.gson.Gson; import com.google.gson.reflect.TypeToken; import org.apache.poi.ss.usermodel.Row; import org.apache.poi.ss.usermodel.Sheet; import org.apache.poi.ss.usermode…

NLP 文本分类核心问题

解决思路 分解为多个独立二分类任务将多标签分类转化为多分类问题更换 loss 直接由模型进行多标签分类 数据稀疏问题 标注更多数据,核心解决方案: 自己构造训练样本 数据增强,如使用 chatGPT 来构造数据更换模型 减少数据需求增加规则弥补…

ReKep——李飞飞团队提出的让机器人具备空间智能:基于视觉语言模型GPT-4o和关系关键点约束

前言 由于工厂、车厂的任务需求场景非常明确,加之自今年年初以来,我司在机器人这个方向的持续大力度投入(包括南京、长沙两地机器人开发团队的先后组建),使得近期我司七月接到了不少来自车厂/工厂的订单,比如其中的三个例子&…

草莓团队创造了o1 - Building OpenAI o1 (Extended Cut) 观后笔记

美妙的事物往往需要世界去创造,商业希望大模型越来越快给出回答。或许花费几个月几年的时间持续思考,大模型能够解决更复杂的问题,而不只是回答42 刚发现凌晨OpenAI发布了一个22多分钟的采访,将构建出O1的整个团队拉到一个小屋子&…

基于单片机红外感应智能卫生间系统仿真

文章目录 前言资料获取设计介绍功能介绍设计程序具体实现截图设计获取 前言 💗博主介绍:✌全网粉丝10W,CSDN特邀作者、博客专家、CSDN新星计划导师,一名热衷于单片机技术探索与分享的博主、专注于 精通51/STM32/MSP430/AVR等单片机设计 主要对…

基于微信小程序的智慧物业管理系统

作者:计算机学姐 开发技术:SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等,“文末源码”。 专栏推荐:前后端分离项目源码、SpringBoot项目源码、Vue项目源码、SSM项目源码 精品专栏:Java精选实战项目…

设置VsCode搜索时排除文件,文件列表中隐藏文件

按照《VsCode gdb gdbserver远程调试C程序》中介绍的方法,配置好VsCode后,打开一个C/C工程,发现左侧的面板会显示编译时生成的中间文件(比如.d和.o文件)。我们可以通过设置隐藏掉一些我们不需要打开的文件以简洁面板…

Class path contains multiple SLF4J bindings.

最近由于要改kafka成datahub&#xff0c;于是在pom文件上引入了 <dependency><groupId>com.aliyun.datahub</groupId><artifactId>aliyun-sdk-datahub</artifactId><version>2.25.1</version> </dependency> 然后让我去测试…

C语言中if else组合

一 bool变量与“零值”进行比较 bool 变量与“零值”进行比较的 if 语句怎么写&#xff1f; bool bTestFlag FALSE;//想想为什么一般初始化为 FALSE 比较好&#xff1f; A), if(bTestFlag 0); if(bTestFlag 1); B), if(bTestFlag TRUE); if(bTestFlag FLASE); C), if(b…

WPF DataGrid 动态修改某一个单元格的样式

WPF DataGrid 动态修改某一个单元格的样式 <DataGrid Name"main_datagrid_display" Width"1267" Height"193" Grid.Column"1"ItemsSource"{Binding DataGridModels}"><DataGrid.Columns><!--ElementStyle 设…

libreoffice word转pdf

一、准备一个word文件 运行&#xff1a; cd /root libreoffice --headless --convert-to pdf --outdir /root/output doc1.docx 发现中文乱码&#xff1a; 此时我们需要给linux 上添加中文字体&#xff1a; centos7 添加中文字体 再次运行正常&#xff1a; libreoffice --h…

61. 旋转链表【 力扣(LeetCode) 】

零、原题链接 61. 旋转链表 一、题目描述 给你一个链表的头节点 head &#xff0c;旋转链表&#xff0c;将链表每个节点向右移动 k 个位置。 二、测试用例 示例 1&#xff1a; 输入&#xff1a;head [1,2,3,4,5], k 2 输出&#xff1a;[4,5,1,2,3]示例 2&#xff1a; 输入…

828华为云征文 | 在Huawei Cloud EulerOS系统中安装Docker的详细步骤与常见问题解决

前言 Docker是一种轻量级的容器技术&#xff0c;广泛用于应用程序的开发、部署和运维。在华为云的欧拉&#xff08;Huawei Cloud EulerOS&#xff09;系统上安装和运行Docker&#xff0c;虽然与CentOS有相似之处&#xff0c;但在具体实现过程中&#xff0c;可能会遇到一些系统…

【ArcGIS微课1000例】0123:数据库中要素类批量转为shapefile

除了ArcGIS之外的其他GIS平台,想要打开ArcGIS数据库,可能无法直接打开,为了便于使用shp,建议直接将数据库中要素类批量转为shapefile。 文章目录 一、连接至数据库二、要素批量转shp一、连接至数据库 打开ArcMap,或者打开ArcCatalog,找到数据库连接,如下图: 数据库为个…

Maven的详细解读和配置

目录 一、Maven 1.1 引言 1.2 介绍 1.3 下载安装 1.3.1 解压 1.3.2 配置环境变量 1.3.3 测试 1.4 仓库[了解] 1.5 Maven配置 1.5.1 修改仓库位置 1.5.2 设置镜像 二、IDEA - MAVEN 2.1 idea关联maven 2.2 为新项目设置 2.2 创建java项目[重点] 2.3 java项目结构…

连续数组问题

目录 一题目&#xff1a; 二思路&#xff1a; 三代码&#xff1a; 一题目&#xff1a; leetcode链接&#xff1a;. - 力扣&#xff08;LeetCode&#xff09; 二思路&#xff1a; 思路&#xff1a;前缀和&#xff08;第二种&#xff09;化0为-1hash&#xff1a; 这样可以把…