文心一言放出的“时代礼物”,藏着中国科技的黄金机会

news2025/1/23 7:25:34

03382e603e30b605e4f800608652e04f.jpeg

8月31日,第一批国产大模型通过了“生成式人工智能备案”,可以开放公众服务。

一石激起千层浪,对AIGC强烈好奇,为国产应用疯狂打call,文心一言对话刷屏朋友圈,普通人和科技圈都嗨翻了。

不到24小时,文心一言APP就飙升苹果商店免费榜首,成为首个登顶的中文AI原生应用。

f962ed74c6fa92b12399b405e84b3024.png

这两天的狂欢也说明了:生成式AI的黄金时代,正在迎来真正的破晓。

很多人可能会说,我不懂什么大模型,也不会开发应用程序,这波生成式AI的热度跟我没关系。

中国有句古话“女怕嫁错郎,男怕入错行”,今天,男女都怕入错行,都希望掌握一场技术革命中最有价值的核心资源,获得发展。

就像汽车司机不用精通动力学和热力学,却受益于工业革命和蒸汽机。KOL和电商主播大都不会写程序,却受益于信息时代和互联网。同样,AI时代的大部分受益者,也并非都来自核心技术领域,而是能够运用好新技术、新资源的人。

在文心一言APP重新唤起大众应用热情的时候,本文希望冷静剖析一下,普通人究竟有什么机会,如何搭上生成式AI这趟“时代顺风车”。

人人都能适应AI

这可能吗?

a2c782f6de13203b2d16dafe3ce66d6e.png

大众对生成式AI的热情,已经点燃。我们团队的小伙伴们也都第一时间成了“自来水”,开始“调戏”文心一言。不过,和前几个月不同的是,我们拷问AIGC的角度,也变了。

我们不想用几个零散的的问题,来笼统地评价一个大模型的基本能力。

现在,已经有许多专业机构,通过规范的测量基准benchmark,对大模型进行更为全面、科学的考察,这些权威报告更值得读者参考。比如IDC最新发布的《AI大模型技术能力评估报告,2023》显示,文心大模型3.5拿下12项指标的7个满分,得到“综合评分第一,算法模型第一,行业覆盖第一”三个绝对第一。

我们也不想用一些脑筋急转弯、抖机灵式的问题,“为难”一下大模型,大家看完了乐子,还是不知道除了有限的展示案例之外,大模型究竟能怎么跟自己的日常和工作结合。

所以,我们决定从三种具体的任务场景出发,通过文心一言和ChatGPT的实际效果,来考察一下,生成式AI在不同应用场景下的能力究竟如何?每一个人都能在这些场景中,找到大模型与自身的关联,或者带来一些灵感。

第一个场景:容错率高,人工参与度低。

娱乐、聊天、创意文案、设计草稿等等的生成,对大模型的幻觉和胡说八道,有一定的包容度,交给AI可以大大解放生产力。

比如在文旅领域,通过生成式AI来生成数字人导游,与观众进行交流互动,提供导览服务,增强沉浸式旅游体验,设计文创产品,是一个对ToC和ToB都非常有价值的应用场景。

我们考察的首要能力,就是理解。

如果大模型都无法准确理解用户所说的话、传达的情绪和意图,那生成效果当然也不会理想。这方面,我们发现文心一言的理解能力,进步真的飞快。

坦率地说,三月的时候,我们曾让文心一言和ChatGPT,判断句子中表达的情绪时,文心一言的理解是不如ChatGPT的。而现在再测,最新版的文心一言,已经能很好地理解图文中所隐含的情绪了。

a70b1568ebfe572b31160beed3b6f936.png

第二个测试,是中国文化理解。

与中国用户互动,生成式AI对中国文化和语言的理解,是基本要求。文心一言的中文能力,当然一如既往的稳,我们也对ChatGPT的回答比较宽松。这一次测试的关注点,不在于比拼ChatGPT的中文有多强,而在于进步有多大?

结果有点失望。当我们询问:“柔情似水,佳期如梦”,这句话是什么意思?

文心一言三月份就给出了正确答案,这次的回答也很不错。而ChatGPT无论是几个月前还是现在,回答都是编造的。上一次说,这句话出白唐代诗人李清照的《如梦令》,最新的回答是出自唐代杜牧的《秋夕》。

这个问题也说明,ChatGPT的中文水平,不仅有大模型的幻觉问题,会胡说八道,而且对中文的优化和重视,并不太够,才会进步缓慢。

34a577b32e5a60921b30198881a58c5c.png

当然,大家对大模型和生成式AI的期待,不仅是“闲聊”,更希望作为“生产力工具”,在办公、金融、咨询等多个领域提高工作效率。

我们测试的第二个场景:容错率中等,需要一定的人工参与。

比如办公领域,使用AIGC来生成PPT、写文案、咨询报告、读论文等,AI可以作为“副驾”大大减少人的工作量,人只需要判断、纠偏、决策就好。要求生成式 AI 拥有较强的语言逻辑、事实准确等基本能力,同时有丰富的插件来辅助提高效率。

试想一下,如果写一个报告还有逻辑错误,轻则被骂,重则走人,大模型的逻辑能力,对打工人来说可太重要了。这方面,文心一言和ChatGPT的能力已经基本一致了。

比如询问:香蕉的平方根是多少?二者都能够准确地识别出逻辑陷阱。

82c38dc3a8b04fee86320374ff01be2a.png

再换个角度,跨语言的国际交流,是很多行业和企业日常工作中都会涉及到的。如果你是一个外贸办事员,想要将产品上架到海外平台,文心一言能行吗?

我们测试了一下,文心一言APP一键翻译四国语言,多语言类任务的工作效率会大幅提高,成本也会下降。

b66afe850717a3a0857050f417ed3187.png

当然了,这些都是短语。对于打工人来说,处理商业报告、论文、撰写长文章,才是特别花费时间精力的地方。

百度智能工作平台如流,就基于文心一言的能力发布了「超级助手」,通过各类插件完成指令任务,包括查询日程、创建会议、设置待办、申请休假等。

插件的好处,是不需要很高的学习门槛和成本,就能轻松调用AIGC相关能力,轻松搞定。

a0b5807be9d4c9fec9a7176f5868cf8b.png

而由于OpenAI的访问限制,我们目前还没能上手体验ChatGPT的插件能力。这也说明,ChatGPT的可及性和便捷性,是远不如文心一言的,给很多企业和个人使用AIGC设置了障碍,增加了额外的成本。

第三个场景,则是低容错率、人工参与度高的严肃领域。

比如金融投资、科学任务、医疗诊疗、自动驾驶等,这些领域应用AIGC进行分析和预测,对于内容的准确性、可靠性、专业性、严谨性,要求很高。要求大模型拥有极高的安全可靠可信,因此目前AIGC落地的进展相对较慢。

生成式AI必须要掌握专业的知识点,给出详细、准确、具体的解释,才能在一些严肃专业场景中,协助完成各项任务。

那么,文心一言和ChatGPT有没有潜力,进入这些严肃复杂的领域知识呢?

让它们介绍一下量子力学,都答对了:

7136a73eaa6886070148f2aa455f2743.png

说了这么多,不难看出,基于国产大模型的生成式AI,基础能力已经可以满足“人人皆可适应AI”的需求了。

既可以陪人闲聊,也可以帮助人们方便快捷的做专业的工作,总有一款应用场景适合你。

目前,以文心一言为代表的国产大模型,综合能力已经可以媲美ChatGPT,部分能力甚至超越GPT 4。这一点究竟是怎么做到的呢?

238ea36ff5b27d42e742325440279c77.png

AIGC黄金时代

“四有青年”带来的礼物

文心一言全面开放服务之后的火爆景象,说明大家都不希望错过AI这趟时代列车。加速推进智能革命,真正让每一个人和企业都用上AI,是今天摆在大模型面前的必答题,而谁是这次变革的担当者呢?答案是敢为先锋的“四有青年”。

如果我们冷静客观地看待这个热度,会发现即将爆发的AI原生应用热潮,也伴随一系列挑战,比如模型能力加速迭代、算力昂贵稀缺,国产大模型面临的竞争是前所未有的激烈。这样的背景下,国产大模型必须加速成长,保持技术先进性的同时,支撑产业落地。

这恰好是百度这些年一步步沉淀的能力,能给用户和开发者掏出的“时代礼物”。

百度CTO王海峰分享过,“做文心一言不是头脑发热,是十余年的技术积累和产业实践的水到渠成,我们在人工智能四层的技术架构上都有很深的积累,尤其是框架层和模型层联合优化发挥了非常大的作用”。

e7b18b79d077b747292053919e4c6bd9.png

应对接下来AIGC应用大爆发的机会和挑战,文心一言已经做好了准备:

有技术,依托百度NLP强大算法基础,自研深度学习平台飞桨最先进的大模型训练和推理部署技术,让文心大模型得以快速迭代,为接下来更多AI原生应用的创新和涌现,打下了能力底座。

有知识,百度是最大的中文搜索引擎,并且花十余年时间积累了世界上最大的多源异构知识图谱,为大模型提供数万亿数据和数千亿知识,可以让生成式AI与更多行业和场景任务,更加有针对性的结合。

有算力,两代通用 AI芯片“昆仑”的量产及应用,为大模型落地提供强大算力支持。百度智能云千帆大模型平台,提供了灵活高效的智能计算基础设施。通过文心与飞桨联合优化,提升模型的训练吞吐速度,从而全面实现了以更小资源消耗达到大模型训练目标。为基于文心一言的应用大规模创新,提供了算力保障。

有生态,助力各行业的生成式 AI 应用需求落地,文心一言的生态优势非常明显。以最新的插件机制为例,插件是开发者进入某项新技术的最短路径,也是开发者急切期待的。在刚刚过去的WAVE SUMMIT上,王海峰表示,未来百度将与开发者共建插件生态,共享技术创新成果。

新一轮的黄金时代,普通人对AI的热情和渴望,比以往任何时候都更加强烈。“四有青年”百度的选择,是给予用户更多礼物,让更多人可以用文心一言来触摸AI、解决问题、创造价值,搭上“时代顺风车”。

中国科技的历史机会

真的来了吗?

30bffde36592b012a102603c1c80061e.png

作家格拉德威尔(Gradwell)在《异类》(Outliers)一书中,介绍了这样一个事实:人类历史上最富有的75人中,有1/5出生在1830—1840年的美国,其中包括大家熟知的钢铁大王卡内基和石油大王洛克菲勒。因为他们赶上了美国内战后的工业革命浪潮。第二个高峰年代就是上世纪末,比尔盖茨、乔布斯、拉里佩奇等人赶上了信息革命的大潮。

对于这个国家和人民来说,AI是数百年来一遇的机会。这一次,中国终于能够把握住影响全人类的新科技,在人工智能领域与世界同步,甚至更快。

而文心一言等大模型的开放,会给这场智能革命,带来前所未有的加速度:

首先,是能力自证。只有让大家真用真体验,都用上国产大模型,亲身感受大语言模型的理解、生成、逻辑、记忆等核心能力,才能真正建立起产品信心和市场信赖度。这是国产大模型的当务之急,而文心一言作为第一批全面开放服务的国产大模型,也确实向大众证明了中国AI技术的硬实力。

接下来,是技术领先。

2bebcaae3652e4f53ec08a905f3efd74.png

大模型的能力提升,非常依赖于用户反馈的强化学习,用户越多、反馈越多,就学的越多、表现越好。此前没备案通过之前,只能以内测、邀测等形式,向部分个人用户、企业行业用户有限开放。 “反馈飞轮”一定程度上影响了大模型的体验迭代。

文心一言全面开放服务后,用户猛增。从这个节点开始,国产大模型可以在庞大的用户规模和反馈基础上,加速迭代进化,未来有望赶超GPT-4等海外大模型,让中国在人工智能领域保持领先位置。

更进一步,是产业繁荣。

备案上线后,面向大众ToC场景的大模型更为积极地提供服务,用户能直接检验AIGC的产品质量,愿意为之付费;AI受众大幅增加,会吸引更多应用开发者来大显身手,大量AI原生应用通过API调度资源……商业模式建立,促进国产大模型的良性发展,让中国的AI产业化和产业AI化更加深入。

举个例子,大模型的应用爆发,会带动AI基础设施建设,进而促进国产计算硬件、软件生态的兼容、壮大,合力来解决算力卡脖子的问题。再比如,文心一言全面开放之后,开发者和行业企业会更加积极地拥抱大模型,探索生成式AI的落地可能性,带动国內应用软件和产业智能的新一波热潮。

勒庞说:没有传统,就没有文明;没有对传统的缓慢淘汰,就没有进步。这就是科技产业最让人振奋的地方。

每一次科技浪潮,都有代表性的企业和个人,幸运地站上了时代的浪潮之巅。而没能投入到上一个技术大潮中的人,也不用担心错过,因为技术一直在进步,新的智能革命已经拉开了序幕,而这一次,中国科技没有错过。

生成式AI的黄金时代,刚刚被国产大模型拉开了一角,是你我即将亲历的又一个历史机遇。无论你是普通用户、应用开发者,还是行业观察者和看客,都不妨给与它们更多期待。

0343fa0b4d56c3f713a2026b0026bcf4.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/962929.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

硬件SPI口扩展

在工控板设计中,经常会遇到扩展IO。具有相同的功能电路板接口相同,所以很容易采用排线方式连接到CPU主控板上,这种排线连接,我称之为总线。 现在的CPU引脚多,不扩展IO,使用模拟SPI,也可以实现&…

【力扣每日一题】2023.9.2 最多可以摧毁的敌人城堡数量

目录 题目: 示例: 分析: 代码: 题目: 示例: 分析: 这道题难在阅读理解,题目看得我匪夷所思,错了好多个测试用例才明白题目说的是什么。 我简单翻译一下就是寻找1和…

15000字、6个代码案例、5个原理图让你彻底搞懂Synchronized

Synchronized 本篇文章将围绕synchronized关键字,使用大量图片、案例深入浅出的描述CAS、synchronized Java层面和C层面的实现、锁升级的原理、源码等 大概观看时间17分钟 可以带着几个问题去查看本文,如果认真看完,问题都会迎刃而解&…

03_nodjs_npm的使用

03 【npm的使用】 1.包和npm 1.1 什么是包 由于 Node 是一套轻内核的平台,虽然提供了一系列的内置模块,但是不足以满足开发者的需求,于是乎出现了包(package)的概念: 与核心模块类似,就是将一…

[学习笔记]斜率优化dp 总结

前言: 我们学过不少优化类的算法了,大部分都是基于凸函数的性质给出的优化,比如Slope Trick,Wqs二分,又比如今天的斜率优化(不知道什么时候会有空把Slope Trick写掉) 正文: 我们考…

这个在线网站让你三分钟制作出一份精美简历

今天,我要向大家推荐一个神奇的在线工具网站,它能够提供免费简历模板、简历范文,支持在线编辑,并且一键下载为PDF。这个工具让你的简历制作变得轻松便捷! 首先,这个网站的简历模板非常丰富多样。无论你是刚…

bazel构建原理

调度模型 传统构建系统有很多是基于任务的,例如 Ant,Maven,Gradle。用户可以自定义"任务"(Task),例如执行一段 shell 脚本。用户配置它们的依赖关系,构建系统则按照顺序调度。 基于 Task 的调度…

揭秘亚马逊Amazon测评,掌握细节和技巧,提升产品销量和评论数量

亚马逊是全球最大的跨境电商平台,拥有全球65个国家的几十个网站。对于跨境卖家来说,亚马逊是最值得选择的平台之一。 亚马逊的八大站点分别是美国、加拿大、墨西哥、欧洲、澳大利亚、日本、中东和巴西。 美国站点是全球最大的零售市场,拥有…

区块链实验室(18) - 用FISCO BCOS架设1个无标度网络

FISCO技术文档提供1个4节点的网络案例,这4个节点构成1个强连通图。强连通图在现实中通常是不存在的。 本文用FISCO架设1个网络,该网络由100个节点构成1个无标度(scale free)网络,如下图所示。 1 用FISCO工具构建1个100节点的初始网络 FISCO提…

Jenkins java8安装版本安装

一、首先准备Jenkins、Jdk8、Tomcat9安装包 根据Jenkins官网介绍,Jenkins支持Java8的版本如下: 我们选择2.164版本进行安装,根据版本号支持输入下载地址:https://archives.jenkins.io/war/2.164/jenkins.war,进行下载…

【牛客网题目】合并两个排序的链表

目录 描述 题目分析 描述 输入两个递增的链表,单个链表的长度为n,合并这两个链表并使新链表中的节点仍然是递增排序的。 数据范围:0≤n≤1000,1000≤节点值≤1000 要求:空间复杂度 O(1),时间复杂…

为什么我说 90% 的技术人搞副业都会失败?!

见字如面,我是军哥! 这几天有多位程序员读者请教我,如何搞副业?并且有一位已经搞了半年了,涨粉困难,这小伙子大概工作 2 年的样子,所在的公司算中等二线大厂吧。 我把和他们聊的内容总结了一下&…

vscode调教配置:快捷修复和格式化代码

配置vscode快捷键,让你像使用idea一样使用vscode,我们最常用的两个功能就是格式化代码和快捷修复,所以这里修改一下快捷修复和格式化代码的快捷键。 在设置中,找到快捷键配置: 然后搜索:快捷修复 在快捷键…

分库分表篇-1 分库分表介绍

文章目录 前言一、为什么要分库分表?二、分库分表的策略:2.1 垂直切分:2.2.1 垂直分库:2.2.2 垂直分表:2.2.3 垂直拆分的优缺点: 2.2 水平切分:2.2.1 库内分表:2.2.2 分库分表:2.2.3 水平切分优缺点: 三、分…

04-MySQL02

1、什么是索引下推? 索引下推(index condition pushdown )简称ICP,在Mysql5.6的版本上推出,用于优化查询。 需求: 查询users表中 "名字第一个字是张,年龄为10岁的所有记录"。 SELECT * FROM u…

无涯教程-JavaScript - FTEST函数

FTEST函数取代了Excel 2010中的F.TEST函数。 描述 该函数返回F检验的输出。 F检验返回两尾概率,即array1和array2的方差没有显着差异。使用此功能可以确定两个样本是否具有不同的方差。 语法 FTEST (array1, array2)争论 Argument描述Required/OptionalArray1The first ar…

【仿写spring之ioc篇】三、检查是否实现了Aware接口并且执行对应的方法

Aware接口 Aware接口中只是设置了对应的set方法,目前只定义了三个Aware 以BeanNameAware为例 package com.ez4sterben.spring.ioc.factory.aware;/*** bean名字清楚** author ez4sterben* date 2023/08/31*/ public interface BeanNameAware {/*** 设置beanName* …

老胡的周刊(第106期)

老胡的信息周刊[1],记录这周我看到的有价值的信息,主要针对计算机领域,内容主题极大程度被我个人喜好主导。这个项目核心目的在于记录让自己有印象的信息做一个留存以及共享。 🎯 项目 quivr[2] Quivr 是您在云中的第二个大脑&…

Mysql数据库事务隔离级别造成死锁

场景:如下代码,获取数据库连接,删除权限的时候,会造成数据库死锁. 代码 日志: 数据库: SHOW OPEN TABLES where In_use > 0; 问题分析:测试环境Centos7操作系统,Mysql5.7.40版本程序运行正常,开发环境Windows操…

设计模式行为型-模板模式

文章目录 一:模板方法设计模式概述1.1 简介1.2 定义和目的1.3 关键特点1.4 适用场景 二:模板方法设计模式基本原理2.1 抽象类2.1.1 定义和作用2.1.2 模板方法2.1.3 具体方法 2.2 具体类2.2.1 定义和作用2.2.2 实现抽象类中的抽象方法2.2.3 覆盖钩子方法 …