【首发评测】国产大模型真落地,我用这5个问题为难了它们,结果你意想不到...

news2025/1/22 1:50:19

出品 | 网易科技《智见焦点》

作者 | 赵芙瑶

编辑 | 丁广胜

b59355395e5d4c541d9d80bdbc7e7994.gif

大模型的风暴席卷全球,然而对于普通C端用户来说,国产大模型的内测邀请码却总是“一码难求”,即使开放申请体验,排队时长也难以预估。

然而就在今日,备受行业瞩目的首批大模型产品获批名单来了,当中既有百度、字节跳动、腾讯、华为、商汤等大型企业,也包含了具有科研院校背景的智谱AI、中科院等,同时创业公司百川智能、MINIMAX等也位列其中。

fe016f3bcad3e6180c2734445887ebd3.png

也就是说,国产大模型人人可用的时代已经到来。

2022年12月,国家网信办、工信部、公安部联合出台了《互联网信息服务深度合成管理规定》,对深度合成技术作出规范,并规定从2023年1月10日起实施。2023年7月,国家网信办等七部门联合公布《生成式人工智能服务管理暂行办法》,希望促进生成式人工智能健康发展和规范应用。国内生成式AI的发展也紧跟政策步伐,此次11家公司首批通过《生成式人工智能服务管理暂行办法》备案,可正式上线面向公众提供服务,无疑意味着市场格局的又一次生变。

Open AI之所以强势出圈,与其强大的数据集不无关系。曾几何时,对于许多国产大模型来说,中文语料库短缺的痛点一直存在。此前大模型也并未全面开放,中文数据无法像ChatGPT那样进行“几何级”的积累。

AI时代“百舸争流”,哪家大模型最先拿到了开放的名额,就相当于拿到了最先积累中文数据、占领市场份额的“船票”。

那么,这些大模型的水平究竟如何?网易科技就以下近期热点话题,对首批已开放的部分大模型展开了评测。

a6b882f1ab4e9e9df06ea8378a7e98ac.png

01

百度-文心大模型-文心一言

嵌入搜索引擎、插件可生成表格

0de6583bfde5f3f5b54fa9a5f2222784.png

文心一言是知识增强的大语言模型,2023年3月27日上线, 6月开放3.5版本内测。百度作为国内率先入场大模型的企业之一,李彦宏对于文心一言寄予厚望。从文心一言的回答来看,比较言简意赅,虽然并未进行强观点的输出,但是答案相对中规中矩。

此前ChatGPT的插件集十分火爆,此次令人惊喜的是,文心一言也更新了插件功能!包括览卷文档、E言易图以及说图解画。

7654b9df974360684854f1913504b4da.png

近期正值财报季,上市企业们纷纷发布二季报,以折线图、柱状图的形式展现财务数据会更加一目了然。输入财报数据,并选中E言易图插件,就会生成柱状图,然而美中不足的是,E言易图并不能明白“在柱状图上标明数据”的指令。

cfd8e889603e450f1907c11d1a491c48.png

至于“说图解画”插件,文心一言不知为何忽然建议使用英文进一步提问,或许是使用了英文数据集的缘故。

c9ad360d1b0068ff35095af204b75a01.png

不过可圈可点的是,百度将文心一言的对话能力嵌入了搜索引擎,与New Bing类似,可以面向更多的用户群体,文心一言客户端也已经在App store上线。

67310eb79f6a183be32127a3a8860292.png

02

商汤科技-日日新大模型-商量

To B To C 两手抓

313adfc5d2a866887fb4bfe6b1dc7197.png

日日新(SenseNova),是商汤科技宣布推出的大模型体系,包括自然语言处理模型“商量”(SenseChat)、文生图模型“秒画”和数字人视频生成平台“如影”(SenseAvatar)等。

从商量·SenseChat的回答来看,回答连贯、逻辑流畅、较为专业、篇幅较长,并且有一些有价值的观点。更令人惊喜的是,其拥有“辩证思维”。例如给出蔚来造手机以及小米造车的分析时,商量能发现二者之间的异曲同工之处。

bfb6efd87669ac36c01ce81a5dc47e7d.png

点击查看商量的回答

从其它回答来看,商量在回答问题时都会联网查询相关信息。但日日新的To B应用还暂未向公众开放,目前只能联系商务进行试用。

03

MINIMAX-ABAB大模型

有限速、不可输入过长文本

ABAB大模型,是Minimax推出的自研通用大模型。令人费解的是,其开放平台在当前阶段,体验用户(未充值)调用接口时会被限速,所以其生成答案的速度为所有大模型中最为缓慢,并且输入字符也有限制,所以只能将每个问题单独提问一遍。其页面UI设计让信息浏览也略有不便,不过生成的答案倒是没什么毛病。

9540d6e81c275668c3e580b787ed545b.png

04

中科院自动化研究所-紫东太初大模型

效果差强人意 理解能力还需提高

据官网介绍,紫东.太初是中科院自动化所与MindSpore社区联合打造的全球首个图、文、音三模态大模型。紫东.太初将文本 + 视觉 + 语音各个模型进行协同,可以完成跨模态检测、视觉问答、语义描述等下游任务。

首先是视觉问答,目前来看,紫东太初似乎完全无法理解指令

b94a55f062c4b725a0dd0f3b8c87d3ee.png

以图生文方面,推理有错误,误判了桌上的物品

81cad7497f09c5bee4bf58437f21c9a7.png

以文生图方面,生成的图片较为模糊,不过好在理解了指令。

fe8a4e881b1b73493f408f6f4478717a.png

05

智谱AI -GLM-ChatGLM

多种模型可供选择

智谱AI是由清华大学计算机系技术成果转化而来的公司,希望打造新一代认知智能通用模型。今日其首款生成式AI助手“智谱清言”已在各大应用商店上线。这款工具基于智谱AI自主研发的中英双语对话模型ChatGLM2,与此同时,智谱AI官网也已开放其他大模型试用入口。

1bc5ecbcc1c9e7e85583bc1420c6474f.png

从ChatGLM-Pro的回答来看,要点明确,篇幅较为简洁,在内容丰富度上略微逊色。

1988705fe1b55f653757b755e22b2428.png

06

字节跳动-云雀大模型-豆包

拟人化AI助手

feae5ce1227d3dcab70bbc6ebbc7efeb.png

豆包是字节跳动公司基于云雀模型开发的AI工具,提供聊天机器人、写作助手以及英语学习助手等功能。它可以回答各种问题并进行对话,帮助人们获取信息,支持网页 Web 平台,iOS 以及安卓平台,但 iOS 需要使用 TestFlight 安装。

豆包清晰、详细地回答了问题,同时具有逻辑性和连贯性,也有一定程度的创新性,提供了新的观点和信息。

dd8d558343400bda16f14f5dd3cc6771.png

07

百川智能-百川大模型

结构严谨 观点具有辩证性

百川智能,是王小川和茹立云联合创立的一家研发并提供通用人工智能服务的中国公司,旨在打造中国版的 OpenAI 基础大模型及颠覆性上层应用。

da3ed3805ba86f0875c910a8bb7b9b34.png

从百川大模型的回答来看,其结构严谨,会一分为二的阐述观点并进行总结。

08

上海人工智能实验室-书生大模型-书生·浦语+

仍未开放 值得期待

目前,书生大模型的官网还未开放试用入口,只提供了一些此前的案例,所以目前还无法评判其对话能力

2893198a0424b5c67a3ee5a120a7316d.png

结语

此次国内11家大模型企业首批通过《生成式人工智能服务管理暂行办法》备案,无疑标志着中国生成式人工智能服务将拥有更加规范的管理。该备案的通过,意味着这些生成式人工智能系统的合法性得到了确认,也意味着这些系统的服务质量将受到更严格的管理。

这对于全行业来说,都是一个积极信号,必将有助于推动生成式人工智能行业的健康、有序、快速发展,让大模型人人可用,让数据积累更加简单。

18673001427c7140a19878696e0af6e9.jpeg

        动动手指 关注我们

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/966269.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2023面试系列 线程池用过居然不知道底层原理,啥也不是!

1.为什么使用线程池: 1. 减少线程频繁的创建跟销毁带来的性能消耗 2. 便于管理线程 3. 提高响应速度(不用等待线程创建) 4. 能提供更多的功能 2.线程池的创建方式: 通过Executors创建 通过ThreadPoolExecutor创建&#xff08…

【基础计算机网络1】认识计算机网络体系结构,了解计算机网络的大致模型(上)

前言 今天,小编我也要进入计算机网络的整个内容,虽然这个计算机网络的内容在考研部分中占比比较小,有些人不把这一部分当成重点,这种想法是错误的。我觉得考研的这四个内容都是非常重要的,我们需要进行全力以赴的对待每…

【C++】异常处理详解

本篇文章重点将会对C中的异常的相关处理操作进行详解。希望本篇文章的内容会对你有所帮助。 目录 一、C语言的异常处理 二、C异常 2、1 异常概念 2、2 异常的使用 2、3 异常类 2、4 异常的重新抛出 三、异常的安全与规范 3、1 异常的安全 3、2 异常的规范 四、异常的优缺点 &am…

如何使用CSS实现一个带有动画效果的折叠面板(Accordion)?

聚沙成塔每天进步一点点 ⭐ 专栏简介⭐ 带有动画效果的折叠面板(Accordion)⭐ 写在最后 ⭐ 专栏简介 前端入门之旅:探索Web开发的奇妙世界 记得点击上方或者右侧链接订阅本专栏哦 几何带你启航前端之旅 欢迎来到前端入门之旅!这个…

FPGA时序分析与约束(4)——时序分析,时序约束,时序收敛

一、前言 在之前的文章中,我们介绍了组合电路的时序和时序电路的时序问题,之后又把理想化的时钟变成了实际的时钟考虑了进来,在阅读本文之前,强烈推荐优先阅读本系列之前的文章,毕竟这是我们继续学习的基础&#xff0c…

Elasticsearch 8.X 可以按照数组下标取数据吗?

1、线上环境问题 老师、同学们,有人遇到过这个问题么,索引中有一个 integer 数组字段,然后通过脚本获取数组下标为1的值作为运行时字段,发现返回的值是乱的,并不是下标为1的值, 具体如下: DELETE my_index …

36岁男子自称被裁,曾是前500强公司市场总监,最后接受做外买

(点击即可收听) 最近有一个新闻,上了头条,36岁男子自称被裁,是前500强公司市场总监,一年没找到工作,以前不信年龄是道坎 以为自己的经验和履历,能在找到一份相匹配的工作不成问题 但是现实却很残酷,一年后,仍然没有找到对口的工作,即使降低了薪资标准,可依旧找不到 都说疫情前难…

逻辑回归Logistic

回归 概念 假设现在有一些数据点,我们用一条直线对这些点进行拟合(这条直线称为最佳拟合直线),这个拟合的过程就叫做回归。进而可以得到对这些点的拟合直线方程。 最后结果用sigmoid函数输出 因此,为了实现 Logisti…

3D视觉测量:形位公差 面对面垂直度(附源码)

文章目录 0. 测试效果1. 基本内容2. 实现方法2. 代码实现3. 参考文章目录:3D视觉测量目录微信:dhlddxB站: Non-Stop_0. 测试效果 1. 基本内容 垂直度用于描述被测要素相对基准(面/轴)的垂直(90)程度。是一个表面或轴线与一个基准面(通常是垂直于图纸纸面的一个面)之间的…

Leetcode 16.07 最大数值

编写一个方法,找出两个数字a和b中最大的那一个。不得使用if-else或其他比较运算符。 示例: 输入: a 1, b 2 输出: 2 我的答案: 为了找出两个数中的较大者,而不使用比较或条件语句,我们可以…

Linux常用命令——cupsdisable命令

在线Linux命令查询工具 cupsdisable 停止指定的打印机 补充说明 cupsdisable命令用于停止指定的打印机。 语法 cupsdisable(选项)(参数)选项 -E:当连接到服务器时强制使用加密; -U:指定连接服务器时使用的用户名; -u&#…

【无公网IP内网穿透】异地远程访问本地SQL Server数据库

目录 1.前言 2.本地安装和设置SQL Server 2.1 SQL Server下载 2.2 SQL Server本地连接测试 2.3 Cpolar内网穿透的下载和安装 2.3 Cpolar内网穿透的注册 3.本地网页发布 3.1 Cpolar云端设置 3.2 Cpolar本地设置 4.公网访问测试 5.结语 1.前言 数据库的重要性相信大家…

jdk-8u371-linux-x64.tar.gz jdk-8u371-windows-x64.exe 【jdk-8u371】 全平台下载

jdk-8u371 全平台下载 jdk-8u371-windows-x64.exejdk-8u371-linux-x64.rpmjdk-8u371-linux-x64.tar.gzjdk-8u371-macosx-x64.dmgjdk-8u371-linux-aarch64.tar.gz 下载地址 迅雷云盘 链接:https://pan.xunlei.com/s/VNdLL3FtCnh45nIBHulh_MDjA1?pwdw4s6 百度…

uni-app之android离线打包

一 AndroidStudio创建项目 1.1,上一节演示了uni-app云打包,下面演示怎样androidStudio离线打包。在AndroidStudio里面新建空项目 1.2,下载uni-app离线SDK,离线SDK主要用于App本地离线打包及扩展原生能力,SDK下载链接h…

2023开学礼新疆理工学院图书馆藏八一新书《乡村振兴战略下传统村落文化旅游设计》许少辉新财经理工

2023开学礼新疆理工学院图书馆藏八一新书《乡村振兴战略下传统村落文化旅游设计》许少辉新财经理工

GraalVM Community Edition 22.3.3

https://github.com/graalvm/graalvm-ce-builds/releases/ 按需下载 https://github.com/graalvm/graalvm-ce-builds/releases/download/vm-22.3.3/graalvm-ce-java11-windows-amd64-22.3.3.ziphttps://github.com/graalvm/graalvm-ce-builds/releases/download/vm-22.3.3/nat…

山西电力市场日前价格预测【2023-09-03】

日前价格预测 预测明日(2023-09-03)山西电力市场全天平均日前电价为316.78元/MWh。其中,最高日前电价为405.32元/MWh,预计出现在19: 15。最低日前电价为249.46元/MWh,预计出现在12: 15。 价差方向预测 1: 实…

公司文件数据防泄密软件——「天锐绿盾透明加密防泄密系统」

天锐绿盾透明加密防泄密系统是一款利用驱动层透明加密技术实现电子文件安全加密的防护产品。该系统集成了密码学、访问控制和审计跟踪等技术手段,对企事业单位电子文件的存储、访问、传播和处理过程进行全方位防护,从源头上保障数据安全和使用安全。 PC访…

springboot web开发登录拦截器

在SpringBoot中我们可以使用HandlerInterceptorAdapter这个适配器来实现自己的拦截器。这样就可以拦截所有的请求并做相应的处理。 应用场景 日志记录,可以记录请求信息的日志,以便进行信息监控、信息统计等。权限检查:如登陆检测&#xff…

.NET之后,再无大创新

回想起来,2001年发布的.NET已经是距离最近的一次软件开发技术的整体创新了,后续的新技术就没有在各个端都这么成功的了。.NET是Windows平台下软件开发技术的巨大变革。在此之前,有VB、C(MFC)、JSP,在此之后…