讯飞星火大模型体验报告

news2025/1/17 0:57:57

近日,科大讯飞召开了星火认知大模型成果发布会,会上表示讯飞星火大模型将突破开放式问答,对标ChatGPT,在中文能力上超过ChatGPT,在英文能力上与ChatGPT相当。对此,你怎么看?

笔者准备给bing/chat_GPT、百度文心一言、星火大模型用同样的问题实测一波,来确认星火大模型究竟是什么样的一个水平~

一、对话式AI简介

首先还是简要的介绍一下生成式大模型AI,去年末由美国openAI公司引爆的新一代人工智能模型,给原本要凉凉的AI领域放了一把火。导致所有具备能力的大集团一窝蜂似的涌入,希望能涌现出相当甚至超越人类的智能。这类大模型,之所以叫“大”,是由于它是典型的大力出奇迹,就像编程中的暴力“算法”,以循环多而闻名!大模型这玩意和循环一样,for用得多了,总能把复杂的问题给解决掉,以堆参数、堆GPU来解决问题。不是一般小公司玩得起的,openAI虽然小,但这公司后面站着微软。闲话少叙,咱以几个问题来实测一下今天的主角–星火大模型。

二、古典文学陷井题

星火大模型既然说在中文能力上已经超越了chatGPT,咱先来一题中文的:简介中国古典名著《水浒》中梁山泊好汉马文才在攻打祝家庄时与庄主之女祝英台双双化蝶的爱情故事。这是一道有深坑的题~

1、百度回答:

在这里插入图片描述
很好!编得有鼻子有眼的,笔者差点就信了。就是相约化蝶而去有点生硬了,至少逻辑通顺,咱给个60分。

2、bing回答:

《水浒》是中国古典四大名著之一,描写了北宋末年一百零八位梁山好汉的反抗斗争和社会理想。其中有一个感人的爱情故事,就是马文才与祝英台的化蝶传说。

马文才是梁山泊的好汉之一,擅长弓箭,有“神箭八九”的绰号。他曾经参与了三打祝家庄的战役,与祝家庄的庄主祝朝奉交战。祝朝奉有一个美丽聪明的女儿,名叫祝英台,她从小就喜欢读书,有“才女”之称。

祝英台见到马文才后,对他一见钟情,暗中送信给他,希望能够与他相会。马文才也被祝英台的才貌所吸引,便答应了她的邀请。两人在祝家庄的后花园里相见,相谈甚欢,互诉衷肠,许下了白头偕老的誓言。

不料,他们的私会被祝朝奉发现了,祝朝奉大怒,认为马文才是梁山泊的强盗,不配与他的女儿相配,便命人将马文才囚禁起来”

这里笔者用的EDGE的bing撰写功能。可能字数限制,没写全吧~不过也够了,从回答来看。它编得比百度更详细一点,都给马文才起上绰号了,神箭八九,经查水浒中没有这个外号!…还整出一个祝朝奉!更能迷惑人。加上它是个外籍AI,就给个70分吧。

3、今天的主角星火

在这里插入图片描述

笔者申明:我只问了这一次,不知道为什么它来个对不起,回答有误…难道真有人在后台看着?
咱先忽略这个对不起,从结果来看。这是三者中唯一没掉进出笔者的陷阱的一个,只从这一点讲。说它更懂中文也是很有道理的。扣掉“对不起”这点让我疑惑的10分,给它90分没问题。
希望没人在后台看着,要有的话,这得忙成什么样子。细思极恐啊!

三、现代文学常识题

咱不能太欺负外籍AI,这还是来一道容易的中文题吧:概括朱自清先生的《背影》

1、百度文心一言

在这里插入图片描述
在笔者看来,回答得很好,反正我也不知道对不对。加上老是让它打头阵,有点不公平,给90分吧。

2、bing

《背影》是朱自清先生的一篇散文,描写了他与父亲分别的场景。文章以细腻的笔触,展现了父亲对儿子的深厚爱意,以及儿子对父亲的敬慕之情。文章中,朱自清先生用了许多比喻和细节,把父亲的形象刻画得栩栩如生。文章的结尾,朱自清先生回忆了父亲送他上车时的背影,表达了他对父亲的不舍和怀念。《背影》是一篇感人至深的散文,体现了中华民族的孝道和亲情。

比百度略多了几个字,回答大同小异,也给90分吧。

3、星火

在这里插入图片描述
嗯~ 比bing又略详细了点,同样也给90分吧。文学领域的东西,笔者不懂。而且这种简单的送分题就是为了不让结果太难看。

四、甲骨文认知

1、百度

在这里插入图片描述

因为星火没有生成图片的能力,为了公平起见,咱先给文字描述也打个分,鉴于描述得还算能让人看明白个大概,就给文字描述打75分吧。

明显百度是有画图能力的,但它没有直接给出图片,而是用了文字描述。显然它不会主动为你生成图片,需要我们指定,所以笔者追问了一句:

在这里插入图片描述
笔者认为是它在上下文衔接上很有问题,再问详细一点就好了吧~

在这里插入图片描述
我无语了~无法再给小度找理由了。话说回来,还是要强行给小度找点理由的!看头上那两角,还是和文心一言的描述还是有几分像的…同鞋们记好了,甲骨文的羊是酱紫滴,心疼古人三秒钟,写个羊字得花几个小时吧。上古时期,文字只掌握在少数人的手里是很有道理的。
这题文心一言虽然给出了两张漂亮美女图,但是很明显出丑了!多模态能力打59分。从这也可以看出文心一言的多模态并不是在一个框架下的。所以你懂的…

以下是问完bing以后的补充问题,由文心一言手机app生成:

在这里插入图片描述

咱放弃了…不再试图挽救。

2、bing

这里笔者觉得EDGE的bing不好用,换了网页版
在这里插入图片描述
回答虽还不如百度开篇详细,但文字描述至少也能让人看出了个大概,就给文字描述70分吧。
为了看看它会不会生成图片,笔者又换了手机bing,因为手机bing是可以生成图片的。
在这里插入图片描述

很好嘛,这才是多模态!为了公平,我又去百度文心一言app试试。又补充到百度的回答中让大家看看笔者的猜测…
bing明显是个多模态AI优等生,95分!

3、星火

在这里插入图片描述
这??是什么鬼…
虽然我知道当前星火并不具备生图能力,我还是问了一句:
在这里插入图片描述
好吧,它还是??
这个回答文字方面远不如百度和bing,文字描述只能给了59分,不能再多了。

从以上的关于中文的三个问题来看,星火虽然有点让人迷惑,但说中文能力领先,也不完全算是吹牛,至少对古典文学的理解,超过了另两者。下面我们换编程能力,这里为了避免太大众的语言太好回答,咱找点小众的。

五、cmd编程

问题是:请用Windows批处理语言,写一个脚本,计算(2+3)乘 4 的结果。
为什么要用这么简单的东西呢?是因为笔者认为在互联网上是找不到这个简单功能的现成代码的。主要笔者也不精通这玩意!

1、百度

在这里插入图片描述

没有考虑2+3的事,直接让你输入了,算是变通吧。但是后面的%4%又是啥玩意…明显没有这个变量,去掉4左右的%,这个写法还是能用的。从它的解释来看,逻辑是对的。可为什么要写成%4%呢,迷一样的行为。打分就困难了,给个60分吧,至少解释对了。

2、bing

在这里插入图片描述

很好!简单直接的给出了答案。让程序员来写多半也是这个写法。99分,少给1分是怕它骄傲了。bing是码农的好帮手,笔者也问过一些较复杂的编程问题,有时也会给出类似百度的迷一样代码,比如经常分不清字符串和数字,但稍微改改还是能用的。

3、星火

在这里插入图片描述

这是什么鬼~ 不用试就知道错的,!result!这种写法是要设置变量延迟的。这比笔者这初学者都还不如,看着眼花缭乱的… 我只能给10分,理由是它用对了语言,没用别的语言来生搬硬套。

从这可以看出,也就别期望星火大模型的编程能力了。如此简单的一个问题都回答得豪无逻辑可言。嗯~ 也许它有它的逻辑,但明显不是人类逻辑。

总结

虽然笔者是很希望有超越GPT4的国产大模型出现的,但笔者对这个问题是持悲观态度的!百度都把文心一言做成这半生不熟的样子,其它公司希望更小。笔者这个观点和大模型训练的三要素有关,算力、算法、数据。算力是资金问题,这个不怕,有钱的公司多去了。人家不卖显卡?咱多堆几块好了,咱也不缺电力是吧!算法嘛人家都给出正确的路了,总能学会的。唯有数据,中文互联网的数据肯定是不少的,就算质量上略差吧,数量来补。最大的问题就是中文互联网的数据是属于各app的,这简直离了大谱!所以除了百度有海量数据外,其它公司想要训练出超越GPT的模型是基本不可能的(个人浅见)。

笔者也没试用过阿里等别的大模型,就不对它们做评价了。之所以测试星火大模型,也是因为讯飞本身具有较强的AI能力,深耕AI领域多年。

要说星火大模型中文超过了GPT那肯定有吹水的成份,只能说在中文文学领域并不弱于GPT!从实用性来讲,去写写作文还可以胜任的。各细分专业领域其实从编程就可以看出来了,如此简单的一段代码都不能正确生成。说它有编程能力都是夸张了!编程代码相对于其它专业领域更容易在互联网得到大量训练数据。也许星火的python,C++等更流行的语言的能力会略强,可显然它并没有涌现出较强的逻辑能力,没逻辑能力一切都枉然。

本文以上测试均为实测,只对本次测试负责!以上结论均为笔者个人主观评测,不代表所测试的AI大模型的真实能力。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/524102.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

数据结构第二天:File Transfer 【树的应用:集合】

原题是英文的:题目详情 - 05-树8 File Transfer (pintia.cn) 我用软件翻译了一下: 我们有一个计算机网络和一系列双向连接。这些连接中的每一个都允许文件从一台计算机传输到另一台计算机。有没有可能从网络上的任何一台计算机向其他计算机发送文件? Input Specif…

STM32 学习笔记_7 定时器中断:输出比较

输出比较 电机相关比较重要。 OC Output Compare(IC 是输入捕获,CC代指这两个单元),用于输出一定频率和占空比的PWM波形。 右下角四个就是CCR。只有通用计时器和高级计时器有,共用一个cnt计数器,高级计数…

(数字图像处理MATLAB+Python)第七章图像锐化-第四节:频域高通滤波与综合案例

文章目录 一:频域高通滤波(1)理想的高通滤波器(2)巴特沃斯高通滤波器(3)指数高通滤波器(4)梯形高通滤波器 二:综合案例——人像美化(1&#xff09…

C语言函数大全-- w 开头的函数(2)

C语言函数大全 本篇介绍C语言函数大全-- w 开头的函数 1. wcstok 1.1 函数说明 函数声明函数功能wchar_t *wcstok(wchar_t *wcs, const wchar_t *delim, wchar_t **ptr);用于将一个长字符串拆分成几个短字符串(标记),并返回第一个标记的地…

非煤矿山电子封条建设算法 yolov8

非煤矿山电子封条建设算法模型通过yolov8网络模型AI视频智能分析技术,算法模型对作业状态以及出井入井人员数量变化、人员睡岗离岗等情况实时监测分析,及时发现异常动态,自动推送生成的违规截图报警信息。现代目标检测器大部分都会在正负样本…

免费下载Sketch模板素材一文搞定!

对于设计师来说,UI 模板素材是提高设计效率和保证设计质量的重要工具。然而,很多设计师在使用 Sketch 时,会遇到 Sketch 模板素材不足、格式不兼容或使用成本高等问题。本文将为你介绍一款资源齐全、跨平台、无需下载、免费使用的 Sketch 模板…

Tips for Deep Learning

目录 Recipe of Deep Learning Good Results on Training Data? New activation function Adaptive learning rate Good Results on Testing Data? Early Stopping Regularization Dropout Recipe of Deep Learning 我们要做的第一件事是&#x…

http协议在万维网的一生

tcp与udp的区别 http协议位于应用程序层,必须经过传输层进行通信 tcp即传输控制协议,首先通过三次握手建立连接,然后传输数据,数据传输成功后 通过四次挥手关闭连接,如有数据丢失则会重试保证数据传输可靠性 是一个面向…

树的前中后序以及广度优先搜索和深度优先搜索

文章目录 基本概念定义一棵树前序遍历中序遍历后序遍历BFS广度优先遍历DFS深度优先遍历 基本概念 树是一个有n个有限节点组成一个具有层次关系的集合,每个节点有0个或者多个子节点,没有父节点的节点称为根节点,也就是说除了根节点以外每个节…

TS38.331中need -M/R/N/S 的含义

need M:这种字段需要UE在不存在时维护;need R:当RRC中此字段不存在时,UE需要释放;need N:当此字段不存在时,UE不需要采取任何行动(即UE不需要保持该字段的任何现有值)&am…

如何使用单片机点亮LED灯,并使用按键控制[51单片机]

首先先看一下我的板子,如果我们板子不相同,可能操作也不太相同 我们就不讲底层原理了,直接看,我们可以看到板子上有 8个LED灯 那这个8个LED用什么来控制呢,我们先看底层的线路图,所有的LEDD都连接到了P2带后…

云原生技术中的容器技术有哪些?

文章目录 云原生技术中的容器技术有哪些1、云原生的含义2、容器的含义3、云原生的技术的基石:容器技术4、容器技术有哪些? 结语 云原生技术中的容器技术有哪些 在现今的安全行业中云原生安全技术中的容器安全技术有哪些呢,很多用户都不知道具体的含义以…

Linux程序设计之UDP通信

1.UDP通信是不可靠的、无连接的通信&#xff0c;客户端只需要服务器端的地址信息即可与之进行通信。UDP通信的基本流程如下&#xff1a; 2.利用UDP实现服务器端与客户端的通信如下&#xff1a; /*UDP通信*/ //服务端#include <stdio.h> #include <string.h> #incl…

低造价形状记忆合金相变温度DSC热分析替代技术:帕尔贴热电装置和电阻温度测量

摘要&#xff1a;形状记忆合金&#xff08;SMA&#xff09;是一种先进的金属材料&#xff0c;其物理和机械性能本质上依赖于温度。为了快速和低成本的实现SMA相变温度和热滞后性能的测试表征&#xff0c;基于更灵敏的电阻温度依赖关系&#xff0c;本文提出了采用帕尔贴TEC加热制…

论文学习笔记:ViT Vision Transformer An Image is worth 16X16 words

论文阅读&#xff1a;ViT Vision Transformer An Image is worth 16X16 words 今天介绍的是 Transformer 在视觉领域的一篇非常重要的论文&#xff0c;Vision Transformer&#xff0c;这篇文章发表在 2021 ICLR 的会议上。长久以来 CNN 一直是 CV 领域最主流的模型&#xff0c…

从零开始:开发一款应用程序的完整流程技巧

在数字化快速发展的现在&#xff0c;开发一款应用程序已经不是一件困难的事情。低代码应用开发平台的诞生更是让应用开发变成一项人人都能快速掌握的技能。之前&#xff0c;我们使用Java、C语言等传统的语言技术进行应用开发&#xff0c;来满足企业的业务应用需求。但是&#x…

rm / -rf指令的作用是?

学习Linux 指令&#xff0c;它是操作系统的前端&#xff0c;学好这部分内容一方面可以帮助你应对工作场景&#xff0c;另一方面可以让你在学习操作系统底层知识前&#xff0c;对 Linux 有一个大概的了解。 学习 Linux 指令之前&#xff0c;先来说一下什么是 Shell&#xff1f;S…

使用FFMPEG加载外挂字幕小记

ffmpeg版本&#xff1a; FFMEPEG 4.4 继上一篇简易播放器实现后&#xff0c;优化过程中&#xff0c;加载外挂字幕小记的过程和遇到的坑记录如下&#xff1a; 视频字幕分为三种。 内嵌字幕&#xff0c;字幕与视频图像合二为一&#xff0c;成为视频帧的一部分。 内封字幕&…

Python浪漫520表白代码

目录 前言 表白界面 跳动的爱心 漂浮的爱心 满屏表白代码 前言 520是每年的5月20日&#xff0c;因数字“520”与“我爱你”发音相似而被许多年轻人用作表达爱意的节日。这个节日起源于中国互联网文化&#xff0c;逐渐传递到其他国家和地区。在这一天&#xff0c;情侣们通…

C++:深入理解C++11新特性:Chapter3:左值和右值

Chapter3&#xff1a;左值和右值 1. 将右值绑定到 左值2. 将右值绑定到 常量左值引用3. 将右值绑定到右值引用总结&#xff1a;5. 左值&#xff0c;右值和右值引用6. 引用类型可以引用的值 在C语言中&#xff0c;我们常常会提起左值&#xff08;lvalue&#xff09;,右值&#x…