名人说:一花独放不是春,百花齐放花满园。——《增广贤文》
作者:Code_流苏(CSDN)(一个喜欢古诗词和编程的Coder😊)目录
- 一、简要介绍
- 二、分类问题测试
- 0️⃣自我介绍
- 1️⃣语言理解
- 2️⃣知识问答
- 3️⃣逻辑推理
- 4️⃣数学题解答
- 5️⃣代码理解与编写
- 三、体验感受
★观前提示:以下内容仅为内测测试内容,不代表未来正式版如何,或许你认为它与chatgpt仍有不小的差距,或许你认为它目前做的已经不错了,都可以,但是咱们测试体验,只讲述体验,本篇文章不做对比。
一、简要介绍
讯飞星火认知大模型官网,官网可预约内测
讯飞星火认知大模型是一款由讯飞公司开发的人工智能系统,它集成了多种认知能力,如语言理解、知识获取、内容生成、任务执行和模型评估,可以应用于多个领域和场景。
那么星火大模型可以做什么呢?
如图,各种方面、丰富的用途。
讯飞星火认知大模型真的有这么厉害吗?它能否通过一些测试来证明其能力和价值?我决定用这些问题来挑战讯飞星火认知大模型,看看它能否给我惊喜的答案。
二、分类问题测试
测试采用多类问题提问,以检验其多方面的功能究竟如何。
0️⃣自我介绍
1、介绍自己
2、介绍chatgpt
3、介绍文心一言
4、介绍通义千问
5、你觉得你相比于它们的优势在哪里?
自我介绍部分,整体来看回答的还不错,而且在问它相比于其它模型的优势在哪里时,它巧妙地避开了,直接说自身的各类优势的回复,而是选择了另一种说法,表明各有优势。是一个有趣的模型,接下来测试其它部分。
1️⃣语言理解
1、你认为汉语和英语有什么相同和不同之处?
2、你能说出几个常见的成语,并解释它们的意思吗?
3、千古绝对,烟锁池塘柳,你知道什么意思吗?
额外小测试
请你接一下 “烟锁池塘柳” 下联
4、请你帮我翻译一下以下这段内容(内容节选自考研英语一的翻译):
语言理解这一块来看,目前感觉真的还不错,大多数问题都能够较为准确地回答出来,而且在说一句绝对的下联的时候,它接的也没有很扯,烟锁池塘柳,雨打琵琶声。可能没有上联那么细节,但是也不拗口(非专业评价,欢迎熟悉对联的大佬评论指点一二)。
2️⃣知识问答
1、地球是太阳系中的第几颗行星?
太阳系还有哪些行星?
冥王星为什么不属于其中?
关于问“太阳系还有哪些行星?”,我期待的回答是,除了地球还有哪几个行星,但是它的回复直接把太阳系的八大行星都写了出来。不过这些问题整体回答都还可以。
2、莫扎特是哪个国家的音乐家?
他的代表作有哪些?
百科对比:
3、今天厦门天气怎么样?
4、什么是达尔文的进化论,它是如何解释生物的多样性和适应性的?
关于知识问答这一部分,测试了几个模型,感觉讯飞的星火模型,回答的效果感觉中等偏上,还不错,接下来进入逻辑推理部分。
3️⃣逻辑推理
1、如果明天下雨,我就不去上班。明天不下雨,我会去上班吗?
这个回答确实可以,能综合的考虑到其它因素。
2、所有的猫都有四条腿,一些猫是黑色的。所有的黑色动物都有四条腿吗?
赞赞赞
3、果A说“B在说谎”,B说“C在说谎”,C说“A和B都在说谎”,那么谁在说真话?
4、如果有三个盒子,其中一个盒子里有一枚金币,另外两个盒子里都是银币。每个盒子上都有一个标签,分别是“金币”、“银币”和“金币或银币”。但是这三个标签都贴错了位置,也就是说每个盒子上的标签都不符合盒子里的内容。那么你应该打开哪个盒子,才能找到金币?
正确答案:应该打开标签是“银币”的盒子,才能找到金币。因为标签都贴错了位置,所以标签是“金币”的盒子里一定不是金币,标签是“金币或银币”的盒子里一定不是金币或银币,而是另一种。所以只有标签是“银币”的盒子里才可能是金币。
与正确答案有一定出入,不过前面几个问题回答的效果都还不错。
4️⃣数学题解答
1、2+3×4-5=?
2、已知直角三角形ABC中,AB=3,BC=4,求AC=?
3、已知一个圆的半径是2,一个正方形的边长是4,这两个图形的面积之比是多少?
4、已知一个等差数列的前三项分别是2,5,8,求这个数列的第n项和前n项的和。
整体来说,回答的准确率还挺高的,超出预期,不错,赞!
5️⃣代码理解与编写
1、请你帮我解释一下这段代码
#include<iostream>
using namespace std;
const int maxn = 101;
int n, m, a[maxn][maxn];
int main()
{
//输入矩阵的行数n和列数m
cin>>n>>m;
//输入矩阵a
for(int i = 1; i <= n; i++)
{
for(int j = 1; j <= m; j++)
{
cin>>a[i][j];
}
}
//输出"转置"后的矩阵a
for(int j = 1; j <= m; j++)
{
for(int i = 1; i <= n; i++)
{
cout<<a[i][j]<<" ";
}
cout<<endl;
}
return 0;
}
2、请你用C++编写一段代码,实现两个整数相加,并返回结果。
给出的代码:
#include<iostream>
using namespace std;
int add(int a, int b) {
return a + b;
}
int main() {
int num1, num2;
cout << "请输入两个整数:" << endl;
cin >> num1 >> num2;
cout << "两数之和为:" << add(num1, num2) << endl;
return 0;
}
测试运行结果:
请输入两个整数:
1 2
两数之和为:3
--------------------------------
Process exited after 1.59 seconds with return value 0
请按任意键继续. . .
3、请你用C++实现栈的基本操作
给出的代码:
#include <iostream>
#include <vector>
using namespace std;
class Stack {
public:
void push(int value) {
data.push_back(value);
}
void pop() {
if (isEmpty()) {
cout << "栈为空,无法弹出元素" << endl;
return;
}
data.pop_back();
}
int top() const {
if (isEmpty()) {
cout << "栈为空,无法获取顶部元素" << endl;
return -1;
}
return data.back();
}
int size() const {
return data.size();
}
bool isEmpty() const {
return data.empty();
}
private:
vector<int> data;
};
int main() {
Stack stack;
stack.push(1);
stack.push(2);
stack.push(3);
cout << "栈顶元素: " << stack.top() << endl;
stack.pop();
cout << "弹出栈顶元素后,栈顶元素: " << stack.top() << endl;
cout << "栈的大小: " << stack.size() << endl;
cout << "栈是否为空: " << stack.isEmpty() << endl;
return 0;
}
运行测试结果:
栈顶元素: 3
弹出栈顶元素后,栈顶元素: 2
栈的大小: 2
栈是否为空: 0
--------------------------------
Process exited after 0.06803 seconds with return value 0
请按任意键继续. . .
代码理解与编写部分,代码编写良好,不过,比较令人头大的是,它中间加了许多的空格,影响了整体的可阅读性,整体中规中矩,还不错。
三、体验感受
首先很荣幸能够参加讯飞星火大模型的内测,经过这些测试,我对讯飞星火认知大模型的能力和价值有了更深刻的了解和认识。我发现讯飞星火认知大模型不仅能够理解不同语言的语法、语义、情感和逻辑,还能够从互联网或其他数据源获取相关的知识和信息,以及根据给定的主题、风格或目的生成有创意和有价值的内容,如诗歌、故事、代码、摘要等。它还能够执行一些特定的任务,如问答、对话、推荐、翻译等,并且能够自我评估其生成的内容或执行的任务的质量和效果。
个人觉得讯飞星火认知大模型是一款还不错的人工智能系统,它为我们提供了一个新的视角和工具来探索和创造这个丰富多彩的世界。一些不足相信后续应该也会不断迭代完善,不过刚刚发布体验也没多久,星火大模型还在不断地学习和进步。我也相信它未来会变得更好更强大,它会给我们带来更多的惊喜和价值。真心期待国内百花齐放、百家争鸣的局面!(〃 ̄o ̄) 人 ( ̄︶ ̄〃)
关于测试暂时测试这些,很感谢你能看到这里,如有相关疑问,还请下方评论留言。
Code_流苏(CSDN)(一个喜欢古诗词和编程的Coder😊)
如果对大家有帮助的话,希望大家能多多点赞+关注!这样我动力会更足哦! ღ( ´・ᴗ・` )比心