超越GPT4 Turbo?科大讯飞发布星火认知大模型3.5版本

news2024/11/28 4:50:06

34b77e4ecb48e663e8586fbf7abb57e0.jpeg简介

1月30日,科大讯飞举行星火认知大模型V3.5升级发布会。科大讯飞董事长刘庆峰、研究院院长刘聪正式发布基于首个全国产算力训练的讯飞星火V3.5,七大核心能力全面提升。

功能展示多模交互

  • 多模理解:上传图片素材,大模型完成识别理解,返回关于图片的准确描述
  • 视觉问答:围绕上传图片素材,响应用户的问题,大模型完成回答
  • 多模生成:根据用户的描述,生成符合期望的合成音频和视频
  • 虚拟人视频:描述期望的视频内容,整合AI虚拟人,快速生成匹配视频

代码能力

  • 代码生成:智能生成单行或函数级代码建议;根据注释、函数名自动生成代码
  • 代码解释:类、函数及其作用逐一详解;支持逐行代码注释;学习海量范式,快速精准解读
  • 代码纠错:精准定位拼写、语法、逻辑错误;新老代码比较,支持一键修改
  • 单元测试:选中代码,一键生成单测用例;多主流单元测试框架;智能生成单元测试数据

本文生成

  • 商业文案:根据用户要求,创作具有吸引力与情感共鸣的商业文案
  • 营销方案:根据描述,创作多种形式的营销方案
  • 英文写作:使用英文完成多风格多任务的的长写作任务
  • 新闻通稿:根据新闻要素,创作严谨详实的新闻通稿

数学能力

  • 方程求解:包括一元二次方程、二元一次方程、三元一次方程等等
  • 几何问题:平面几何(如直线、圆、三角形等的性质)和立体几何(如体积、表面积、投影等)
  • 微积分处理:导数、积分等微积分相关的问题,涉及基本概念如极限、连续性、导数等
  • 概率统计:涉及随机变量、概率分布、假设检验等方面的内容

语言理解

  • 机器翻译:翻译多种语言的文字,包括英语、中文、法语、德语、西班牙语等常用语种
  • 文本摘要:根据文本提取简洁而准确的摘要,快速理解文章的核心观点
  • 语法检查:检查语法错误并提供正确的语法建议,使写作更加规范与专业
  • 情感分析:分析文本中的情感色彩,如正面、负面或中性,更好了解内容观点和态度

知识问答

  • 生活常识:提供有关日常生活的知识,如饮食、运动、旅游等方面的建议
  • 工作技能:提供工作方面的知识,如沟通技巧、时间管理技巧、团队协作等方面的建议
  • 医学知识:提供基本的健康保健知识以及疾病预防、诊断和治疗方面的建议
  • 历史人文:提供有关历史事件、文化传承、名人故事、名言警句等方面的文案

逻辑推理

  • 思维推理:通过分析问题的前提条件和假设来推理出答案或解决方案,给出新的想法和见解
  • 科学推理:使用已有的数据和信息进行推断、预测和验证等科学研究中的基本任务
  • 常识推理:在进行对话交流时,运用已有的常识知识来分析、解释和回应用户的提问或需求

实测结果讯飞星火认知大模型对外宣传数学能力超越GPT4 turbo,那么实测如何呢?5f1fd416ccde0f2408331d3d55a2adae.jpeg

在SuperCLUE-Math6中文数据多步推理测评基准上,讯飞星火V3.5取得80.44的高分,较上一代讯飞星火V3.0有43.05分的提升;较GPT4略低3.42分,较GPT4-1106-Preview低7.32分。2e2bc7fc633aea8e99b7e5c29b7b4ea1.jpeg

讯飞星火V3.5在SC-Math6基准上准确率表现优异,取得78.81分,位列在榜国内模型中第二。两轮问题准确率差值在13.15分,在深入推理稳定性上较GPT4(差值7.93分)还有提升空间。

总结

从结果上来看,讯飞星火V3.5在数学多步推理能力上处于国内第一梯队但与GPT4还有一定差距。其中随着推理步骤的增加,讯飞星火V3.5在深入推理方面表现不俗,同时有很好的指令遵循能力。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1425577.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C++/数据结构:二叉搜索树的实现与应用

目录 一、二叉搜索树简介 二、二叉搜索树的结构与实现 2.1二叉树的查找与插入 2.2二叉树的删除 2.3二叉搜索树的实现 2.3.1非递归实现 2.3.2递归实现 三、二叉搜索树的k模型和kv模型 一、二叉搜索树简介 二叉搜索树又称二叉排序树,它或者是一棵空树&#xff0…

vue——实现多行粘贴到table事件——技能提升

最近在写后台管理系统时,遇到一个需求,就是要从excel表格中复制多行内容,然后粘贴到后台系统中的table表格中。 如下图所示:一次性复制三行内容,光标放在红框中的第一个框中,然后按ctrlv粘贴事件&#xff0…

路由备份聚合排错

目录 实验拓扑图 实验要求 实验排错 故障一 故障现象 故障分析 故障解决 故障二 故障现象 故障分析 故障解决 故障三 故障现象 故障分析 故障解决 故障四 故障现象 故障分析 故障解决 故障五 故障现象 故障分析 故障解决 实验拓扑图 实验要求 按照图示配…

Typora导出html文件图片自动转换成base64

Typora导出html文件图片自动转换成base64 一、出现问题二、解决方案三、编码实现3.1.创建Java项目3.2.代码3.3.打包成Jar包 四、如何使用endl 一、出现问题 typora 导出 html 的时候必须带有原图片,不方便交流学习,文件太多显得冗余,只有将图…

Docker中安装MySql的遇到的问题

目录 一、mysql查询中文乱码问题 1. 进入mysql中进行查看数据库字符集 2. 修改 my.cnf 中的配置 3. 重启mysql容器,使得容器重新加载配置文件 4. 测试结果 二、主从同步中遇到的问题 2.1 Slave_IO_Running:Connecting 的解决方案 1. 确定宿主机防火墙开放my…

node.js与express.js创建项目以及连接数据库

搭建项目 一、技术准备 node版本:16.16.0 二、安装node成功后,安装express,命令如下: npm install -g express 或者: npm install --locationglobal express 再安装express的命令工具: npm install --location…

PVE安装后报错:NO IOMMU Detected解决办法

1、首先在BIOS中确定图形界面卡,打开了VT-D功能。 2、修改grub vim /etc/default/grub 找到:GRUB_CMDLINE_LINUX_DEFAULT"quiet" 然后修改为 GRUB_CMDLINE_LINUX_DEFAULT"quiet intel_iommuon" 3、使用命…

巨人踏步,港口自动驾驶提速向前打开行业新空间

按照吞吐量排名,全世界最大的50个港口,中国占了29个。在中国的港口和码头上,一场进化正在发生:人在这个生态中占的比重越来越少,技术接管的要素正在越来越多。像是最具代表性的全球综合自动化程度最高的码头——上海洋…

笔记本电脑Win11重装系统教程

在笔记本电脑Win11操作过程中,用户如果遇到很严重的系统问题,就可以重新正常的Win11系统,快速解决Win11系统问题。但是,部分新手用户不知道不知道如何操作才能给Win11笔记本电脑重装系统?以下小编分享笔记本电脑Win11重…

深入理解TCP网络协议(2)

目录 1.TCP的状态转换 1.1 LISTEN状态和ETABLISHED状态 ​编辑2.TIME_WAIT 和 CLOSE_WAIT 2.滑动窗口 1.TCP的状态转换 我们通过上图可以看到TCP状态转换的详细过程.在实际开发的过程中,我们不需要了解的这么细致.为了方便大家的理解,我挑几个主要的状态来给大家聊一下 1.…

易语言系列学习1

通过本文章你会学习到 如果 如果真 获取编辑框内容 关闭本程序 监听按键让它等价于点击某个按钮 运算:或 且 非(注意中间要有一个空格,否则会报错) 效果 .版本 2.程序集 窗口程序集_启动窗口.子程序 _按钮2_被单击. 如果真 (编…

docker-学习-4

docker学习第四天 docker学习第四天1. 回顾1.1. 容器的网络类型1.2. 容器的本质1.3. 数据的持久化1.4. 看有哪些卷1.5. 看卷的详细信息 2. 如何做多台宿主机里的多个容器之间的数据共享2.1. 概念2.2. 搭NFS服务器实现多个容器之间的数据共享的详细步骤2.3. 如果是多台机器&…

Vue学习笔记(一)JS导入导出

Vue学习笔记(一)JS导入导出 js文件-导出、批量导出、默认导出 showMessage.js export function simpleMessage(msg){console.log(msg); }export function complexMessage(msg){console.log(new Date()": "msg); }// 批量导出 // export {si…

[工具探索]Safari 和 Google Chrome 浏览器内核差异

最近有些Vue3的项目,使用了safari进行测试环境搞开发,发现页面存在不同程序的页面乱码情况,反而google浏览器没问题,下面我们就对比下他们之间的差异点: 日常开发google chrome占多数;现在主流浏览器 Goog…

stm32--simulink开发之--timer的学习,硬件输入中断,触发事件,STM32通用定时器之输出比较模式与PWM模式(重要理解)

下面三个模块,一个比一个高级,当然使用是越来越简单 STM32F4xx系列控制器有2个高级控制定时器、10个通用定时器和2个基本定时器(推荐学习) 1,第一个模块:Timer 浅层理解:计数,不停的触发 Starts timer co…

Nginx简单阐述及安装配置

目录 一.什么是Nginx 二.Nginx优缺点 1.优点 2.缺点 三.正向代理与反向代理 1.正向代理 2.反向代理 四.安装配置 1.添加Nginx官方yum源 2.使用yum安装Nginx 3.配置防火墙 4.启动后效果 一.什么是Nginx Nginx(“engine x”)是一个高性能的HTTP…

【百度Apollo】探索创新之路:深入了解Apollo开放平台

🎬 鸽芷咕:个人主页 🔥 个人专栏: 《linux深造日志》《粉丝福利》 ⛺️生活的理想,就是为了理想的生活! ⛳️ 推荐 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下…

vue3页面跳转产生白屏,刷新后能正常展示的解决方案

可以依次检查以下问题: 1.是否在根组件标签最外层包含了个最大的div盒子包裹内容。 2.看看是否在template标签下面直接有注释,如果有需要把注释写到div里面。(即根标签下不要直接有注释) 3.在router-view 中给路由添加key标识。 …

通过Netbackup恢复Oracle备份实操手册

1、系统环境描述 1 2、恢复前数据备份 2 2.1 在NBU上执行一次完整的备份 2 2.2 查看ORACLE的备份集 3 2.2.1在备份客户端上查看备份集 3 2.2.2在备份服务器netbackup上查看客户端备份集 4 3、本机恢复方法 5 3.1丢失SPFILE文件恢复方法 5 3.2丢失CONTROLFILE文件恢复方…

【Week-P7】VGG16识别咖啡豆

Week-P7 VGG16识别咖啡豆 一、环境配置二、准备数据三、搭建网络结构 VGG16四、开始训练五、查看训练结果六、改变优化器,VSCode运行 🍨 本文为🔗365天深度学习训练营 中的学习记录博客🍖 原作者:K同学啊 | 接辅导、项…