可能是最有前途的国产大模型:讯飞星火认知大模型

news2024/11/25 10:37:02

大家好,我是可夫小子,关注AIGC、读书和自媒体。解锁更多ChatGPT、AI绘画玩法。加:keeepdance,备注:chatgpt,拉你进群。

昨天下午,科大讯飞发布了自己的大模型——星火认知大模型。在上周他们还在内测的时候,我就第一时间拿到了内测资格,通知群里的小伙伴,申请也是秒过。我简单地测试了一下,最直观感受就是「水平在线、诚意满满」。

昨天我观看了他们的发布会。关于大模型,刘庆峰主要讲了1+N的模式,1就主要是大模型的七个能力:内容创作、语义理解、知识问答、逻辑推荐、数学能力、代码能力,还有一个多模态。

loading

对于这些能力,各家的说法都不一样,无外乎就是吴恩达总结LLM的几点能力:总结、推断、转换、扩展。性能上,大语言模型的一些问题它也存在。总的来说,还算中文大模型中第一梯队。那它为什么是「可能最有前途」的那个呢?我主要有以下几点思考

与语音的结合,有天然的优势

我们知道,科大讯飞是一家做语音起家的公司。在许多场景中,前端声学处理 + 语音识别 + NLP + TTS构成了一个最基础的语音全链路技术 。科大讯飞这几十年就是在这个生意,不管是2B业务,还是2C业务。

在全链路的NLP部分,这些年使用最多还是神经网络。而以ChatGPT为代表的大语言模型,使用的是Transformer,算是一种神经网络的技术升级。讯飞的大语言模型的引用,就会对NLP作出了较大的改良。当然其实模块也有会影响,但NLP提升性能最大。

loading

我们在发布会现场也看到,科大讯飞研究院院长刘聪演示大模型案例的时候,输入是使用语音输入,再识别成文本(ASR)。回答的文本也使用了语音合成(TTS)技术读文本。可以看到,他们整合很迅速了。这些前、后端,都是他们成熟的技术,这就是他们比其他公司的优势。

与现有业务结合,快速落地商用

一个新的技术,能否迅速流行起来,就是看能不能快速融入到现有的商业模式中去。在国产大模型中,阿里的通义千问,有这样的潜质。与钉钉办公产品结合,有着立竿见影式的降本增效功能,但钉钉的商业化之路一直走得不顺。

讯飞业务中,教育占了很大比重。其实在发布会,后面也显示了「智能批改作业」的功能,这就是一个很直观的商业落地场景。这块业务,他们在市场、渠道、产品、商业模式都走通过。现在只要用大模型的能力,把这些节点都重塑、改造。小步探索,慢慢试水,就容易搞出一条大模型的变现之路。有了商业的正反馈,技术发展也会得到保障,形成商业与研发的良性互动。

loading

一些新的点

除此之外,我还看到他们关于插件、RPA的一些演示。其实这些是针对大语言模型的技术尝试。我在之前的文章《》,就介绍了OpenAI的Gerg在TED演示的一些内测功能,就有插件的应用。比如6月份,他们还会集成浏览器插件,实现实时信息搜索,可以说讯飞应用层面,没有落后太多。

loading

挑战与风险

我注意到,在昨天的发布会上,刘庆峰在介绍大模型的能力之前,就先提出一个「评测体系」的概念。一方面是想当国内大模型的执牛耳者,成为标准的制定者。还有一个考量就是边界划定。这波AI热度无疑是里程碑式的,那它目的地在哪里?安全边界又怎么界定?

这其实是当下各国政府以及科学家最担心的问题,还不说远景的AGI发展与人类的关系的思考,就当下如何保证技术不被滥用,都是一个很大的课题。讯飞想接这个瓷器活,但也不一定拿得出「金刚钻」

loading

还有一个挑战,就是「算力」。我们大模型的训练和使用就是算力猛兽,每一次请求,都是数亿次的计算。据CNBC报道,ChatGPT一次训练需要200-1200美元,用了1万个英伟达的DGX A100 GPU服务器。这些高性能的GPU,就是机器学习和图形计算的AI心脏,而英伟达占据了95%有市场,之前传闻A100和H100 GPU都不卖给中国公司了。科大在22年9月被美国列入了「实体清单」,要获得这些高性能GPU更是难上加难。

巧妇难为无米之炊,谁不能忽视悬在中国公司头上的「达摩克利斯之剑」

再有一个就是对于「智能涌现」分歧,对于大语言模型的发展,实践其实是走在理论在前面。相关研究人员发现,在ChatGPT的训练语料中,中文不到1%,但是在实际的使用过程中,中文的能力并不会比英文低很多。是不是模型在海量语料学习中,掌握各种语言之间的通用规则,出现一种「智能涌现」的能力?这其实还没有定论。1750亿的参数,就是一个黑盒子。

在刘庆峰的发言稿中,我搜索了「智能/智慧涌现」高达14次。可以看得出他对这个能力的信息,这到底是科学地乐观主义,还是盲目冒进,抑或其他原因,不得而知。

loading

后话

在知乎上,有一个网友问讯飞大模型,Who is the President of the United States?「美国的总统是谁」,大模型回答,他的知识更新是2021年9月,后面的事情它不知道。

2021年9月是一个代表性的日期,ChatGPT和GPT-4他们的训练集知识断点也是这个时间。所以也有网友怀疑,它只是调用OpenAI的API。我自己试了下,怎么回答不会再出现那个「2021年9月」了。当然,这也说明不了什么。

loading

讯飞在发布上的所有示例,都是真人现场演示,我还是觉得他们是有底气的。对此,我保持谨慎而乐观!

📣通知

我的《小白玩转ChatGPT》小册上线啦,已有180多位同学在里面学习,诸多福利一起赠送。只需一杯奶茶钱,让我们联系更紧密。

image.png

推荐阅读: ChatGPT知识库

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/499376.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

小白专用VScode从安装到入门编写_Windows_C/C++

此篇主要梳理VScode的安装、功能拓展等,包括与git管理和Cmake的结合 一、VScode下载二、VScode功能拓展2.1 VScode中文界面在线安装2.2 VScode中文界面离线安装2.3 鼠标滚轮调整字体大小2.4 调整编辑器界面大小2.5 Windows下VScode C/C环境配置2.5.1 MinGW编译器下载…

Illustrator如何创建Web图形与动画之实例演示?

文章目录 0.引言1.创建切片2.选择和编辑切片3.快速生成PNG元素图标 0.引言 因科研等多场景需要进行绘图处理,笔者对Illustrator进行了学习,本文通过《Illustrator CC2018基础与实战》及其配套素材结合网上相关资料进行学习笔记总结,本文对创建…

【Docker】docker核心概念与常用指令

目前掌握的docker处理平时工作倒是可以,但docker网络这块有些模棱两可,干脆从头整理一遍Docker。 🌳🌳【Docer篇整理】🌳🌳 篇一:docker核心概念与常用指令 篇二:镜像与docker数据卷…

【C++】vector的介绍及使用

目录 一、vector的介绍二、vector的常用接口2.1 vector的定义2.2 vector iterator的使用2.3 vector 空间增长问题2.4 vector 增删查改2.4.1.尾插和尾删2.4.2.任意位置插入和删除以及查找2.4.3.vector 的交换与遍历 2.5 vector 迭代器失效问题 一、vector的介绍 vector是表示可…

《花雕学AI》讯飞星火认知大模型的特点和优势,与ChatGPT的对比分析

引言: 人工智能是当今科技领域的热门话题,自然语言处理是人工智能的重要分支。自然语言处理的目标是让计算机能够理解和生成自然语言,实现人机交互和智能服务。近年来,随着深度学习的发展,自然语言处理领域出现了许多创…

人人开源代码

后台源代码: git clone gitgitee.com:renrenio/renren-fast.git 前端源代码: git clone gitgitee.com:renrenio/renren-fast-vue.git 自动生成源代码: git clone gitgitee.com:renrenio/renren-generator.git 关于 renren-fast-vue npm npm报…

RabbitMQ --- 惰性队列、MQ集群

一、惰性队列 1.1、消息堆积问题 当生产者发送消息的速度超过了消费者处理消息的速度,就会导致队列中的消息堆积,直到队列存储消息达到上限。之后发送的消息就会成为死信,可能会被丢弃,这就是消息堆积问题。 解决消息堆积有三种…

cenos7安装wkhtmltopdf

参考:http://www.023dns.com/server_ECS/2190.html https://blog.csdn.net/nexttrial/article/details/125504683 在Centos7 安装wkhtmltopdf,把html页面转换成pdf文档。 1、安装 yum install wkhtmltopdf 2、安装之后,执行操作&#xff…

处理 json 和 HttpMessageConverter--文件下载-ResponseEntity --SpringMVC 文件上传

目录 处理 json 和 HttpMessageConverter 处理 JSON-ResponseBody 说明: 下面是要完成的效果 准备工作 创建json.jsp 创建Dog.java , 作为返回的数据 创建JsonHandler.java 完成测试(页面方式)和 (Postman 方式) ​编辑 处理 JSON-RequestBody 应用案例 修改 json…

Masonry使用以及源码解析(未完待续

文章目录 Masonry使用约束约束优先级 以及 intrinsicContentSize相关问题 Masonry:iOS12Masonry源码解析下面是使用make.width点语法后的全部内部调用过程: Masonry使用 约束 在写Masonry之前,我想先来聊聊约束的基础知识,我们首先要了解一…

igraph的layout布局

做图论的社区检测,需要画图显示,用igraph可以进行可视化。 igraph有几个布局,分别如下: layout_with_dh : The Davidson-Harel layout algorithm Place vertices of a graph on the plane, according to the simulat…

电脑远程控制

这里介绍2种常用的电脑远程控制方式。第一种,向日葵。第二种,QQ。 向日葵 --- 推荐 支持 Mac、Windows、Linux、iOS、Android。 Mac 版向日葵如果想让别人控制你的电脑,安装完向日葵以后要在 Mac 的“安全与隐私”开启几个权限才能被对方正…

node笔记_写文件(异步写入,同步写入,追加写入,流式写入)

文章目录 ⭐前言⭐写文件💖writeFile写入写一个txt文件 💖writeFileSync同步写入写一个txt文件 💖appendFile 追加写入追加写入一个txt 💖createWriteStream流式写入流式写入txt ⭐ 结束 ⭐前言 大家好,我是yma16&…

【计算机网络】 总结复习(2)

tcp tcp 工作在传输层可靠的数据传输服务,确保传输数据是无损坏,无间隔,非冗余按序 一些知识点 服务端最大并发 TCP 连接数远不能达到理论上限,会受以下因素影响: 文件描述符限制,每个 TCP 连接都是一个文…

HTML-CSS学习笔记

day1-01.CSS的元素显示模式 元素的显示模式就是元素&#xff08;标签&#xff09;以什么方式进行展示&#xff0c;比如<div>自己占一行&#xff0c;<span>一行可以放多个。 HTML元素一般分为块元素和行内元素两种类型。 块元素 如果在p标签中放了div标签&#xff…

操作系统——存储管理方式

目录 1.分区存储管理 1-1单一连续分配 1-1-1基本原理&#xff1a; 1-1-2单一连续分区存储管理的地址变换与地址保护 1-1-3管理特点 1-2固定分区分配 1-2-1基本原理 1-2-2分区划分 1-2-3主存空间的分配与回收 1-2-4地址转换与存储保护 1-2-5管理特点 1-3动态分区分配…

软考信管高级——风险管理

风险管理内容 风险管理计划 包含的内容&#xff1a; (1)方法论 (2)角色与职责 (3)预算 (4)时间安排 (5)风险类别 (6)风险概率和影响的定义 (7)概率和影响矩阵 (8)修订的干系人承受力 (9)报告格式 (10)跟踪 风险类型和应对措施 可能遇到的风险&#xff1a; (1)需求风险;(2)技术…

CSS布局基础(精灵图 字体图标 css 三角图标)

精灵图 & 字体图标 精灵图使用字体图标下载字体图标使用方式icomoon阿里 iconfontttf 字体 unicodecss 方式js 方式 更新字体图标icomoon阿里 iconfont css三角图标标准三角&#xff08;垂直的两边相等&#xff09;先来个普通盒子&#xff08;当然是五彩斑斓的边&#xff…

《编程思维与实践》1052.删除注释

《编程思维与实践》1052.删除注释 题目 思路 将所有可能的情况枚举出来: 1.在有效的块注释内: 有效是指块注释不在引号内,如char *s" \ * xxxxxxx *\ "就不是一个有效的块注释, 这种情况下跳过之后所有的内容,直到遇到*/后才重新判断情况; 2.在有效的行注释内: 同理…

ChatGPT :国内免费可用 ChatGPT +Midjourney绘图

前言 ChatGPT&#xff08;全名&#xff1a;Chat Generative Pre-trained Transformer&#xff09;&#xff0c;美国OpenAI 研发的聊天机器人程序 &#xff0c;于2022年11月30日发布 。ChatGPT是人工智能技术驱动的自然语言处理工具&#xff0c;它能够通过理解和学习人类的语言来…