1月30日,科大讯飞召开星火认知大模型V3.5升级发布会,这是国内首个基于全国产算力训练的多模态认知大模型。科大讯飞董事长刘庆峰先生、研究院院长刘聪先生出席了大会,并对最新产品进行了多维度解读。
讯飞星火V3.5的7大核心能力实现全面大幅度提升:文本生成7.3%,语言理解7.6%,知识问答4.7%,逻辑推理9.5%,数学能力9.8%,代码能力8.0%,多模态能力6.6%。
其中,数学、语言理解和语音交互3大核心能力超越GPT-4 Turbo;代码能力达到GPT-4 Turbo 96%,多模态理解达到GPT-4V 91%,成为国产最强多模态大模型之一。
此外,科大讯飞还首次开源了深度适配国产算力平台,130亿参数的iFlytekSpark-13B。这是对前不久美国限制中国使用其云服务训练AI大模型的,一次强有力证明——中国完全可以靠自研踏踏实实地走出自己的大模型发展之路。
讯飞星火V3.5免费体验地址:https://xinghuo.xfyun.cn/?ch=48NE9z
讯飞星火V3.5七大核心能力全面提升
由于美国对中国芯片的疯狂打压和封锁,使得国内各大厂商在大模型的预训练、微调等领域,面临前所未有的困境。最近,美国又限制中国用户使用其云服务,训练、发展AI大模型。
为了解决这些难题,2023年10月24日,科大讯飞携手华为,宣布首个支撑万亿参数大模型训练的万卡国产算力平台“飞星一号”正式启用。启用后的90多天里,讯飞星火突飞猛进,打造了对标GPT-4全国产、功能强大的多模态认知大模型——讯飞星火V3.5。
作为首个基于全国产算力训练的全民开放大模型讯飞星火V3.5,在语言理解、文本生成、知识问答、逻辑推理、数学、代码生成和多模态7个核心功能进行了全面大幅度升级。
其中语言理解、数学能力、语音交互3大能力超过GPT-4 Turbo,代码达到GPT-4 Turbo 96%,多模态理解达到GPT-4V 91%。
这惊人的成绩背后,不仅得益于讯飞星火V3.5在语义理解、指令调优和多轮对话的演示中展现的优异能力,在情绪感知和拟人合成方面的出色表现。
在实操演示环节,刘聪和讯飞星火V3.5现场互动,“听说今年尔滨特别火,作为南方小土豆还挺想去玩一下的。要不你用东北话介绍下有啥好玩的呗?”
讯飞星火V3.5一口地道的东北话逗乐现场观众,并快速为其定制了详细的旅游攻略,还催促他赶快买票,因为春运的机票比较紧俏。
星火开源-13B
为了帮助国内各行业快速打造适用于特定领域的AI助手,科大讯飞首次开源了深度适配国产算力,拥有130亿参数的iFlytekSpark-13B模型(星火开源-13B),并对学术机构和企业免费开放使用。
昇思MindSpore地址:https://xihe.mindspore.cn/modelzoo/iflytek/introduce
启智社区地址:https://openi.pcl.ac.cn/iflytek/iFlytekSpark-13B
Gitee地址:https://gitee.com/iflytekopensource/iFlytekSpark-13B
本次开源,既包含基础模型iFlytekSpark-13B-base、精调模型iFlytekSpark-13B-chat,也开源了微调工具iFlytekSpark-13B-Lora、人设定制工具iFlytekSpark-13B-Charater,可帮助企业、学术机构基于这些全栈自主创新的星火优化套件,高效、快速地训练出专属大模型。
据悉,iFlytekSpark-13B在累计超3万亿tokens海量高质量数据集上进行了预训练,然后在精调的多元化对齐数据上进行微调。
iFlytekSpark-13B具备通用任务处理能力如聊天、问答、文本提取和分类等,还能提供数据分析和代码生成等生产力功能。尤其是在学习辅助、数学、推理等领域进行了深度优化,大幅提升模型的实用性和易用性。
iFlytekSpark-13B在MMLU、CMMLU、ARC等8个知名数据集上进行了综合测试,其能力大幅度优于同参数量级的开源模型。
星火语音大模型
会上,科大讯飞还正式发布了星火语音大模型。刘庆峰介绍,星火语音大模型效果国际领先,中文、英语、法语、俄语等首批37个主流语种的语音识别效果超过OpenAI Whisper V3;
在多语种语音合成方面,星火语音大模型的首批40个语种平均MOS分绝对提升0.25,拟人度超83%。
星火语音大模型API申请地址:https://xinghuo.xfyun.cn/speechllm
在此优势下,语音大模型的能力升级也应用于C端硬件产品。刘庆峰深度介绍了搭载语音大模型的讯飞翻译机,以及即将上线多语种自动识别和增强式翻译两个重要功能,分别于今年1月底和3月中旬完成升级。
升级后的多语种自动识别将支持35种语言,使得跨国、跨语言沟通更加高效、准确、便捷。
应用场景方面,星火语音大模型将为汽车、客服、家庭、商业、陪伴机器人等场景带来智能化语音交互,例如,智能驾驶舱、智能导航、智能音乐控制等。
在星火语音大模型的助力下,将帮助各领域头部厂商,打造变革语音交互新生态。
一句话生成PPT——讯飞智文
发布会现场,科大讯飞还首次发布了讯飞智文这一超强AI产品。用户可选择“主题创建”、“文本创建”、“文档创建”和“自定义创建”四种模式,只需一句话就能快速生成各种精美PPT。
免费体验地址:https://zhiwen.xfyun.cn/?ch=v35-zw
例如,选择主题创建,然后输入“帮我生成一份关于减肥的计划指南”。讯飞智文会快速生成PPT的文本大纲,并且用户可以对生成的内容进行二次编辑非常人性化。
确定大纲内容后,点击下一步,用户选择PPT文档样式,有紫影幽蓝、清新翠绿、清逸天蓝 、质感之境等多种样式,适用于不同的业务场景。
全部确定后,讯飞智文会对大纲内容进行分析、拆解、渲染模板、生成配图等一系列智能自动化操作。
短暂等待之后,一份35页的超精美、详细减肥计划PPT就自动完成了,用户可以将PPT导出用于实际业务或二次修改。值得一提的是,整个PPT生成流程仅用了几分钟。
这个利器对于那些厌倦写PPT或写PPT没灵感的小伙伴来说非常高效、便捷,可以将几天的PPT制作时间压缩至几分钟!
积累数千万用户,打造多领域大模型开发者生态
自讯飞星火大模型发布以来,已成功聚集超过2400万用户,通过写作、医疗、法律、情感咨询、电商运营、社交平台等特定行业的AI助手,帮助他们提升工作效率、激发灵感和节省大量时间。
例如,医学科普作家通过讯飞星火高效撰写专业的肝脏健康文章,以通俗易懂方式普及医学知识;
情感咨询师通过讯飞星火快速了解“人际关系与情感纠葛”等复杂的心理难题,帮助那些有心理疾病的人。
此外,讯飞星火打造的内容创作平台,一站式图文、音频与视频等优质内容生成,赋能百万内容生产者实现降本增效。释放生产力的同时还能打造独具特色的个人IP。
目前,讯飞星火大模型的开发者总数已超过35万,其中企业开发者22万,遍布企业服务、教育培训、智能客服、医疗健康等领域。
典型客户包括:交通银行、招商银行、太平洋保险、广汽、奇瑞、长安、中国石化、中国能源集团、中国绿发等,国内各行业的头部企业。
随着讯飞星火大模型不断技术创新和功能迭代,开发者生态将继续保持高速增长势头,成为国内开发者应用最多的国产大模型之一。
最后,刘庆峰董事长表示,“通过这场发布会,科大讯飞将展现出一个充满希望、孕育着生长能量的春天。
相信2024年,讯飞星火V3.5大模型能以星火燎原之势,赋能各行业实现场景化应用落地,向着AGI通用人工智能大步迈进。同时科大讯飞将在大模型的底层能力的技术研发、安全控制等方面,更上一层楼。”
关注讯飞星火官网,免费使用讯飞星火V3.5,赶快来体验众多全新功能吧!
本文素材来源讯飞星火官网,如有侵权请联系删除
END