商汤科技「日日新4.0」正式发布,多维度升级大模型体系,能力比肩GPT-4!

news2024/12/29 10:29:17

文 | BFT机器人 

图片

近日,商汤科技正式发布「日日新SenseNova 4.0」,宣告大模型体系多维度全面升级。这款模型具备更全面的知识覆盖、更可靠的推理能力,以及更优越的长文本理解和数字推理能力。同时,它还支持跨模态交互,为不同应用场景提供了强大的支持。

商汤科技推出的「日日新·商量大语言模型-通用版本(SenseChat V4)」,具备强大的语言能力,支持128K语境窗口长度,整体评测成绩水平比肩GPT 4,相较GPT 3.5已经实现了全面超越。为了方便开发者使用,商汤还推出了Function call & Assistants API版本的大语言模型,显著降低了使用大模型的门槛。

图片

基于最新发布的Function call & Assistants API版本大语言模型,商汤科技已经开发并发布了数据分析工具“办公小浣熊”。此外,商汤还将大模型能力转化为实际场景的产品应用,推出了面向办公场景的商汤⽇⽇新·商量语⾔⼤模型-数据分析版本、面向医疗场景的日日新·商量语言大模型-医疗版本“大医”、 面向自动驾驶及工业场景的日日新·商量多模态大模型,以及面向创作创意场景的日日新·秒画文生图大模型等丰富的工具。

目前,商汤科技的「日日新SenseNova」大模型体系已经与在金融、手机、医疗、汽车、地产、能源、传媒、工业制造等众多垂直行业超过500家客户建立深度合作,加速了行业企业的智能化转型。未来,商汤将继续推动「日日新SenseNova」大模型体系及相关产品和工具的发展,为实现通用人工智能(AGI)提供有力支持,助力全场景、多产业实现智能化升级。

最高支持12万文字长文本

   综合成绩比肩GPT-4

「日日新SenseNova 4.0」为开发者提供了丰富而灵活的API接口和服务,使他们可以根据实际应用需求轻松调用大模型的AI技术能力。这种设计理念旨在降低成本、提高效率,从而加速各类AI应用的实现。

大模型性能提升的关键在于语言建模能力的增强。「日日新SenseNova 4.0」在语言建模方面实现了全新升级,推出了「日日新·商量大语言模型-通用版本(SenseChat V4)」。该模型支持不同长度的token窗口,包括4k、32k和128k,进一步扩大了模型的应用范围。

图片

图片

在能力提升方面,SenseChat V4在知识理解阅读理解综合推理数理代码长文本理解等领域展现出强大的通用能力。综合整体评测成绩水平比肩GPT-4,尤其在推理和代码编程测评中,表现甚至超越了GPT-4。在权威测试集HumanEval Coding的测试中,一次通过率高达75.6%,这一数据优于GPT-4的74.4%。

构建专业大模型

  填补行业空缺

除了基础模型,商汤科技还致力于通过高效融合垂直领域知识,帮助人们构建各类专业大模型,从而降低大模型的下游应用成本和门槛。这一目标旨在推动大模型技术在更多领域的应用和普及。

在技术演进方面,多模态成为人工智能大模型的重要方向

商汤科技的新一代「日日新 SenseNova」推出了拥有300亿参数的日日新·商量多模态大模型(SenseChat-Vision V4),其图文感知能力在全球范围内处于领先水平。在权威评测基准测试集MME Benchmark上,该模型的综合得分排名首位,展现了出色的性能表现。

图片

目前,该模型已经支持智能驾驶智能车舱电力行业等多个实际场景的应用。与传统的OCR能力相比,日日新·商量多模态大模型不仅能理解图像中的文字和物体,还能根据逻辑进行推理,实现了更高程度的认知能力。这一特点使得该模型在处理复杂场景和任务时具有更高的灵活性和准确性。

办公与数据分析领域,商汤科技推出了日日新·商量语言大模型-数据分析版本(SenseChat-DataAnalysisCode V4)。这款工具具备强大的自然语言输入功能,结合商汤大模型的意图识别、逻辑理解与代码解释器的能力,能够自动将数据转化为有意义的分析和可视化结果。

图片

在实际应用方面,该工具已经广泛支持xls、xlsx、csv、txt、json等格式的文件和表格处理。在1000+测试集的精度上,办公小浣熊的表现略胜于GPT-4。这一优势使得该工具在处理复杂的数据分析任务时更加高效和准确。

此外,在医疗健康领域,商汤科技也对大语言模型的医疗版本进行了全新升级。日日新·商量语言大模型-医疗版本“大医”(SenseChat-Medical V4)在本次更新后,实现了专业医学问答及复杂医学任务推理的功能。同时,该模型还支持更多模态医学文件的智能解读和交互问答。

图片

在两项行业权威评测中,大医的表现均非常出色。在2023年职业药剂师考试大模型评测和中文医疗大语言模型开放评测平台MedBench中,大医的综合评分均排名第二,性能接近GPT-4。这一成绩充分证明了其在医疗领域的强大实力和广泛应用前景。

商汤科技自主研发的日日新-秒画文生图大模型(SenseMirage V4)相较于前一版本,参数量大幅提升至百亿量级。通过采用Mixture of text experts、Spatial-aware CFG等先进的算法优化,该模型的语义理解能力与图像质感细节表现得到了显著增强,能够达到电影级海报的生成水平。

图片

同时,结合Adversarial Distillation算法,商汤科技还发布了秒画SenseMirage-Turbo V4版本。相较于基础版本,该版本在推理速度上实现了10倍的提升。这一显著的优势使得秒画SenseMirage-Turbo V4在处理大规模图像生成任务时更加高效,为实际应用提供了更加强大的支持。

结语

自23年商汤科技推出「日日新 SenseNova」大模型体系以来,这一创新产品形态已成为大模型技术落地应用的重要尝试之一。该体系为企业用户提供了丰富的AI应用工具和服务,使得超过3000家企业能够快速融入大模型技术应用领域,覆盖了互联网、游戏、文旅、教育、医疗健康、金融和编程等多个行业。

图片

商汤科技始终致力于降低大模型的使用门槛,通过不断的技术创新和产品优化,拓展人工智能在各行业的落地场景。这一目标使得大模型技术真正在行业中得到了广泛应用,为各行业带来了更高效、智能的解决方案。

未来,商汤科技将继续推进「日日新 SenseNova」大模型体系的建设,实现更多创新场景的应用。通过不断的技术创新和产品升级,商汤将不断推动大模型的前置化,让更多的智能走向更多场景、更多行业。

若您对该文章内容有任何疑问,请与我们联系,我们将及时回应。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1445026.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

给定具体日期 返回给定日期是星期几 calendar.weekday(year,month,day)

【小白从小学Python、C、Java】 【计算机等考500强证书考研】 【Python-数据分析】 给定具体日期 返回给定日期是星期几 calendar.weekday(year,month,day) [太阳]选择题 如果2024年2月12日是星期一,请问最后一个print语句的运行结果是? import calenda…

【Spring学习】Spring Data Redis:RedisTemplate、Repository、Cache注解

1,spring-data-redis官网 1)特点 提供了对不同Redis客户端的整合(Lettuce和Jedis)提供了RedisTemplate统一API来操作Redis支持Redis的发布订阅模型支持Redis哨兵和Redis集群支持基于Lettuce的响应式编程支持基于JDK、JSON、字符…

【教3妹学编程-算法题】执行操作后的最大分割数量

2哥 : 3妹,今年过年收到压岁钱了没呢。 3妹:切,我都多大了啊,肯定没收了啊 2哥 : 俺也一样,不仅没收到,小侄子小外甥都得给,还倒贴好几千 3妹:哈哈哈哈,2叔叔&#xff0c…

JAVA学习笔记9

1.Java API 文档 1.java类的组织形式 2.字符类型(char) 1.基本介绍 ​ *字符类型可以表示单个字符,字符类型是char,char是两个字节(可以存放汉字),多个字符我们用字符串String ​ eg:char c1 ‘a’; ​ char c2…

AJAX——常用请求方法

1 请求方法 请求方法:对服务器资源,要执行的操作 2 数据提交 场景:当数据需要在服务器上保存 3 axios请求配置 url:请求的URL网址 method:请求的方法,GET可以省略(不区分大小写) …

牛客网SQL进阶114:更新记录

官网链接: 更新记录(二)_牛客题霸_牛客网现有一张试卷作答记录表exam_record,其中包含多年来的用户作答试卷记录,结构如下表。题目来自【牛客题霸】https://www.nowcoder.com/practice/0c2e81c6b62e4a0f848fa7693291d…

Excel下载接口

💗wei_shuo的个人主页 💫wei_shuo的学习社区 🌐Hello World ! Excel下载接口 需求分析 页面表格的数据下载,保存到Excel表格搜索后的数据点击下载,下载的数据需要是搜索后的数据 Controller HTTP 响应对象:…

【HTTP】localhost和127.0.0.1的区别是什么?

目录 localhost是什么呢? 从域名到程序 localhost和127.0.0.1的区别是什么? 域名的等级划分 多网站共用一个IP和端口 私有IP地址 IPv6 今天在网上逛的时候看到一个问题,没想到大家讨论的很热烈,就是标题中这个: …

python常用的深度学习框架

目录 一:介绍 二:使用 Python中有几个非常受欢迎的深度学习框架,它们提供了构建和训练神经网络所需的各种工具和库。以下是一些最常用的Python深度学习框架: 一:介绍 TensorFlow:由Google开发的TensorF…

LeetCode Python -8.字符串转整数

文章目录 题目答案运行结果 题目 请你来实现一个 myAtoi(string s) 函数,使其能将字符串转换成一个 32 位有符号整数(类似 C/C 中的 atoi 函数)。 函数 myAtoi(string s) 的算法如下: 读入字符串并丢弃无用的前导空格检查下一个…

C语言--------数据在内存中的存储

1.整数在内存中的存储 整数在内存是以补码的形式存在的; 整型家族包括char,int ,long long,short类型; 因为char类型是以ASCII值形式存在,所以也是整形家族; 这四种都包括signed,unsigned两种,即有符号和无符号&am…

ncc匹配提速总结

我们ncc最原始的匹配方法是:学习模板w*h个像素都要带入ncc公式计算 第一种提速,学习模板是w*h,而我们支取其中的w/2*h/2,匹配窗口同理,计算量只有1/4。 另外一种因为ncc是线性匹配,我们在这上面也做了文章&#xff0…

【漏洞复现】狮子鱼CMS文件上传漏洞(wxapp.php)

Nx01 产品简介 狮子鱼CMS(Content Management System)是一种网站管理系统,它旨在帮助用户更轻松地创建和管理网站。该系统拥有用户友好的界面和丰富的功能,包括页面管理、博客、新闻、产品展示等。通过简单直观的管理界面&#xf…

【51单片机】串口通信实验(包括波特率如何计算)

目录 串口通信实验通信的基本概念串行通信与并行通信异步通信与同步通信单工、 半双工与全双工通信通信速率 51单片机串口介绍串口介绍串口通信简介串口相关寄存器串口工作方式方式0方式1方式 2 和方式 3 串口的使用方法(计算波特率) 硬件设计软件设计1、…

JAVA设计模式之访问模式详解

访问者模式 1 访问者模式介绍 访问者模式在实际开发中使用的非常少,因为它比较难以实现并且应用该模式肯能会导致代码的可读性变差,可维护性变差,在没有特别必要的情况下,不建议使用访问者模式. 访问者模式(Visitor Pattern) 的原始定义是:允许在运行时将一个或多…

华为 huawei 交换机 接口 MAC 地址学习限制接入用户数量 配置示例

目录 组网需求: 配置思路: 操作步骤: 配置文件: 组网需求: 如 图 2-14 所示,用户网络 1 和用户网络 2 通过 LSW 与 Switch 相连, Switch 连接 LSW 的接口为GE0/0/1 。用户网络 1 和用户网络 2 分别属于 VLAN10 和 V…

第三节 zookeeper基础应用与实战2

目录 1. Watch事件监听 1.1 一次性监听方式:Watcher 1.2 Curator事件监听机制 2. 事务&异步操作演示 2.1 事务演示 2.2 异步操作 3. Zookeeper权限控制 3.1 zk权限控制介绍 3.2 Scheme 权限模式 3.3 ID 授权对象 3.4 Permission权限类型 3.5 在控制台…

antdpro框架npm install 报错,切换tyarn安装成功。

报错日志 有时间补 当前版本 解决办法 进入工作目录 安装官方推荐的tyarn工具:npm install yarn tyarn -g 进行依赖安装:tyarn 启动项目 :tyarn start 注意: 技术迭代较快,建议查询官网后实践,以上作为…

Hive窗口函数详解

一、 窗口函数知识点 1.1 窗户函数的定义 窗口函数可以拆分为【窗口函数】。窗口函数官网指路: LanguageManual WindowingAndAnalytics - Apache Hive - Apache Software Foundationhttps://cwiki.apache.org/confluence/display/Hive/LanguageManual%20Windowing…

并行计算导论 笔记 1

目录 并行编程平台隐式并行超标量执行/指令流水线超长指令字处理器 VLIW 内存性能系统的局限避免内存延迟的方法 并行计算平台控制结构通信模型共享地址空间平台消息传递平台对比 物理组织理想并行计算机并行计算机互联网络网络拓朴结构基于总线的网络交叉开关网络多级网络全连…