「ChatGPT」掀起新一轮AI热潮!超越GPT-4 Turbo,商汤日日新大升级!

news2024/11/16 23:43:48

图片

目录

拳打 GPT-4 Turbo ,脚踢 DALL·E 3

端侧大模型,唯快不破

AI 应用落地需要一个即插即用的大模型超市

并不存在 AI 这个行业,只有 AI+行业,强调 AI 需要与传统产业合作,这种关系是结合与赋能,而不是颠覆,其价值在于帮助传统产业提高生产效率,解放生产力。


福利:文末有福利哦,最新AI资料免费领

chat gpt 免费领,无魔法,无限制

在大模型的浪潮席卷而来的前几年,其实也掀起过一阵 AI 创业热潮。其中商汤科技、旷视科技、云从科技、依图科技是这个时期的代表,这四家公司也被称为「中国 AI 四小龙」。

到了 OpenAI 掀起的这股新浪潮中,四小龙中的商汤科技还留在舞台中央。去年 4 月商汤发布「日日新·大模型」 系列,是国内最早推出基于千亿参数大语言模型的公司之一。

苟日新,日日新,又日新。

商朝的开国君主汤在澡盆上刻了上述自我告诫的格言,恰似今天 AIGC 领域的变化速度,商汤大模型更新的节奏也可谓「日日新」。

图片

两个月前,商汤推出「日日新 SenseNova 4.0」大模型体系,甚至先 OpenAI 一步首发了全球首个支持不同模态工具调用的 Assistants API。

而今天下午,「又日新」的商汤继续推出了一系列基于「日日新」的生成式 AI 模型及应用,先给大家划重点:

日日新 5.0:常用客观评测上达到或超越了 GPT-4 Turbo

1.8B 的端侧模型:同等尺度性能最优,跨级尺度全面领先

企业级的应用一体机:涉及金融、医疗、政务、代码等领域

尚未上线的文生视频生成平台

拳打 GPT-4 Turbo ,脚踢 DALL·E 3

AI 2.0 时代,生成式 AI 被视为推动生产力进步的重要技术,如果能在知识、推理、执行三层能力上实现突破,将真正带来整个社会生产力的跨越式发展。

上个月,商汤 CEO 徐立在出席 2024 GDC 提出了如上观点,而在今天的发布会上,他再次强调,商汤在尺度定律的指导下,会持续探索大模型能力的 KRE 三层架构(知识-推理-执行),不断突破大模型能力边界。

那么全新升级的日日新 SenseNova 5.0(以下简称:日日新 5.0)又有哪些更新亮点呢?

采用 MoE 架构

基于 10TB tokens 训练,大量合成数据

推理上下文窗口支持 200K

知识、推理、数学、代码全面对标 GPT-4 Turbo

图片

日日新 5.0 本次更新主要增强了知识、数学、推理及代码能力,全面对标 GPT-4 Turbo。

在主流客观评测上,日日新 5.0 达到或超越了去年 OpenAI 在开发者大会上发布的 GPT-4 Turbo 版本,同时也几乎碾压了近期发布的 Llama 3-70B。

图片

光说不练假把式,在发布会现场,商汤全方位展示了日日新 5.0 在语言、数学推理等方面的实际能力。

同样输入一道 2022 年的高考作文题,对比 GPT-4 Turbo(仅为去年 11 月份的版本,下同)可以看到,日日新 5.0 生成的结果脱离了模版套路化的束缚,多了点人味,一看就是能走进高考阅卷老师心坎的文章。

图片

面对数学问题的拷问,GPT-4 Turbo 开始有些招架不住,不仅计算过程复杂,最终得出的结果也是错误的,而日日新 5.0 这边得出的答案则充满条理性,也完全正确。

图片

行业差异化是大模型竞争中脱颖而出的关键因素。

瞄准本土化应用场景的日日新 5.0,在理解中文特有的文化和语境上是要优于 GPT-4 Turbo 的。GPT-4 Turbo 既然不熟悉中文语境,自然也就无法准确把握「老鹰捉小鸡」这样的本土游戏规则。

图片

多模态能力被业界普遍视为实现 AGI 的关键路径。

从基准测试结果上看,日日新 5.0 也能与 GPT-4V 打得火热,并且互有胜负。在实际的案例演示中,日日新 5.0 支持的秒画生成老象的效果更自然一些,而同样的问题给到友商,甚至还会出现三条腿的谬误。

基于同一 Prompt 生成的人像图,商汤旗下秒画生成的皮肤纹理自然,既没有过度磨皮加滤镜,也顺利完成了「美丽」的指标 。考虑到国际上用于训练 AI 模型的亚洲人像数据库相对有限,这样的对比结果也相对正常。

图片

结合多模态和数据分析能力,AI 能够实现更为复杂和高级的任务。

日日新 5.0 上能「攻破」长图的总结描述,中能识别滴滴打车的具体信息,下还能计算中国特有早餐的热量,同样的问题给到 GPT-4 Turbo,也许就是两眼一抹黑。

图片

总说 AI 会重塑工作流,这一次,商汤也特别演示办公小浣熊在这方面的能力。

将 F1 赛车手周冠宇三年的参赛记录输入到系统中,并让它绘制出参与比赛数量的柱状图,这个任务看似简单,但实际上牵涉到复杂的识别难题。

在国际比赛中,周冠宇使用其英文名字参赛。传统的大模型在处理这类涉及非英文常规拼写或者特定人物的识别任务时,往往表现不佳。而日日新 5.0 升级的办公小浣熊虽然经历了一些波折,但最终还是顺利绘制出来。

端侧大模型,唯快不破

在武侠世界中,「天下武功,唯快不破」强调了速度在实战中的重要性,而在大模型的战役中,这一原则同样适用。

随着大模型技术的快速发展,不同应用场景的需求日益显现,智能手机、电脑、VR 眼镜等终端设备对大模型的使用频率,性能速度,安全稳定等提出了更高要求。

变得更务实的商汤在本次发布会也正式推出了 1.8B 的 SenseChat-Lite 版本端侧⼤模型。

在基准测试中,该端侧模型全面超越了 MiniCPM-2B、Phi-2 等同量级的大模型,并且还越级比肩一些 7B、13B 大模型,用徐立的话来说,那就是同等尺度性能最优,跨级尺度全面领先。

图片

研究表明,人眼最快的阅读速度大概就是 20 字/秒,而搭载 1.8B 商汤端侧模型在中端手机上能够实现 18.3 字/秒的速度,而在旗舰手机则最高支持 78.3 字/秒,成为业内最快推理速度。

商汤还推出端云协同解决方案,可以通过智能化判断协同发挥端云各自优势,需要联网搜索或处理复杂场景时分流至云端处理,部分场景端侧处理占比超过 80%,从而显著降低推理成本。

在与「商量」的寥寥几秒对谈中,无论是几秒生成请假报告,还是总结几千字的文档都能快速响应。

图片

端侧扩散模型还能实现业内最快推理速度,端侧 LDM-AI 扩图技术在某主流平台上,推理速度小于 1.5 秒,比友商云端 app 快10倍,支持输出 1200 万像素及以上的高清图片,支持在端上快速进行等比扩图、自由扩图、旋转扩图等图像编辑功能。

现场的演示中,工作人员更是可以做到随拍随扩,将端侧大模型「唯快不破」的能力展现得淋漓尽致。

并且,据徐立介绍,该端侧大模型主要适用于日常对话、常识问答、文案生成、相册管理、图片生成、图片扩展等六大领域,还支持多设备适配,使其能够灵活地应用于各种不同的场景和设备之中。

对于金融、代码、医疗、政务等重点行业边缘侧日益增长的 AI 应用需求,商汤还正式推出了高性价比、开箱即用、数据安全、全国产化的企业级应用一体机,涉及金融、医疗、政务、代码等四大行业。

以政务智能咨询问答平台为例,它不仅能够理解用户提出的问题,还能提供答案的参考来源,极大地提升政务服务的智能化水平。

图片

徐立指出,自然语言仍然不能替代编程语言,当前的「AI 程序员」无法独立完成复杂的工业级代码项目,而 Copilot 才是更适合的形态。

因此,今天商汤还发布了小浣熊·代码大模型一体机轻量版,单台支持 100 人规模研发团队使用。支持数据不出域,安全有保障,免费部署即可开箱即用。每台售价 35 万元起,为中小企业用户提供了高性价比的选择。

今年以来,Sora 的出现让人们见识到了 AI 视频生成的无限创造潜力,徐立在最后环节也带来了「One more thing」——三段完全由大模型生成的视频。尚未上线的文生视频生成平台也在人物可控性、动作可控性以及场景可控性等方面都有着出色的表现。

AI 应用落地需要一个即插即用的大模型超市

在 GPT-4 发布一年后,大模型们依然在不断卷参数刷榜。但今年行业里大家真正关心的,其实是怎么将大模型通过 Agent,并接入到无数企业和个人的工作流中。

OpenAI 的 GPT Store 没有如愿成为 AI 行业的 GPT Store,但大量的需求和问题依然摆在那。大模型的强大的能力和落地不同行业场景之间缺乏畅通的桥梁,同时也意味着一个巨大的机遇。

商汤的日日新开放平台,实际上就是一个大模型超市。通过多模态的模型能力提升 API 的调用效率,降低企业和开发者调用和定制各种 AI 功能的门槛。

图片

比起模型的规模参数,商汤更侧重于模型的能力应用。从商汤针对金融、医疗、政务、代码的行业大模型,到目前行业推理速度最快的端侧模型,以及商量、 如影、大医、小浣熊家族等 AI 原生应用,都可能看出商汤想要提供接口更丰富,能执行不同行业复杂任务的 AI 工具箱。

知名调研机构 Frost & Sullivan 发布的《2023年中国AI开发平台市场报告》指出,SenseCore 商汤大装置已成为中国 AI 开发平台云计算基础设施供应商的领先者。在硬件基础设施兼容性、产业链合作情况、模型训练优化模块、智能标注技术能力、预训练模型技术水平5个评估项目中,商汤均获得最高分。

我们前段时间报道过金山办公的 WPS AI 企业版,其中合作的大模型就有商汤。金山表示商汤在数据分析上比较出色,因此 WPS AI 就调用它处需要理科思维的场景。

APPSO 把金山这种不生产大模型,而是坚定做大模型应用的公司,称为 AI 的应用主义者。而商汤在其中扮演的角色,与其说是大模型的提供商,不如说是帮助各行各业大规模应用落地 AI 应用的百货超市。

图片

什么是百货超市?有着广泛的产品线,能满足不同消费者大大小小的个性化需求。最重要的是,百货超市的出现让种类繁多的商品更容易被大众获取,让更多普通人便捷享受到全世界的优质产品和体验。

而这,正是方兴未艾的 AIGC 未来对我们最大的价值。而公司作为现代社会最伟大的发明之一,如果说大模型正在带来第四次工业革命,大概率是从对企业的影响开始。已故的商汤创始人汤晓鸥也曾表示:

并不存在 AI 这个行业,只有 AI+行业,强调 AI 需要与传统产业合作,这种关系是结合与赋能,而不是颠覆,其价值在于帮助传统产业提高生产效率,解放生产力。

汤晓鸥在一次演讲中提到,「企业融资不是用来烧的,而是做伟大的事。」而商汤科技未来十年要做的「伟大的事」,将是帮助千行百业将 AIGC 落地。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1621690.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

设计模式-状态模式在Java中的使用示例-信用卡业务系统

场景 在软件系统中,有些对象也像水一样具有多种状态,这些状态在某些情况下能够相互转换,而且对象在不同的状态下也将具有不同的行为。 为了更好地对这些具有多种状态的对象进行设计,我们可以使用一种被称之为状态模式的设计模式…

Adobe Illustrator 2024 v28.4.1 (macOS, Windows) - 矢量绘图

Adobe Illustrator 2024 v28.4.1 (macOS, Windows) - 矢量绘图 Acrobat、After Effects、Animate、Audition、Bridge、Character Animator、Dimension、Dreamweaver、Illustrator、InCopy、InDesign、Lightroom Classic、Media Encoder、Photoshop、Premiere Pro、Adobe XD 请…

【注解和反射】获取类运行时结构

继上一篇博客【注解和反射】类加载器-CSDN博客 目录 七、获取类运行时结构 测试 getFields()和getDeclaredFields() getMethods()和getDeclaredMethods() 七、获取类运行时结构 获取类运行时结构通常指的是在Java等面向对象编程语言中,使用反射(Ref…

【git学习】Git 的基本操作

文章目录 🚀创建 Git 本地仓库🚀配置 Git🚀认识⼯作区、暂存区、版本库🚀添加⽂件操作 🚀创建 Git 本地仓库 仓库是进⾏版本控制的⼀个⽂件⽬录。我们要想对⽂件进⾏版本控制,就必须先创建⼀个仓库出来。 …

谷歌发布基于声学建模的无限虚拟房间增强现实鲁棒语音识别技术

声学室模拟允许在AR眼镜上以最少的真实数据进行训练,用于开发鲁棒的语音识别声音分离模型。 随着增强现实(AR)技术的强大和广泛应用,它能应用到各种日常情境中。我们对AR技术的潜能感到兴奋,并持续不断地开发和测试新…

web前端框架设计第六课-样式绑定

web前端框架设计第六课-样式绑定 一.预习笔记 1.class属性绑定 给P标签绑定一个类样式,类名为active。当active取值为true时,表示绑定样式成功,取值为false时,取消绑定 以对象形式给P标签绑定多个类样式 以数组形式给P标签绑定多…

网络安全新挑战:通用人工智能(AGI)等级保护指南

通用人工智能(AGI)的发展现状及趋势 随着2023年大语言模型应用的划时代突破,以ChatGPT为杰出代表的此类技术犹如一股洪流,彻底颠覆了人类与机器智能交互的疆界,引领通用人工智能(AGI)步入一个崭…

网络基础(day3)建议在电脑端注册登陆观看!!!

【 理论重点】 网络是什么&#xff1f; &#xff08;网络是载体&#xff0c;目的是传输互联网中的数据&#xff0c;数据是终端产生<手机、电脑、服务器等>。&#xff09; 如何组件网络&#xff08;良性网络架构&#xff09;&#xff1f;有网络架构思维&#xff0c;得按层…

宜搜科技死磕港交所上市:从搜索引擎到广告投放,业绩疲态凸显

近日&#xff0c;宜搜科技控股有限公司&#xff08;下称“宜搜科技”&#xff09;向港交所递交招股书&#xff0c;计划在香港主板上市&#xff0c;中银国际为其独家保荐人。 值得注意的是&#xff0c;宜搜科技已在资本市场辗转多年。该公司曾于2014年向纽交所递交上市申请&…

easyExcel快速入门

目录 &#x1f9c2;1.简单介绍 &#x1f32d;2.快速入门 &#x1f953;1.导入依赖 &#x1f37f;2.导出到excel &#x1f38f;3.读入数据 &#x1f389;4.下载 1.简单介绍 传统操作Excel大多都是利用Apach POl进行操作的,但是POI框架并不完善,使用过程非常繁琐且有较多…

Github进行fork后如何与原仓库同步

前言 fork了一个仓库以后怎么同步源仓库的代码&#xff1f; 步骤 1、执行命令 git remote -v 查看你的远程仓库的路径。 以一个实际例子说明&#xff0c; 来源仓库&#xff1a; TheFirstLineOfCode/basaltgit remote -v得到&#xff1a; origin https://github.com/ghmi…

Redis之路系列(5)功夫在诗外

5 拓展篇—功夫在诗外 6.0新特性 相对都比较鸡肋&#xff0c;谨慎在生产环境使用 ACL安全策略 Redis6版本推出了ACL(Access Control List)访问控制权限 的功能&#xff0c;基于此功能&#xff0c;可以设置多个用户&#xff0c;并且给每个用户单独设 置命令权限和数据权限。 …

机器学习/算法工程师面试题目与答案-深度学习部分1

机器学习/算法工程师面试题目与答案-深度学习部分 BatchNormalization的作用梯度消失循环神经网络&#xff0c;为什么好?什么是GroupConvolution什么是RNN神经网络中权重共享的是&#xff1f;神经网络激活函数&#xff1f;为什么在深度学习中常进行finetuning画GRU结构图什么是…

python+django校园社交高校交友网站2x7r5.

本课题使用Python语言进行开发。代码层面的操作主要在PyCharm中进行&#xff0c;将系统所使用到的表以及数据存储到MySQL数据库中&#xff0c;方便对数据进行操作本课题基于WEB的开发平台&#xff0c;设计的基本思路是&#xff1a; 前端&#xff1a;vue.jselementui 框架&#…

探索Web3:去中心化的互联网新时代

引言 在过去的几十年里&#xff0c;互联网已经改变了我们的生活方式、商业模式以及社交互动方式。然而&#xff0c;一个新的技术浪潮——Web3正在崭露头角&#xff0c;预示着一个去中心化的互联网新时代的来临。本文将深入探讨Web3技术的定义、特点以及其对未来互联网发展的影…

跨平台SIP 客户端-linphone下载、使用、开启视频H264

linphone 介绍 Linphone 是一种开源的语音和视频通信应用程序&#xff0c;它提供了基于互联网协议&#xff08;IP&#xff09;的实时通信功能。用于语音/视频通话、即时消息和电话会议的开源 SIP 电话。它适用于移动和桌面环境&#xff08;iOS、Android、GNU/Linux、macOS、Win…

【ensp】网关冗余vrrp实验

基础文字知识复习时&#xff0c;添加&#xff0c;下文仅拓扑以及核心配置以及结果分析 冗余路由器 核心代码&#xff1a; int g0/0/0 [R1-GigabitEthernet0/0/0]vrrp vrid 1 virtual-ip 192.168.10.1 ###设置虚拟ip [R1-GigabitEthernet0/0/0]vrrp vrid 1 priority 120 …

Flutter-自定义画板

效果 功能 支持绘制线、圆、矩形&#xff0c;支持拓展支持撤回上一步支持清空画板支持自定义画笔颜色&#xff0c;宽度 实现 定义绘制类型 /// 类型 enum ShapeType {//线line,//圆circle,//矩形rectangle,//拓展 }定义绘制抽象类 import dart:ui;/// 绘制抽象类 abstract…

云原生Service Mesh服务网格简单介绍

serviceMesh是什么 Service Mesh是一个用于处理服务间通信的基础设施层&#xff0c;旨在实现云原生应用复杂服务拓扑中的可靠请求传递。其基本构成是一组与应用一起部署的轻量级网络代理&#xff0c;这些代理对应用来说是透明的。Service Mesh通过统一的方式来控制和处理服务间…

数据结构-二叉树-链式

一、链式二叉树的结构 typedef int BTNodeDataType; typedef struct BTNode {BTNodeDataType data;struct BTNode* left;struct BTNode* right; }BTNode; 二叉树的前中后序遍历 前序&#xff1a;根左右 中序&#xff1a;左根右 后序&#xff1a;左右根 void PreOrder(BTNo…