国产最强多模态大模型Step Fun-1V,究竟有多好用?

news2025/4/7 0:50:58

前言:

2023年是大模型的元年,随着ChatGPT的爆火,将大模型带入了公众的视野 ,国内也随之掀起了百模大战的浪潮。在这股浪潮的推动下,诸多科技公司,乃至大厂都争相推出自己的大模型产品,希望能够在大模型领域占据一席之地。一时间,各种大模型如雨后春笋般涌现。故而,今天就来介绍一下,国产最强多模态大模型-阶跃星辰。


 在其它大模型都忙着展示自己的身姿,吸引市场注意力的时候,

阶跃星辰则一直在蛰伏,不断的打磨自己的产品。

直到2024年3月份才正式对外发布了Step系列通用大模型,包括:

Step-1千亿参数语言大模型

Step-1V千亿参数多模态大模型

Step-2万亿参数MoE语言大模型预览版

其中,Step-1V一经发布,就直接登顶国内多模态榜首

这是OpenCompass发布的,截止到2024年5月2日的全球多模态排行榜,

GPT-4毋庸置疑依旧冠绝群雄,

排除掉开源的 InternVL-Chat-V1.5,紧随其后的就是Step-1V了。

在具体介绍之前,我们先来简单的了解一下阶跃星辰的团队背景

其创始人是前微软全球副总裁、微软亚洲互联网工程院首席科学家姜大昕博士

在微软期间,他负责了Bing的全球搜索体验工作,以及AI School China和NLP方向的技术研发

其核心团队也由在人工智能领域经验丰富的顶尖人才组成

目前,团队已经扩展到了150多人的规模

言归正传,阶跃星辰目前一共发布了两款To C的产品:

跃问:个人效率助手

冒泡鸭:AI互动平台

咱也是申请到了内测资格,下面就让大家看看它的多模态到底是怎么个事?

先来试一下它的解读能力

效果还不错,再来试一下,联网和检索的能力

最近比较火的网络热梗,也是不在话下

让它来解读一下Sora的技术报告

把技术报告原文丢给它,几秒钟后,就把它消化好了

再试一下它的识图能力

可能是我上传的照片有点局限,下面我又重新上传了一张全景

果不其然,它立马清晰的描绘出了照片中的建筑物,指出了东方明珠、中心大厦等地标建筑

再看一下它的数据处理和逻辑输出的能力

结果显而易见,完全没毛病,NaN是因为没有2020年的数据,

所以无法计算出2021年的净利增长率

个人感觉,整体使用下来,效果确实不错,

多模态该有的能力都有,但是具体的效果如何,还是需要大家自行去深入体验。

下面,再来看看阶跃星辰的第二个 To C产品 冒泡鸭,

它是一个AI开放世界平台,里面有诸多的智能对话体,

可以通过对话的方式来沉浸到剧情的角色扮演中

探索性和趣味性都很强,比较符合年轻人的口味。

随便点开了一个智能体,跟他聊了一下,根本停不下来,我说的话它基本都能接上

里面几乎可以表达你的所有想法(懂的都懂),确实挺好玩 

小哥哥和小姐姐的声音真好听~

除了这种聊天的智能体以外,还可以玩单人版“剧本杀”,都非常有意思 

冒泡鸭目前有app版和web版, 感兴趣的小伙伴可以自行去体验一下


综合来看,阶跃星辰发布的两款产品,都比较符合年轻人的口味,也是目前大模型产品发展的主流方向,除了阶跃星辰之外,还有之前我们介绍过的MiniMax也在做智能问答体的产品。

阶跃星辰蛰伏一年,确实给了大家一个满意的答复,目前他们正在内测万亿参数的大模型Step-2,浅浅的期待一下吧。

最后的最后,如果你觉得咱写的文章有那么一丁丁的意思,不妨点个赞,顺手留个关注,

小的必将兢兢业业的给大家带来更有意思的文章~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1646287.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

华为 二层交换机与防火墙连通上网实验

防火墙是一种网络安全设备,用于监控和控制网络流量。它可以帮助防止未经授权的访问,保护网络免受攻击和恶意软件感染。防火墙可以根据预定义的规则过滤流量,例如允许或阻止特定IP地址或端口的流量。它也可以检测和阻止恶意软件、病毒和其他威…

element-plus upload查看图片后不展示press delete to remove?

直接上全局样式就行: :deep(.el-upload-list__item .el-icon--close-tip) {display: none !important; }

灌溉机器人 状压dp

灌溉机器人 题目描述 农田灌溉是一项十分费体力的农活,特别是大型的农田。小明想为农民伯伯们减轻农作负担,最近在研究一款高科技——灌溉机器人。它可以在远程电脑控制下,给农田里的作物进行灌溉。 现在有一片 N 行 M 列的农田。农田的土…

【数据结构】有关环形链表题目的总结

文章目录 引入 - 快慢指针思考 - 快慢指针行走步数进阶 - 寻找环形链表的头 引入 - 快慢指针 141-环形链表 - Leetcode 关于这道题,大家可以利用快慢指针,一个每次走两步,一个每次走一步,只要他们有一次相撞了就代表说这是一个链…

【吃透Java手写】SpringBoot-简易版-源码解析

【吃透Java手写】SpringBoot-简易版-源码解析 1 SpringbootDemo2 准备工作2.1 Springboot-my2.1.1 依赖2.1.2 SpringBootApplication2.1.3 SJBSpringApplication2.1.3.1 run方法 2.2 Springboot-user2.2.1 依赖2.2.2 UserController2.2.3 UserApplication 2.3 分析run方法的逻辑…

13 【PS作图】人物绘画理论-脸型

三庭五眼 三庭:脸的长度比例 (1)发际线到眉毛 (2)眉毛到鼻底 (3)鼻底到下巴 三个部分大致为三等分 五眼:脸的宽度比例 以眼睛长度为单位,把脸的宽度分成五等分&#x…

为什么很多人不推荐你用JWT?

为什么很多人不推荐你用JWT? 如果你经常看一些网上的带你做项目的教程,你就会发现 有很多的项目都用到了JWT。那么他到底安全吗?为什么那么多人不推荐你去使用。这个文章将会从全方面的带你了解JWT 以及他的优缺点。 什么是JWT? 这个是他的官网JSON…

搜索算法系列之四(斐波那契)

以下算法被验证过,如有什么问题或有补充的欢迎留言。 前言 斐波那契数列,又称黄金分割数列,是由意大利数学家(Leonardo Fibonacci)在1202年提出的。这个数列的递推关系是F(0)1,F(1)1,F(n)F(n-…

微搭低代码入门05文件的上传和下载

目录 1 创建数据源2 创建应用3 创建页面4 设置导航功能5 文件上传6 文件下载总结 小程序中,我们通常会有文件的上传和下载的需,在微搭中,文件是存放在云存储中,每一个文件都会有一个唯一的fileid,我们本篇就介绍如何通…

强化学习玩flappy_bird

强化学习玩flappy_bird(代码解析) 游戏地址:https://flappybird.io/ 该游戏的规则是: 点击屏幕则小鸟立即获得向上速度。 不点击屏幕则小鸟受重力加速度影响逐渐掉落。 小鸟碰到地面会死亡,碰到水管会死亡。&#…

vscode连接服务器的docker步骤

进入容器之后,操作方式与本地windows系统操作逻辑一样;容器内部结构都能任意查看和使用,创建文件及编写python脚本都可以直接使用vs code编辑器进行编辑和调试,从而避免使用命令行及vim编辑文件,非常直观且方便~

4. RedHat认证-进程管理

4. RedHat认证-进程管理 1.进程概念 进程就是正在运行中的程序或者命令 每一个进程都是运行的实体,都有自己的地址空间,并占有一定的资源空间 程序消耗的是磁盘资源、进程消耗的是内存和CPU资源 进程会占用四类资源(CPU 、内存、磁盘、网…

python爬虫(一)之 抓取极氪网站汽车文章

极氪汽车文章爬虫 闲来没事,将极氪网站的汽车文章吃干抹尽,全部抓取到本地,还是有点小小的难度。不能抓取太快,太快容易被封禁IP,不过就算被封了问题也不大,大不了重启路由器,然后你的IP里面又…

i.MX 6ULL 裸机 IAR 环境安装

一. IAR 的安装请自行搜索 二. 使用最新版本的 IAR,需要修改 SDK 1. 在 SDK 的 core_ca7.h 加上 #include "intrinsics.h" /* IAR Intrinsics */ 2. debug 时需要修改每个工程下的 ddr_init.jlinkscript,参考链接 Solved: How to conn…

使用C语言实现杨氏矩阵并找出数字

前言 过了五一假期,咋们经过了一个假期的休息,要继续学习了,不能偷懒哦!! 今天让我们来看看如何在一个杨氏矩阵中找出自己想找到的数字。 首先,我们要了解一下杨氏矩阵到底是什么,如果一个矩阵中…

[redis] redis为什么快

1. Redis与Memcached的区别 两者都是非关系型内存键值数据库,现在公司一般都是用 Redis 来实现缓存,而且 Redis 自身也越来越强大了!Redis 与 Memcached 主要有以下不同: (1) memcached所有的值均是简单的字符串,red…

ACPWorkbench_for_BP10

一、菜单 文件菜单包含导入导出所有参数,导出flashbin文件和退出操作。文件菜单显示如下: Import Audio Settings:从音频配置文件中导入音频参数。 Export Audio Settings:将音频设置导出为音频配置文件。 Export Flash Binary Fi…

OpenNJet:下一代云原生应用引擎

OpenNJet:下一代云原生应用引擎 前言一、技术架构二、新增特性1. 透明流量劫持2. 熔断机制3. 遥测与故障注入 三、Ubuntu 发行版安装 OpentNJet1. 添加gpg 文件2. 添加APT 源3. 安装及启动4. 验证 总结 前言 OpenNJet,是一款基于强大的 NGINX 技术栈构建…

设置定位坐标+请按任意键继续

设置定位坐标 目的 在编程和游戏开发中,设置定位坐标的目的是为了确定对象在屏幕或游戏世界中的具体位置。坐标通常由一对数值表示,例如 (x, y),其中 x 表示水平位置,y 表示垂直位置。设置定位坐标的目的包括: 1. **精…

【JavaScript】数据类型转换

JavaScript 中的数据类型转换主要包括两种:隐式类型转换(Implicit Type Conversion)和显式类型转换(Explicit Type Conversion)。 1. 隐式类型转换(自动转换): js 是动态语言&…