两大国产多模态大模型推荐

两大国产多模态大模型推荐

news2026/3/7 0:26:58

GLM-4V

智谱AI 开放平台提供一系列具有不同功能和定价的大模型，包括通用大模型、超拟人大模型、图像大模型、向量大模型等，并且支持使用您的私有数据对模型进行微调。GLM-4V 就是在不牺牲任何NLP任务性能的情况下，实现了视觉语言特征的深度融合；支持视觉问答、图像字幕、视觉定位、复杂目标检测等各类图像理解任务。

资料地址：https://open.bigmodel.cn/dev/howuse/glm-4v
在这里插入图片描述
支持视觉问答、图像字幕、视觉定位、复杂目标检测等各类图像理解任务，具有2k上下文。价格换算成M Tokens计价的话是50元/M Tokens。与下面的step-1v对比，性价比不高。

Step-1V

阶跃星辰推出的step-1v系列多模态大模型，该模型拥有强大的图像理解能力，暂时只开放文本和图像输入，且仅支持文本生成。上下文长度分别为8k和32k。是由前微软全球副总裁姜大昕创立，大模型五虎将之后，阶跃星辰异军突起，加入五虎，成为大模型六小强之一。

资料地址：https://www.stepfun.com/#step1v
在这里插入图片描述
使用限制

单次请求图像数量上限：除了模型长下文长度约束，step-1v系列模型限制了单次请求图像不能超过5张。
轮次较多的对话，建议先通过多模态模型对图像进行描述或总结，再放入轮次历史作为文本理解的上下文。
单次请求图像体积大小限制：多张图片总大小控制在20M以内。
图像元数据：模型无法获得图像元数据信息，如文件路径、文件名、文件大小、原始分辨率、作者、相机型号、地理位置信息等。在输入模型前，预处理阶段会将元数据清除，以免泄露隐私。此外，图像也会被缩放到最佳尺寸。
字体过小的文本：文字过小可能会影响识别效果。
旋转和裁切：不完整或非正位可能会影响识别效果。
计数：模型输出的数值可能不是完全精确，而是估算的值。
准确性：在某些情况下，模型可能会生成不正确的描述或标题。请勿在有严重后果的场景依赖模型推理结果。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1932839.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

网络编程-TCP/IP

网络编程-TCP/IP

网络概述网络采用分而治之的方法设计，将网络的功能划分为不同的模块，以分层的形式有机组合在一起。每层实现不同的功能，其内部实现方法对外部其他层次来说是透明的。每层向上层提供服务，同时使用下层提供的服务网络体系结构…

阅读更多...

【LeetCode】删除排序链表中的重复元素 II

【LeetCode】删除排序链表中的重复元素 II

目录一、题目二、解法完整代码一、题目给定一个已排序的链表的头 head ， 删除原始链表中所有重复数字的节点，只留下不同的数字。返回已排序的链表。示例 1： 输入：head [1,2,3,3,4,4,5] 输出：[1,2,5] 示例 …

阅读更多...

WEB前端06-DOM对象

WEB前端06-DOM对象

BOM浏览器对象模型浏览器对象模型：将浏览器的各个组成部分封装成对象。是用于描述浏览器中对象与对象之间层次关系的模型，提供了独立于页面内容、并能够与浏览器窗口进行交互的对象结构。组成部分 Window：浏览器窗口对象 Navigator&…

阅读更多...

$win11局域网共享打印机或者文件提示：\\计算机名无法访问。你可没有权限使用网络资源。请与这台服务器的管理员联系以查明你是香有访问权限。网络不存在或尚未启动。解决方法$

win11局域网共享打印机或者文件提示：\\计算机名无法访问。你可没有权限使用网络资源。请与这台服务器的管理员联系以查明你是香有访问权限。网络不存在或尚未启动。解决方法

win11局域网共享打印机或者文件提示：\\计算机名无法访问。你可没有权限使用网络资源。请与这台服务器的管理员联系以查明你是香有访问权限。网络不存在或尚未启动。是因为win11更新会默认关闭不安全的SMB1协议，导致局域网共享不可用。既然这样&#xf…

阅读更多...

Web开发：四角线框效果（HTML、CSS、JavaScript）

Web开发：四角线框效果（HTML、CSS、JavaScript）

目录一、实现效果二、完整代码三、页面准备 1、页面结构 2、初始样式 3、现有效果三、线框实现 1、需求分析 2、线框结构 3、线框大小 4、线框位置 5、线框样式 6、移动线框 7、添加过渡效果 8、使用CSS变量一、实现效果如下图所示，当鼠标移动…

阅读更多...

项目管理进阶之RACI矩阵

项目管理进阶之RACI矩阵

前言项目管理进阶系列续新篇。 RACI？这个是什么矩阵，有什么用途？ 在项目管理过程中，如Team规模超5以上时，则有必要采用科学的管理方式，满足工作需要。否则可能事倍功半。 Q：什么是RACI矩阵 …

阅读更多...

SQL面试题练习 —— 查询每个用户最大连续登录天数

SQL面试题练习 —— 查询每个用户最大连续登录天数

目录 1 题目2 建表语句3 题解 1 题目查询每个用户最大连续登录天数样例数据如下 login_log： 2 建表语句 --建表语句 create table if not exists login_log (user_id int comment 用户id,login_time date comment 登录时间 ); --数据插入 INSERT overwrit…

阅读更多...

N Puzzle (数字推盘游戏)

N Puzzle (数字推盘游戏)

N Puzzle [数字推盘游戏] 1. 15 Puzzle2. N PuzzleReferences puzzle /ˈpʌzl/：n. 谜，智力游戏，疑问，不解之谜，令人费解的事 vt. 迷惑，使困惑1. 15 Puzzle https://en.wikipedia.org/wiki/15_puzzle The…

阅读更多...

Python 在Word表格中插入、删除行或列

Python 在Word表格中插入、删除行或列

Word文档中的表格可以用于组织和展示数据。在实际应用过程中，有时为了调整表格的结构或适应不同的数据展示需求，我们可能会需要插入、删除行或列。以下提供了几种使用Python在Word表格中插入或删除行、列的方法供参考： 文章目录 Python 在Wo…

阅读更多...

Qt QProcess 进程间通信读写数据通信

Qt QProcess 进程间通信读写数据通信

本文介绍了如何使用Qt的QProcess 进行程序开发，包括启动进程间通信、设置环境变量、通用方法；方便在日常开发中使用； 1.使用Qt进行程序开发，可以通过QProcess类用于启动外部程序并与其进行通信.； 进程A（…

阅读更多...

【时时三省】tessy 集成测试：小白入门指导手册

【时时三省】tessy 集成测试：小白入门指导手册

目录 1，创建集成测试模块且分析源文件 2，设置测试环境 3，TIE界面设置相关函数 4，SCE界面增加用例 5，编辑数据 6，用例所对应的测试函数序列 7，添加 work task 函数 8，为测试场景添加函数 9，为函数赋值 10，编辑时间序列的数值 11，执行用例 12，其他注意事项…

阅读更多...

Hadoop3：MR程序的数据倾斜问题处理

Hadoop3：MR程序的数据倾斜问题处理

一、数据倾斜什么是数据倾斜？ 学过Redis集群的都知道数据倾斜这个问题。就是大量数据，分配不均匀的现象。二、MR数据倾斜 1、怎么判断出现数据倾斜？ 数据频率倾斜——某一个区域的数据量要远远大于其他区域。数据大小倾斜——部分记…

阅读更多...

【STM32】RTT-Studio中HAL库开发教程四：DAC+DMA输出波形

【STM32】RTT-Studio中HAL库开发教程四：DAC+DMA输出波形

文章目录一、DAC介绍二、HAL库配置初始化三、RTT中初始化四、测试验证一、DAC介绍 1.DAC作用 DAC（Digital-to-Analog Converter），即为数字/模拟转换模块，又称D/A转换器；作用就是把输入的数字编码，转换成…

阅读更多...

昇思25天学习打卡营第16天 | Vision Transformer图像分类

昇思25天学习打卡营第16天 | Vision Transformer图像分类

昇思25天学习打卡营第16天 | Vision Transformer图像分类文章目录昇思25天学习打卡营第16天 | Vision Transformer图像分类Vision Transform（ViT）模型TransformerAttention模块Encoder模块 ViT模型输入模型构建Multi-Head Attention模块Encoder模块Pa…

阅读更多...

Java对象转换为JSON字符串

Java对象转换为JSON字符串

0 写在前面业务中有很多场景需要把一个带有数据的 Java对象/Java集合转换为JSON 存入数据库中。在需要的时候还需要吧和这个JSON字符串拿出来再次转换成Java对象/集合 1 Java对象与JSON字符串互转引入依赖: <dependency><groupId>com.alibaba</groupId&…

阅读更多...

解决VMware虚拟机在桥接模式下无法上网的问题

解决VMware虚拟机在桥接模式下无法上网的问题

解决VMware虚拟机在桥接模式下无法上网的问题 windows11系统自动启动了热点功能，开启热点可能会干扰虚拟机的桥接设置。方法一：windows11可以提供网络热点服务方法二：手动指定桥接的物理网卡方法一：关闭热点功能优点&#xff…

阅读更多...

【Java项目笔记】01项目介绍

【Java项目笔记】01项目介绍

一、技术框架 1.后端服务 Spring Boot为主体框架 Spring MVC为Web框架 MyBatis、MyBatis Plus为持久层框架，负责数据库的读写阿里云短信服务 2.存储服务 MySql redis缓存数据 MinIO为对象存储，存储非结构化数据（图片、视频、音频&a…

阅读更多...

【开发指南】HTML和JS编写多用户VR应用程序的框架

【开发指南】HTML和JS编写多用户VR应用程序的框架

1.概述 Networked-Aframe 的工作原理是将实体及其组件同步到连接的用户。要连接到房间，您需要将networked-scene组件添加到a-scene元素。对于要同步的实体，请向其添加networked组件。默认情况下，position和rotation组件是同步的，…

阅读更多...

【Spring Cloud】掌握Gateway核心技术，实现高效路由与转发

【Spring Cloud】掌握Gateway核心技术，实现高效路由与转发

目录前言示例创建一个服务提供者创建网关创建common子项目前言 Spring Cloud Gateway 是一个基于 Spring Boot 的非阻塞 API 网关服务，它提供了动态路由、请求断言、过滤器等功能。以下是关于 Spring Cloud Gateway 的示例： 示例创建一个服务提…

阅读更多...

什么是 std::ios::sync_with_stdio(false)

什么是 std::ios::sync_with_stdio(false)

介绍 std::ios::sync_with_stdio(false) 是 C 中的一个配置设置，用于控制标准 I/O 流（如 std::cin, std::cout）的行为。这个设置主要用于优化输入输出操作的性能，尤其是在处理大量数据时。在 C 中，标准流库&#xf…

阅读更多...

推荐文章

最新文章