魔搭社区汇聚各领域最先进的机器学习模型,提供模型探索体验、推理、训练、部署和应用的一站式服务。https://www.modelscope.cn/datasets
多模态大模型Yi-VL-plus体验 效果很棒 - 知乎最近测了一下零一万物的多模态大模型Yi-VL-plus的效果,发现多模态理解能力非常棒 ,尤其是细粒度识别方面,相比去年业界的模型有了非常大的提升。下面是三个典型的例子,供参考。 例子1:截图结构化信息提取参数…https://zhuanlan.zhihu.com/p/694736111
提取图片中的图书信息,要求返回JSON格式,只有一个字段books_info,其对应的value是list,list中每本书都是一个字典,字段为“书名”、“评分”、“作者”、“出版社”、“出版时间”、“是否已经读完”和“收藏时间”,其中评分字段只记录数字,是否已经读完的枚举值是“是”和“否”,如果显示正在读,答案应该是“否”,否则都是“是”。
这是多模态大模型评测基准MMBench中的一张图,有两个问题:1. 图中评估了哪些模型? 2. 图中评估了模型的哪些能力?
这张表从哪些维度评估模型的能力?模型分为哪几种?综合表现最好的5个模型是哪些?
What is the name of the movie in the poster?
Based on the photo, which floor is the Department of Otorhinolaryngology on?
How much would I pay if I want to order two Salmon Burger and three Meat Lover\'s Pizza? Think carefully step by step.
上面两张图片分别是哪两个城市?请对它们进行对比。
图里有啥?
请给我框出图中上海环球金融中心和东方明珠
帮我写个这座城市的旅游计划