【书生大模型实战营】进阶岛 第1关 探索 InternLM 模型能力边界

news2024/11/15 20:07:18

文章目录

  • 【书生大模型实战营】进阶岛 第1关 探索 InternLM 模型能力边界
  • 学习任务
    • Bad Case 1:
    • Bad Case 2:
    • Bad Case 3:
    • Bad Case 4:
    • Bad Case 5:
    • Good Case 1:
    • Good Case 2:
    • Good Case 3:
    • Good Case 4:
    • Good Case 5:

【书生大模型实战营】进阶岛 第1关 探索 InternLM 模型能力边界

学习任务

在 CompassArena 中选择双模型对话,与InternLM2.5及另外任意其他模型对话,收集 5 个 InternLM2.5 输出结果不如其他模型的对话案例,以及 InternLM2.5 的 5 个 Good Case

在这里插入图片描述

Bad Case 1:

模型服务来源自行部署/compassarea
您的输入请分析《西游记》的主题思想
模型AInternLM2.5-Chat-20B (上海AILab书生·浦语)
模型BGLM-4-0520 (智谱AI)
模型A输出《西游记》是中国古代四大名著之一,由明朝作家吴承恩所著。该书以唐僧师徒四人西天取经的故事为主线,展现了丰富的主题思想。以下是对《西游记》主题思想的简要分析:追求理想与信念:唐僧西天取经的故事,实际上是一种追求理想与信念的象征。唐僧师徒四人的取经之路充满了艰难险阻,但他们的信念从未动摇,最终取得了真经。这一主题鼓励人们持之以恒地追求自己的理想和信念。人性的复杂性:《西游记》通过对唐僧师徒四人的描述,展现了人性的复杂性。比如,唐僧虽然善良,但有时也显得过于仁慈;孙悟空虽然机智勇敢,但有时也会冲动。这些人物形象反映了人性的多面性和复杂性。道德与正义:《西游记》中的许多故事都揭示了道德与正义的重要性。比如,孙悟空在多次战斗中展现了正义感,而唐僧也总是以道德为准则行事。这些故事传达了正义与道德的价值。人与自然的和谐共处:在《西游记》中,唐僧师徒四人经常与自然界打交道,展现了人与自然的和谐共处。比如,他们穿越山林、渡过河流、攀登高峰等,这些情节反映出人与自然的和谐共处是重要的。总的来说,《西游记》通过唐僧师徒四人的取经之路,展现了追求理想与信念、人性的复杂性、道德与正义以及人与自然的和谐共处等多个主题思想。这些主题思想不仅具有深远的文化意义,也对现代社会的道德和价值观产生了深远的影响。
模型B输出《西游记》是我国古典文学名著之一,作者是明朝的吴承恩。该作品以唐僧师徒四人取经为主线,通过一系列富有象征意义的奇幻故事,展现了丰富多样的主题思想。修行与成长:作品通过唐僧师徒四人的西天取经之路,寓意人生的修行与成长过程。在艰难险阻的环境中,师徒四人不断克服困难、战胜心魔,最终实现了自身的蜕变和升华。这一主题告诉我们,只有历经磨难,才能成就非凡。坚持与信念:《西游记》强调信念的力量。唐僧师徒四人为了求得真经,不畏艰难,始终坚持信念。在面对诱惑、困境时,他们始终保持初心,勇往直前。这一主题启示人们,只要坚定信念,就能战胜一切困难。团结与合作:作品中,唐僧师徒四人虽然性格各异,但为了共同的目标,他们能够团结一心,互相扶持。在这一过程中,他们学会了包容、信任和合作。这一主题强调了团队精神的重要性,只有团结一心,才能共克时艰。善恶与因果:作品通过描绘各种妖魔鬼怪,反映了善恶有报、因果循环的道理。师徒四人在取经过程中,既要面对外部的恶势力,也要战胜内心的恶念。这一主题告诫人们,要行善积德,才能获得福报。反映社会现实:《西游记》在描绘奇幻世界的同时,也反映了当时社会的现实问题。如官场腐败、民生疾苦、宗教纷争等。作者通过作品对社会现象进行了讽刺和批判,表达了改革社会、造福民众的愿望。传承文化:《西游记》融合了道教、佛教、儒家等多种思想,展现了古代中国的文化底蕴。作品通过唐僧师徒的取经之旅,传承了古代的文化精髓,弘扬了民族精神。总之,《西游记》是一部具有丰富主题思想的古典名著,它从多方面启示人们追求真善美,弘扬民族精神,具有很高的文学价值和历史意义。
其他补充

Bad Case 2:

模型服务来源自行部署/compassarea
您的输入1.9和1.11哪个大
模型AInternLM2.5-Chat-20B (上海AILab书生·浦语)
模型BERNIE-4.0-8K-Preview-0518 w/search (百度文心一言)
模型A输出1.9和1.11的大小比较是一个基本的小学数学问题。通过直观的观察可以看出,1.11比1.9大,因为1.11在1.9的后面又多出了0.01。更严谨的解释是,在小数比较中,我们首先比较整数部分,如果整数部分相同,再比较小数部分。在这个例子中,两个数的整数部分都是1,所以我们比较小数部分。小数部分中,1.11的小数部分是11(即0.01重复),而1.9的小数部分是9(即0.9),显然11大于9,所以1.11大于1.9。因此,1.11比1.9大。
模型B输出我们要比较1.9和1.11哪个数字更大。首先,我们观察这两个数的整数部分,它们都是1,所以整数部分相同,我们无法确定大小。接着,我们观察这两个数的小数部分。1.9的小数部分是0.9,而1.11的小数部分是0.11。我们知道,在比较小数的大小时,如果整数部分相同,那么小数部分大的那个数就更大。现在,我们只需要比较0.9和0.11哪个更大。很明显,0.9比0.11大,因为0.9表示9个0.1,而0.11只表示1个0.1和1个0.01。所以,1.9比1.11大。
其他补充B对

在这里插入图片描述

Bad Case 3:

模型服务来源自行部署/compassarea
您的输入画一朵花的字符画
模型AInternLM2.5-Chat-20B (上海AILab书生·浦语)
模型BERNIE-4.0-8K-Preview-0518 w/search (百度文心一言)
模型A输出/_/\ ( o.o ) > ^ <
模型B输出请注意,字符画通常受到文本格式的限制,可能无法完美地呈现复杂的图像。这个示例旨在提供一个基本的、可识别的花朵形状。你可以根据自己的需要和创造力进行调整和改进。
其他补充B对

在这里插入图片描述

Bad Case 4:

模型服务来源自行部署/compassarea
您的输入讲一个冷笑话
模型AInternLM2.5-Chat-20B (上海AILab书生·浦语)
模型BERNIE-4.0-8K-Preview-0518 w/search (百度文心一言)
模型A输出好的,这是一个冷笑话:"为什么电脑总是冰冷的?因为它有一个’硬件’!"希望你喜欢这个笑话。如果你需要更多的笑话或者有其他需求,请随时告诉我。
模型B输出当然可以,这里有一个冷笑话:有一天,白气球遇到黑气球,一见面白气球二话不说上去就打,黑气球吓了一跳问道:“你干嘛打我?白气球说:“你手里拿着根牙签,我还以为你是烤肠!”
其他补充B对

Bad Case 5:

模型服务来源自行部署/compassarea
您的输入推荐一首古风歌曲
模型AInternLM2.5-Chat-20B (上海AILab书生·浦语)
模型BERNIE-4.0-8K-Preview-0518 w/search (百度文心一言)
模型A输出古风歌曲有很多,以下是我为你推荐的一首:《蜀道难》 - 戴荃
模型B输出根据您的要求,我为您推荐一首古风歌曲,以下是我的推荐:推荐歌曲:《半纸心事》推荐理由:流行度与热度:根据公开发布的信息,《半纸心事》是近期在抖音等平台上非常火热的古风歌曲之一。其优美的旋律和深情的歌词吸引了大量听众的喜爱。古风特色:这首歌曲充满了浓郁的古风韵味,无论是旋律的编排还是歌词的撰写,都展现了中国传统文化的魅力。对于喜爱古风音乐的听众来说,这是一首不可多得的好歌。演唱者与制作团队:由国风堂和河图共同演绎的《半纸心事》,在制作上也十分精良。国风堂作为专注于古风音乐的团队,其作品一直受到广大古风爱好者的喜爱。而河图作为知名的古风歌手,其独特的嗓音和深情的演唱方式也为这首歌曲增添了不少色彩。综上所述,《半纸心事》是一首值得推荐的古风歌曲,无论是从流行度、古风特色还是演唱者与制作团队方面来看,它都具备了成为古风经典歌曲的潜质。
其他补充B对

Good Case 1:

模型服务来源自行部署/compassarea
您的输入当前气候如何
模型AInternLM2.5-Chat-20B (上海AILab书生·浦语)
模型BERNIE-4.0-8K-Preview-0518 w/search (百度文心一言)
模型A输出我无法提供实时气候信息,因为我无法访问或更新外部数据库或传感器。不过,我可以提供一些关于气候变化的一般信息。气候变化是一个全球性问题,它影响着地球的天气模式、海平面、生态系统和人类社会。科学家们通过气候模型、卫星数据和地面观测来研究和预测气候变化。当前全球气候呈现出变暖的趋势,这主要归因于人类活动产生的温室气体排放,特别是二氧化碳的排放。这种变暖趋势对全球气候系统产生了广泛的影响,包括极端天气事件的增加、冰川和冰盖的融化、海平面上升以及生态系统和生物多样性的变化。为了应对气候变化,全球各国正在采取行动,包括减少温室气体排放、发展可再生能源、提高能源效率、保护和恢复森林等自然生态系统等。同时,适应气候变化也是必要的,比如通过改进基础设施、改善农业实践、强化防灾减灾措施等。如果你需要了解特定地区或时间的具体气候信息,我建议查阅最新的气象报告或使用可靠的天气预报服务。
模型B输出我无法提供实时的气候信息,因为我不具备实时数据访问能力。要获取当前气候状况,您可以查看最近的天气预报,使用智能手机或电脑上的天气应用程序,或者询问智能助手(如Siri、Google Assistant或Alexa)当前的天气情况。如果您在中国,也可以通过中国气象局的官方网站或其官方微博、微信等渠道获取最新的气候信息。
其他补充

Good Case 2:

模型服务来源自行部署/compassarea
您的输入一句话评价三国演义
模型AInternLM2.5-Chat-20B (上海AILab书生·浦语)
模型BGLM-4-0520 (智谱AI)
模型A输出《三国演义》是中国古代四大名著之一,以其深厚的历史文化底蕴、丰富的人物形象、曲折的故事情节和独特的艺术魅力,生动地展现了三国时期的风云变幻和社会生活,对中国乃至世界的文学艺术发展产生了深远的影响。
模型B输出《三国演义》是一部传世经典,以宏大的历史背景和丰富的想象力,生动描绘了群雄逐鹿、英雄辈出的三国时代。
其他补充

Good Case 3:

模型服务来源自行部署/compassarea
您的输入一句话推荐一首歌曲
模型AInternLM2.5-Chat-20B (上海AILab书生·浦语)
模型BGLM-4-0520 (智谱AI)
模型A输出《平凡之路》是朴树的一首歌曲,歌词深情而富有哲理,旋律朴实而动人,让人在平凡的生活中感受到不平凡的力量,是值得一听的歌曲。
模型B输出如果你喜欢激情四溢的旋律,推荐你听听《Victory》,它激昂的旋律能瞬间点燃你的斗志。
其他补充

Good Case 4:

模型服务来源自行部署/compassarea
您的输入你在三国杀里更喜欢哪个角色
模型AInternLM2.5-Chat-20B (上海AILab书生·浦语)
模型BGLM-4-0520 (智谱AI)
模型A输出作为一个AI,我并没有个人偏好,但是我可以为你分析三国杀中各个角色的特点。三国杀是一款以三国时期为背景的桌面游戏,游戏中的角色大多以历史人物为原型,每个角色都有其独特的技能和游戏策略。例如:曹操:他是魏国的开国皇帝,游戏中以其狡猾、狡诈的技能著称,能够通过“奸雄”技能窃取他人的牌。关羽:以忠义著称的英雄,他的“武圣”技能可以在攻击时造成额外伤害,同时“青龙偃月刀”使他能够拥有更多的攻击机会。诸葛亮:蜀汉的丞相,以智慧和策略闻名,游戏中他的“观星”技能允许他预测并规避致命伤害,“空城”技能则是他的标志性技能,可以在无人防守的情况下迷惑敌人。黄盖:东吴的重要人物,以“苦肉计”著称,游戏中的“苦肉计”技能允许他在受到伤害后获得额外攻击机会。每个角色都有其独特的魅力和策略,玩家可以根据自己的喜好和游戏策略选择不同的角色。这也是三国杀游戏的乐趣之一,通过不同的角色体验不同的游戏体验和策略。
模型B输出作为一个人工智能,我没有个人喜好,所以我没有在《三国杀》中偏好的角色。不过,我可以根据不同角色的特点为你提供建议。例如,如果你喜欢策略和操控,你可能会喜欢曹操这样的主公角色;如果你偏好技巧和爆发力,那么黄月英或者贾诩这样的武将可能更适合你。游戏中的每个角色都有其独特的能力和玩法,选择哪个角色取决于你的游戏风格和策略。
其他补充

Good Case 5:

模型服务来源自行部署/compassarea
您的输入一句话评价见义勇为行为
模型AInternLM2.5-Chat-20B (上海AILab书生·浦语)
模型BGLM-4-0520 (智谱AI)
模型A输出见义勇为是无私无畏、积极向上的行为,体现了高尚的道德品质和强烈的社会责任感,值得我们每一个人去学习、去推广。
模型B输出见义勇为是英勇无畏、传递社会正能量的行为,体现了人们的责任感和对正义的坚守。
其他补充

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2093224.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

requests:一个强大的HTTP请求Python库

我是东哥&#xff0c;一个热衷于用Python简化日常工作的技术爱好者。今天&#xff0c;我要和大家分享一个网络请求的Python利器——requests库。你是否曾经在编写代码时&#xff0c;需要从网络上获取数据&#xff0c;却对复杂的HTTP协议感到头疼&#xff1f;requests库将帮你轻…

LMDeploy 量化部署进阶实践

1 配置LMDeploy环境 1.1 InternStudio开发机创建与环境搭建 打开InternStudio平台&#xff0c;进入如下界面并按箭头指示顺序点击创建开发机。 点选开发机&#xff0c;自拟一个开发机名称&#xff0c;选择Cuda12.2-conda镜像。 我们要运行参数量为7B的InternLM2.5&#xff0c;…

AI 内容创作:思考与实践

文章目录 LLM 与 RAGLLMRAGRAG 定制策略AI 写作助手演示 内容层次结构与内容深度优化有效的主题与段落结构内容深度的多样性与独特性提高文本逻辑性与连贯性模拟实践 内容评测与优化迭代机制内容评测自动迭代优化机制评估指标模拟实践 个性化写作与 AI 协同写作用户画像与需求分…

【C++ 第十八章】C++11 新增语法(3)

前情回顾&#xff1a; 【C11 新增语法&#xff08;1&#xff09;&#xff1a;1~6 点】 C11出现与历史、花括号统一初始化、initializer_list初始化列表、 auto、decltype、nullptr、STL的一些新变化 【C11 新增语法&#xff08;2&#xff09;&#xff1a;7~8 点】 右值引用和…

香橙派入手第一天

一、开箱 拿到快递回来以后&#xff0c;兴冲冲的把快递拆开&#xff0c;里面一共有一下几样东西&#xff0c;一个板卡&#xff0c;一个充电器&#xff0c;一个小风扇&#xff0c;还有一些安装用的零件和一把小螺丝刀。 值得一提的是这个充电器是最高支持65w的typec-typec的充电…

回溯法-0/1背包问题

什么是回溯法&#xff1f; 回溯法是一种搜索算法&#xff0c;它通过深度优先搜索的方式来解决决策问题。它从根节点开始&#xff0c;逐步扩展节点&#xff0c;直到找到所有可能的解。 回溯法的基本思想 开始节点&#xff1a;从根节点出发&#xff0c;这个节点是解空间的起点…

LLM 教程——如何为特定任务定制微调 BERT

通过本文&#xff0c;您将学会如何为特定的自然语言处理任务&#xff08;如分类、问答等&#xff09;微调BERT。 1、引言 BERT 是一个强大的预训练语言模型&#xff0c;可以用于多种下游任务&#xff0c;只需进行极小的修改。通过微调 BERT&#xff0c;您可以利用它的大规模知…

系统设计:一致性哈希的概念

目录 一、介绍 二、问题提出 三、朴素实施 四、一致性哈希 4.1 关闭服务器 4.2 添加新服务器 五、分布不均 5.1 虚拟节点 5.2 应用 六、结论 资源 一、介绍 我们生活在一个每天都会生成大量数据的世界里。在大公司中&#xff0c;几乎不可能将所有数据存储在单个服务器…

【区间dp、前缀和】 P1220 关路灯 题解

关路灯 题目描述 某一村庄在一条路线上安装了 n n n 盏路灯&#xff0c;每盏灯的功率有大有小&#xff08;即同一段时间内消耗的电量有多有少&#xff09;。老张就住在这条路中间某一路灯旁&#xff0c;他有一项工作就是每天早上天亮时一盏一盏地关掉这些路灯。 为了给村里…

APACHE NIFI—wait、notify组件报拒绝连接访问的报错

报错文字&#xff1a; Wait[idele44704-6fb6-1b60-ffff-ffffdcofbba2]Failed to process session due to Failed to get signal for c84c4aec-1287-4216-b1a2-f5c6fod4a3b7 due to java.net.ConnectException:Connection refused: org.apache.nifi.processor.exception.Proces…

jmeter响应断言、json断言、断言持续时间操作

一、响应断言 Apply to&#xff1a;断言应用的范围&#xff0c;这里默认&#xff0c;通常发出一个请求只触发一个服务器测试字段 响应文本&#xff0c;response响应体内的信息响应代码&#xff1a; 响应码&#xff0c;一般是200响应信息&#xff1a;响应码后面的返回的信息&am…

zdppy+vue3+onlyoffice文档管理系统实战 20240831上课笔记 继续完善登录功能

遗留的问题 1、整合验证码的接口2、渲染验证码3、实现验证码校验的功能4、验证码校验通过之后&#xff0c;再校验登录功能 验证码框架怎么使用 安装&#xff1a; pip install zdppy_captcha使用示例&#xff1a; import zdppy_api as api import zdppy_captcha import zdp…

Docker compose 安装 ELK

1. 简介 方案概述 我们使用 Filebeat 作为日志收集器&#xff0c;接入到 Redis 队列&#xff0c;然后消费队列中的日志数据流转到 Logstash 中进行解析处理&#xff0c;最后输出到 Elasticsearch 中&#xff0c;再由 Kibana 展示到页面上。我们采用 Elasticsearch 3 节点集群…

hello树先生——AVL树

AVL树 一.什么是AVL树二.AVL树的结构1.AVL树的节点结构2.插入函数3.旋转调整 三.平衡测试 一.什么是AVL树 二叉搜索树虽可以缩短查找的效率&#xff0c;但如果数据有序或接近有序二叉搜索树将退化为单支树&#xff0c;查找元素相当于在顺序表中搜索元素&#xff0c;效率低下。…

【计组 | Cache原理】讲透Cache的所有概念与题型方法

Cache 写在前面&#xff1a;高速缓存Cache一直408中的重点以及绝对的难点&#xff0c;前几天我在复习计组第三章的知识&#xff0c;Cache这一节把我困住了&#xff0c;我发现很多概念我都不记得了&#xff0c;一些综合性强的计算题根本无从下手&#xff0c;我深知Cache对于每个…

1分钟把高质量AI知识库站点嵌入小程序

许多企业都有把 AI 知识库装进小程序、网站、企业微信、钉钉等的需求&#xff0c;让用户能够在小程序上访问到高品质的内容。奈何有太多限制&#xff0c;往往会遇到IP地址不被信任或技术对接接口配置等困难。HelpLook能帮你节省这些繁琐的程序&#xff0c;0代码快速将AI知识库站…

工程师们都爱看的Docker容器技术,一看就会!保姆级教程(上)

文章目录 Docker简介Docker在企业中的应用场景Docker与虚拟化的对比Docker的优势 部署Docker部署DockerDocker的基本操作Docker镜像管理容器的常用操作 Docker镜像构建Docker镜像结构镜像运行的基本原理镜像获得方式镜像构建Docker镜像构建企业实例 镜像优化方案镜像优化策略镜…

一款免费强大的快速启动工具,快速打开程序,软件,网站,工具等

Lucy是一款由个人开发者针对个人需求开发的快速启动工具&#xff0c;其最大的特点在于简洁和快速。它允许用户通过简单的拖拽操作将文件、文件夹、网址等添加到启动列表中&#xff0c;实现快速访问常用程序和文件的目的。Lucy不依赖于网络连接&#xff0c;避免了隐私泄露的风险…

Xcode插件开发

Xcode插件开发 文章目录 Xcode插件开发一、插件开发流程创建插件Extension文件介绍文件说明 二、插件使用安装说明 一、插件开发流程 创建插件的过程并不复杂&#xff0c;只是官方教程&#xff0c;过于简单&#xff0c;所以这里补充下创建细节 创建插件 环境&#xff1a;Xco…

公安智慧大楼信息化整体建设设计方案

1. 项目背景与需求分析 《公安智慧大楼信息化整体建设设计方案》针对一个用地面积和建筑面积均具规模的建设项目&#xff0c;提出了信息化建设的全方位设计方案&#xff0c;以满足现代公安业务的需求。 2. 信息化设计理念 方案强调了信息化设计的顶层设计方法论&#xff0c;…