首先,我认为一个好的人工智能开放平台应该具备以下关键特性:提供多种AI模型和工具,涵盖自然语言处理、计算机视觉、语音识别、数据分析等多个领域。
满足不同应用领域的需求;需具备强大的计算资源,以支持大规模模型的训练和推理;提供直观的用户界面和简便的API接口,以方便用户/开发者快速上手。
最近,智谱AI BigModel开放平台发布了三个全新旗舰的大模型(GLM-4-Plus、GLM-4V-Plus和CogView-3-Plus)。在测评过后,我觉得作为一个CS背景的程序员兼个人开发者,智谱AI BigModel开放平台足以满足我日常工作和学习的需求。 举个例子:
- 应用GLM-4-Plus的语言理解与推理能力:进行算法优化与代码生成;生成技术文档,帮助我更好地管理项目;解答技术难题等。
- 应用CogView-3-Plus的图像理解和编辑能⼒:进行图像创作与定制设计;展示电商产品;优化和美化UI设计等。
- 应用GLM-4V-Plus的图像和视频理解能⼒:理解视频内容并生成摘要;将视频/图片转换为HTML代码等。
接下来我挑选3个场景,分别测评一下智谱AI BigModel开放平台最新的三个模型:
GLM-4-Plus:代码调试与优化
在开发分布式服务系统时,我经常需要编写算法来模拟服务器的请求调度和处理流程,并最终统计每台服务器在一段时间内处理的请求数量,来分析并优化服务器的负载均衡策略。
我找到了LeetCode里一道类似于上面需求的题目,并且难度为Hard,来测试一下GLM-4-Plus的代码生成功能怎么样。
LeetCode题目:
步骤:
-
注册并登录智谱AI BigModel开放平台(链接:https://zhipuaishengchan.datasink.sensorsdata.cn/t/PB)
-
打开智谱AI BigModel开放平台->控制台->体验中心,选择GLM-4-Plus模型(链接:https://zhipuaishengchan.datasink.sensorsdata.cn/t/PB )。
-
将LeetCode题目复制粘贴后发送给大模型,要求它给出java代码。
发现它不仅给了代码而且还加上了清晰的注释,最后甚至还给出了详细的代码解析。生成出来的内容看起来还不错,还得测试一下是否正确。
- 将GLM-4-Plus给出的代码粘贴到LeetCode中运行。 发现三个测试用例都能跑过,并且提交以后所有隐藏测试用例都跑过了,不过就是运行时间和内存占用率有点高,看看它还能不能帮我优化一下代码。
- 继续向GLM-4-Plus提问,优化代码。
-
将代码放到LeetCode上运行。
-
遇事不慌,向GLM-4-Plus说明报错原因,继续让它修改代码。然后粘贴到LeetCode上运行。
不错,它这次给出的代码能成功运行,并且运行时间从之前的135ms提升到120ms,内存占用也从65.37MB提升到65.52MB。并且给出的解释也非常清晰易懂。我:GLM-4-Plus请受徒儿一拜!
CogView-3-Plus:个性化UI设计
在前端开发中,特别是那些注重用户体验和界面美观的项目里,经常需要一些有创意、设计感强,而且个性化的图片。然而,要找到合适的素材,通常得花大量时间在各种素材库里挑选,或者花钱请设计师定制,这既费时又费钱。
听说,智谱AI BigModel开放平台这次发布的CogView-3-Plus在原来的功能上还添加了允许用户在已生成的图像基础上进⾏精细化的编辑和调整的功能。我就来简单测试一下。 步骤:
- 注册并登录智谱AI BigModel开放平台平台(链接:https://zhipuaishengchan.datasink.sensorsdata.cn/t/PB )
- 我想生成一幅关于“大漠孤烟直,长河落日圆”的图片,但不太熟悉文生图的提问格式,先请教一下GLM-4-Plus老师。(链接:https://zhipuaishengchan.datasink.sensorsdata.cn/t/PB )
- 打开智谱AI BigModel开放平台->控制台->体验中心,选择CogView-3-Plus模型。
- 按照GLM-4-Plus生成的提问例子,直接复制粘贴向CogView-3-Plus发送。
将所有模型集合在一个页面里真的太方便了,直接丝滑切换,不用在多个软件里换来换去,谁懂!
- 基于CogView-3-Plus给出的照片我感觉色调和风格是我想要的,但是烟有些太大了。接着让它基于上图进行微调。 效果不错,图片在保持了上幅的构图和风格的基础上把孤烟改小了,河流的流水波纹看起来也更真实了一些。
- 对比:把CogView-3-Plus与可灵AI做了一下对比。在相同的描述下,两个模型生成的图片都很和谐,并且也紧扣了“大漠孤烟直,长河落日圆”的主题,难分伯仲。但是就这个例子来说,我更满意CogView-3-Plus生成的图片(右图),因为在描述中我表达了想要写实的风格,明显右图更接近写实一点。
GLM-4V-Plus:视频解说与笔记生成
在日常学习中,我经常需要观看大量的教学视频,其中有些是英文的,而且没有中文字幕。对于英语基础不太好的我来说,这无疑是一个巨大的挑战。此外,还需要一边学习一边记录学习笔记,这无疑会耗费大量的时间和精力。在这种情况下,强大且易用的AI工具简直是救世主的存在。
智谱AI这次全新旗舰模型中的GLM-4V-Plus居然能支持视频格式的文件输入,据官方说GLM-4V-Plus 能够理解并分析复杂的视频内容,同时具备时间感知能力。这个功能我真的太需要了,速速试一试。 步骤:
- 注册并登录智谱AI BigModel开放平台(链接:https://zhipuaishengchan.datasink.sensorsdata.cn/t/PB )
- 从网站上把视频下载下来。这里我拿一个学习如何向GPT高效提问的视频作为例子。
(视频链接:https://easylink.cc/vp4lue )
- 打开智谱AI BigModel开放平台->控制台->体验中心,选择CogView-3-Plus模型。
- 在对话框上传视频,并要求根据视频给出学习笔记。 一定要等待视频上传成功后再发送信息,否则你将一无所获(别问我是怎么知道的)
4 将文本信息变为markdown形式:模型总结的笔记很不错,但是我一般习惯用markdown形式写笔记。聪明的我又请出了GLM-4-Plus老师,直接让它帮我把笔记内容变为markdown模式。
- 直接复制粘贴到笔记软件,一篇漂亮的笔记就水灵灵的写完了。
在经过了以上三个场景的测试之后,我个人对智谱AI的全新旗舰模型表现非常满意。我也非常推荐大家尝试使用一下智谱AI BigModel开放平台的大模型。我总结了几个推荐的理由:
· 提升效率:这次测评中,无论是文本问答、代码生成和优化,还是文图以及视频内容的分析,智谱AI的大模型都展现出了强大的能力。平时需要几个小时甚至几天去完成的任务,花几分钟甚至几秒与AI进行对话就能得到解决。
· 一应俱全:一个智谱AI BigModel开放平台集成了市面上几乎所有的AI模型,可以全面覆盖我们工作、学习或生活中的问答需求。
· 经济实惠:现在新用户注册通过实名认证后就送免费500万个tokens,如果把配置拉满,按现在模型支持的最大max_tokens=4095算,最少都可以问1221个问题!!这不赶紧薅羊毛(等火了之后肯定就没这福利了)。再看看价格表,也是非常良心了,这里贴上价格链接:https://bigmodel.cn/pricing。
现如今,AI时代的浪潮已经势不可挡,市面上的人工智能开放平台也变得越来越丰富。
无论是OpenAI的GPT、Google的Bard,还是国内的智谱AI BigModel开放平台,各个平台都在不同领域展现了出色的应用潜力。
作为一名程序员和个人开发者,我比较关注和应用智谱AI BigModel开放平台,因为它不仅整合了多种强大的大模型,而且在性能表现、价格设置以及使用的便捷性上都非常符合我的需求。
经过多次使用,我发现它确实在工作和学习中能够大大提升效率,所以如果你也在寻找好用的AI工具,不妨亲自去体验一下。