目录
前段时间世界人工智能大会在上海举行,我去参观感受了一下,整个感受是有点名不副实的,参展的有各种银行、车企、还有中国电信、联通三个运营商都来凑热闹了。
但是也有Google、华为、阿里、腾讯、商汤这样的大厂。现场也可以体验一些大厂开发的大语言模型。例如阿里的通义千问、百度的文心一言,这些感觉生成效果都不错。还有华为的盘古大模型,尤其是盘古气象大模型,听说效果不错,研究成果还发布到了《Nature》
ok,今天就来介绍一下阿里的通义大模型。
阿里的通义大模型是达摩院自主研发的超大规模语言模型,包括了:
• 通义千问(内容生成)
• 通义听悟(音频处理)
• 通义万相(AI绘画)
我申请体验了一下,没想到第二天就申请通过了,速度还是挺快的,大家也可以申请体验一下:https://tongyi.aliyun.com/
我体验了一下通义千问这个模型,在一些常规问题上的效果还不错,但是在逻辑理解、代码理解能力还有些不足。例如给它一个算法题,给出的代码甚至不能通过编译,并且无法完成代码的纠错。而ChatGPT给出的代码一次即可通过测试。
通义千问是类似ChatGPT一样的文本内容生成模型。
做一份旅游攻略
代码生成
实现一个快速排序:
给它一个Leetcode算法题(最长回文子串),把它的代码测试运行一下,发现编译都报错…
然后我发现它给出的代码中不知道为什么要用一个int变量减去一个布尔值
然后它就一直重复回答…
同样的prompt,我们看下ChatGPT的效果:
ChatGPT给出的代码放在Leetcode上可以直接运行成功,通过测试。
让ChatGPT成功指出通义千问代码的错误,并且修正后的代码运行测试通过。
而通义千问对代码的理解能力却有待提高:
并且UI还有显示的BUG:
内容创作
这效果差的不是半点啊
另外我还体验了通义万相,是AI绘画类模型,但是生成的效果和MidJourney、Stable Diffusion这些差了一些。