2023年7月第4周大模型荟萃
- 2023.7.31
- 版权声明:本文为博主chszs的原创文章,未经博主允许不得转载。
1、Cerebras推出全球最强AI超算
AI芯片初创公司Cerebras Systems和总部位于阿联酋的技术控股集团G42于7月20日宣布,携手打造一个由互联的超级计算机组成的网络,为AI计算提供一种新的方案,有望大幅减少AI大模型训练时间。目前,该网络上的第一台AI超级计算机——“Condor Galaxy 1(CG-1)”正式上线,AI算力高达4 exaFLOPS,这也是目前性能最强的AI超级计算机。
CG-1由64台CS-2 AI计算机组合而成,每台CS-2 AI计算机则是由一个WSE-2芯片所驱动,使得整个CG-1系统当中的AI内核数量达到了5400万个,总体的片上内存容量达到了82TB,各个CS-2系统间的带宽速率高达388Tbps。同时,CG-1还配备了高达72704个AMD EPYC CPU内核。
CG-1针对大型语言模型和生成人工智能进行了优化,标准支持多达6000亿个参数模型。CG-1使用简单的数据并行性,就可实现从1到64个CS-2系统的近乎线性的性能扩展。扩展后的配置可支持多达100万亿个参数模型。要知道今年以来非常火爆的AI大模型GPT-4为1.8万亿个参数。
2、微软、OpenAI、谷歌等巨头联合成立前沿模型论坛
微软、OpenAI、谷歌和 Anthropic 四家公司共同发起成立前沿模型论坛,它是一个专注于前沿人工智能模型的组织。所谓前沿人工智能模型,是指那些超越现有最先进模型的能力,并且可以执行多种任务的大规模机器学习模型。论坛认为,创造人工智能技术的公司有责任确保它是安全、可靠且受人类控制的。
前沿模型论坛组织公布了其发展目标:
- 推进人工智能安全研究,促进前沿模型的负责任开发,降低风险,并实现独立、标准化的能力和安全评估。
- 确定前沿模型负责任开发和部署的最佳实践,帮助公众了解这项技术的性质、能力、局限和影响。
- 与政策制定者、学者、民间社会和企业合作,分享有关信任和安全风险的知识。
- 支持开发可以帮助应对社会最大挑战的应用,例如减缓和适应气候变化、早期癌症检测和预防、以及应对网络威胁。
3、网易有道发布垂直教育行业的大模型“子曰”
2023年7月26日,网易有道发布垂直教育行业的大模型“子曰”。“子曰”大模型现已应用于有道生态内的软件和硬件上,实现了产品化,包括大模型翻译、AI作文批改、英语语法精讲、虚拟人口语教练、AIBox、文档问答等,面向付费用户。网易内部调研中,自认为“子曰”大模型的翻译能力已经优于ChatGPT、超过了市面上所有主流翻译引擎。
点评:官方的新闻稿有点自大,动不动就超越ChatGPT。从网页版的有道翻译来看,目前的翻译质量只能说还行,有道总不能说,“我们还没有把大模型用到我们的产品上”。
4、用友发布企业服务大模型YonGPT
7月27日,用友发布企业服务大模型YonGPT。在大模型赛道上,用友选择做自己长期专注且有一定积累的企业服务领域的大模型,而不是做通用语言大模型。发布会上用友展示了基于YonGPT已经实现的四个智能化场景服务:1)基于YonGPT的企业收入/利税经营智能分析,可实时掌控经营状况、快速洞察问题、准确预测企业效益、有效预见变化;2)基于YonGPT的智能生单,实现快速智能生单,提高企业效能;3)基于YonGPT的智能招聘,帮助企业快速识别人才,从简历池发现人才,通过AI互动改善应聘体验;4)基于YonGPT的智能大搜,改善搜索体验,加速企业知识的价值化服务,让知识赋能业务和组织。
5、新壹科技发布视频垂直大模型
7月27日,新壹科技发布了面向视频的大模型“新壹视频大模型”,以及基于此大模型的AIGC视频生成平台,根据新壹科技的宣称,其AI生成能力已覆盖文本、图像、音视频等内容模态,号称实现了从大模型到平台服务再到产品服务落地的AIGC业务全链路打通。遗憾的是,发布会主要还是动嘴皮子,看不到实际的东西。
6、AI初创公司Cohere推出面向企业用户的知识助手Coral
7月26日,AI初创公司Cohere宣布推出面向企业用户的知识助手Coral。Coral是一款企业级聊天机器人,可以与用户进行对话,帮助他们完成业务方面的任务。公司表示,Coral通过提供对专有的内部公司数据以及公开来源的引用来缓解幻觉问题。此外,Coral可以接受内部数据和公司技术资源方面的培训,以提供分析、报告和其他定制信息。公司表示,Coral已与上百个集成的数据源链接,包括CRM、协作工具、数据库、搜索基础设施和支持系统等。
7、Stability AI推出开源文生图模型SDXL 1.0
明星AI初创公司Stability AI打造的文本到图像生成模型Stable Diffusion在今年风靡全球。虽然从文本到图像的生成模型并不少,但Stable Diffusion是最受欢迎的开源模型。各路开发者也基于Stable Diffusion模型进行二创,推出各种各样、花式繁多的AIGC应用。7月26日,Stability AI公司正式推出了Stable Diffusion XL(SDXL)1.0开源文生图模型,完成了进化过程中的又一次重要迭代。这是Stability AI最新的旗舰图像模型,也是当前图像生成领域最好的开源模型。
在SDXL 1.0版发布之前,Stability AI在六月份推出的SDXL 0.9仅能作研究用途。但从今天起,SDXL 1.0将通过Stability AI的API开源开放给开发者,普通人也可以通过消费级应用Clipdrop和DreamStudio访问。
体验SDXL 1.0目前有几种渠道:
- Clipdrop:https://clipdrop.co/stable-diffusion
- DreamStudio:https://dreamstudio.ai/generate
- Stability AI Platform:https://platform.stability.ai/
- Github:https://github.com/Stability-AI/generative-models
国内的一些大模型可以跟着进化一波了。
8、C-Eval中文大模型权威排名公布
C-Eval是由清华大学、上海交通大学和爱丁堡大学合作构建的面向中文语言模型的综合性考试评测集,包含13948道多项选择题,涵盖52个不同学科和四个难度级别。7月23日,最新的排名公布了,中文大模型全球排名前四分别为清华智谱的ChatGLM2、OpenAI的GPT-4、商汤的SenseChat,APUS的AiLMe-100Bv1。具体如下:
大模型测试跟手机跑分差不多,做个参考即可。以国人的聪明才智,针对测试题对大模型做训练,拿个90多分,甚至100分都可以。有些手机厂家就做过针对跑分软件做优化,一检测到跑分软件运行就开启超频加速。
9、Runway视频生成工具Gen-2全面开放
Runway是一家专注于提供各种AI影像编辑工具的公司,Runway Gen-2是其推出的最新文本生成视频的AI模型。Gen-2不仅可以像Gen-1一样在原视频的基础上编辑出符合用户要求的视频,还可以从头生成视频。使用Gen-2模型,用户能够根据简单的文本提示生成4秒的视频片段,这些片段,可以被看作是动画GIF,提供了一种独特而简洁的方式来让想法变为现实。而想要使用Runway Gen-2的用户,只需在Runway网站上创建一个免费账户。
然而,免费生成的视频数量是有限制的,免费试用的额度为105秒,每个视频为4秒,也就是大约可免费生成26个Gen-2视频。用户可以通过每月15美元或每年144美元(预付)的价格,获取一系列的高级功能。这包括更高分辨率的视频,去除Runway的水印,以及每月视频限制增加到125秒等。