2023年7月第4周大模型荟萃

news2024/10/6 16:16:40

2023年7月第4周大模型荟萃

  • 2023.7.31
  • 版权声明:本文为博主chszs的原创文章,未经博主允许不得转载。

1、Cerebras推出全球最强AI超算

AI芯片初创公司Cerebras Systems和总部位于阿联酋的技术控股集团G42于7月20日宣布,携手打造一个由互联的超级计算机组成的网络,为AI计算提供一种新的方案,有望大幅减少AI大模型训练时间。目前,该网络上的第一台AI超级计算机——“Condor Galaxy 1(CG-1)”正式上线,AI算力高达4 exaFLOPS,这也是目前性能最强的AI超级计算机。

CG-1由64台CS-2 AI计算机组合而成,每台CS-2 AI计算机则是由一个WSE-2芯片所驱动,使得整个CG-1系统当中的AI内核数量达到了5400万个,总体的片上内存容量达到了82TB,各个CS-2系统间的带宽速率高达388Tbps。同时,CG-1还配备了高达72704个AMD EPYC CPU内核。

CG-1针对大型语言模型和生成人工智能进行了优化,标准支持多达6000亿个参数模型。CG-1使用简单的数据并行性,就可实现从1到64个CS-2系统的近乎线性的性能扩展。扩展后的配置可支持多达100万亿个参数模型。要知道今年以来非常火爆的AI大模型GPT-4为1.8万亿个参数。

2、微软、OpenAI、谷歌等巨头联合成立前沿模型论坛

微软、OpenAI、谷歌和 Anthropic 四家公司共同发起成立前沿模型论坛,它是一个专注于前沿人工智能模型的组织。所谓前沿人工智能模型,是指那些超越现有最先进模型的能力,并且可以执行多种任务的大规模机器学习模型。论坛认为,创造人工智能技术的公司有责任确保它是安全、可靠且受人类控制的。

前沿模型论坛组织公布了其发展目标:

  • 推进人工智能安全研究,促进前沿模型的负责任开发,降低风险,并实现独立、标准化的能力和安全评估。
  • 确定前沿模型负责任开发和部署的最佳实践,帮助公众了解这项技术的性质、能力、局限和影响。
  • 与政策制定者、学者、民间社会和企业合作,分享有关信任和安全风险的知识。
  • 支持开发可以帮助应对社会最大挑战的应用,例如减缓和适应气候变化、早期癌症检测和预防、以及应对网络威胁。

3、网易有道发布垂直教育行业的大模型“子曰”

2023年7月26日,网易有道发布垂直教育行业的大模型“子曰”。“子曰”大模型现已应用于有道生态内的软件和硬件上,实现了产品化,包括大模型翻译、AI作文批改、英语语法精讲、虚拟人口语教练、AIBox、文档问答等,面向付费用户。网易内部调研中,自认为“子曰”大模型的翻译能力已经优于ChatGPT、超过了市面上所有主流翻译引擎。

点评:官方的新闻稿有点自大,动不动就超越ChatGPT。从网页版的有道翻译来看,目前的翻译质量只能说还行,有道总不能说,“我们还没有把大模型用到我们的产品上”。

4、用友发布企业服务大模型YonGPT

7月27日,用友发布企业服务大模型YonGPT。在大模型赛道上,用友选择做自己长期专注且有一定积累的企业服务领域的大模型,而不是做通用语言大模型。发布会上用友展示了基于YonGPT已经实现的四个智能化场景服务:1)基于YonGPT的企业收入/利税经营智能分析,可实时掌控经营状况、快速洞察问题、准确预测企业效益、有效预见变化;2)基于YonGPT的智能生单,实现快速智能生单,提高企业效能;3)基于YonGPT的智能招聘,帮助企业快速识别人才,从简历池发现人才,通过AI互动改善应聘体验;4)基于YonGPT的智能大搜,改善搜索体验,加速企业知识的价值化服务,让知识赋能业务和组织。

5、新壹科技发布视频垂直大模型

7月27日,新壹科技发布了面向视频的大模型“新壹视频大模型”,以及基于此大模型的AIGC视频生成平台,根据新壹科技的宣称,其AI生成能力已覆盖文本、图像、音视频等内容模态,号称实现了从大模型到平台服务再到产品服务落地的AIGC业务全链路打通。遗憾的是,发布会主要还是动嘴皮子,看不到实际的东西。

6、AI初创公司Cohere推出面向企业用户的知识助手Coral

7月26日,AI初创公司Cohere宣布推出面向企业用户的知识助手Coral。Coral是一款企业级聊天机器人,可以与用户进行对话,帮助他们完成业务方面的任务。公司表示,Coral通过提供对专有的内部公司数据以及公开来源的引用来缓解幻觉问题。此外,Coral可以接受内部数据和公司技术资源方面的培训,以提供分析、报告和其他定制信息。公司表示,Coral已与上百个集成的数据源链接,包括CRM、协作工具、数据库、搜索基础设施和支持系统等。

7、Stability AI推出开源文生图模型SDXL 1.0

明星AI初创公司Stability AI打造的文本到图像生成模型Stable Diffusion在今年风靡全球。虽然从文本到图像的生成模型并不少,但Stable Diffusion是最受欢迎的开源模型。各路开发者也基于Stable Diffusion模型进行二创,推出各种各样、花式繁多的AIGC应用。7月26日,Stability AI公司正式推出了Stable Diffusion XL(SDXL)1.0开源文生图模型,完成了进化过程中的又一次重要迭代。这是Stability AI最新的旗舰图像模型,也是当前图像生成领域最好的开源模型。

在SDXL 1.0版发布之前,Stability AI在六月份推出的SDXL 0.9仅能作研究用途。但从今天起,SDXL 1.0将通过Stability AI的API开源开放给开发者,普通人也可以通过消费级应用Clipdrop和DreamStudio访问。

体验SDXL 1.0目前有几种渠道:

  • Clipdrop:https://clipdrop.co/stable-diffusion
  • DreamStudio:https://dreamstudio.ai/generate
  • Stability AI Platform:https://platform.stability.ai/
  • Github:https://github.com/Stability-AI/generative-models

国内的一些大模型可以跟着进化一波了。

8、C-Eval中文大模型权威排名公布

C-Eval是由清华大学、上海交通大学和爱丁堡大学合作构建的面向中文语言模型的综合性考试评测集,包含13948道多项选择题,涵盖52个不同学科和四个难度级别。7月23日,最新的排名公布了,中文大模型全球排名前四分别为清华智谱的ChatGLM2、OpenAI的GPT-4、商汤的SenseChat,APUS的AiLMe-100Bv1。具体如下:
C-Eval中文大模型权威排名
大模型测试跟手机跑分差不多,做个参考即可。以国人的聪明才智,针对测试题对大模型做训练,拿个90多分,甚至100分都可以。有些手机厂家就做过针对跑分软件做优化,一检测到跑分软件运行就开启超频加速。

9、Runway视频生成工具Gen-2全面开放

Runway是一家专注于提供各种AI影像编辑工具的公司,Runway Gen-2是其推出的最新文本生成视频的AI模型。Gen-2不仅可以像Gen-1一样在原视频的基础上编辑出符合用户要求的视频,还可以从头生成视频。使用Gen-2模型,用户能够根据简单的文本提示生成4秒的视频片段,这些片段,可以被看作是动画GIF,提供了一种独特而简洁的方式来让想法变为现实。而想要使用Runway Gen-2的用户,只需在Runway网站上创建一个免费账户。

然而,免费生成的视频数量是有限制的,免费试用的额度为105秒,每个视频为4秒,也就是大约可免费生成26个Gen-2视频。用户可以通过每月15美元或每年144美元(预付)的价格,获取一系列的高级功能。这包括更高分辨率的视频,去除Runway的水印,以及每月视频限制增加到125秒等。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/817033.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

pytorch学习——正则化技术——权重衰减

一、概念介绍 权重衰减(Weight Decay)是一种常用的正则化技术,它通过在损失函数中添加一个惩罚项来限制模型的复杂度,从而防止过拟合。 在训练参数化机器学习模型时, 权重衰减(weight decay)是…

【JavaEE初阶】Servlet(四) Cookie Session

文章目录 1. Cookie && Session1.1 Cookie && Session1.2 Servlet会话管理操作 1. Cookie && Session 1.1 Cookie && Session Cookie是什么? Cookie是浏览器提供的持久化存储数据的机制.Cookie从哪里来? Cookie从服务器返回给浏览器. 服务…

生产中出现CPU或者内存飙升如何进行解决

文章目录 定位CPU标高内存问题JVM参数工具 定位CPU标高 方法1: 1-启动:java -jar 2_cpu-0.0.1-SNAPSHOT.jar 8 > log.file 2>&1 & 2-一般来说,应用服务器通常只部署了java应用,可以top一下先确认,是否是…

Java 错误异常介绍(Exceptions)

1、异常介绍 异常是程序执行期间发生的意外事件。它影响程序指令流,从而导致程序异常终止。 发生异常的原因有很多。其中包括: 无效的用户输入 设备故障 网络连接丢失 物理限制(磁盘内存不足) 代码错误 打开一个不可用的文…

第四章:C语言的条件分支控制结构

文章目录 1、分支控制if..else...2、分支控制if..else if...else...(嵌套)3、Switch4、goto 1、分支控制if…else… 标准格式:if{}else{} {}里面的语句表示条件是否成立再决定是否执行 2、分支控制if…else if…else…(嵌套) 标准格式:if{}else if{}…

无人机调试笔记——常见参数

无人机的PID调试以及速度相关参数 1、Multicopter Position Control主要是用来设置无人机的各种速度和位置参数。调试顺序是先调试内环PID,也就是无人机的速度闭环控制,确认没有问题后再进行外环位置控制,也就是定点模式控制。 2、调试的时…

CentOS7.3 安装 docker

亲测、截图 阿里云服务器 文章目录 更新源2345 启动开机自启 更新源 sudo yum update -y2 sudo yum install -y yum-utils device-mapper-persistent-data lvm23 sudo yum-config-manager --add-repo https://download.docker.com/linux/centos/docker-ce.repo4 sudo yum …

一款介于无代码和低代码之间的数据可视化平台

一、前言 随着企业数字化拉开序幕,低代码( Low Code Development)开发的概念开始火起来,即用少量的代码就能开发复杂的业务系统。然后更进一步,由此又催生出一个新的概念:无代码开发( No Code Development)。 低代码和无代码开发平…

【C++从0到王者】第十四站:list基本使用及其介绍

文章目录 一、list基本介绍二、list基本使用1.尾插头插接口使用2.insert接口使用3.查找某个值所在的位置4.erase接口使用以及迭代器失效5.reverse6.sort7.merge8.unique9.remove11.splice 三、list基本使用完整代码 一、list基本介绍 如下所示,是库里面对list的基本…

自然语言处理学习笔记(一)————概论

目录 1.自然语言处理概念 2.自然语言与编程语言的比较 (1)词汇量: (2)结构化: (3)歧义性: (4)容错性: (5&#xff0…

【143. 重排链表】

来源:力扣(LeetCode) 描述: 给定一个单链表 L 的头节点 head ,单链表 L 表示为: L0 → L1 → … → Ln - 1 → Ln 请将其重新排列后变为: L0 → Ln → L1 → Ln - 1 → L2 → Ln - 2 → … 不…

Redis (一)消息订阅和发送测试

〇、redis 配置 1、概况 本文基于 Ubuntu20.04 云服务器配置Redis,且在本地进行 Redis 测试。 2、目录概况 一、配置文件 位于 /config/app.yml 中,目的用于 Redis 初始化: redis:addr: "39.104.**.28:6379"password: "p…

盛元广通实验室教学仪器设备综合信息管理系统LIMS

实验室作为学生以及教师进行科研教学环境,对于实验室设备的使用情况、维护、借还、台账管理、盘点、报废等需要得到有效的管理,以促进科研教学工作的高质量开展,介于传统手动管理方式越发不能满足现代科研的飞速发展需要,实验室的…

【element-plus】 table表格每行圆角解决方案 element也通用

系列文章目录 【Vue3ViteTselement-plus】使用tsx实现左侧栏菜单无限层级封装 前言 我们在使用element-plus或element 的table时是否有时UI给到的UI效果是如下面这样的,但是我们翻遍了组件库的文档 调整了很多次样式 发现在 左右侧栏固定的时候 普通的方法是完全…

二阶阻尼弹簧系统的simulink仿真(s函数)

文章目录 前言一.非线性反步法1.原系统对应的s函数脚本文件(仅修改模板的初始化函数、导数函数和输出函数三个部分)2.控制器对应的s函数脚本文件(仅修改模板的初始化函数和输出函数两个部分)3.其他参数脚本文件4.输入5.输出&#…

【Git系列】分支操作

🐳分支操作 🧊1. 什么是分支🧊2. 分支的好处🧊3. 分支操作🪟3.1 查看分支🪟3.2 创建分支🪟3.3 切换分支 🧊4. 分支冲突🪟4.1 环境准备🪟4.2 分支冲突演示 &am…

NPP及碳源、碳汇模拟,python蒸散发与植被总初级生产力估算

CASA模型是一个基于过程的遥感模型(Potteret al,1993;Potter et al,1994),耦合了生态系统生产力和土壤碳、氮通量,由网格化的全球气候、辐射、土壤和遥感植被指数数据集驱动。模型包括土壤有机物、微量气体通量、养分利…

DelphiZXingQRCode 库:轻松集成二维码生成功能到 Delphi 项目中

一、下载地址:GitHub - foxitsoftware/DelphiZXingQRCode: Delphi port of QR Code functionality from ZXing, a barcode image processing library. 二、使用步骤: 1)引用单元文件。 //引用单元 usesDelphiZXIngQRCode2)编写…

AD21 PCB设计的高级应用(五)模块复用的操作

(五)模块复用的操作 1.利用Room实现相同模块复用2.复制粘贴功能实现模块复用 1.利用Room实现相同模块复用 本小节介绍 Altium Designer 两种常用模块复用方法:一种是利用 Room 实现相同模块复用,另一种是利用复制粘贴功能实现。 1.利用Room实现相同模块…

《面试1v1》Kafka的ack机制

🍅 作者简介:王哥,CSDN2022博客总榜Top100🏆、博客专家💪 🍅 技术交流:定期更新Java硬核干货,不定期送书活动 🍅 王哥多年工作总结:Java学习路线总结&#xf…