2023年7月第3周大模型荟萃

news2024/9/30 17:32:26

2023年7月第3周大模型荟萃

  • 2023.7.25
  • 版权声明:本文为博主chszs的原创文章,未经博主允许不得转载。

1、华为发布大模型时代 AI 存储新品

7 月 14 日华为在深圳发布了大模型时代 AI 存储新品,为基础模型训练、行业模型训练,细分场景模型训练推理提供存储解决方案。华为此次推出的AI 存储新品包括 OceanStor A310 深度学习数据湖存储FusionCube A3000 训/推超融合一体机。其中,OceanStor A310 深度学习数据湖存储可实现从数据归集、预处理到模型训练、推理应用的 AI 全流程海量数据管理。FusionCube A3000 训/推超融合一体机面向行业大模型训练/推理场景,针对百亿级模型应用,可提供拎包入住式的部署体验。

2、英特尔发布高性价比 Gaudi2 加速卡

7 月 11 日,Intel 面向中国市场推出第二代 Gaudi 深度学习加速器 Habana Gaudi2。在大语言模型 GPT-3 的评测上,Gaudi2 也展示了其较优的性能。对于在中国运行深度学习训练和推理工作负载的客户来说,与市场上其他面向大规模生成式 AI 和大语言模型的产品相比,Gaudi2 是更理想的选择。除了在性能表现上超过 A100 之外,Gaudi2 在各种最先进的模型上相对于 A100 提供了约两倍的性价比。

在 GPT-3 的训练上,英特尔使用 384 块 Gaudi 2 加速器使用 311 分钟训练完成;相比之下,英伟达在 512 块 H100 GPU 上的训练时间则为 64 分钟。这意味着,基于 GPT-3 模型,每个 H100 的性能领先于 Gaudi2 3.6 倍。性价比是影响 H100 和 Gaudi2 相对价值的重要考量因素,Gaudi2 服务器的成本要比 H100 低得多。

3、Meta 发布最强免费可商用大模型 Llama 2

一直以来 Llama 可以说是 AI 社区内最强大的开源大模型。但因为开源协议问题,一直不可免费商用。2023年7月19日,在今天的微软的Inspire 合作伙伴大会上,Meta宣布和微软深化合作,正式推出新一代开源大型语言模型Llama 2,并将该模型免费开放给商业和研究使用。

面对OpenAI和谷歌正在努力构建的技术围墙,Meta似乎想要另辟蹊径、通过生态开放来切入这场巨头间的大模型竞赛。此次Meta高调开源Llama 2,无疑是在正面硬刚走“技术保密路线”的GPT-4和谷歌的PaLM 2。

此次 Meta 发布的Llama 2 模型系列包含 70 亿、130 亿和 700 亿三种参数变体。根据官方的介绍,相比于 Llama 1,Llama 2 的训练数据多了 40%,上下文长度也翻倍,并采用了分组查询注意力机制。具体来说,Llama 2 预训练模型是在2 万亿的 token上训练的,精调 Chat 模型是在100 万人类标记数据上训练的。根据公布的测评结果显示,Llama 2 在包括推理、编码、精通性和知识测试等许多外部基准测试中都优于其他开源语言模型。

此举意味着,国内大多数大模型又将升级新一代了。

  • 论文地址:https://ai.meta.com/research/publications/llama-2-open-foundation-and-fine-tuned-chat-models/
  • 项目地址:https://github.com/facebookresearch/llama

4、LG发布多模态大语言模型EXAONE 2.0

7 月 20 日消息,LG 公司正式发布多模态大语言模型 EXAONE 2.0,支持韩语、英语两种语言,可用于新材料、新药开发等领域。据介绍,EXAONE 2.0 学习了“约 4500 万件通过合作伙伴关系获得的专利和论文等专业文献,以及 3.5 亿张图片”。为了解决超大型 AI 的高成本问题,EXAONE 2.0 在处理大规模语言模型(LLM)、图像和语言等多种信息的同时,还进行了轻量化设计。目前,EXAONE 2.0 仅为 B2B(企业与企业之间)领域提供服务。

点评:推测是基于开源大模型项目+自己训练。

5、斯坦福研究发现GPT-4“变笨”

近日,来自斯坦福、UC Berkeley 的一篇 arXiv 预印本论文给出了对这一问题的定量实验结果并公布了相关评估和响应数据。在论文公布不久,这篇研究就引起了大家广泛的关注与讨论,很多网友都认同论文阐述的结果。

具体而言,通过四个任务研究过 GPT-3.5 和 GPT-4 的 2023 年三月版和六月版的生成结果后,研究者发现这两个 LLM 确实在一些指标上变得更差了,尤其是 GPT-4 求解数学问题的能力,可以说是雪崩式下降 —— 三月版 97.6% 的准确度到六月只剩 2.4%。研究者还推测了这些变化的原因。需要指出,更新版的 LLM 并不总是能生成更好的结果。事实上,尽管 GPT-4 的整体表现变得更好了,但六月版却会在三月版答对的问题上犯错。

目前此问题还没有准确的结论。

6、IDC 最近最新发布《AI大模型技术能力评估报告,2023》

7月20日,国际数据公司IDC 最新发布《AI大模型技术能力评估报告,2023》,从算法、生态、服务能力等多个维度评估中国大模型的整体实力。其中,百度和阿里的大模型得分比较高。

在这里插入图片描述

7、多国出台法规监管AIGC技术

  • 中国:近日,国家网信办等7部门联合发布《生成式人工智能服务管理暂行办法》(以下称《办法》),自2023年8月15日起施行。《办法》的公布为中国生成式人工智能服务的健康发展提供了重要法制保障。
  • 欧盟:当地时间6月14日,欧盟的主要立法机构欧洲议会通过了一项名为《人工智能法案》(AI Act)的法律草案,该法案将对被视为该技术最危险的用途施加新的限制——投票禁止实时远程生物识别技术,欧盟禁令意味着不能在公共场合实时扫描人脸;同时要求OpenAI和谷歌等公司必须进行风险评估,并披露更多用于创建程序的数据。欧盟在监管生成式AI方面的进展可能对该领域产生巨大影响,据估计,未来10年,该领域的价值将超过1.3万亿美元。而违反欧盟的监管规定,可能导致一家公司面临高达年收入6%的罚款。
  • 美国:6月下旬,美国商务部宣布其下属的国家标准与技术研究所(NIST)将启动一个政府工作小组,制订指导方针应对生成式人工智能带来的风险,同时有助于抓住这种新技术带来的机遇。
  • 当地时间7月21日,美国总统拜登与美国人工智能领域的7家领军科技企业负责人会面。这七家公司是亚马逊、Anthropic、谷歌、Inflection、Meta、微软和OpenAI。这些公司自愿向白宫承诺为AI生成内容添加水印。
  • 澳大利亚:近日,澳大利亚政府表示,将弥补现有法律漏洞,对新形式的人工智能技术采取“保障措施”。澳大利亚联邦工业、创新和科学部部长埃德·胡斯克(Ed Husic)发布了澳大利亚国家科学技术委员会的建议,以及一份关于人工智能的讨论文件,其主旨是考虑有针对性的监管措施。
  • 英国:据路透社消息,在英国有几家国家监管机构负责起草内容涵盖人工智能的监管规则,这些机构中就包括金融行为监管局。目前,该机构正在与艾伦·图灵研究所和其他法律与学术机构协商,提高其对人工智能技术的理解。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/788828.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

连锁反应开始了!Linux 发行版迎新变化!

任何企业都有合法权利捍卫其模型和产品。撇开大量不真正了解开源许可证如何工作的人不谈,我们的印象是,有很多人觉得仅仅因为这是Linux,他们就有某种权利免费获得它。但事实上,他们没有。这不是自由软件中的“自由”的意思&#x…

【VCS】(5)Fast RTL-level Verification

Fast RTL-level Verification General Coding GuidlinesLab --- simprofile$display() 输出彩色内容 前面的内容都是在说怎样进行仿真和验证,即如何使用 VCS 。 但是,仿真和验证是不是也有所讲究? 有没有一些标准来衡量设计代码和验证代码的质…

面向初学者的APP开发教程:开始你的编程之旅

不管你是已经在 APP开发行业中工作了很长时间,还是正在学习该领域的知识,都有必要开始学习如何编写一个应用程序。对于初学者来说,编写应用程序的第一步是使用 HTML和 CSS构建一个漂亮的UI。 一旦你学会了这些基本技能,你就可以开…

全志F1C200S嵌入式驱动开发(解决spi加载过慢的问题)

【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing @163.com】 之前的几个章节当中,我们陆续解决了spi-nor驱动的问题、uboot支持spi-nor的问题。按道理来说,下面要做的应该就是用uboot的loady命令把kernel、dtb、rootfs这些文件下载到ddr,然…

【Milvus】记录一次基于milvus-backup做的Milvus备份与恢复

文章目录 环境代码准备备份构建/运行验证 恢复遇到的问题 环境 milvus:v2.2.4 go:1.20.2 darwin/amd64 milvus-backup:v0.2.2 代码准备 https://github.com/zilliztech/milvus-backup/releases 如果你的milvus是2.2.9版本及以上&#xf…

SAP CAP篇十一:支持Media Object:图片、附件等

文章目录 本系列此前的文章官方文档详细修改更新数据库修改Annotation使其显示在Object Page上 运行结果Fiori Object Page上的Attachment Facet选择完文件后的UI效果前台与后台的交互 对应代码及branch 本系列此前的文章 SAP CAP篇一: 快速创建一个Service,基于Ja…

软件测试如何做到充分性测试?

目录 1 提前介入测试 2 测试分析,测试用例设计 3 测试用例评审 4 严格按照测试用例执行测试 5 分解需求 6 交叉测试 7 重点功能要及时跟踪进行测试充分性分析 做软件测试要想保质保量,就要做到测试充分,什么是测试充分,就是…

将数组和减半的最少操作次数(力扣)

将数组和减半的最少操作次数 题目描述思路测试代码复杂度测试结果 题目描述 给你一个正整数数组 nums 。每一次操作中,你可以从 nums 中选择 任意 一个数并将它减小到 恰好 一半。(注意,在后续操作中你可以对减半过的数继续执行操作&#xf…

(笔记)深度理解-主成分分析PCA

主成分分析 PCA(Principal Component Analysis),即主成分分析方法,是一种使用最广泛的数据降维算法。PCA的主要思想是将n维特征映射到k维上,这k维是全新的正交特征也被称为主成分,是在原有n维特征的基础上重新构造出来的k维特征。…

蛋白质分子结构设计

paper read 1 Created by: 银晗 张 Created time: May 27, 2023 3:47 PM Tags: Product 补充了解蛋白质的生物学知识学习一下Diffusion的原理 💡 Method & Innovations Framework Summary: first deep learning models to perform antibody sequence-stru…

随笔--更改已经启动中的容器的配置文件

文章目录 docker 容器的配置信息地址修改文件映射 docker 容器的配置信息地址 # 一般在 sudo su cd /cd /var/lib/docker/containers/{容器id}/ # 查看容器的id,CONTAINER ID就是容器id的前部分 docker ps修改文件映射 进入容器的配置文件位置一般包含这些文件 # 先stop容器…

0基础学习VR全景平台篇 第69篇:VR直播-如何设置广告

直播间可以插入轮播广告,并且支持外链跳转,能够有效地提升VR直播活动的转化率。 1、点击,添加广告 2、广告图展现形式分为两种:普通广告和全屏广告,普通广告在非全屏播放的直播间显示,全屏广告在全屏播放的…

特征选择策略:为检测乳腺癌生物标志物寻找新出口

内容一览:microRNA(小分子核糖核酸)是一类短小的单链非编码 RNA 转录体。这些分子在多种恶性肿瘤中呈现失控性生长,因此近年来被诸多研究确定为确诊癌症的可靠的生物标志物 (biomarker)。在多种病理分析中,差异表达分析…

在 “小小容器” WasmEdge 里运行小小羊驼 llama 2

昨天,特斯拉前 AI 总监、OpenAI 联合创始人 Andrej Karpathy 开源了 llama2.c 。 只用 500 行纯 C 语言就能训练和推理 llama 2 模型的框架,没有任何繁杂的 python 依赖。这个项目一推出就受到大家的追捧,24 小时内 GitHub 收获 4000 颗星&am…

AI学习笔记三:编写检测的yolov5测试代码

若该文为原创文章,转载请注明原文出处。 通过detect.py代码测试通过后,阅读detect.py代码发现,有些难以看懂,看得有点蒙蒙的, 所以编写了一个简单的测试程序。 代码如下: import cv2 import numpy as np…

工业自动化编程与数字图像处理技术

编程是计算机领域的基础技能,对于从事软件开发和工程的人来说至关重要。在工业自动化领域,C/C仍然是主流的编程语言,特别是用于工业界面(GUI)编程。工业界面是供车间操作员使用的,使用诸如Halcon或OpenCV等软件单独无法完成项目&a…

mysql 第八章

1.主从复制 主服务器: 从服务器: 检测结果: 2.读写分离 amoeba 机器: 客户端机器: 检测结果: 3.总结 在企业应用中,业务通常数据量都比较大。单台 mysql 在安全性、 高可用性、高并发方面都&am…

走好职业生涯第一步 中科驭数2023校招生培训“芯星计划” 落幕

校招生作为公司发展的新鲜血液,是公司在人才储备和人才梯队建设上的重要投资。近日,中科驭数在北京、武汉两地组织开展了2023年校招生培训项目——“芯星计划”,旨在帮助2023届校招新员工快速了解公司文化、融入驭数团队,顺利迈过…

字节抖音小程序,使用 uniapp 调起内置支付

字节抖音小程序,使用 uniapp 调起内置支付 第一步:提交订单 后端通过抖音预下单接口,提交支付订单信息。 预下单接口_小程序_抖音开放平台预下单接口 提交支付订单信息。 ## 使用限制 无 ## 接口说明 预下单接口需要保证同一app_id下每笔订…

中国剩余定理讲解及例题

凡有所学&#xff0c;皆成性格。 凡有所学&#xff0c;皆成性格。 目录&#x1f352; &#x1f349;中国剩余定理维基百科<font colorgreen>:cherries:形式描述&#xff1a; <font colorred>:pear: 解法:strawberry:<font colorgreen>求解方法&#xff1a;:…