2023年8月第1~2周大模型荟萃

news2024/11/27 10:40:59

2023年8月第1~2周大模型荟萃

  • 2023.8.14
  • 版权声明:本文为博主chszs的原创文章,未经博主允许不得转载。

1、黑客制造了一款基于 AI 的恶意工具 FraudGPT

早先,有黑客制作了一个“没有道德限制”的 WormGPT 聊天机器人,可以自动生成一系列钓鱼邮件。目前,又有黑客制造了一个基于 AI 的恶意工具 FraudGPT,黑客在售卖页表示,该工具可用于编写恶意代码、创建出“一系列杀毒软件无法检测的恶意软件”、检测网站漏洞、自动进行密码撞库。据称不到一周已经有逾 3000 名买家下单。

Netenrich 公司研究员 Rakesh Krishnan 声称,FraudGPT 自 7 月 22 日以来,一直在暗网流通,订阅费用为每月 200 美元(约 1429.46 元人民币)、六个月 1000 美元(约 7147.3 元人民币),一年 1700 美元(约 12150.41 元人民币)。

2、小米大模型首次曝光

小米大模型MiLM-6B于近日现身C-Eval大模型评测榜单,在C-Eval榜单中排名第9,排在阿里的通义千问大模型之前,仍然落后于清华的ChatGLM2-12B。

小米于今年4月正式组建AI实验室大模型团队,号称投入AI领域人员超1200人,短短4月就初步完成了大模型的训练和部署,成绩显著。小米总裁卢伟冰发言表示,会积极拥抱大模型,但不会像Open AI一样做通用大模型,而是会深度和业务结合协同,利用AI技术提升内部效率。但是从目前公开的信息来看,做的仍然是通用大模型。

3、鸿蒙4.0集成大模型应用

8 月 4 日华为正式发布了 HarmonyOS 4.0,其中一个显著的特点是接入了盘古AI大模型,在智能助手小艺的功能中引入了AI对话和文本生成能力。小艺可以帮助用户识别图片中的内容和文字,朗读文字内容,接入更多服务。在原有的语音交互基础上,小艺扩展了文字、图片、文档等多种形式的输入。用日常说话的方式自然地与 AI 交流,小艺就可以自动帮用户完成任务。

华为针对终端消费者场景构建了大量的场景数据与精调模型后的L1层对话模型,并将该模型用在了智慧助手小艺中,华为也成为国内率先将大模型能力融入智慧助手并面向消费者落地的科技公司。这种思路值得点赞。

4、OPPO引入阿里通义千问大模型

今年4月,阿里云宣布将与OPPO安第斯智能云联合打造OPPO大模型基础设施,基于通义千问完成大模型的持续学习、精调及前端提示工程,建设服务于OPPO终端用户的AI服务。OPPO中国区总裁刘波曾在接受采访时提到,OPPO内部在思考大模型在手机端的应用。OPPO的小布助手团队一直在AI技术领域开展大量研究,包括语音识别、语义理解、对话生成、知识问答系统、开放域聊天、多模态等。

5、微软亚洲研究院探索将LLM用于工业控制

最近,微软亚洲研究院提出可以将LLM用于工业控制,而且仅需少量示例样本就能达成优于传统强化学习方法的效果。该研究尝试使用GPT-4来控制空气调节系统(HVAC),得到了相当积极的结果。研究团队设计了一种机制来从专家演示和历史交互挑选示例,还设计了一种可将目标、指示、演示和当前状态转换为prompt的prompt生成器。然后,再使用生成的prompt,通过LLM来给出控制。

6、英伟达发布CALMAI模型

英伟达近日和以色列理工学院、巴伊兰大学和西蒙弗雷泽大学合作,发布了一篇关于CALMAI模型的技术论文。英伟达表示CALM的全称是条件对抗潜在模型(Conditional Adversarial Latent Models),用于训练定制虚拟角色。英伟达表示,在真实世界训练10天,相当于在模拟世界里训练10年时间。CALMAI模型在训练之后,可以模拟50亿个人体动作,涵盖行走、站立、坐姿、跑步、用剑战斗等人类动作。CALMAI模型的实用价值极大。

7、湖北算力与大数据产业联盟成立

湖北算力与大数据产业联盟于8月11日宣布成立,首批20家联盟成员单位包括中国移动、中国电信、中国联通、华为、科大讯飞、达梦数据库、武汉大学、华中科技大学、华中农业大学、武汉理工大学、武汉人工智能研究院、中国科学院、中国长江三峡集团、湖北数据集团、长江计算、湖北科投、武汉云、芯动科技、利川振业等,目标是形成上下游、大中小、产学研用深度融合的数字化协同发展生态,为湖北省算力与大数据产业规模实现“一年夯基、两年成势、三年跃升”的目标提供强力支撑。

8、阿里字节等向英伟达订50亿美元芯片

最近,中国互联网巨头们向英伟达下单订购50亿美元的芯片。百度、字节跳动、腾讯、阿里巴巴已下单10亿美元,采购约10万张英伟达A800 GPU,将于今年交付。两位接近英伟达的人士称,这些中国科技巨头还采购了40亿美元的GPU,将于2024年交付。之前有报道表示,字节跳动已储备了至少10000张英伟达GPU。字节还订购了近70000张A800芯片,将于明年交付,价值约7亿美元。据两位接近阿里巴巴的人士透露,阿里云从英伟达收到了数千块H800芯片。

9、大模型基准测试工具AgentBench发布

8月7日,来自清华大学、俄亥俄州立大学、加州大学伯克利分校的研究人员们在预印本平台arXiv发表一篇新论文,介绍了一个面向大型语言模型的多维基准测试工具AgentBench。AgentBench由8个不同的任务组成,可评估大语言模型在多轮开放式生成环境中的推理和决策能力。研究团队对25个大型语言模型的广泛测试表明,顶级商业大型语言模型在复杂环境中表现出强大的代理能力,但它们与开源竞争对手之间的性能存在显著差异。

10、IBM计划在watsonx平台上提供LLAMA 2模型

8月9日,IBM宣布计划在watsonx.ai工作室中托管Meta的Llama 2-chat 700亿参数模型,现可供部分客户及合作伙伴提前访问。这将建立在IBM与Meta在AI开放创新方面的合作基础上,包括与Meta开发的开源项目合作,例如PyTorch机器学习框架和watsonx.data中使用的Presto查询引擎。

目前通过watsonx.ai,AI构建者既可使用IBM的模型,也可使用Hugging Face社区的模型,这些模型经过预训练,来支持一系列自然语言处理(NLP)的任务,包括问答、内容生成和摘要、文本分类和提取。预计随后还将发布其AI调优平台,watsonx.ai 模型的fact sheets,以及新增的AI模型。

11、Stability AI推出生成式AI编程产品StableCode

8月8日,Stability AI宣布推出其首个用于编码的大型语言模型生成式AI产品StableCode。该产品旨在帮助程序员进行日常工作,同时也为准备将技能提升的新开发人员提供了一个很好的学习工具。StableCode通过使用三种不同的模型来帮助开发人员编程,提高效率,分别是基础模型、用于解决复杂编程任务的指令模型、为用户提供单行和多行自动补全建议的长上下文窗口模型。
StableCode

12、英伟达推出下一代GH200 Grace Hopper超级芯片

2023 年 8 月 8 日,NVIDIA 发布新一代 NVIDIA GH200 Grace Hopper 平台,该平台基于全球首款搭载 HBM3e 处理器的 Grace Hopper 超级芯片,专为加速计算和生成式 AI 时代而构建。新平台专为处理大语言模型、推荐系统、矢量数据库等全球最复杂的生成式 AI 工作负载而构建,将提供多种配置选择。

GH200由72核Grace CPU和4PFLOPS Hopper GPU组成,在全球最快内存HBM3e的“助攻”下,内存容量高达141GB,提供每秒5TB的带宽。其每个GPU的容量达到NVIDIA H100 GPU的1.7倍,带宽达到H100的1.55倍。与当前一代产品相比,新的双GH200系统共有144个Grace CPU核心、8PFLOPS计算性能的GPU、282GB HBM3e内存,内存容量达3.5倍,带宽达3倍。如果将连接到CPU的LPDDR内存包括在内,那么总共集成了1.2TB超快内存。

13、清华大学沈阳教授团队发布《大语言模型综合性能评估报告》

清华大学沈阳教授团队于8月7日发布了《大语言模型综合性能评估报告》。其中对文心一言(v2.2.0)、讯飞星火(v1.5)、通义千问(v1.0.3)、昆仑天工(v3.5)、GPT-4、ChatGPT 3.5、Claude(v1.3)七款大模型进行了测评。评估截止时间为2023年6月30日。

LLM领域发展迅猛,故时效性很重要,而写报告花了一个多月?难以理解。从报告的内容来看,评测范围窄,内容一般,像是研究生们的实习练手之作。因此报告也就可以一读,价值不大。比如对比Claude v1.3实在是选错了对象,Claude 2的性能才是业界关注的重点。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/875627.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

PDF文件限制编辑怎么取消?

PDF文件设置了限制编辑,想要取消PDF文件的限制编辑,很简单,打开PDF编辑器,点击工具栏中的文件,选择属性按钮,进入到熟悉感界面之后,点击安全,然后我们点击权限下拉框,选择…

ModaHub魔搭社区:Milvus Cloud向量数据库可以部分避免AI幻觉

向量数据库的技术优势使其更适合在AI场景下应用,能够为AI的开发、增强内容生成的准确性提供重要的技术支撑。进一步来讲,向量数据库也被看作是大语言模型的记忆与灵魂,对于解决大模型的“幻觉”问题至关重要。 由于大模型是基于已有数据训练而…

TB/TM-商品详情原数据(APP)

一、接口参数说明: item_get_app-获得TB/TMapp商品详情原数据,点击更多API调试,请移步注册API账号点击获取测试key和secret 公共参数 请求地址: https://api-gw.onebound.cn/taobao/item_get_app 名称类型必须描述keyString是调用key&…

java+springboot+mysql员工管理系统

项目介绍: 使用javaspringbootmysql开发的员工管理系统(人力资源管理系统),系统包含超级管理员、管理员、员工角色,功能如下: 超级管理员:管理员管理;部门管理;职位管理…

嵌入式面试笔试刷题(day10)

文章目录 前言一、数组和链表的区别二、什么是内存对齐三、IIC的时序四、static作用五、查看tty设备的方法六、查找指定文件命令七、三次握手和四次挥手1.三次握手2.四次挥手 八、半关闭状态九、字节流和数据报总结 前言 本篇文章继续讲解笔试和面试。 一、数组和链表的区别 …

C++ STL stack queue

目录 一.stack 介绍 二.stack 使用 三.stack 模拟实现 普通版本: 适配器版本: 四.queue的介绍 五. queue使用 六.queue模拟实现 七.deque介绍 1.容器适配器 2.deque的简单介绍 3.deque的缺陷 4.为什么选择deque作为stack和queue的底层默认容…

SpringBoot复习:(46)全局的bean懒加载是怎么实现的?

在application.properties中配置: spring.main.lazy-initializationtrue在运行SpringApplication的run方法时,代码如下: 其中调用了prepareContext,prepareContext代码如下: 当在配置文件中配置了spring.main.lazy-initializat…

中国1990-2021连续30年土地利用数据CLCD介绍及下载

CLCD数据介绍 CLCD(China Land Cover Dataset)数据集由武汉大学黄昕老师公布,黄昕老师基于Google Earth Engine上335,709景Landsat数据,制作中国年度土地覆盖数据集(annual China Land Cover Dataset, CLCD),包含1985+1990—2020中国逐年土地覆盖信息。 为此,黄昕老师…

学好Elasticsearch系列-索引的批量操作

本文已收录至 Github,推荐阅读 👉 Java 随想录 先看后赞,养成习惯。 点赞收藏,人生辉煌。 文章目录 基于 mget 的批量查询基于 bulk 的批量增删改增加删除修改 filter_path Elasticsearch 提供了 _bulk API 来执行批量操作&#x…

Web APIs 第六天

正则表达式介绍语法元字符修饰符 一.正则表达式介绍 ① 简介 用来匹配字符串中字符组合的模式在JavaScript中,正则表达式也是对象通常用来查找,替换那些符合正则表达式的文本,许多语言都支持正则表达式 ② 使用场景 验证表单&#xff1a…

解决Adobe Flash Player已被屏蔽

问题:该插件不支持 原因:现在浏览器默认禁用flash 博主当前使用的是谷歌浏览器Chrome 2个主要方法都已经失效 搜索一圈后,之前博客给出的2个主要方法都已经失效。 1、flash.cn 下载本地播放器 2、在chrome中打开flash的禁用开关 2023年解…

vm ubuntu20共享文件夹

问题: 根据教程开启共享文件夹后 ,在ubuntu 的/mnt里面没有hgfs目录,也没有共享的两个文件夹,执行如上命令可重新挂载共享目录 vmware-hgfsclient sudo vmhgfs-fuse .host:/ /mnt/ -o nonempty -o allow_other 之后通过find / -name 你的共享目录名字 查看是否加载成功 附…

总线基本概念

总线基本概念 为什么要用总线 总线是连接各个部件的信息传输线,是各个部件共享的传输介质。(如果没有总线,那么每新增一个组件,就需要增加若干线和其余组件相连) 在任何一个时刻,只能有一对设备&#xf…

第三章 图论 No.12欧拉回路与欧拉路径

文章目录 定义欧拉路径的性质:1123. 铲雪车边编号输出欧拉路径:1184. 欧拉回路点编号字典序最小输出欧拉路径:1124. 骑马修栅栏并查集判断有向图是否存在欧拉路径:1185. 单词游戏 定义 小学一笔画问题,每条边只经过一次…

pconsc4 安装

Pconsc4 安装遇到的问题 Pconsc4-github 按照红框给的一行命令,一行毁所有。 1 gcc and g not found # 1 Start by updating the packages list:sudo apt update# 2 Install the build-essential package by typing:sudo apt install build-essential## The comm…

83. 删除排序链表中的重复元素

题目链接:力扣(LeetCode)官网 - 全球极客挚爱的技术成长平台 解题思路:从前往后遍历节点,如果当前节点和下一个节点的值相等,就跳过下一个节点 具体算法如下: current head如果 current!null…

如何使用CSS实现一个下拉菜单?

聚沙成塔每天进步一点点 ⭐ 专栏简介⭐ 使用CSS实现下拉菜单⭐ HTML 结构⭐ CSS 样式⭐ 写在最后 ⭐ 专栏简介 前端入门之旅:探索Web开发的奇妙世界 记得点击上方或者右侧链接订阅本专栏哦 几何带你启航前端之旅 欢迎来到前端入门之旅!这个专栏是为那些…

SAP MIGO采购订单收货默认库存类型控制

在启用了QM模块的企业应用中,收货时针对库存类型就会有不同情况,参与质检的收到质检库存,不参与质检的收到非限制库存。 那么我一直没的遇到过关于应收到质检,而收到非限制库存的反馈。说明这样的问题不会发生,带着疑…

PyQt5设置按钮菜单和信号与槽函数的连接

目录 一、Qt Designer 在窗口中添加菜单和工具栏 二、源代码 1、界面代码 2、逻辑代码 3、演示 三、相关功能 一、Qt Designer 在窗口中添加菜单和工具栏 右键可以选择创建菜单栏。创建后双击【在这里输入】,然后输入菜单名,敲下回车确认&#xf…

OpenCV图像处理——图像平滑

目录 图像噪声椒盐噪声高斯噪声图像平滑简介均值滤波高斯滤波中值滤波 图像噪声 椒盐噪声 随机出现的黑白噪声 高斯噪声 噪声的灰度值符合高斯分布 图像平滑简介 均值滤波 cv.blur(src,ksize,anchor,borderType)import numpy as np import cv2 as cv import matplotlib.…