A stochastic parrot in every pot 每口锅里都会有一只随机鹦鹉? | 经济学人社论双语精翻

news2024/11/25 10:06:47

本期双语文章来自《经济学人》2023年5月13日周报社论:《人工智能经济学》(The economics of AI)

A stochastic parrot in every pot?

每口锅里都会有一只随机鹦鹉?

What does a leaked Google memo reveal about the future of AI?

一份泄露的谷歌备忘录揭示了人工智能怎样的未来?

Open-source AI is booming. That makes it less likely that a handful of firms will control the technology.

开源AI正在蓬勃发展。从而降低了少数公司控制这项技术的可能性。

They have changed the world by writing software. But techy types are also known for composing lengthy memos in prose, the most famous of which have marked turning points in computing. Think of Bill Gates’s “Internet tidal wave” memo of 1995, which reoriented Microsoft towards the web; or Jeff Bezos’s “API mandate” memo of 2002, which opened up Amazon’s digital infrastructure, paving the way for modern cloud computing. Now techies are abuzz about another memo, this time leaked from within Google, titled “We have no moat”. Its unknown author details the astonishing progress being made in artificial intelligence (AI)—and challenges some long-held assumptions about the balance of power in this fast-moving industry.

他们通过编写软件改变了世界。但是这些技术型人才也因为用散文撰写冗长的备忘录而闻名,其中最著名的一篇标志着计算机科学的转折点。想想比尔·盖茨(Bill Gates)1995年的“互联网浪潮”备忘录,该备忘录将微软重新定位到网络;或者杰夫·贝佐斯(Jeff Bezos)2002年的“API授权”备忘录,该备忘录开辟了亚马逊的数字基础设施,并为现代云计算技术铺平了道路。现在,技术人员正在讨论另一份备忘录,这次是从谷歌内部泄露的,标题为“我们没有护城河”。其未知作者详细介绍了人工智能(AI)取得的惊人进展,并对这个快速发展行业中势力均衡的一些长期假设提出了挑战。

1995年,微软总裁比尔·盖茨(Bill Gates)在巴黎举行的新闻发布会前展示了微软的Windows 95程序。下图为比尔·盖茨1995年“互联网浪潮”备忘录

AI burst into the public consciousness with the launch in late 2022 of ChatGPT, a chatbot powered by a “large language model” (LLM) made by OpenAI, a startup closely linked to Microsoft. Its success prompted Google and other tech firms to release their own LLM-powered chatbots. Such systems can generate text and hold realistic conversations because they have been trained using trillions of words taken from the internet. Training a large LLM takes months and costs tens of millions of dollars. This led to concerns that AI would be dominated by a few deep-pocketed firms.

随着2022年底推出ChatGPT,人工智能进入了公众意识,这是一款由与微软密切相关的初创公司OpenAI制造的“大语言模型”(LLM)驱动的聊天机器人。它的成功促使谷歌和其他科技公司发布了自己的LLM聊天机器人。这样的系统可以生成文本并进行逼真的对话,因为它们已经使用从互联网上获取的数万亿个单词进行了训练。培训大型LLM需要数月时间,费用为数千万美元。这导致人们担心人工智能将由少数财力雄厚的公司主导。

But that assumption is wrong, says the Google memo. It notes that researchers in the open-source community, using free, online resources, are now achieving results comparable to the biggest proprietary models. It turns out that LLMs can be “fine-tuned” using a technique called low-rank adaptation, or LoRa. This allows an existing LLM to be optimised for a particular task far more quickly and cheaply than training an LLM from scratch.

但这种假设是错误的,谷歌备忘录说。它指出,开源社区的研究人员使用免费的在线资源,现在所取得的结果可与最大的专有模型相匹敌。事实证明,LLM可以使用一种称为低秩适应或LoRa的技术进行“微调”。这使得现有的LLM可以针对特定任务进行优化,比从头开始训练LLM更快,更便宜。

LoRA的思想逻辑可简单描述为:在原始PLM(Programmable Logic Matrice,可编程序的逻辑矩阵)旁边增加一个旁路,做一个降维再升维的操作,来模拟所谓的intrinsic rank。训练的时候固定PLM的参数,只训练降维矩阵A与升维矩阵B。而模型的输入输出维度不变,输出时将BA与PLM的参数叠加。

基于大模型的内在低秩特性,增加旁路矩阵来模拟全模型参数微调,LoRA通过简单有效的方案来达成轻量微调的目的。可以将现在的各种大模型通过轻量微调变成各个不同领域的专业模型。

考虑OpenAI对GPT模型的认知,GPT的本质是对训练数据的有效压缩,从而发现数据内部的逻辑与联系,LoRA的思想与之有相通之处,原模型虽大,但起核心作用的参数是低秩的,通过增加旁路,达到四两拨千斤的效果。

Activity in open-source AI exploded in March, when LLAMA, a model created by Meta, Facebook’s parent, was leaked online. Although it is smaller than the largest LLMs (its smallest version has 7bn parameters, compared with 540bn for Google’s PALM) it was quickly fine-tuned to produce results comparable to the original version of ChatGPT on some tasks. As open-source researchers built on each other’s work with LLAMA, “a tremendous outpouring of innovation followed,” the memo’s author writes.

开源人工智能的活动在三月份呈爆炸式增长,当时Facebook的母公司Meta创建的模型LLAMA在网上泄露。虽然它比最大的LLM小(它的最小版本有70亿个参数,而谷歌的PALM有5400亿个参数),但它很快就被微调了,在某些任务上产生了与ChatGPT原始版本相当的结果。因为开源研究人员在LLAMA为基础并借鉴彼此的成果,“随之而来的是巨大的创新涌现,”备忘录的作者写道。

This could have seismic implications for the industry’s future. “The barrier to entry for training and experimentation has dropped from the total output of a major research organisation to one person, an evening, and a beefy laptop,” the Google memo claims. An LLM can now be fine-tuned for $100 in a few hours. With its fast-moving, collaborative and low-cost model, “open-source has some significant advantages that we cannot replicate.” Hence the memo’s title: this may mean Google has no defensive “moat” against open-source competitors. Nor, for that matter, does OpenAI.

这可能会对该行业的未来产生地震般的影响。“培训和实验的进入门槛已经从一个主要研究机构的总产出下降到一个人、花一个晚上时间和一台强大的笔记本电脑就够了,”谷歌备忘录声称。LLM现在可以在几个小时内以100美元的价格进行微调。凭借其快速发展、协作和低成本的模式,“开源具有一些我们无法复制的显著优势。”因此,备忘录的标题是:这可能意味着谷歌对开源竞争对手没有防御性的“护城河”。就此而言,OpenAI也没有。

《经济学人》2023年5月7日文章链接:你的工作可能不受人工智能的影响

(https://www.economist.com/finance-and-economics/2023/05/07/your-job-is-probably-safe-from-artificial-intelligence)

Not everyone agrees with this thesis. It is true that the internet runs on open-source software. But people use paid-for, proprietary software, from Adobe Photoshop to Microsoft Windows, as well. AI may find a similar balance. Moreover, benchmarking AI systems is notoriously hard. Yet even if the memo is partly right, the implication is that access to AI technology will be far more democratised than seemed possible even a year ago. Powerful LLMs can be run on a laptop; anyone who wants to can now fine-tune their own AI.

不是每个人都同意这个论点。的确,互联网运行在开源软件上。但人们也使用付费的专有软件,从Adobe Photoshop到Microsoft Windows。人工智能可能会找到类似的平衡。此外,对人工智能系统进行基准测试是出了名的困难。然而,即使备忘录的部分内容是正确的,其含义是,人工智能技术的获取将比一年前更加民主化。强大的LLM可以在笔记本电脑上运行;任何想要的人现在都可以微调自己的AI。

This has both positive and negative implications. On the plus side, it makes monopolistic control of AI by a handful of companies far less likely. It will make access to AI much cheaper, accelerate innovation across the field and make it easier for researchers to analyse the behaviour of AI systems (their access to proprietary models was limited), boosting transparency and safety. But easier access to AI also means bad actors will be able to fine-tune systems for nefarious purposes, such as generating disinformation. It means Western attempts to prevent hostile regimes from gaining access to powerful AI technology will fail. And it makes AI harder to regulate, because the genie is out of the bottle.

这既有积极的影响,也有消极的影响。从好的方面来说,它使少数公司垄断控制人工智能的可能性大大降低。它将使人工智能的获取成本大大降低,加速整个领域的创新,并使研究人员更容易分析人工智能系统的行为(他们对专有模型的访问受到限制),从而提高透明度和安全性。但更容易获得人工智能也意味着坏人们将能够出于邪恶的目的微调系统,例如生成虚假信息。这意味着西方阻止敌对政权获得强大人工智能技术的努力将失败。这样一来,人工智能更难监管,因为妖怪已经从瓶子里出来了。

《经济学人》2023年4月20日文章链接:如何理性担心人工智能

(https://www.economist.com/leaders/2023/04/20/how-to-worry-wisely-about-artificial-intelligence)

Whether Google and its ilk really have lost their moat in AI will soon become apparent. But as with those previous memos, this feels like another turning point for computing. 

谷歌之流是否真的在人工智能领域失去了护城河,很快就会变得显而易见。但与之前的备忘录一样,这感觉像是计算科学的另一个转折点。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/650167.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

软文营销,如何写出优质的新闻稿

传媒如春雨,润物细无声,大家好,我是51媒体网胡老师。 一,什么是软文营销? 软文营销是一种通过撰写和发布具有信息性、有趣性和可读性的文章,来推广产品、服务或品牌的营销策略。软文是指以一种较为隐晦、…

【默认端口】市面上各种中间件、软件、服务的默认端口汇总

常用软件,中间件,服务的默认端口汇总 常用软件默认端口汇总 市面上各种中间件、软件和服务的默认端口众多,下面列举一些常见的默认端口: SSH(Secure Shell):22 Telnet:23 FTP…

AI在零售行业的应用

原创 | 文 BFT机器人 如今,零售商已经体验到使用人工智能 (AI) 的诸多好处,随着行业不断创新,人工智能的重要性只会越来越大。随着人工智能越来越被广泛接受,它的实施也越来越广泛。 查看这些用例,了解零售业中的 AI如…

一文掌握linux基本操作命令

欢迎关注博主 Mindtechnist 或加入【Linux C/C/Python社区】一起学习和分享Linux、C、C、Python、Matlab,机器人运动控制、多机器人协作,智能优化算法,滤波估计、多传感器信息融合,机器学习,人工智能等相关领域的知识和…

Selenium元素定位的八种方法(建议收藏)

自动化一般需要四步操作:获取元素,操作元素,获取返回结果,断言(返回结果与期望结果是否一致),最后自动出测试报告。Selenium提供8种元素定位的方法:id,name,class name,link text,xp…

三维点云机器学习检测定位圆心,三维圆检测,拟合轴线(基于open3d和python)

0.任务描述 背景:从端面拍摄大型圆筒工件,该工件周向尺寸大于相机视野,只能拍摄到1/3左右的圆周,且无法保证相机与端面垂直拍摄 任务:需要拟合圆周与轴线位置 难点:三维圆拟合与检测都很复杂&#xff0c…

fscan安装配置(windows、linux系统)

fscan安装配置(windows、linux系统) 1、简介 fscan一款内网综合扫描工具,方便一键自动化、全方位漏扫扫描。 它支持主机存活探测、端口扫描、常见服务的爆破、ms17010、redis批量写公钥、计划任务反弹shell、读取win网卡信息、web指纹识别、web漏洞扫描、netbios探…

程序员面试必备的 Java 八股文,适合所有的 Java 求职者

说明 本文分享 Java 后端真实高频面试题,有详细答案,保你稳过面试。题目包括:Java 基础、多线程、JVM、数据库、Redis、Shiro、Spring、SpringBoot、MyBatis、MQ、ELK、SpringCloud、设计模式等。 包含从简单到困难、从高频到低频的题目&…

EF Core中Partition by实现

一、SQL语句实现 Partition by是SQL Server数据库中提供的分区函数,跟Group by不同的是,Partition by能够按照分区返回所有记录,而Group by只能返回一条记录。 举个例子,有如下的数据库,需要找出每个唯一编号最新状态的数据。 显然,CW048201和CW048202它们的最新状态都…

靠着这套Github标星55K的Java面试笔记,成功拿到了2个大厂offer

作为一名优秀的程序员,技术面试是不可避免的一个环节,一般技术面试官都会通过自己的方式去考察程序员的技术功底与基础理论知识。 如果你参加过一些大厂面试,肯定会遇到一些这样的问题: 1、看你项目都用的框架,熟悉S…

Linux 环境下Docker将镜像打包导出到本地,上传至内网服务器(八)

文章目录 背景1. docker容器打包成镜像和压缩(1)首先查看镜像所在的容器,获取到容器id(2)将容器保存成镜像(3)将镜像打包(4)将镜像包压缩 2. docker镜像压缩包解压及镜像…

2023最新发布:Java 面试突击大全 带你摸熟 20+ 互联网公司面试考点

对于程序员来说,春招的失利意味着在金九银十要打一场“硬战”,可又有多少人做好了面试的准备呢?对于一线互联网公司的面试,你又了解多少呢? 今天,一本《Java 面试考点大全》全网首发,带你摸熟 …

阿里8年,肝到P7只剩这份笔记了,帮朋友拿了7个Offer....

时光飞逝,转眼间在阿里工作了8年,工作压力大,节奏快,但是从技术上确实得到了成长,尤其是当你维护与大促相关的系统的时候,熬到P7也费了不少心思 我的职业生涯开始和大多数测试人一样,刚开始接触…

大话设计模式——享元

享元(Flyweight) Intent 利用共享的方式来支持大量细粒度的对象,这些对象一部分内部状态是相同的。 Class Diagram Flyweight:享元对象IntrinsicState:内部状态,享元对象共享内部状态ExtrinsicState&am…

【架构设计】单点登录实现技术方案

序言 你只管努力,其他交给时间,时间会证明一切。 文章标记颜色说明: 黄色:重要标题红色:用来标记结论绿色:用来标记一级论点蓝色:用来标记二级论点 1 基本介绍 1.1 什么是单点登录 单点登录&am…

命令模式(十七)

相信自己,请一定要相信自己 上一章简单介绍了模板模式(十六), 如果没有看过, 请观看上一章 一. 命令模式 定义:将一个请求封装为一个对象,使发出请求的责任和执行请求的责任分割开。这样两者之间通过命令对象进行沟通, 这样方便…

智能锁语音芯片方案,NV170D-SOP8九芯电子自主研发

随着智能家居市场的不断壮大,智能门锁已经成为越来越多家庭不可或缺的一部分。传统的机械锁门的开锁方式已经无法满足人们对安全和便捷性的需求。而电子锁门随着技术的不断突破,拥有了更为丰富的功能和更高的安全性。 但是,目前市场上有那么…

1.4.2:DHTMLX JS 看板 DHTMLX JS Kanban Board Crack

用于任务管理应用 程序的 敏捷 JavaScript 看板,使用 DHTMLX JavaScript 看板库开发成熟的 Web 应用程序,以获得对工作量的完全控制并有效地管理任务。 开始使用 DHTMLX JS 看板 DHTMLX 看板允许创建任意数量的任务并通过右侧面板编辑它们。用户可以编…

uCOSii的任务延时和软件定时器

uCOSii的任务延时和软件定时器 1、心跳节拍 操作系统的心跳节拍称为一个Tick。uCOSii中有一个专用的心跳节拍函数:OSTimeTick(),每调用一次,系统时间计数器OSTime计数器就会加1次。为了能调用这个心跳节拍函数,我们使用CPU的滴答…

极致呈现系列之:Echarts地图的浩瀚视野(二)

今天我将基于上一个博客讲到的Echarts地图的相关知识,来实现一个三维地图的效果,我将通过两种方式来实现,一种是伪3D效果的中国地图效果,为什么说是伪3D效果呢,跟着做完你就明白了;一种是真正的三维效果中国…