AI很渴:chatGPT交流一次=喝掉一瓶水,GPT3训练=填满核反应堆

news2024/10/7 10:16:51

流行的大型语言模型(LLM),如OpenAI的ChatGPT和Google的Bard,耗能巨大,需要庞大的服务器农场提供足够的数据来训练这些强大的程序。对这些数据中心进行冷却也使得AI聊天机器人对水的需求量极大。新的研究表明,仅GPT-3的训练就消耗了18.5万加仑(70万升)的水。根据一项新研究,普通用户与ChatGPT的对话基本上相当于在地面上倒掉一大瓶新鲜水。考虑到聊天机器人的空前流行,研究人员担心所有这些浪费的水瓶可能对水供应造成严重影响,尤其是在世界各地历史性干旱和迫在眉睫的环境不确定性之际。

加州河滨分校和得克萨斯大学阿灵顿分校的研究人员在一篇题为《让AI更节水》的预印论文中发布了AI的用水估算结果。作者们发现,训练GPT-3所需的淡水量相当于填满一个核反应堆的冷却塔所需的水量。OpenAI并未披露训练GPT-3所需的时间长度,这给研究人员的估算带来了困难,但微软与这家AI初创公司达成了一项为期多年、价值数十亿美元的合作伙伴关系,并为AI训练建造了超级计算机,微软表示,其最新的超级计算机需要一个庞大的冷却装置,包含1万张图形卡和超过28.5万个处理器核心,这使我们能够一窥人工智能背后的庞大规模。那么巨大的加仑数量足以为320辆特斯拉电池生产电池单元,或者换句话说,ChatGPT(在GPT-3之后推出)需要“喝掉”一瓶500毫升的水才能与用户进行大约25-50个问题的基本交流。

用于训练AI模型的巨大加仑数量也假设了训练是在微软的最先进的美国数据中心进行的,该数据中心专门为OpenAI建造,耗资数千万美元。报告指出,如果数据是在该公司较低能源效率的亚洲数据中心进行训练的话,水消耗可能会高出三倍。研究人员预计,随着新模型的推出,例如几个月前发布的GPT-4,这些水需求只会进一步增加,因为这些新模型比之前的模型使用了更大规模的数据参数。

研究人员表示:“AI模型的水足迹不能再被忽视了。水足迹必须成为解决全球水资源挑战的优先考虑因素之一。”

聊天机器人如何使用水呢?在这里插入图片描述

在计算AI的水消耗量时,研究人员在水的“取用”和“消耗”之间作了区分。取用水是指从河流、湖泊或其他水源中实际取水的行为,而消耗水则特指在数据中心使用时由于蒸发而丧失的水。对AI水使用的研究主要关注了这个方程式中的消耗部分,这部分水无法回收利用。

任何在公司服务器房间里待过几秒钟的人都知道,你需要先穿上毛衣。服务器房间需要保持冷却,通常保持在50到80华氏度之间,以防止设备出现故障。保持这个理想的温度是一个持续的挑战,因为服务器本身会将电能转化为热能。为了对抗这种热量并保持房间的理想温度,通常会使用冷却塔,通过蒸发冷水来实现。

冷却塔可以完成工作,但它们需要大量的水来实现。研究人员估计,平均数据中心每消耗一千瓦时的电能就会消耗大约一加仑的水。而且并非所有类型的水都可以使用。数据中心使用清洁淡水源,以避免海水可能带来的腐蚀或细菌滋生问题。淡水对于房间的湿度控制也是必不可少的。研究人员还指出,数据中心为了产生所消耗的大量电力所需的水也应该受到关注,科学家们将此称为“场外间接用水消耗”。

用水问题不仅限于OpenAI或AI模型。2019年,谷歌仅在三个州就要求提供超过23亿加仑的水用于数据中心。该公司目前在北美有14个数据中心,用于为Google搜索、其一系列工作产品以及最近的LaMDa和Bard大型语言模型提供动力。根据最近的研究论文,仅LaMDA可能就需要数百万升的水进行训练,比GPT-3还要大,因为谷歌的一些水耗能数据中心位于德克萨斯等炎热州,因此研究人员在这个估计中发出了警告,称其为“近似参考点”。

除了水,新的大型语言模型同样需要大量的电力。斯坦福大学上周发布的一份人工智能能耗报告对四个知名AI模型的能耗差异进行了研究,估计OpenAI的GPT-3在训练过程中排放了502吨的碳。总体而言,训练GPT-3所需的能量可以为一个普通美国家庭提供数百年的电力。

“数据中心为跟上这一切而奋斗得很激烈,”Critical Facilities Efficiency Solution首席执行官凯文·肯特在接受《时代》杂志采访时说道。“他们并不能总是做出最环保的选择。”

气候变化和日益严重的干旱可能加剧对AI水耗的担忧

据世界经济论坛估计,已经有220万美国居民缺乏水和基本室内供水设施。另外4400万人生活在“不充分”的供水系统下。研究人员担心,气候变化和美国人口增加的组合将使这些数字在本世纪末进一步恶化。斯坦福大学估计,到2071年,该国将有近一半的204个淡水盆地无法满足每月的用水需求。据报道,许多地区在未来50年内可能会将水供应削减三分之一。

人类活动导致的气温上升已经导致美国西部出现了有1000年来最严重的干旱,这也威胁到淡水资源,尽管最近的暴雨有助于缓解一些严峻的问题。像密德湖这样的水库水位已经下降到了暴露出几十年前的人类遗骸。所有这些意味着AI庞大的用水需求很可能成为一个日益严重的争议点,尤其是如果这项技术嵌入到越来越多的领域和服务中。LLM的数据需求正在不断增加,这意味着公司将不得不找到提高数据中心水利用效率的方法。

研究人员表示,有一些相对明确的方法可以降低AI的水耗费。首先,AI模型的训练地点和时间是影响水消耗的因素。例如,AI模型的训练可以选择在温度较低的午夜进行,或者在具有更好水利用效率的数据中心进行。而用户使用聊天机器人的时间也可以选择在“节水时段”进行,就像市政当局鼓励在非高峰时段使用洗碗机一样。然而,这些需求方面的改变都需要科技公司在建立这些模型时提供更多的透明度,而研究人员表示这方面的信息目前令人担忧地相对不足。

研究人员写道:“我们建议AI模型开发者和数据中心运营商更加透明。AI模型在何时、何地进行训练?AI模型在第三方数据中心或公共云中进行了训练和/或部署吗?这些信息对于研究界和公众都非常有价值。”

随着大型语言模型的普及和应用范围的扩大,AI的水耗费问题将成为越来越引人注目的话题。在当前全球水资源挑战的背景下,科技公司和研究人员需要共同努力,寻找降低AI水消耗的解决方案,以保护水资源并应对气候变化的影响。

AI好书推荐

AI日新月异,但是万丈高楼拔地起,离不开良好的基础。您是否有兴趣了解人工智能的原理和实践? 不要再观望! 我们关于 AI 原则和实践的书是任何想要深入了解 AI 世界的人的完美资源。 由该领域的领先专家撰写,这本综合指南涵盖了从机器学习的基础知识到构建智能系统的高级技术的所有内容。 无论您是初学者还是经验丰富的 AI 从业者,本书都能满足您的需求。 那为什么还要等呢?

人工智能原理与实践 全面涵盖人工智能和数据科学各个重要体系经典

北大出版社,人工智能原理与实践 人工智能和数据科学从入门到精通 详解机器学习深度学习算法原理

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/716278.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

小白到运维工程师自学之路 第四十五集 (生产级Redis Cluster部署)

一、概述 Redis Cluster是Redis数据库的一种分布式解决方案,用于在多个节点上分布和 管理数据。它通过将数据分片存储在不同的节点上,实现数据的分布式存储和处理。 Redis Cluster采用主从复制的方式来保证数据的高可用性和容错性,每个主节…

ai绘画二次元软件免费的哪个好?这些二次元ai绘画软件比较好

小伙伴好呀,今天我要和你们分享一个超酷的话题——ai绘画二次元作品!是不是感觉很时髦?没错,现在我们不再局限于传统的绘画方式,而是可以通过ai技术来创造出令人赞叹的二次元世界。你不需要成为一名艺术大师&#xff0…

从文档智能开始洞察一切

文档智能 Document Intelligence 即使在当今数字至上的时代,许多交易仍依赖于发票、合同、法律文件、员工记录、财务报表等纸质文件。当企业希望对纸质记录进行数字化处理,以便搜索、保存和提取有价值的数据以用于决策和市场开拓,AI支持的文…

【教学类-36-05】动物头饰制作2.0(midjounery动物简笔画四图)一页两种动物

作品展示 背景需求: 头饰1.0的教学实践发现,完全可以利用裁剪的边缘纸条作为头饰的套环。因此重新设计word模板,合理布局图案位置,设计了一页2份的头饰。 原来样式:一页一份动物(4个) 现在样式…

16-Linux背景知识

目录 1.Linux是什么? 2.Unix & Linux 发展历程图 3.Linux 发行版 PS:CentOS 和 RedHat 的关系 4.关于 Linux 学习什么? 4.1.基础命令(重点) PS:使用命令相比于使用图形界面的主要好处 4.2.系统编程 &…

IP地址定位在电商行业中的应用

最新数据显示,随着电商行业的快速发展越来越多的企业开始将IP地址定位技术应用于其业务中。IP地址定位是一种利用互联网上的IP地址来确定用户地理位置的技术它通过识别用户的IP地址,从而可以实时追踪和定位他们的位置。 在电商行业中,IP地址定…

Docker 搭建sonarqube,并集成阿里P3C规则

简介 本文安装的sonarqube是7.6-community版本,未安装最新版是因为7.9之后不再支持mysql。如果你安装的是其他版本的sonarqube,那么不要使用插件包中的插件,会有版本兼容性问题。 插件 插件包 插件包中包含java语音插件,汉化插…

linux下postgresql的安装和部署

1.官网下载安装包 PostgreSQL: File Browser 2. 下载成功后上传到Linux服务器 3.解压文件 tar -zxvf postgresql-14.5.tar.gz 4.编译(后边的地址指定的就是安装数据库目录) ./configure --prefix/usr/local/postgresql 出现异常:configure: error: readline lib…

Static Timing Analysis for Nanometer Designs A Practical Approach

分享电子书籍:静态时序分析圣经 Static Timing Analysis for Nanometer Designs A Practical Approach 1 setup time Setup time (建立时间)是数据信号(D)在时钟事件(这里以时钟上升沿为例)发生之前保持稳定的最小时间。以便时钟可靠地对数据进行采样。适用于同步电路,如触…

如何制作3D虚拟人物?这篇文章告诉你

3D虚拟人物制作是一种利用计算机技术来创建并模拟逼真的虚拟角色的过程。随着科技的不断发展和创新,3D虚拟人物制作在影视特效、游戏开发、虚拟主播、辅助医疗等领域得到了广泛应用和重视。 3D虚拟人物制作是一项复杂而精细的工作。它需要具备扎实的绘画基础和美学…

如何组织一次有价值的业务巡检

1.背景 随着业务的快速迭代,开发自测需求与QA测试的需求比例相当,对于开发自测的需求,需求质量我们无法把控,并且随着自测需求的增多,QA对业务的熟悉程度也会出现断层; 部分业务整体已趋于稳定&#xff0c…

如何在Microsoft Excel中使用RANK函数快速计算排名

Excel 中的 RANK 函数是一个内置的统计函数,它返回给定数字数组中数值的秩。根据特定数据点相对于列表中其他值的大小,将等级分配给该数据点。 RANK 的公式是:=RANK(number,ref,[order]),该函数接受两个强制参数 number 和 ref,第三个参数 order 是可选的,其中: number…

JMeter定时器使用小结

目录 前言: 一、定时器的作用域 二、定时器的作用 1、BeanShell定时器(BeanShell Timer) 2、固定吞吐量定时器(Constant Throughput Timer) 3、JSR223定时器(JSR223 Timer) 4、泊松随机定…

python接口自动化(十五)--参数关联接口(详解)

简介 我们用自动化新建任务之后,要想接着对这个新建任务操作,那就需要用参数关联了,新建任务之后会有一个任务的Jenkins-Crumb,获取到这个Jenkins-Crumb,就可以通过传这个任务Jenkins-Crumb继续操作这个新建的任务。 …

Vue3 动态组件

父组件 <template><div><h1>动态组件</h1><ul class"ul"><li :class"{ actived: index isactive }" click"changeCur(index)" v-for"(item, index) in list" :key"item.name">{{item…

Elasticsearch(1)——倒排索引与HTTP操作Elasticsearch

文章目录 1 前言2 Elasticsearch 安装3 数据格式4 倒排索引5 常用HTTP请求操作Elasticsearch5.1 创建索引5.2 查询索引信息5.3 删除索引5.4 创建/修改文档5.5查找文档5.6局部修改文档5.7删除文档5.8分页查询 1 前言 Elastic Stack 核心产品包括 Elasticsearch【存储数据】、Ki…

行云管家堡垒机和传统堡垒机的区别简单讲解

据统计&#xff0c;70%以上的IT故障其实都是内部人为引起的&#xff0c;例如账号密码管理不规范、资产授权不清晰、违规执行高危敏感命令等&#xff0c;这意味着信息化安全管理首先要解决的是加强内部信息安全管控。而加强内部信息安全管控就需要用到运维审计产品&#xff0c;也…

Bito - 超越Copilot的一款神级插件

文章目录 01 引言02 Bito的安装与使用2.1 安装Bito2.2 注册并创建工作空间2.3 使用方式 03 其它3.1 插件支持的平台3.2 文档 04 文末 01 引言 Bito IDEA插件地址&#xff1a;https://plugins.jetbrains.com/plugin/18289-bito–gpt-4–chatgpt-to-write-code-explain-code-crea…

合作、参与、让开源更易用 | 亚马逊的开源文化

JAX 是一种越来越流行的库&#xff0c;它支持原生 Python 或 NumPy 函数的可组合函数转换&#xff0c;可用于高性能数值计算和机器学习研究。JAX 提供了编写 NumPy 程序的能力&#xff0c;这些程序可以使用 GPU/TPU 自动差分和加速&#xff0c;从而形成了更灵活的框架来支持现代…

举例说明什么是前馈神经网络

前馈神经网络&#xff08;Feedforward Neural Network&#xff09;是一种最基本的人工神经网络结构&#xff0c;它由多个层次的神经元组成&#xff0c;这些神经元间具有相互连接的权重。数据从输入层进入&#xff0c;然后逐层传播&#xff0c;最后到达输出层。在这个过程中&…