深度解读:Etched Sohu与Groq LPU芯片的区别

news2024/11/28 13:32:00

本文简单讲解一下Etched Sohu与Groq LPU两种芯片的区别。

设计理念的差异

首先,这两款产品在设计理念上完全是两条不同的路线。Etched Sohu芯片的设计理念是围绕Transformer模型进行优化。Transformer模型近年来在NLP任务中表现出色,Etched公司因此为其设计了一款专用的ASIC芯片,名为Sohu。这款芯片集成了大量硬件加速器,专门优化Transformer模型中的关键计算步骤,使其在处理Transformer任务时表现非常出色。Sohu芯片每秒可以处理高达50万个tokens,支持最高100万亿参数的大模型。在推理Llama-3 70B模型时,Sohu的速度比英伟达的H100快至少20倍。

Etched公司能够获得1.2亿的融资,显示出其技术实力。然而,Sohu芯片也有其限制。作为一款ASIC芯片,Sohu的应用范围较窄,除了运行大型Transformer模型外,几乎无法处理其他任务,例如U-Net、CNN等。因此,Etched公司将全部赌注押在了Transformer模型上,希望通过专用芯片的性能提升,在硬件层面上击败其他竞争对手。只要Transformer仍然是最流行的大模型架构,Sohu就有无限潜力。这也是为什么众多投资人看好Etched的原因。但从另一个角度来看,如果有一天Transformer被更强大的模型架构取代,Sohu芯片可能也会随之失去市场。

与Sohu不同,Groq的LPU芯片则采用了另一种设计思路。Groq团队从头设计了一个张量流处理器(Tensor Streaming Processor,简称TSP)架构,这个架构没有采用传统的开发小型可编程内核并进行数百次复制的方法,而是直接构建了一个包含数百个功能单元的处理器。为了组织多个TSP,Groq设计了一个名为Dragonfly的网络,采用多级层次化结构,通过几个层次的路由器连接不同的子组,从而提供高带宽容量和低通信延迟,这对于机器学习任务来说非常重要。

性能与应用场景

简单来说,Groq的TSP技术就像一个交通系统,通过软件控制红绿灯,让同一方向的所有车辆在一条路上快速前进,从而大大提高了效率和速度。在这个基础上,虽然同为ASIC架构,但LPU和Sohu的核心玩法却不同。Groq通过将模型权重和中间数据放在SRAM中,而不是HBM或DRAM,利用空间换时间。这种架构允许Groq在系统中不采用高带宽存储器(HBM),而是使用SRAM,从而避免了频繁的数据重新加载。这种做法不仅大幅提高了推理速度,还避免了HBM短缺的问题。

举个例子,假设你有两个工人,一个是来自Groq的“LPU”,另一个是来自英伟达的GPU,两人的任务是尽快整理完一大堆文件。GPU就像一个速度很快的工人,但依赖于高速的传送系统,例如HBM,不停地把文件快速传送到他的桌子上。虽然这个工人干活能力不错,但由于HBM产能有限,很难招到他。而Groq的LPU则像一群高效组织任务的工人,他们利用身边的小桌子(SRAM)快速获取所需的文件,从而能够立即工作。这意味着他们可以在不依赖快速交付系统的情况下快速工作。这就是LPU的特点——小内存和大算力,适合需要频繁搬运数据的场景。

然而,LPU的速度虽然很快,但单卡的吞吐能力有限,这意味着LPU用户需要购买更多的卡来保证同等的吞吐量。因此,速度对于LPU而言既是优势也是劣势。例如,贾扬清曾在推特上算过一笔账,运行Llama-2 70B模型时,需要305张LPU卡才能把模型塞进去,而用H100只需要8张卡。从目前的价格来看,这意味着在同等吞吐量下,LPU的硬件成本是H100的40倍,能耗成本是H100的10倍。

应用前景与挑战

与Sohu类似,LPU也面临应用范围较窄的问题,目前只能为少数的大型模型提供服务。然而,LPU并没有像Sohu那样专门针对Transformer进行优化,这意味着LPU在未来有机会应用到新的大模型架构上,相对而言,被模型迭代淘汰的风险较小。

总结来看,无论是Sohu还是LPU,都在各自的专用领域内表现出色,但在面对市场上的通用需求时,仍难以撼动英伟达的地位。英伟达凭借多年的技术积累和市场布局,仍然在综合性能方面领先。对于芯片领域的新玩家来说,虽然可以在某些特定场景下展现优势,但要全面挑战英伟达,还需更多的技术突破和市场验证。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1896946.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

从数据到智能,英智私有大模型助力企业实现数智化发展

在数字化时代,数据已经成为企业最重要的资源。如何将这些数据转化为实际的业务价值,是每个企业面临的重要课题。英智利用业界领先的清洗、训练和微调技术,对企业数据进行深度挖掘和分析,定制符合企业业务场景的私有大模型&#xf…

#Vue 3 + ts + antd table表格的使用(嵌套 子表格版)

1. 嵌套子表格的使用 <template><a-table :columns"columns" :data-source"data" class"components-table-demo-nested"><template #bodyCell"{ column }"><template v-if"column.key operation">…

论文写作全攻略:Kimi辅助下的高效学术写作技巧

学境思源&#xff0c;一键生成论文初稿&#xff1a; AcademicIdeas - 学境思源AI论文写作 完成论文写作是一个多阶段的过程&#xff0c;涉及到不同的任务和技能。以下是按不同分类总结的向Kimi提问的prompt&#xff0c;以帮助你在论文写作过程中取得成功&#xff1a; 1. 选题与…

Redis 7.x 系列【19】管道

有道无术&#xff0c;术尚可求&#xff0c;有术无道&#xff0c;止于术。 本系列Redis 版本 7.2.5 源码地址&#xff1a;https://gitee.com/pearl-organization/study-redis-demo 文章目录 1. 往返时间2. 管道技术3. 代码演示4. 其他批处理4.1 原生批处理命令4.2 事务4.3 脚本…

华大基因乌拉圭实验室启航:中国技术赋能拉美精准医学发展

乌拉圭作为加入“一带一路”倡议的国家&#xff0c;多年来&#xff0c;与中国在经贸、教育、文化和科技等多个关键领域的合作不断深化与拓展。随着“共建‘健康丝绸之路’倡议”的深化落实&#xff0c;中乌两国在医疗卫生领域的合作也迈入了新阶段。作为中国基因行业的奠基者&a…

大型能源电力集团需要什么样的总部数据下发系统?

能源电力集团的组织结构是一个复杂的系统&#xff0c;包括多个职能部门和子分公司。这些子分公司负责具体的电力生产、销售、运维等业务。这些部门和公司协同工作&#xff0c;确保电力生产的顺利进行&#xff0c;同时关注公司的长期发展、市场拓展、人力资源管理、财务管理和公…

C#实战|账号管理系统:通用登录窗体的实现。

哈喽,你好啊,我是雷工! 本节记录登录窗体的实现方法,比较有通用性,所有的项目登录窗体实现基本都是这个实现思路。 一通百通,以下为学习笔记。 01 登录窗体的逻辑 用户在登录窗输入账号和密码,如果输入账号和密码信息正确,点击【登录】按钮,则跳转显示主窗体,同时在固…

属性描述符初探——Vue实现数据劫持的基础

目录 属性描述符——Vue实现数据劫持的基础 一、属性描述符是什么&#xff1f; ​编辑 1.1、属性描述符示例 1.2、用属性描述符定义属性及获取对象的属性描述符 1.3、带有读取器和设置器的属性描述符 二、使用属性描述符的情景 2.1、封装和数据隐藏 使用getter和setter…

Node之Web服务

前言 本文将讲解node的web服务 通过讲解http请求&#xff0c;node创建web服务等知识点让你更加深入的理解web服务和node创建的web服务 HTTP请求是什么&#xff1f; HTTP请求是客户端&#xff08;通常是浏览器或其他应用程序&#xff09;与服务器之间进行通信的一种方式。 …

onclick和@click有什么区别,究竟哪个更好使?

哈喽小伙伴们大家好,我是爱学英语的程序员,今天来给大家分享一些关于vue中事件绑定相关的内容,希望对大家有所帮助. 场景是这样的:我要实现一个切换栏,默认激活的是第一个标签,当鼠标移动到第二个标签是,对应的内容让激活.起初,我第一时间想到的是用element plus的组件来实现这…

从“NLP技术”到“AI大模型”

自从AI大模型问世以来&#xff0c;仿佛很少有人提及NLP技术这个词了。昨天休息的时候突然在想一个问题&#xff0c;AI大模型已经如此强大了&#xff0c;还需要传统的NLP技术吗&#xff1f; 传统的NLP技术指&#xff1a;从分词&#xff08;ws&#xff09;、词性标注&#xff08;…

【半导体行业推荐】PFA酸纯化器 特氟龙材质 酸蒸馏仪

PFA酸纯化器是一种实验室设备&#xff0c;专门用于制备高纯度的酸&#xff0c;这些高纯酸在化学分析、材料科学、半导体制造、光伏产业、生物医学研究等领域有着重要应用。以下是PFA酸纯化器的一些关键特性和功能&#xff1a; 1. 高效提纯&#xff1a;PFA酸纯化器通过先进的膜…

go语言day09 通道 协程的死锁

Go语言学习——channel的死锁其实没那么复杂 - JackieZheng - 博客园 (cnblogs.com) 目录 通道 创建通道 1&#xff09;无缓冲通道 2&#xff09;有缓冲通道 通道的使用 1) 值从通道入口进 2) 值从通道出口出 信道死锁&#xff1a; 0&#xff09;死锁现场0 1&#xff09;死…

Twitter批量发送消息api接口如何申请配置?

Twitter批量发送消息API接口的功能&#xff1f;接口有哪些限制&#xff1f; 企业和开发者越来越多地需要在Twitter上批量发送消息。然而&#xff0c;申请和配置这个接口需要一定的步骤和注意事项。AokSend将详细介绍如何申请和配置Twitter批量发送消息API接口。 Twitter批量发…

静力水准仪:测量与安装的全面指南

静力水准仪作为一种高精度的测量仪器&#xff0c;广泛应用于管廊、大坝、核电站、高层建筑、基坑、隧道、桥梁、地铁等工程领域&#xff0c;用于监测垂直位移和倾斜变化。本文将详细介绍静力水准仪的工作原理、特点及其安装过程中的注意事项&#xff0c;旨在为相关工程人员提供…

sql业务场景分析思路参考

1、时间可以进行排序&#xff0c;也可以用聚合函数对时间求最大值max&#xff08;时间&#xff09; 例如下面的例子&#xff1a;取最晚入职的人&#xff0c;那就是将入职时间倒序排序&#xff0c;然后limit 1 表&#xff1a; 场景&#xff1a;查找最晚入职员工的所有信息 se…

maven项目、idea抽风问题解决

开发的时候遇到奇奇怪怪的非技术问题&#xff0c;解决起来会费时间&#xff0c;做无用功。   这里记录常见的情况和解决方法 1.未识别maven项目 文件的图标变成了这种橙色的&#xff0c;而且有主启动函数也不能run 右键pom文件&#xff0c;点击Add as Maven Project 如果…

215. 数组中的第K个最大元素(中等)

215. 数组中的第K个最大元素 1. 题目描述2.详细题解3.代码实现3.1 Python3.2 Java 1. 题目描述 题目中转&#xff1a;215. 数组中的第K个最大元素 2.详细题解 快速排序算法在每一轮排序中&#xff0c;随机选择一个数字 x x x&#xff0c;根据与 x x x的大小关系将要排序的数…

C++ 引用——引用的基本语法

引用的基本使用 作用&#xff1a;给变量起别名 语法&#xff1a;数据类型 &别名 原名 示例&#xff1a; 运行结果&#xff1a;