众人吹捧的Exo并不是真正的分布式推理，而无人问津的Cake或许才是

众人吹捧的Exo并不是真正的分布式推理，而无人问津的Cake或许才是

news2025/1/8 3:49:29

之前就看到不少抖音AI区的博主吹火爆外网的Exo项目支持多台苹果机运行一个 Llama 70B。我就觉得这个事情或许有些不对劲，而随着最近 Meta 出了 405B，又有朋友向我推荐Exo，我不禁想知道一个 Bonjour 的 Zeroconf 怎么就让 MLX 支持 P2P 的分布式推理了。Incredible（笑）

在这里插入图片描述

我就看来他的main.py 直接去调 chatgpt

在这里插入图片描述
然后，我又随便翻了翻，找到 examples/llama3_distributed.py

在这里插入图片描述
这不是mlx-community的4bit模型嘛，要知道fp16量化到4bit，基本上模型就是一天一地。而且默认就是8B的模型

在这里插入图片描述

8B直接1.7B，1.7B 比 Phi 3 都小。所以，我觉得它只是分布式负载均衡和MLX推理，怎么就吹成 70B 的分布式推理了。而对于 Cake，我也严谨的看了下源码，的确是self-host的分布式架构，只是纯手工配置，没有用 Raft。345 download 却出现 4k star（整个人无语了呀）

在这里插入图片描述

公道自在人心，资讯多并不能说明具备专业性，还得踏实学习基础，慢慢来。

我会定期在CSDN分享我的学习心得，项目经验和行业动态。如果你对某个领域感兴趣，或者想要了解更多技术干货，请关注我的账号，一起成长！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1948154.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

IP 泄露：原因与避免方法

IP 泄露：原因与避免方法

始终关注您的IP信息！ 您的IP地址不仅显示您的位置，它包含几乎所有的互联网活动信息！ 如果出现IP泄漏，几乎所有的信息都会被捕获甚至非法利用！ 那么，网站究竟如何追踪您的IP地址？您又如何有效…

阅读更多...

【前端学习笔记】CSS基础一

【前端学习笔记】CSS基础一

一、什么是CSS 1.CSS 介绍 CSS（Cascading Style Sheets，层叠样式表）是一种用来控制网页布局和设计外观的样式语言。它使得开发者可以分离网页的内容（HTML）和表现形式（样式），提高了…

阅读更多...

C语言玩一下标准输出——颜色、闪烁、加粗、下划线属性

C语言玩一下标准输出——颜色、闪烁、加粗、下划线属性

文章目录 C语言玩一下标准输出——颜色、闪烁、加粗、下划线属性转换Tip切换内容介绍显示方式字体色背景色常用光标控制附示例和运行结果 C语言玩一下标准输出——颜色、闪烁、加粗、下划线属性标准输出格式其属性可控制，控制由一系列的控制码指定。标准输出函数可…

阅读更多...

【OAuth2系列】集成微信小程序登录到 Spring Security OAuth 2.0

【OAuth2系列】集成微信小程序登录到 Spring Security OAuth 2.0

作者：后端小肥肠创作不易，未经允许严禁转载。姊妹篇： 【Spring Security系列】权限之旅：SpringSecurity小程序登录深度探索_spring security 微信小程序登录-CSDN博客目录 1. 前言 2. 总体登录流程 3. 数据表设计 3.1. sys…

阅读更多...

2025第25届北京环卫展|市政设施展|清洗设备展览会

2025第25届北京环卫展|市政设施展|清洗设备展览会

2025第25届北京国际环卫与市政设施及清洗设备展览会时间：2025年 4月10-12日地点：全国农业展览馆（朝阳区北三环东路16号） 邀请函指导支持：中国城市环境卫生协会北京市城市管理委员会主办单位：北京…

阅读更多...

Coggle数据科学 | Kaggle 知识点：时序模型 Prophet

Coggle数据科学 | Kaggle 知识点：时序模型 Prophet

本文来源公众号“Coggle数据科学”，仅用于学术分享，侵权删，干货满满。原文链接：Kaggle 知识点：时序模型 Prophet Prophet 算法在时间序列中Prophet是Facebook开源的时间序列预测算法，可以有效处理节假…

阅读更多...

CSS学习笔记[Web开发]

CSS学习笔记[Web开发]

CSS学习本文为学习笔记，参考菜鸟和w3c 文章目录 CSS 简介CSS 插入外部 CSS内部 CSS行内 CSS多个样式表层叠顺序 CSS 语法例子解释 CSS 选择器CSS 元素选择器CSS id 选择器实例CSS 类选择器实例CSS 通用选择器实例CSS 分组选择器CSS 后代选择器CSS 子元素选择器CSS …

阅读更多...

Java初级之集合（Map可变参数集合工具类）

Java初级之集合（Map可变参数集合工具类）

目录 1、Map集合 1.1 Map集合的概述和特点 1.2 Map集合的基本功能 1.3 Map集合的获取功能 1.4 Map集合的遍历（一） 1.4 Map集合的遍历（二） 2、HashMap 2.1HashMap集合概述和特点 2.2HashMap集合应用案例 3、TreeMap集合 …

阅读更多...

.Net Core 微服务之Consul（三）-KV存储分布式锁

.Net Core 微服务之Consul（三）-KV存储分布式锁

引言：集合上两期.Net Core 微服务之Consul（一）(.Net Core 微服务之Consul（一）-CSDN博客) 。.Net Core 微服务之Consul（二）-集群搭建）（.Net Core 微服务之Consul（二）-集群搭建-CSDN博客）目录一. Consul KV 存储 1. KV 存储介绍 1.1 数据模型 1.2 一致性和…

阅读更多...

react18+

react18+

主要是围绕函数式组件讲，18主要用就是函数式组件，学习前先熟悉下原生js的基本使用，主要是事件 1、UI操作 1.1、书写jsx标签语言基本写法和原生如同一则，只是放在一个方法里面返回而已，我们称这样的写法为函数式组件…

阅读更多...

牛客JS题（三）文件扩展名

牛客JS题（三）文件扩展名

注释很详细，直接上代码涉及知识点： 正则表达式可选链操作符题干： 我的答案 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8" /></head><body><script>/*** 可能…

阅读更多...

Vue前端页面嵌入mermaid图表--流程图

Vue前端页面嵌入mermaid图表--流程图

一、安装Mermaid 首先，你需要在你的项目中安装Mermaid。可以通过npm或yarn来安装： npm install mermaid --save # 或者 yarn add mermaid结果如图： 二、Vue 方法一：使用pre标签使用ref属性可以帮助你在Vue组件中访问DOM元素 …

阅读更多...

JAVA同城服务场馆门店预约系统支持H5小程序APP源码程序

JAVA同城服务场馆门店预约系统支持H5小程序APP源码程序

🔥同城服务场馆门店预约系统：一键预约，便捷生活新体验！🎉 🌟告别排队等待，预约新风尚🌟 你还在为去游泳馆、健身房或是瑜伽馆排队等待而烦恼吗？同城服务场馆门店预约系统…

阅读更多...

渲染技术如何帮助设计内容实现从平面到立体的转换

渲染技术如何帮助设计内容实现从平面到立体的转换

随着数字艺术和视觉特效的飞速发展，三维建模与渲染技术在影视、游戏、广告、工业设计、建筑可视化等多个领域展现出了其不可或缺的重要性。这一技术不仅实现了从平面到立体的跨越，还极大地丰富了视觉表达的层次感和真实感。三维建模：构建虚…

阅读更多...

模拟电子技术-实验四二极管电路仿真

模拟电子技术-实验四二极管电路仿真

实验四二极管电路仿真一．实验类型验证性实验二．实验目的 1、验证二极管的单向导电性 2、验证二极管的稳压特性。三．实验原理二极管的单向导电性： 四、实验内容 1、二极管参数测试仿真实验 1）仪表仿真…

阅读更多...

【Linux】线程互斥和同步

【Linux】线程互斥和同步

目录线程互斥相关概念互斥量mutex 互斥量的接口初始化互斥量销毁互斥量互斥量加锁/解锁可重入VS线程安全概念可重入与线程安全的联系可重入与线程安全的区别死锁死锁的四个必要条件避免死锁避免死锁的算法线程同步条件变量条件变量函数初始…

阅读更多...

【已解决】ModuleNotFoundError: No module named ‘numpy’

【已解决】ModuleNotFoundError: No module named ‘numpy’

【已解决】ModuleNotFoundError: No module named ‘numpy’ 在Python编程中，遇到“ModuleNotFoundError: No module named ‘numpy’”这样的错误提示并不罕见。这个错误意味着Python解释器无法在你的环境中找到名为numpy的模块。numpy是Python中一个非常重要的库…

阅读更多...

ElasticSearch(四)— 数据检索与查询

ElasticSearch(四)— 数据检索与查询

一、基本查询语法所有的 REST 搜索请求使用_search 接口，既可以是 GET 请求，也可以是 POST请求，也可以通过在搜索 URL 中指定索引来限制范围。 _search 接口有两种请求方法，一种是基于 URI 的请求方式，另一种是基于…

阅读更多...

JavaScript第一天

JavaScript第一天

变量的基本使用更新变量 let age 18age 19 用户名输入案例： let uname prompt(请输入姓名) document.write(uname) 这样在提示框中输入姓名之后，就会在网页中显示出来当输入之后不在网页中显示的时候，可能是变量名写错了&#xf…

阅读更多...

C++笔记---缺省参数和函数重载

C++笔记---缺省参数和函数重载

1. 缺省参数 1.1 定义缺省参数是声明或定义函数时为函数的参数指定一个缺省值（默认值）。在调用该函数时，如果没有指定实参则采用该形参的缺省值，否则使用指定的实参，缺省参数分为全缺省和半缺省参数。 void Func(…

阅读更多...

推荐文章

最新文章