Twitter 推荐算法底有多牛? 已斩获11.7K star

news2024/7/4 6:05:13

点击上方“Github中文社区”,关注

看Github,每天提升

第070期分享 ,作者:Huber | Github中文社区

大家好,我是Huber。

在美国当地时间 3 月 31 日,马斯克履行当初的诺言,他宣布了 Twitter  算法的正式开源-the-algorithm。

96434cb3634598cfb197d5d275d9e77c.png

离开源已经过去一个月,该项目在github表现如何,今天我就带大家看看这项目,是不是符合开发者预期。

the-algorithm

  the-algorithm 在github 近期较热门。目前该在github上已收获11.7K star, 56.6K次 fork,可见该项目非常火。

73c3c0d1e65bd174e9f67c797fb67032.png

a9709eceeeab6010fd514012091c3adc.jpeg

到这里,大家可能还不知道本项目是什么?该项目主要是我们用 Twitter app时给你推荐的机制算法代码,如果不知道 Twitter 。抖音大家都刷过吧,改根据用户喜好和行为,推算出你想看的内容。

27186c22c521fe7c8cd2264143953350.jpeg

我们看看  the-algorithm 组件架构,它包含了两个存储库 (main repo、ml repo),这两个仓库包含了,推特推荐算法的源代码,包括用我用户在 For You 时间线上看到的推文的机制。甚至推特发布了一篇WIKI分享了有关推特算法的细节(https://blog.twitter.com/engineering/en_us/topics/open-source/2023/twitter-recommendation-algorithm)。

691bae0b2c3bf06d5f8987965f1263f5.png

主要框架架构

包含三层:数据+模型+软件框架,包含的共享组件细节如下:

45b3a0f242c04ab12c4a13cc74d10522.png

数据

  • 统一的用户行为

  • 用户信号服务

模型

  • 模拟集群

  • 特征

  • 安全模型

  • 实图

  • tweepcred

  • recos-injector

  • 图形功能服务

  • topic-social-proof

  • representation-scorer

软件框架:

  • navi

  • product-mixer

  • 时间线聚合框架

  • 代理管理器

  • twml

此存储库中包含的For You Timeline的核心组件如下所示:

b2d057a58b52667f8110f454079fa4f7.png

好了,看着很简单,但每个组件里面代码非常对多,看来马斯克没让我们失望,该项目基本丝毫没有保留,把技术贡献出来,改项目下的其他组件代码,感兴趣的读者可以点击传送门的地址,自行阅读。

fe96e378da8961c568959925cd8bde22.png

传送门

开源项目地址:https://github.com/twitter/the-algorithm/

开源项目作者:

  • dzhao

  •     pouriya Pouriya

  •   MrAuro Auro

c846b1645d00d8e8c3788c05d63d561f.png

OK!到这就是这期分享

如果觉得文章有用,请点在看,收藏,分享。


历史原创

★  一个开源的 ChatGPT VSCode 插件

★ 微软重磅开源 Visual ChatGPT!一个月内斩获30K star

★  2021 GitHub年度排行榜出炉!中文Top3项目诞生!

★  厉害了!清华北大重磅开源这份资料,干货到让我惊呆

bfdc2074df865cfac290720bb2a0f9d3.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/494224.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

《编程思维与实践》1048.解密字符串

《编程思维与实践》1048.解密字符串 题目 思路 主要到密码是升序的,所以先将每个数字对应的个数求出,之后升序排列输出即可得到结果. 求每个数字(0-9)对应的个数可以考虑每个英文单词中特有的字符(出现单次), zero,one,two,three,four,five,six,seven,eight,nine; 下面提供其中…

系统性能压力测试

系统性能压力测试 一、压力测试 压力测试是给软件不断加压,强制其在极限的情况下运行,观察它可以运行到何种程度,从而发现性能缺陷,是通过搭建与实际环境相似的测试环境,通过测试程序在同一时间内或某一段时间内&…

深度学习—卷积神经网络

卷积神经网络 传统意义上的多层神经网络只有输入层、隐藏层和输出层。其中隐藏层的层数根据需要而定,没有明确的理论推导来说明到底多少层合适。 卷积神经网络CNN,在原来多层神经网络的基础上,加入了更加有效的特征学习部分,具…

人生四维度

人生四维度 不是有钱了就成功,你知道;人生的成功不止一种,你也知道。但成功还有哪种?你知道吗? 如果把人生的体验展开,我们可以得到四个维度,高度、深度、宽度和温度。 财富、权力、影响力 构…

2023年3月股份行GX评测盘点:招商银行稳居榜首,各项指标均居前列

易观:2023 年3月GX评测数据显示,招商银行、平安口袋银行、中信银行位居行业Top 10,浦发银行、兴业银行、光大银行紧跟其后。 股份行APP 用户体验:招商银行以绝对优势稳居第一 2023年3月股份行GX评测结果数据显示,在操作…

VScode代码编辑器官网下载慢问题解决方法-亲测有效

VScode官网下载慢的问题如何解决? 问题描述: VisualStudioCode(简称VSCode)是Microsoft开发的一款功能强大的代码编辑器,它支持Windows,Linux和macOS等操作系统以及开源代码,因此被很多开发人…

maven从入门到精通 第四章 Maven中依赖的传递、排除、继承、聚合

这里写自定义目录标题 一 maven中依赖的传递1 依赖的传递性2 使用complie范围依赖spring-core3 测试依赖是否被传递4 依赖传递性的意义 二 maven中依赖的排除1 依赖排除概述2 具体操作依赖排除 三 maven中依赖的继承四 maven中依赖的聚合 一 maven中依赖的传递 1 依赖的传递性…

thinkphp+vue+html超市零食品美食推荐系统零食购物商城网站7v281

本系统的开发使获取食品推荐系统信息能够更加方便快捷,同时也使食品推荐系统管理信息变的更加系统化、有序化。系统界面较友好,易于操作 运行环境:phpstudy/wamp/xammp等 开发语言:php 后端框架:Thinkphp5 前端框架:vu…

Linux入门2(常用命令)

Linux入门2 Linux常用命令快捷键基础命令文件查看命令文件编辑命令进程管理命令用户管理命令 Linux常用命令 快捷键 Ctrl Alt T打开终端 Ctrl shift 加号 终端字体放大 ctrl 减号 终端字体缩小 基础命令 sudo su 进入管理员目录 exit 返回到用户目录 ls 当前目录下的文…

数据导向下制造业的生产效率、交易效率提升办法

在智能制造和工业4.0成为趋势的今天,大部分制造业企业,均已在企业内部通过实施PLM系统(Product Lifecycle Management,产品生命周期管理系统),实现了对组织内产品研发过程和产品研发数据的管理,…

联发科MT8768核心板 安卓4G核心板智能模块MTK方案主板开发板

MT8768核心板是一款性能优异的芯片板,具有以下特点: 处理器方面,MT8768核心板采用联发科MTK8768平台,搭载八核A53处理器,最高主频可达2.3GHz,为您提供出色的运行速度和高效率。 内存和存储方面,…

OAK相机如何将 YOLO NAS 模型转换成blob格式?

编辑:OAK中国 首发:oakchina.cn 喜欢的话,请多多👍⭐️✍ 内容可能会不定期更新,官网内容都是最新的,请查看首发地址链接。 ▌前言 Hello,大家好,这里是OAK中国,我是助手…

数据库迁移同步 | 两地三中心到异地双活演变及关键技术探讨

两地三中心和异地多活都是分布式系统的关键技术,用于保证系统的高可用性和容错性。其中最关键的技术无疑是数据同步、同步防环和数据冲突解决。 异地容灾 & 两地三中心 两地三中心架构是一种分布式系统的架构模式,用于保证系统的高可用性和容错性。…

pom文件的project标签报错java.lang.OutOfMemoryError: GC overhead limit exceeded

1、pom文件的project标签报错java.lang.OutOfMemoryError: GC overhead limit exceeded,如何解决? 只需修改idea配置 调大内存,即可解决

git之gitk命令介绍

Gitk 是 Git 提供的一个 GUI 工具,可作为git图形化客户端使用。安装 Git 的时候会自动安装 Gitk 工具。打开git bash,输入 gitk 命令即可打开gitk工具。 Gitk 的主界面主要包含五个部分: 主菜单栏显示区提交信息显示区,显示提交…

【Nginx基础篇】Linux虚拟机安装nginx

目录 一、版本区别 二、编译安装 三、启动nginx 关于防火墙 四、安装成系统服务 一、版本区别 常用版本分为四大阵营 Nginx开源版 http://nginx.org/ Nginx plus 商业版 https://www.nginx.com openresty http://openresty.org/cn/ Tengine http://tengine.taobao.org/ …

BetaFlight统一硬件AOCODARC H7DUAL配置文件讨论

BetaFlight统一硬件AOCODARC H7DUAL配置文件讨论 1. 源由2. Review配置3. 分析整理3.1 生产商信息3.2 磁力计3.3 气压计3.4 陀螺仪3.5 串口RxTx3.6 板载Flash3.7 模拟OSD MAX74563.8 PPM接收机3.9 伺服器3.10 LED灯带3.11 蜂鸣器3.12 电机 X83.13 ADC(电压/电流/RSSI信号强度/空…

(六)Spring源码阅读:invokeBeanFactoryPostProcessors方法

一、概述 invokeBeanFactoryPostProcessors的执行顺序大致如下,先执行子类BeanDefinitionRegistryPostProcessor再执行父类BeanFactoryPostProcessor。而对于同一个类的执行顺序是先执行外部的集合再到子集,之后再到父集。更小维度执行的顺序按照order注…

私人图片云盘 - 本地快速搭建简单的EasyImage图床并实现公网访问

文章目录 1.前言2. EasyImage网站搭建2.1. EasyImage下载和安装2.2. EasyImage网页测试2.3.cpolar的安装和注册 3.本地网页发布3.1.Cpolar云端设置3.2 Cpolar内网穿透本地设置 4. 公网访问测试5. 结语 1.前言 一个好的图床,是网站或者文章图片能稳定显示的关键&…

学习网络安全如何避免成为脚本小子或者安全工具人

想要避免成为工具人或者脚本小子,你需要注意学习初期和工作初期的选择。 首先,在学习初期,打好基础最重要,避免成为脚本小子。 你可能发现很多人仅仅会写个Python然后会用工具,积累一点经验就可以找到一份还不错的工…