推荐一个对pytorch代码详细注释的github项目

news2024/12/25 14:08:39

今天在无意间找一个pytorch代码和注释的Github项目。
先上项目:
https://github.com/labmlai/annotated_deep_learning_paper_implementations

这个项目还有个网站,地址:https://nn.labml.ai/
这个项目将论文和pytorch代码结合起来,大大方便了大家的学习。

论文实现

Transformers

Multi-headed attention
Transformer building blocks
Transformer XL
Relative multi-headed attention
Rotary Positional Embeddings (RoPE)
Attention with Linear Biases (ALiBi)
RETRO
Compressive Transformer
GPT Architecture
GLU Variants
kNN-LM: Generalization through Memorization
Feedback Transformer
Switch Transformer
Fast Weights Transformer
FNet
Attention Free Transformer
Masked Language Model
MLP-Mixer: An all-MLP Architecture for Vision
Pay Attention to MLPs (gMLP)
Vision Transformer (ViT)
Primer EZ
Hourglass

Eleuther GPT-NeoX

Generate on a 48GB GPU
Finetune on two 48GB GPUs
LLM.int8()

Diffusion models

Denoising Diffusion Probabilistic Models (DDPM)
Denoising Diffusion Implicit Models (DDIM)
Latent Diffusion Models
Stable Diffusion

Generative Adversarial Networks

Original GAN
GAN with deep convolutional network
Cycle GAN
Wasserstein GAN
Wasserstein GAN with Gradient Penalty
StyleGAN 2

Recurrent Highway Networks

LSTM

HyperNetworks - HyperLSTM

ResNet

ConvMixer

Capsule Networks

U-Net

Sketch RNN

Graph Neural Networks

Graph Attention Networks (GAT)
Graph Attention Networks v2 (GATv2)

Reinforcement Learning

Proximal Policy Optimization with Generalized Advantage Estimation
Deep Q Networks with with Dueling Network, Prioritized Replay and Double Q Network.

Counterfactual Regret Minimization (CFR)

Solving games with incomplete information such as poker with CFR.

Kuhn Poker

Optimizers

Adam
AMSGrad
Adam Optimizer with warmup
Noam Optimizer
Rectified Adam Optimizer
AdaBelief Optimizer

Normalization Layers

Batch Normalization
Layer Normalization
Instance Normalization
Group Normalization
Weight Standardization
Batch-Channel Normalization
DeepNorm

Distillation

Adaptive Computation

PonderNet

Uncertainty

Evidential Deep Learning to Quantify Classification Uncertainty

Activations

Fuzzy Tiling Activations

Language Model Sampling Techniques

Greedy Sampling
Temperature Sampling
Top-k Sampling
Nucleus Sampling

Scalable Training/Inference

Zero3 memory optimizations

查看实例

我们一起看一下ResNet的例子,地址:https://nn.labml.ai/resnet/index.html

在这里插入图片描述
这是Block。
在这里插入图片描述
这是Block里面的内容。

这样的方式理解pytorch代码是不是简单了许多。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/54674.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

jsp源码商城系统Myeclipse开发mysql数据库servlet开发java编程计算机网页项目

一、源码特点 JSP 源码商城系统 是一套完善的web设计系统,对理解JSP java编程开发语言有帮助,系统具有完整的源代码和数据库,系统采用serlvetdaobean mvc 模式,系统主要采用B/S模式开发。开发环境为TOMCAT7.0,Myeclipse8.5开发…

想学习如何把excel图片转表格?1分钟教会你图片转表格怎么转

应该有不少小伙伴接收过上司或领导以图片格式发送过来的excel表格吧?并且还会要求我们将里面的内容整理为电子档,便于后期的内容编辑以及数据修改。 而当你们收到这种任务时,是怎么去操作的呢?是不是大部分人会选择手动重新制作&a…

【数据可视化】第四章—— 基于pandas的数据可视化(pandas数据结构)

文章目录前言1. Pandas库的引用2. Pandas库的数据类型2.1 Series类型2.2 Series创建方式2.3 Series类型的基本操作2.3.1 Series类型的切片和索引2.3.2 Series类型的对齐操作2.3.3 Series类型的name属性2.3.4 Series类型的修改2.4 DataFrame类型2.5 DataFrame类型创建2.6 DataFr…

毕设选题推荐基于python的django框架医院预约挂号系统

精彩专栏推荐订阅:在 下方专栏👇🏻👇🏻👇🏻👇🏻 💖🔥作者主页:计算机毕设老哥🔥 💖 Java实战项目专栏 Python实…

公网SSH远程连接内网Ubuntu主机【cpolar内网穿透】

SSH为建立在应用层基础上的安全协议,专为远程登录会话和其他网络服务提供安全性的协议。但在没有公网IP的环境下,只能在同个局域网下远程。 本篇教程主要实现通过内网穿透,在公网环境下SSH远程登录内网的Ubuntu主机,突破局域网的…

manjaro gnome 记录 3 配置国内镜像源

manjaro gnome 记录 3 配置国内镜像源初manjaro 记录 3 配置国内镜像源更改这个文件设置源初 希望能写一些简单的教程和案例分享给需要的人 manjaro 记录 3 配置国内镜像源 打开图像界面的软件管理,点击右上角:三个点的图标 点击首选项 输入管理员密…

Day17-购物车页面-收获地址-初步封装my-address组件

1.创建收货地址组件(my-address) 我的操作: 1>在uni_modules文件夹右键新建一个组件 2>还需要自己补全代码 1>和2>的阶段效果图: my-address组件已经被渲染成功了。 *********************************************…

一文看懂linux 内核网络中 RPS/RFS 原理

1 自带 irqbalance 瓶颈 基于简单的中断负载均衡(如系统自带的irqbalance进程)可能会弄巧成拙。因为其并不识别网络流,只识别到这是一个数据包,不能识别到数据包的元组信息。 在多处理器系统的每个处理器都有单独的硬件高速缓存,如果其中一…

黑马程序员软件测试实战项目

Ego微商 “Ego微商”微信小程序应用,主要针对于有特色的食品类商品线上零售。通过微信平台的大流量入口,在一定程度上升高了特色食品的影响力,同时借助微信的模板消息快速推送更新的商品,实现轻量级应用的C2C或者是B2C的线上销售…

《论文阅读》BALM: Bundle Adjustment for Lidar Mapping

留个笔记自用 BALM: Bundle Adjustment for Lidar Mapping 做什么 首先是最基础的,Structure-from-Motion(SFM),SFM可以简单翻译成运动估计,是一种基于dui8序列图片进行三维重建的算法。简单来说就是是从运动中不同…

12月2日第壹简报,星期五,农历十一月初九

12月2日第壹简报,星期五,农历十一月初九1. 银保监会:2023年1月起在北京、上海、江苏、浙江、福建、广东等10个省市开展商业养老金业务试点。2. 国家首批未来产业科技园试点名单出炉:空天科技未来产业科技园、未来能源与智能机器人…

2022-12-02 编译Android平台OpenCV,用到读取视频时报错:AMediaXXX

文章目录编译Android平台OpenCV,用到读取视频时报错:解决参考编译Android平台OpenCV,用到读取视频时报错: ld: error: undefined symbol: AMediaExtractor_new ld: error: undefined symbol: AMediaExtractor_setDataSourceFd ld…

PyQt5的安装

0. 准备工作 Anaconda3-5.2.0-Windows-x86_64pycharm-professional-2018.2.4PyQt5 5.8.1 1. 如何正确安装PyQt5? 1.1 安装PyQt5 pip install PyQt5 -i https://pypi.douban.com/simple- i表示指定安装源,表示国内源 https://pypi.douban.com/simple …

创建一个SpringCloud项目

文章目录1.首先在**SpringCloud官网**中查看依赖版本号2.创建主Maven项目:在pom文件中引入依赖3.再在这个Maven项目中创建子模块(子模块也是Maven)(1)创建一个数据库db01和表dept(2)创建实体类dept(注意:**每个实体类都…

导包问题解决--ImportError: DLL load failed while importing _path: 找不到指定的模块

一、问题反馈 在运行某个Python程序时,需要导入numpy和matplotlib包如下: import numpy as np import matplotlib.pyplot as plt运行程序时会报错“ImportError: DLL load failed while importing _path: 找不到指定的模块”: 二、问题解决…

信号发生器的电路构成及工作原理

一、信号发生器的电路构成 信号发生器的电路组成有多种形式,一般包括以下几个环节: 基本波形产生电路:波形产生可以由RC振荡器、文丘里电桥振荡器或压控振荡器产生。 波形转换电路:基本波形由正弦波、方波、三角波经过矩形波整形电路、正弦波整形电路、三角波整形电…

经众多Nature文章使用认证!艾美捷抗酒石酸酸性磷酸酶TRAP染色试剂盒

抗酒石酸酸性磷酸酶(TRAP,tartrate-resistant acid phosphatase)为破骨细胞的标志酶,特异地分布于破骨细胞中,为破骨细胞所特有。通常作为鉴别破骨细胞的重要标志物,使破骨细胞呈红色。Kamiya艾美捷抗酒石酸…

Java单表实现评论回复功能

Java单表实现评论回复功能1.简介2.功能实现图3.数据库设计4.实体类5.实现思路6.功能实现6.1 Sql入手6.2 业务实现7.前端实现8.最终成果1.简介 最近在写毕业设计的时候发现需要实现一个评论功能,然后看了一下掘金和csdn的评论区,如何实现评论功能&#xf…

【已解决】nginx x-cache: MISS

nginx x-cache: MISS 今天在使用nginx的时候发生了巨无语的一件事,明明我已经配置了代理缓存proxy_cache,但是一直未生效,于是我不断进行排错、nginx -s reload,问题始终没有解决。后来我尝试在另一台服务器上使用相同的配置&…

Docker的数据管理(数据卷、容器互联)

Docker的数据管理Docker的数据管理(数据卷、容器互联)一、数据卷(容器与宿主机之间数据共享)创建数据卷容器写入数据宿主机写入数据容器只有读的权限二、数据卷容器(容器与容器之间数据共享)创建两个数据卷…