@Linear()全连接层+矩阵原理)
Linear()全连接层+矩阵原理
Linear()参数
原文地址:https://blog.csdn.net/horizonwys/article/details/125933921
。
矩阵原理
在 NLP中 x 一般为一行 故
*linear()中输出为 x W x的维度为 (token-n,embding-long)
token-n 为 样本数量
embding-long 为样本特征数量
W(embding-long,hidden-num)
hidden-num:神经元数量,也就是 一个样本 由 embding-long——>hidden-num是一个线性加权的过程,也就是矩阵映射的过程
合理的创建标题,有助于目录的生成
直接输入1次#,并按下space后,将生成1级标题。
输入2次#,并按下space后,将生成2级标题。
以此类推,我们支持6级标题。有助于使用TOC
语法后生成一个完美的目录。