目录
解码层跑几次取决于输出词汇多少
10个单词,在解码层跑几次transformer
解码层跑几次取决于输出词汇多少
10个单词,在解码层跑几次transformer
- 取决于具体任务和输出要求
- 在自然语言处理任务中,Transformer 架构的解码器(Decoder)运行次数与你想要生成的输出长度有关。如果你的任务是将这 10 个单词翻译成另一种语言,或者基于这 10 个单词续写一个句子等生成任务,那么运行次数主要取决于目标输出序列的长度。
- 以翻译任务为例
- 假设这 10 个单词组成的句子是源语言句子,要将其翻译为目标语言