循环神经网络 - 机器学习任务之异步的序列到序列模式

news2025/4/11 0:20:54

前面我们学习了机器学习任务之同步的序列到序列模式:循环神经网络 - 机器学习任务之同步的序列到序列模式-CSDN博客

本文我们来学习循环神经网络应用中的第三种模式:异步的序列到序列模式!

一、基本概述:

异步的序列到序列模式也称为编码器-解码器(Encoder-Decoder)模型,即 输入序列和输出序列不需要有严格的对应关系,也不需要保持相同的长度。比如在机器翻译中,输入为源语言的单词序列,输出为目标语言的单词序列。

在异步的序列到序列模式中,输入为长度为 𝑇 的序列 𝒙1∶𝑇 = (𝒙1, ⋯ , 𝒙𝑇 ),输出为长度为𝑀的序列𝑦1∶𝑀 =(𝑦1,⋯,𝑦𝑀)。

异步的序列到序列模式一般通过先编码后解码的方式来实现.先将样本 𝒙 按不同时刻输入到一个循环神经网络(编码器 ) 中 ,并得到其编码 𝒉 𝑇 。然后再使用另 一 个循环神经网络 ( 解码器 ),得到 输出序列 𝑦̂1∶𝑀。

为了建立输出序列之间的依赖关系,在解码器中通常使用非线性的自回归模型。令 𝑓1 (⋅) 和 𝑓2 (⋅) 分别为用作编码器和解码器的循环神经网络,则编码器-解码器模型可以写为:

其中𝑔(⋅)为分类器,𝒚̂ 为预测输出𝑦̂ 的向量表示。在解码器通常采用自回归模型,每个时刻的输入为上一时刻的预测结果 𝑦̂𝑡−1。

下图给出了异步的序列到序列模式示例,其中 ⟨𝐸𝑂𝑆⟩ 表示输入序列的结束, 虚线表示将上一个时刻的输出作为下一个时刻的输入。

二、具体案例

循环神经网络(RNN)在异步的序列到序列(Asynchronous Sequence-to-Sequence)模式中的应用,主要解决输入序列和输出序列在时间或长度上不对等的场景。以下是通俗易懂的解释和两个具体案例:

核心概念:异步的序列到序列

  • 同步模式:输入和输出的时间步严格对齐(如视频逐帧分类,每帧对应一个标签)。

  • 异步模式:输入和输出的序列长度不同、时间不对齐,且输出可能滞后于输入。
    典型特征

    • 输入序列:[x₁, x₂, ..., xₘ](长度m

    • 输出序列:[y₁, y₂, ..., yₙ](长度n,且n ≠ m

    • 模型需要动态调整输入与输出的时序关系

案例1:实时语音翻译(同声传译)

场景描述
  • 输入:一段连续的中文语音(如"今天天气很好"),按时间分帧输入。

  • 输出:对应的英文翻译("The weather is nice today"),输出可能比输入延迟几秒。

异步性体现
  • 输入(语音帧)是实时流入的,而输出(翻译结果)需要积累足够上下文后才能生成。

  • 输入序列长度(语音时长)与输出序列长度(英文单词数)不匹配。

RNN处理过程
  1. 编码器(Encoder):使用RNN(如LSTM)逐步处理语音帧,生成隐藏状态。

  2. 解码器(Decoder):在输入未完全接收时,解码器已开始生成部分翻译,但需等待关键信息(如动词位置)后再输出完整句子。

  3. 注意力机制(Attention):动态对齐输入语音帧与输出单词的对应关系。

示例
  • 输入语音帧序列:[今, 天, 天, 气, 很, 好](逐帧输入)

  • 输出翻译序列:[The, weather, is, nice, today](可能在输入到"气"时开始输出"The weather",后续调整)

案例2:股票价格预测(多步预测)

场景描述
  • 输入:过去5天的股票数据(开盘价、成交量等),按时间顺序输入。

  • 输出:未来3天的价格预测,但预测需要在第3天就给出全部3天的结果。

异步性体现
  • 输入是连续的历史数据流,输出需要一次性预测多步未来值。

  • 输入长度(5天)与输出长度(3天)不同,且输出需要提前生成。

RNN处理过程
  1. 编码器:用RNN编码过去5天的数据,生成隐藏状态(包含趋势信息)。

  2. 解码器:从隐藏状态出发,通过自回归(Auto-regressive)方式逐步预测未来3天的值。

    • 第1步预测y₁(第6天价格),将其作为输入预测y₂(第7天),依此类推。

  3. 教师强制(Teacher Forcing):训练时使用真实值作为解码器输入,测试时使用预测值迭代生成。

示例
  • 输入序列:[Day1, Day2, Day3, Day4, Day5](历史数据)

  • 输出序列:[Day6, Day7, Day8](未来预测,需在第5天结束时全部输出)

异步模式的关键技术

  1. 编码器-解码器架构:分离输入处理和输出生成。

  2. 注意力机制:解决长距离依赖和对齐问题。

  3. 自回归生成:解码器逐步生成输出,每一步依赖前一步结果。

  4. 动态长度支持:通过<EOS>(结束符)标记灵活控制输入输出长度。

与传统同步模式对比

任务类型同步模式(如情感分析)异步模式(如机器翻译)
输入输出对齐严格对齐(1输入 → 1输出)动态对齐(多输入 → 多输出)
典型应用视频逐帧分类、实时传感器监测翻译、语音识别、文本摘要
RNN结构单层RNN直接映射编码器-解码器 + 注意力机制

异步的序列到序列模式是RNN在动态时序场景下的核心能力,它允许模型灵活处理输入与输出的复杂对应关系。无论是同声传译中的"边听边译",还是股票预测中的"多步前瞻",都体现了RNN对现实世界异步任务的强大建模能力。

三、上面提到“自回归Auto-regressive”怎么理解?

自回归(Auto-regressive)的核心思想是:用过去的数据预测未来的数据,且每一步的预测都依赖之前的预测结果。这种“逐步生成”的方式就像“自己给自己提供线索”,非常适用于生成序列数据(如文本、语音、时间序列等)。

通俗理解

想象你在写一篇文章:

  1. 你写下第一个词:“今天”。

  2. 根据“今天”,你接着写“天气”。

  3. 根据“今天天气”,你继续写“很好”。

  4. 最终得到完整的句子:“今天天气很好”。

这就是自回归:每一步生成新内容时,都依赖之前生成的所有内容。机器学习的自回归模型和你的思考过程类似,只是用数学方法实现。

自回归的两种场景

1. 时间序列预测(如股票价格)
  • 目标:用历史数据预测未来值。

  • 方法:每一步预测都基于前几步的真实值或预测值。

例子:预测未来3天的温度

  • 输入:过去5天的温度 [20℃, 22℃, 21℃, 23℃, 24℃]

  • 自回归预测过程:

    1. 根据过去5天,预测第6天是 25℃

    2. 用第6天的预测值 25℃ 和之前的数据,预测第7天是 26℃

    3. 再用第6-7天的预测值,预测第8天是 27℃

问题:如果第一步预测错了(比如实际第6天是 23℃),后续预测会越来越偏离真实值。

2. 文本生成(如GPT写文章)
  • 目标:生成连贯的句子或段落。

  • 方法:每生成一个词,都依赖之前生成的词。

例子:生成句子

  • 输入提示:“人工智能”

  • 自回归生成过程:

    1. 模型生成“是” → “人工智能是”;

    2. 基于“人工智能是”,生成“未来” → “人工智能是未来”;

    3. 基于“人工智能是未来”,生成“的” → “人工智能是未来的”;

    4. 继续生成,直到得到完整句子:“人工智能是未来的核心技术”。

关键特点:生成过程像“滚雪球”,每一步都基于前面的结果。

自回归在模型中的实现

以GPT-3生成文本为例:

  1. 输入:用户提供开头(如“人工智能”)。

  2. 第一步:模型计算“人工智能”后面最可能的词(假设是“的”)。

  3. 第二步:将“人工智能的”输入模型,计算下一个词(可能是“发展”)。

  4. 循环:重复此过程,直到生成完整的句子。

数学表达
模型每次预测第t个词的概率:
P(词ₜ | 词₁, 词₂, ..., 词ₜ₋₁)

自回归的优缺点

优点缺点
生成结果连贯,上下文逻辑一致生成速度慢(必须一步步计算)
适合长序列生成(如文章、对话)错误会累积(一步错,步步错)
技术成熟(GPT、LSTM均采用)无法并行计算(依赖前序结果)

自回归 vs 非自回归

对比项自回归(如GPT)非自回归(如BERT填词)
生成方式逐词生成,依赖前文可同时生成所有词
速度
质量更连贯可能逻辑跳跃
典型应用文本生成、翻译文本纠错、摘要

生活中的自回归例子

  1. 导航路线规划

    • 你开车时,每到一个路口都根据当前位置重新规划路线。

    • 类似自回归:每一步决策依赖之前的路径。

  2. 音乐即兴创作

    • 音乐家根据已弹奏的音符决定下一个音符。

    • 自回归模型生成音乐时也是同理。

自回归是机器生成序列数据的核心方法,本质是“用过去推导未来”。无论是让AI写诗、预测股票,还是生成对话,都依赖这种“步步为营”的逻辑。它的缺点(速度慢)和优点(结果连贯)就像硬币的两面,选择使用时需权衡任务需求。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2328090.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

什么是检索增强生成(RAG)

1、什么是检索增强生成&#xff08;RAG&#xff09; 1.1 检索增强生成的概念 检索增强生成&#xff08;Retrieval-Augmented Generation, RAG&#xff09;是一种结合了信息检索和文本生成技术的新型自然语言处理方法。这种方法增强了模型的理解和生成能力。 相较于经典生成…

MATLAB 控制系统设计与仿真 - 33

状态反馈控制系统 -全维状态观测器的实现 状态观测器的建立解决了受控系统不能测量的状态重构问题&#xff0c;使得状态反馈的工程实现成为可能。 考虑到系统的状态方程表达式&#xff0c;如果{A,B}可控&#xff0c;{A,C}可观&#xff0c;且安装系统的性能指标&#xff0c;可…

企业管理系统的功能架构设计与实现

一、企业管理系统的核心功能模块 企业管理系统作为现代企业的中枢神经系统&#xff0c;涵盖了多个核心功能模块&#xff0c;以确保企业运营的顺畅与高效。这些功能模块通常包括&#xff1a; 人力资源管理模块&#xff1a;负责员工信息的录入、维护、查询及统计分析&#xff0c…

覆盖学术、职场、生活的专业计算工具

软件介绍 今天要给大家介绍一款超给力的工具软件——CalcKit 计算器。它就像是你口袋里的智能计算专家&#xff0c;轻松化解日常生活中的各类计算难题。无论是简单的数字加减乘除&#xff0c;还是复杂的专业运算&#xff0c;它都不在话下。 这款软件内置了极为强大的计算功能…

【大模型系列篇】大模型基建工程:基于 FastAPI 自动构建 SSE MCP 服务器 —— 进阶篇

&#x1f525;&#x1f525;&#x1f525; 上期 《大模型基建工程&#xff1a;基于 FastAPI 自动构建 SSE MCP 服务器》中我们使用fastapi-mcp自动挂载fastapi到mcp工具&#xff0c;通过源码分析和实践&#xff0c;我们发现每次sse请求又转到了内部fastapi RESTful api接口&…

【python】Plot a Square

文章目录 1、功能描述2、代码实现3、效果展示4、完整代码5、涉及到的库函数 更多有趣的代码示例&#xff0c;可参考【Programming】 1、功能描述 用 python 实现&#xff0c;以 A和B两个点为边长&#xff0c;方向朝 C 绘制正方形 思路&#xff1a; 计算向量 AB 和 AC。使用向…

实战打靶集锦-37-Wpwnvm

文章目录 1. 主机发现2. 端口扫描&服务枚举3. 服务探查4. 系统提权 靶机地址&#xff1a;https://download.vulnhub.com/wpwn/wpwnvm.zip 1. 主机发现 目前只知道目标靶机在192.168.37.xx网段&#xff0c;通过如下的命令&#xff0c;看看这个网段上在线的主机。 $ nmap -…

三、GPIO

一、GPIO简介 GPIO&#xff08;General Purpose Input Output&#xff09;通用输入输出口GPIO引脚电平&#xff1a;0V&#xff08;低电平&#xff09;~3.3V&#xff08;高电平&#xff09;&#xff0c;部分引脚可容忍5V 容忍5V&#xff0c;即部分引脚输入5V的电压&#xff0c;…

混杂模式(Promiscuous Mode)与 Trunk 端口的区别详解

一、混杂模式&#xff08;Promiscuous Mode&#xff09; 1. 定义与工作原理 定义&#xff1a;混杂模式是网络接口的一种工作模式&#xff0c;允许接口接收通过其物理链路的所有数据包&#xff0c;而不仅是目标地址为本机的数据包。工作层级&#xff1a;OSI 数据链路层&#x…

[dp5_多状态dp] 按摩师 | 打家劫舍 II | 删除并获得点数 | 粉刷房子

目录 1.面试题 17.16. 按摩师 题解 2.打家劫舍 II 题解 3.删除并获得点数 题解 4.粉刷房子 题解 一定要有这样的能力&#xff0c;碰到一个新题的时候&#xff0c;可以往之前做过的题方向靠&#xff01; 打家劫舍问题模型: 不能选择相邻的两个数&#xff0c;并且要最终…

DM数据库配置归档模式的两种方式

归档模式&#xff0c;联机日志文件中的内容保存到硬盘中&#xff0c;形成归档日志文件(REDO日志)。 采用归档模式会对系统的性能产生些许影响&#xff0c;然而系统在归档模式下运行会更安全&#xff0c;当 出现故障时其丢失数据的可能性更小&#xff0c;这是因为一旦出现介质故…

Agent TARS与Manus的正面竞争

Agent TARS 是 Manus 的直接竞争对手&#xff0c;两者在 AI Agent 领域形成了显著的技术与生态对抗。 一、技术架构与功能定位的竞争 集成化架构 vs 模块化设计 Agent TARS 基于字节跳动的 UI-TARS 视觉语言模型&#xff0c;将视觉感知、推理、接地&#xff08;grounding&#…

【Tauri2】013——前端Window Event与创建Window

前言 【Tauri2】012——on_window_event函数-CSDN博客https://blog.csdn.net/qq_63401240/article/details/146909801?spm1001.2014.3001.5501 前面介绍了on_window_event&#xff0c;这个在Builder中的方法&#xff0c;里面有许多事件&#xff0c;比如Moved&#xff0c;Res…

创建Linux虚拟环境并远程连接,finalshell自定义壁纸

安装VMware 这里不多赘述。 挂载Linux系统 1). 打开Vmware虚拟机&#xff0c;打开 编辑 -> 虚拟网络编辑器(N) 选择 NAT模式&#xff0c;然后选择右下角的 更改设置。 设置子网IP为 192.168.100.0&#xff0c;然后选择 应用 -> 确定。 解压 CentOS7-1.zip 到一个比较大…

基于pycharm的YOLOv11模型训练方法

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言一、前期准备1.1 软件环境配置1.2 训练集参考 二、训练步骤2.1 打开文件夹2.2 打开文件2.3 data.yaml最终代码 三、train.py四、最终结果五、detect.py六、 拓展…

034-QSharedMemory

QSharedMemory 以下为针对 QSharedMemory 的技术调研及实现方案&#xff0c;包含原理、优化策略、完整代码实现及流程图解&#xff1a; 一、QSharedMemory 核心原理 1.1 共享内存机制 共享内存流程图 &#xff08;注&#xff1a;此处应为共享内存IPC流程图&#xff0c;因文本…

在 Ubuntu 上离线安装 Prometheus 和 Grafana

在 Ubuntu 上离线安装 Prometheus 和 Grafana 的步骤如下&#xff1a; 一.安装验证 二.安装步骤 1.准备离线安装包 在一台可以访问互联网的机器上下载 Prometheus 和 Grafana 的二进制文件。 Prometheus 下载地址&#xff1a;Prometheus 官方下载页面Grafana 下载地址&#…

Ansible:playbook的高级用法

文章目录 1. handlers与notify2. tags组件3. playbook中使用变量3.1使用 setup 模块中变量3.2在playbook 命令行中定义变量3.3在playbook文件中定义变量3.4使用变量文件3.5主机清单文件中定义变量主机变量组&#xff08;公共&#xff09;变量 1. handlers与notify Handlers&am…

【C++进阶九】继承和虚继承

【C进阶九】继承和虚继承 1.什么是继承2.继承关系2.1protected和private的区别2.2通过父类的函数去访问父类的private成员2.3默认继承 3.基类和派生类对象的赋值转换4.继承中的作用域5.子类中的默认成员函数6.继承与静态成员7. 菱形继承8.虚继承9.继承和组合 1.什么是继承 继承…

电子电气架构 --- 面向服务的体系架构

我是穿拖鞋的汉子&#xff0c;魔都中坚持长期主义的汽车电子工程师。 老规矩&#xff0c;分享一段喜欢的文字&#xff0c;避免自己成为高知识低文化的工程师&#xff1a; 周末洗了一个澡&#xff0c;换了一身衣服&#xff0c;出了门却不知道去哪儿&#xff0c;不知道去找谁&am…