1.1 强化学习与深度学习的基本概念
1.1.1 强化学习的核心思想
什么是强化学习?
-
强化学习(Reinforcement Learning, RL):指在与环境(Environment)的反复交互中,智能体(Agent)通过“试错”获取经验,并依据获得的奖励(Reward)学习出最优策略(Policy),以期在未来的决策中取得最大化的累积回报(Return)。
-
核心要素
- 智能体(Agent):在环境中执行动作的主体;
- 环境(Environment):Agent 与之交互的外部世界;
- 状态(State):环境在某一时刻的刻画,Agent 能观测到或部分观测到;
- 动作(Action):Agent 针对所处状态执行的操作