【强化学习原理+项目专栏】必看系列:单智能体、多智能体算法原理+项目实战、相关技巧(调参、画图等、趣味项目实现、学术应用项目实现
对于深度强化学习这块规划为:
- 基础单智能算法教学(gym环境为主)
- 主流多智能算法教学(gym环境为主)
- 一些趣味项目(超级玛丽、下五子棋、斗地主、各种游戏上应用)
- 单智能多智能题实战(论文复现偏业务如:无人机优化调度、电力资源调度等项目应用)
本专栏主要方便入门同学快速掌握强化学习单智能体|多智能体算法原理+项目实战。后续会持续把深度学习涉及知识原理分析给大家,让大家在项目实操的同时也能知识储备,知其然、知其所以然、知何由以知其所以然。
-
专栏订阅(按需选择):
-
强化学习原理+项目专栏大合集
-
强化学习单智能体算法原理+项目实战
-
强化学习多智能体原理+项目实战
-
强化学习相关技巧(调参、画图等)
-
tensorflow_gym-强化学习:免费
-
0.tensorflow_gym-强化学习基础入门(推荐新人看)
【一】gym环境安装以及安装遇到的错误解决
【二】gym初次入门一学就会—代码详细解析简明教程----平衡杆案例
【三】gym简单画图、快来上手入门吧,超级简单!
【四】gym搭建自己的环境,全网最详细版本,3分钟你就学会了!
【五】gym搭建自己的环境之寻宝游戏,详细定义自己myenv.py文件以及算法实现
【六】gym搭建自己环境升级版设计,动态障碍------强化学习
【七】强化学习、gym学习平台扩充,更好的玩转虚拟环境,关于mujoco、mujoco-py、baselines安装配置----待更新------
![在这里插入图片描述](https://img-blog.csdnimg.cn/b64791cf8f964947bd86eb46b31d6d19.png
1.强化学习单智能体算法原理+项目实战
1.1 前置教学:
【一】飞桨paddle【GPU、CPU】安装以及环境配置+python入门教学
【二】强化学习之Parl基础命令–PaddlePaddlle及PARL框架{飞桨}
【三】强化学习之PaddlePaddlle-Notebook、&pdb、ipdb 调试—及PARL框架
1.2 理论知识篇
1.3 RL项目实战(本地版含码源)-old
【四】强化学习入门简介—PaddlePaddlle强化学习及PARL框架
【五】强化学习之Sarsa、Qlearing详细讲解----PaddlePaddlle【PARL】框架{飞桨}
【六】强化学习之DQN—PaddlePaddlle【PARL】框架{飞桨}
【七】强化学习之Policy Gradient—PaddlePaddlle【PARL】框架{飞桨}
【八】强化学习之DDPG—PaddlePaddlle【PARL】框架{飞桨}
【九】强化学习之TD3算法四轴飞行器仿真—PaddlePaddlle【PARL】框架
部分效果展示:
基于TD3强化学习算法解决四轴飞行器悬浮任务
基于多智能体(无人机群)路径探索的深度强化学习
1.4 RL项目实战云端+本地版-new
待更新
2.强化学习多智能体原理+项目实战
2.1 理论原理篇
常见多智能体强化学习仿真环境介绍【一】{推荐收藏,真的牛}
多智能体强化学习算法【一】【MAPPO、MADDPG、QMIX】
多智能体强化学习算法【二】【MADDPG、QMIX、MAPPO】
多智能体强化学习算法【三】【QMIX、MADDPG、MAPPO】
【一】最新多智能体强化学习方法【总结】
【二】最新多智能体强化学习文章如何查阅{顶会:AAAI、 ICML }
【三】多智能体强化学习(MARL)近年研究概览 {Analysis of emergent behaviors(行为分析)_、Learning communication(通信学习)}
【四】多智能体强化学习(MARL)近年研究概览 {Learning cooperation(协作学习)、Agents modeling agents(智能体建模)}
2.2 MARL项目实战
2.2.1MADDPG
【一】MADDPG-单智能体|多智能体总结(理论、算法)
【二】MADDPG多智能体算法实现(parl)【追逐游戏复现】
【三】补发一篇tensorflow下MADDPG环境搭建配置
3.强化学习相关技巧(调参、画图等)
强化学习调参技巧一: DDPG算法训练动作选择边界值_分析解决
强化学习调参技巧二:DDPG、TD3、SAC算法为例:
强化学习技巧三:Python多进程
强化学习技巧四:模型训练速度过慢、GPU利用率较低,CPU利用率很低问题总结与分析。
强化学习技巧五:numba提速python程序
python随机种子seed的作用(强化学习常用到)
python生成数据曲线平滑处理——(Savitzky-Golay 滤波器、convolve滑动平均滤波)方法介绍,推荐玩强化学习的小伙伴收藏
4.后续趣味项目实现(尝鲜看)
MarLio 马里奥的强化学习冒险
4.学术应用项目实现(计划中)
单智能多智能题实战(论文复现偏业务如:无人机优化调度、电力资源调度等项目应用)
敬请期待