强化学习(Python)

强化学习(Python)

Morvan
澳洲PhD, 喜欢机器学习, 分享知识. 个人教学网页, 莫烦python: http://morvanzhou.github.io/tutorials/
  • 课程目录
  • 课程介绍
  • 课时1:什么是 强化学习

  • 课时2:强化学习方法汇总

  • 课时3:Why?

  • 课时4:课程要求

  • 课时5:什么是 Q Learning

  • 课时6:简单例子

  • 课时7:Q Learning 算法更新

  • 课时8:Q Learning 思维决策

  • 课时9:什么是 Sarsa

  • 课时10:Sarsa 算法更新

  • 课时11:Sarsa 思维决策

  • 课时12:什么是 Sarsa(lambda)

  • 课时13:Sarsa(lambda)

  • 课时14:什么是 DQN

  • 课时15:DQN 算法更新

  • 课时16:DQN 神经网络

  • 课时17:DQN 思维决策

  • 课时18:OpenAI Gym 环境库

  • 课时19:Double DQN

  • 课时20:DQN with Prioritised Replay

  • 课时21:Dueling DQN

  • 课时22:什么是 Policy Gradients

  • 课时23:Policy Gradient 算法更新

  • 课时24:Policy Gradients 思维决策

  • 课时25:什么是 Actor Critic

  • 课时26:Actor Critic

  • 课时27:什么是 DDPG

  • 课时28:DDPG

  • 课时29:什么是 A3C

  • 课时30:A3C

课程概述

学习什么是强化学习, 有哪些种类的强化学习. 并且边学边用, 使用 非常容易上手的 python 来实现各类强化学习的模拟. 点击前几节内容, 我们来看看这门强化学习, 我们包含了那些内容, 做了哪些有趣的模拟实验.

课程内容在每周末更新. 将要囊括强化学习各种方法的使用, 包括 Q leanring, Sarsa, Sarsa-lambda, Deep Q Network, Policy Gradient, Model based Reinforcement Learning.

教程推荐

Clojure在线教程

MariaDB在线教程

MySQL在线教程

Java 加密在线教程

Swift在线教程

R在线教程

随机推荐

飞利浦电话机座机固定电话究竟合不合格,评测比较哪款好

小熊加湿器卧室婴儿迷你家用办公室空气加湿器大雾量适不适合你!...

爱普生V370良心点评配置区别,哪款性价比更好

悦心为己野餐垫评测下来告诉你坑不坑,这就是评测结果!

美的空调大1匹评测结果好吗,评测值得入手吗

茶花洗衣袋优缺点分析测评,优劣分析评测结果!