深度学习增强学习的过程

作者：云创智学|发布时间：2022-05-06 10:21:37.0|来源：云创智学

增强学习是一种试错(trial-and-error)的学习方式，从不断尝试的经验中发现一个好的policy，从而在这个过程中获取更多的reward。在学习过程中，会有一个在Exploration（探索）和Exploitation（利用）之间的权衡。

Exploration（探索）会放弃一些已知的reward信息，而去尝试一些新的选择——即在某种状态下，算法也许已经学习到选择什么action让reward比较大，但是并不能每次都做出同样的选择，也许另外一个没有尝试过的选择会让reward更大，即Exploration希望能够探索更多关于environment的信息。

Exploitation（利用）指根据已知的信息最大化reward。

深度学习增强学习的过程

作者：云创智学|发布时间：2022-05-06 10:21:37.0|来源：云创智学

友情链接

关于云创

联系我们

深度学习增强学习的过程

作者：云创智学|发布时间：2022-05-06 10:21:37.0|来源：云创智学

推荐课程

大数据与人工智能就业初级班

大数据与人工智能就业高级班

大数据与人工智能就业中级班

人工智能导论

人工智能图像处理应用

大数据分析挖掘实训课

大数据实战能力提升

ChatGPT应用教学

大数据实战能力提升+金牌服务

云计算职业技能竞赛初级课程（视频资源）

大数据平台技术

大数据应用实训工程实战

云计算职业技能竞赛中级课程（带实验平台实战资源）

云计算职业技能竞赛高级资源增强包

云计算职业技能竞赛中级资源增强包

云计算职业技能竞赛初级资源增强包

云计算职业技能竞赛初级课程/（带实验平台实战资源）

友情链接

关于云创

联系我们