2020年强化学习-不确定性决策与强化学习

    这本书的目的旨在整理不确定性条件下,决策判断相关的一系列知识及结果,就像普特曼在1994年写了一半关于马尔可夫决策过程的书,对马尔可夫决策过程理论进行详细整理。本书的一个主要目标是希望对一个连续决策问题的算法和理论进行完整整理,包括强化学习。从基本的统计决策理论出发,发展到强化学习问题和各种求解方法。这本书的结尾集中在模型和近似算法的当前最先进的科研成果。

 

  最新pdf获取地址:https://mp.weixin.qq.com/s?__biz=MzIxNDgzNDg3NQ==&mid=2247487610&idx=1&sn=09457b1485eee3bc8a0860bb83eb9999&chksm=97a0dbaea0d752b804c992c6007c6c9a36422e412edeaa2c2e060eeca382d66e9f150b592a5e&token=272301662&lang=zh_CN#rd

     

本书目录

     

本书正文截图

 

pdf获取地址: https://mp.weixin.qq.com/s?__biz=MzIxNDgzNDg3NQ==&mid=2247487610&idx=1&sn=09457b1485eee3bc8a0860bb83eb9999&chksm=97a0dbaea0d752b804c992c6007c6c9a36422e412edeaa2c2e060eeca382d66e9f150b592a5e&token=272301662&lang=zh_CN#rd

 

往期精品内容推荐

做过这个NLP项目的面试通过率高达 90%!!

自然语言处理任务相关经典论文、免费书籍、博客、tf代码整理分享

新书-《Bandit问题-基础、算法、理论、应用》分享

深度学习自然语言处理模型实现大集合(精简版<100行)

推荐系统原理、工程、大厂(Youtube、BAT、TMB)架构干活分享

深度学习基础:正向模型、可微损失函数与优化

自动化机器学习(AutoML)文献/工具/项目资源大列表分享

2019年Google最新中文版《机器学习速成课程》分享

历史最全-130本科技互联网类免费书籍整理-汇总分享

新书分享-嵌入式深度学习:持续性神经网路算法、结构和电路设计

8月最新-《可解释机器学习-Christoph Molnar》-新书分享

2019年BAT、TMD等互联网最新、最全面试题目及答案汇总

深度学习基础系列之2019深度学习暑期课程视频分享(中英字幕)

图神经网络(GNN)无监督学习 - Thomas Kipf

相关推荐
©️2020 CSDN 皮肤主题: 大白 设计师:CSDN官方博客 返回首页