CORC  > 北京大学  > 数学科学学院
关于马氏决策中概率准则的综述
姜玉双
2003
关键词马尔可夫决策过程 最优策略 目标值 概率准则
英文摘要本文对马尔可夫决策过程(Markov Decision Process,简记为:MDP)中概率准则的有关模型进行了综述.概率准则是实际问题中应用的比较广泛的一个重要准则.首先我们给出了MDP的一般构成.并介绍了一些经典的MDP模型,即以期望值为优化目标的期望模型,如有限阶段模型、折扣模型和平均模型等.其次我们介绍了MDP中关于概率准则模型的有关性质和有效算法.最后提出概率准则模型今后可能的研究方向.; 0
语种中文
出处万方 ; http://d.g.wanfangdata.com.cn/Conference_4505798.aspx
内容类型其他
源URL[http://hdl.handle.net/20.500.11897/13671]  
专题数学科学学院
推荐引用方式
GB/T 7714
姜玉双. 关于马氏决策中概率准则的综述. 2003-01-01.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace