关于马氏决策中概率准则的综述 | |
姜玉双 | |
2003 | |
关键词 | 马尔可夫决策过程 最优策略 目标值 概率准则 |
英文摘要 | 本文对马尔可夫决策过程(Markov Decision Process,简记为:MDP)中概率准则的有关模型进行了综述.概率准则是实际问题中应用的比较广泛的一个重要准则.首先我们给出了MDP的一般构成.并介绍了一些经典的MDP模型,即以期望值为优化目标的期望模型,如有限阶段模型、折扣模型和平均模型等.其次我们介绍了MDP中关于概率准则模型的有关性质和有效算法.最后提出概率准则模型今后可能的研究方向.; 0 |
语种 | 中文 |
出处 | 万方 ; http://d.g.wanfangdata.com.cn/Conference_4505798.aspx |
内容类型 | 其他 |
源URL | [http://hdl.handle.net/20.500.11897/13671] |
专题 | 数学科学学院 |
推荐引用方式 GB/T 7714 | 姜玉双. 关于马氏决策中概率准则的综述. 2003-01-01. |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论