×
验证码:
换一张
忘记密码?
记住我
CORC
首页
科研机构
检索
知识图谱
申请加入
托管服务
登录
注册
在结果中检索
科研机构
数学与系统科学研究院 [3]
清华大学 [1]
心理研究所 [1]
自动化研究所 [1]
内容类型
期刊论文 [6]
发表日期
2020 [1]
2016 [1]
2010 [1]
2004 [1]
2001 [1]
2000 [1]
更多...
×
知识图谱
CORC
开始提交
已提交作品
待认领作品
已认领作品
未提交全文
收藏管理
QQ客服
官方微博
反馈留言
浏览/检索结果:
共6条,第1-6条
帮助
已选(
0
)
清除
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
作者升序
作者降序
题名升序
题名降序
发表日期升序
发表日期降序
提交时间升序
提交时间降序
Neural Dynamic Responses of Monetary and Social Reward Processes in Adolescents
期刊论文
FRONTIERS IN HUMAN NEUROSCIENCE, 2020, 卷号: 14, 页码: 16
作者:
Wang, Di
;
Liu, Tongran
;
Shi, Jiannong
收藏
  |  
浏览/下载:64/0
  |  
提交时间:2020/06/15
reward processes
neurodevelopment
adolescence
social reward
monetary reward
event-related potential
Online reinforcement learning control by Bayesian inference
期刊论文
IET CONTROL THEORY AND APPLICATIONS, 2016, 卷号: 10, 期号: 12, 页码: 1331-1338
作者:
Xia, Zhongpu
;
Zhao, Dongbin
;
Dongbin Zhao
收藏
  |  
浏览/下载:51/0
  |  
提交时间:2016/06/15
Learning Systems
Bayes Methods
Gaussian Processes
Optimal Control
Online Reinforcement Learning Control
Bayesian Inference
Self-learning Control
Probability
Action Value Function
Gaussian Process
Bayesian-state-action-reward-state-action Algorithm
Maintenance strategy optimization of aeismatic structure during design reference period
期刊论文
2010, 2010
Teng Hai-wen
;
Huo Da
;
Li Yue
收藏
  |  
浏览/下载:4/0
On average reward semi-markov decision processes with a general multichain structure
期刊论文
MATHEMATICS OF OPERATIONS RESEARCH, 2004, 卷号: 29, 期号: 2, 页码: 339-352
作者:
Jianyong, L
;
Xiaobo, Z
收藏
  |  
浏览/下载:29/0
  |  
提交时间:2018/07/30
semi-Markov decision processes
average reward criterion
multichain structure
data-transformation method
optimal policy
Weighted Markov decision processes with perturbation
期刊论文
MATHEMATICAL METHODS OF OPERATIONS RESEARCH, 2001, 卷号: 53, 期号: 3, 页码: 465-480
作者:
Liu, K
;
Filar, JA
收藏
  |  
浏览/下载:30/0
  |  
提交时间:2018/07/30
Markov decision processes
weighted reward
optimal policy
delta-optimal
singular perturbation
general perturbation
Nonhomogeneous Markov decision processes with Borel state space - The average criterion with nonuniformly bounded rewards
期刊论文
MATHEMATICS OF OPERATIONS RESEARCH, 2000, 卷号: 25, 期号: 4, 页码: 667-678
作者:
Guo, XP
;
Liu, JY
;
Liu, K
收藏
  |  
浏览/下载:28/0
  |  
提交时间:2018/07/30
nonhomogeneous Markov decision processes
average reward criterion
optimality equations
epsilon(>= 0)-optimal policies
rolling horizon algorithm
©版权所有 ©2017 CSpace - Powered by
CSpace