×
验证码:
换一张
忘记密码?
记住我
CORC
首页
科研机构
检索
知识图谱
申请加入
托管服务
登录
注册
在结果中检索
科研机构
自动化研究所 [1]
内容类型
会议论文 [1]
发表日期
2019 [1]
×
知识图谱
CORC
开始提交
已提交作品
待认领作品
已认领作品
未提交全文
收藏管理
QQ客服
官方微博
反馈留言
浏览/检索结果:
共1条,第1-1条
帮助
已选(
0
)
清除
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
作者升序
作者降序
题名升序
题名降序
发表日期升序
发表日期降序
提交时间升序
提交时间降序
Conservative Policy Gradient in Multi-critic Setting
会议论文
Hangzhou, China, 2019.11.22-24
作者:
Xi, Bao
;
Wang, Rui
;
Wang, Shuo
;
Lu, Tao
;
Cai, Yinghao
收藏
  |  
浏览/下载:25/0
  |  
提交时间:2021/02/02
inconsistancy
stablility
Q learning
policy gradient
©版权所有 ©2017 CSpace - Powered by
CSpace