×
验证码:
换一张
忘记密码?
记住我
CORC
首页
科研机构
检索
知识图谱
申请加入
托管服务
登录
注册
在结果中检索
科研机构
自动化研究所 [12]
沈阳自动化研究所 [4]
长春光学精密机械与物... [1]
合肥物质科学研究院 [1]
内容类型
期刊论文 [10]
会议论文 [7]
学位论文 [1]
发表日期
2020 [18]
×
知识图谱
CORC
开始提交
已提交作品
待认领作品
已认领作品
未提交全文
收藏管理
QQ客服
官方微博
反馈留言
浏览/检索结果:
共18条,第1-10条
帮助
限定条件
发表日期:2020
已选(
0
)
清除
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
作者升序
作者降序
题名升序
题名降序
发表日期升序
发表日期降序
提交时间升序
提交时间降序
Optimal Elevator Group Control via Deep Asynchronous Actor-Critic Learning
期刊论文
IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2020, 卷号: 31, 期号: 12, 页码: 5245-5256
作者:
Wei, Qinglai
;
Wang, Lingxiao
;
Liu, Yu
;
Polycarpou, Marios M.
收藏
  |  
浏览/下载:19/0
  |  
提交时间:2021/03/08
Elevators
Optimal control
Backpropagation
Machine learning
Neural networks
Learning (artificial intelligence)
Actor
–critic
adaptive dynamic programming
deep learning (DL)
elevator group control (EGC)
optimal control
reinforcement learning (RL)
Wd3: Taming the estimation bias in deep reinforcement learning
会议论文
Baltimore, MD, USA, 2020-12
作者:
He Q(何强)
;
Hou XW(侯新文)
收藏
  |  
浏览/下载:2/0
  |  
提交时间:2022/06/27
deep reinforcement learning
estimation bias
neural networks
面向机械臂控制的强化学习方法研究
学位论文
沈阳: 中国科学院沈阳自动化研究所, 2020
作者:
胡亚洲
收藏
  |  
浏览/下载:25/0
  |  
提交时间:2020/12/18
机器人控制
强化学习
值函数近似
优势函数
自由能原理
Accelerating Minibatch Stochastic Gradient Descent Using Typicality Sampling
期刊论文
IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2020, 卷号: 31, 期号: 11, 页码: 4649-4659
作者:
Peng, Xinyu
;
Li, Li
;
Wang, Fei-Yue
收藏
  |  
浏览/下载:14/0
  |  
提交时间:2021/01/06
Training
Convergence
Approximation algorithms
Stochastic processes
Estimation
Optimization
Acceleration
Batch selection
machine learning
minibatch stochastic gradient descent (SGD)
speed of convergence
Stable Training of Bellman Error in Reinforcement Learning
会议论文
Thailand, November 18–22
作者:
Gong C(龚晨)
;
Bai YP(白云鹏)
;
Hou XW(侯新文)
;
Ji XH(季晓慧)
收藏
  |  
浏览/下载:0/0
  |  
提交时间:2023/06/27
Reinforcement Learning-Based Optimal Stabilization for Unknown Nonlinear Systems Subject to Inputs With Uncertain Constraints
期刊论文
IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2020, 卷号: 31, 期号: 10, 页码: 4330-4340
作者:
Zhao, Bo
;
Liu, Derong
;
Luo, Chaomin
收藏
  |  
浏览/下载:34/0
  |  
提交时间:2021/01/07
Nonlinear systems
Optimal control
Artificial neural networks
Actuators
Observers
Feedforward systems
Adaptive dynamic programming (ADP)
neural networks (NNs)
optimal control
reinforcement learning (RL)
uncertain input constraints
unknown nonlinear systems
Nash Q-learning based equilibrium transfer for integrated energy management game with We-Energy
期刊论文
NEUROCOMPUTING, 2020, 卷号: 396, 页码: 216-223
作者:
Yang, Lingxiao
;
Sun, Qiuye
;
Ma, Dazhong
;
Wei, Qinglai
收藏
  |  
浏览/下载:52/0
  |  
提交时间:2020/06/22
Nash Q-learning
Integrated energy management game
Interconnected multicarrier systems
Equilibrium transfer
We-Energy
Domain Adaptation for EEG Emotion Recognition Based on Latent Representation Similarity
期刊论文
IEEE TRANSACTIONS ON COGNITIVE AND DEVELOPMENTAL SYSTEMS, 2020, 卷号: 12, 期号: 2, 页码: 344-353
作者:
Li, Jinpeng
;
Qiu, Shuang
;
Du, Changde
;
Wang, Yixin
;
He, Huiguang
收藏
  |  
浏览/下载:42/0
  |  
提交时间:2020/08/03
Electroencephalography
Brain modeling
Emotion recognition
Adaptation models
Training
Feature extraction
Neural networks
Domain adaptation
electroencephalogram (EEG)
emotion recognition
neural network
transfer learning
Potential Driven Reinforcement Learning for Hard Exploration Tasks
会议论文
线上, 2020-4
作者:
Zhao EM(赵恩民)
;
Deng SH(邓诗弘)
;
Zang YF(臧一凡)
;
Kang YX(康永欣)
;
Li K(李凯)
收藏
  |  
浏览/下载:0/0
  |  
提交时间:2023/06/29
Multi-Agent Formation Control with Obstacles Avoidance under Restricted Communication through Graph Reinforcement Learning
会议论文
线上, 2020.06
作者:
Huimu, Wang
;
Tenghai, Qiu
;
Zhen, Liu
;
Zhiqiang, Pu
;
Jianqiang, Yi
收藏
  |  
浏览/下载:9/0
  |  
提交时间:2021/06/24
©版权所有 ©2017 CSpace - Powered by
CSpace