中国开放科研知识云: 检索

验证码:

换一张

忘记密码？记住我

取消登录

CORC

首页
科研机构
检索
知识图谱
申请加入
托管服务

在结果中检索

科研机构

自动化研究所 [12]

沈阳自动化研究所 [4]

长春光学精密机械与物... [1]

合肥物质科学研究院 [1]

内容类型

期刊论文 [10]

会议论文 [7]

学位论文 [1]

发表日期

2020 [18]

知识图谱

CORC

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共18条，第1-10条

帮助

限定条件

发表日期：2020

已选(0)清除条数/页：排序方式：
	Optimal Elevator Group Control via Deep Asynchronous Actor-Critic Learning 期刊论文 IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2020, 卷号: 31, 期号: 12, 页码: 5245-5256 作者: Wei, Qinglai; Wang, Lingxiao; Liu, Yu; Polycarpou, Marios M. 收藏 \| 浏览/下载：19/0 \| 提交时间：2021/03/08 Elevators Optimal control Backpropagation Machine learning Neural networks Learning (artificial intelligence) Actor –critic adaptive dynamic programming deep learning (DL) elevator group control (EGC) optimal control reinforcement learning (RL)
	Wd3: Taming the estimation bias in deep reinforcement learning 会议论文 Baltimore, MD, USA, 2020-12 作者: He Q(何强); Hou XW(侯新文) 收藏 \| 浏览/下载：2/0 \| 提交时间：2022/06/27 deep reinforcement learning estimation bias neural networks
	面向机械臂控制的强化学习方法研究学位论文沈阳: 中国科学院沈阳自动化研究所, 2020 作者: 胡亚洲收藏 \| 浏览/下载：25/0 \| 提交时间：2020/12/18 机器人控制强化学习值函数近似优势函数自由能原理
	Accelerating Minibatch Stochastic Gradient Descent Using Typicality Sampling 期刊论文 IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2020, 卷号: 31, 期号: 11, 页码: 4649-4659 作者: Peng, Xinyu; Li, Li; Wang, Fei-Yue 收藏 \| 浏览/下载：14/0 \| 提交时间：2021/01/06 Training Convergence Approximation algorithms Stochastic processes Estimation Optimization Acceleration Batch selection machine learning minibatch stochastic gradient descent (SGD) speed of convergence
	Stable Training of Bellman Error in Reinforcement Learning 会议论文 Thailand, November 18–22 作者: Gong C(龚晨); Bai YP(白云鹏); Hou XW(侯新文); Ji XH(季晓慧) 收藏 \| 浏览/下载：0/0 \| 提交时间：2023/06/27
	Reinforcement Learning-Based Optimal Stabilization for Unknown Nonlinear Systems Subject to Inputs With Uncertain Constraints 期刊论文 IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2020, 卷号: 31, 期号: 10, 页码: 4330-4340 作者: Zhao, Bo; Liu, Derong; Luo, Chaomin 收藏 \| 浏览/下载：34/0 \| 提交时间：2021/01/07 Nonlinear systems Optimal control Artificial neural networks Actuators Observers Feedforward systems Adaptive dynamic programming (ADP) neural networks (NNs) optimal control reinforcement learning (RL) uncertain input constraints unknown nonlinear systems
	Nash Q-learning based equilibrium transfer for integrated energy management game with We-Energy 期刊论文 NEUROCOMPUTING, 2020, 卷号: 396, 页码: 216-223 作者: Yang, Lingxiao; Sun, Qiuye; Ma, Dazhong; Wei, Qinglai 收藏 \| 浏览/下载：52/0 \| 提交时间：2020/06/22 Nash Q-learning Integrated energy management game Interconnected multicarrier systems Equilibrium transfer We-Energy
	Domain Adaptation for EEG Emotion Recognition Based on Latent Representation Similarity 期刊论文 IEEE TRANSACTIONS ON COGNITIVE AND DEVELOPMENTAL SYSTEMS, 2020, 卷号: 12, 期号: 2, 页码: 344-353 作者: Li, Jinpeng; Qiu, Shuang; Du, Changde; Wang, Yixin; He, Huiguang 收藏 \| 浏览/下载：42/0 \| 提交时间：2020/08/03 Electroencephalography Brain modeling Emotion recognition Adaptation models Training Feature extraction Neural networks Domain adaptation electroencephalogram (EEG) emotion recognition neural network transfer learning
	Potential Driven Reinforcement Learning for Hard Exploration Tasks 会议论文线上, 2020-4 作者: Zhao EM(赵恩民); Deng SH(邓诗弘); Zang YF(臧一凡); Kang YX(康永欣); Li K(李凯) 收藏 \| 浏览/下载：0/0 \| 提交时间：2023/06/29
	Multi-Agent Formation Control with Obstacles Avoidance under Restricted Communication through Graph Reinforcement Learning 会议论文线上, 2020.06 作者: Huimu, Wang; Tenghai, Qiu; Zhen, Liu; Zhiqiang, Pu; Jianqiang, Yi 收藏 \| 浏览/下载：9/0 \| 提交时间：2021/06/24

相关链接
欧盟学术资源开放存取平台
CALIS高校机构知识库
台湾学术机构典藏
香港机构知识库整合系统
中国科学院机构知识库网格系统

CORC
关于我们
服务条款
隐私条款

联系我们
0931-8270076
cspace@llas.ac.cn
China-OR

中文简体

©版权所有 ©2017 CSpace - Powered by CSpace