中国开放科研知识云: 检索

验证码:

换一张

忘记密码？记住我

取消登录

CORC

首页
科研机构
检索
知识图谱
申请加入
托管服务

在结果中检索

科研机构

自动化研究所 [17]

沈阳自动化研究所 [5]

深圳先进技术研究院 [4]

光电技术研究所 [3]

长春光学精密机械与物... [2]

大连理工大学 [1]

内容类型

会议论文 [17]

期刊论文 [16]

学位论文 [2]

发表日期

知识图谱

CORC

已提交作品

待认领作品

已认领作品

未提交全文

浏览/检索结果: 共35条，第1-10条

帮助

已选(0)清除条数/页：排序方式：
	Privacy Preserving Demand Side Management Method via Multi-Agent Reinforcement Learning 期刊论文 IEEE/CAA Journal of Automatica Sinica, 2023, 卷号: 10, 期号: 10, 页码: 1984-1999 作者: Feiye Zhang; Qingyu Yang; Dou An 收藏 \| 浏览/下载：7/0 \| 提交时间：2023/09/07 Centralized training and decentralized execution demand side management multi-agent reinforcement learning privacy preserving
	MUTS-Based Cooperative Target Stalking for A Multi-USV System 期刊论文 IEEE/CAA Journal of Automatica Sinica, 2023, 卷号: 10, 期号: 7, 页码: 1582-1592 作者: Chengcheng Wang; Yulong Wang; Qing-Long Han; Yunkai Wu 收藏 \| 浏览/下载：5/0 \| 提交时间：2023/06/14 Cooperative target stalking improved deep reinforcement learning multi-unmanned surface vehicle (multi-USV) systems V-type probabilistic data extraction
	面向连续控制任务的深度强化学习值函数估计研究学位论文中国科学院自动化研究所: 中国科学院大学, 2022 作者: 何强收藏 \| 浏览/下载：22/0 \| 提交时间：2022/06/17 深度强化学习值函数估计值函数表示集成强化学习
	基于局部策略交互探索的深度确定性策略梯度的工业过程控制方法期刊论文计算机应用, 2022, 页码: 1-8 作者: 邓绍斌; 朱军; 周晓锋; 刘舒锐收藏 \| 浏览/下载：4/0 \| 提交时间：2022/03/15 工业过程控制深度强化学习深度确定性策略梯度学习效率青霉素仿真
	A multiagent deep deterministic policy gradient-based distributed protection method for distribution network 期刊论文 NEURAL COMPUTING & APPLICATIONS, 2022, 页码: 1-12 作者: Zeng P(曾鹏); Cui SJ(崔世界); Song CH(宋纯贺); Wang ZF(王忠锋); Li, Guangye 收藏 \| 浏览/下载：21/0 \| 提交时间：2022/02/19 Distributed generation Distribution system Multiagent Power system protection Reinforcement learning
	Application of Deep Reinforcement Learning in Reconfiguration Control of Aircraft Anti-Skid Braking System 期刊论文 Aerospace, 2022, 卷号: 9, 期号: 10, 页码: 25 作者: S. C. Liu; Z. Yang; Z. Zhang; R. Q. Jiang; T. Y. Ren 收藏 \| 浏览/下载：1/0 \| 提交时间：2023/06/14
	Efficient Cooperative Structured Control for a Multijoint Biomimetic Robotic Fish 期刊论文 IEEE-ASME TRANSACTIONS ON MECHATRONICS, 2021, 卷号: 26, 期号: 5, 页码: 2506-2516 作者: Yan, Shuaizheng; Wu, Zhengxing; Wang, Jian; Tan, Min; Yu, Junzhi 收藏 \| 浏览/下载：28/0 \| 提交时间：2021/12/28 Robots Robot kinematics Optimization Biomimetics Sports Training Task analysis Deep reinforcement learning evolutionary strategy robotic fish structured control
	Deep Deterministic Policy Gradient for High-Speed Train Trajectory Optimization 期刊论文 IEEE TRANSACTIONS ON INTELLIGENT TRANSPORTATION SYSTEMS, 2021, 页码: 13 作者: Ning, Lingbin; Zhou, Min; Hou, Zhuopu; Goverde, Rob M. P.; Wang, Fei-Yue 收藏 \| 浏览/下载：42/0 \| 提交时间：2022/01/27 Rail transportation Training Heuristic algorithms Resistance Optimal control Trajectory optimization Switches High-speed railway train trajectory optimization deep deterministic policy gradient energy efficiency
	Wide-Sense Stationary Policy Optimization with Bellman Residual on Video Games 会议论文 Shenzhen, China, 05-09 July 2021 作者: Gong C(龚晨); He Q(何强); Bai YP(白云鹏); Hou XW(侯新文); Fan GL(范国梁) 收藏 \| 浏览/下载：4/0 \| 提交时间：2022/06/27 Video Game Reinforcement Learning Quantile Regression Bellman residual Wasserstein Distance
	Omnidirectional Drift Control of an Underwater Biomimetic Vehicle-Manipulator System via Reinforcement Learning 会议论文 Suzhou, China, May 14-16, 2021 作者: Ma, Ruichen; Wang, Yu; Wang, Rui; Wang, Shuo 收藏 \| 浏览/下载：0/0 \| 提交时间：2023/08/02 Omnidirectional Drift Control Undulating Fin Underwater Biomimetic Vehicle-manipulator System (UBVMS) Reinforcement Learning Twin Delayed Deep Deterministic policy gradient (TD3)

相关链接
欧盟学术资源开放存取平台
CALIS高校机构知识库
台湾学术机构典藏
香港机构知识库整合系统
中国科学院机构知识库网格系统

CORC
关于我们
服务条款
隐私条款

联系我们
0931-8270076
cspace@llas.ac.cn
China-OR

中文简体

©版权所有 ©2017 CSpace - Powered by CSpace