×
验证码:
换一张
忘记密码?
记住我
CORC
首页
科研机构
检索
知识图谱
申请加入
托管服务
登录
注册
在结果中检索
科研机构
自动化研究所 [17]
沈阳自动化研究所 [5]
深圳先进技术研究院 [4]
光电技术研究所 [3]
长春光学精密机械与物... [2]
大连理工大学 [1]
更多...
内容类型
会议论文 [17]
期刊论文 [16]
学位论文 [2]
发表日期
2023 [2]
2022 [4]
2021 [6]
2020 [7]
2019 [7]
2018 [7]
更多...
×
知识图谱
CORC
开始提交
已提交作品
待认领作品
已认领作品
未提交全文
收藏管理
QQ客服
官方微博
反馈留言
浏览/检索结果:
共35条,第1-10条
帮助
已选(
0
)
清除
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
发表日期升序
发表日期降序
提交时间升序
提交时间降序
题名升序
题名降序
作者升序
作者降序
Privacy Preserving Demand Side Management Method via Multi-Agent Reinforcement Learning
期刊论文
IEEE/CAA Journal of Automatica Sinica, 2023, 卷号: 10, 期号: 10, 页码: 1984-1999
作者:
Feiye Zhang
;
Qingyu Yang
;
Dou An
收藏
  |  
浏览/下载:7/0
  |  
提交时间:2023/09/07
Centralized training and decentralized execution
demand side management
multi-agent reinforcement learning
privacy preserving
MUTS-Based Cooperative Target Stalking for A Multi-USV System
期刊论文
IEEE/CAA Journal of Automatica Sinica, 2023, 卷号: 10, 期号: 7, 页码: 1582-1592
作者:
Chengcheng Wang
;
Yulong Wang
;
Qing-Long Han
;
Yunkai Wu
收藏
  |  
浏览/下载:5/0
  |  
提交时间:2023/06/14
Cooperative target stalking
improved deep reinforcement learning
multi-unmanned surface vehicle (multi-USV) systems
V-type probabilistic data extraction
面向连续控制任务的深度强化学习值函数估计研究
学位论文
中国科学院自动化研究所: 中国科学院大学, 2022
作者:
何强
收藏
  |  
浏览/下载:22/0
  |  
提交时间:2022/06/17
深度强化学习
值函数估计
值函数表示
集成强化学习
基于局部策略交互探索的深度确定性策略梯度的工业过程控制方法
期刊论文
计算机应用, 2022, 页码: 1-8
作者:
邓绍斌
;
朱军
;
周晓锋
;
刘舒锐
收藏
  |  
浏览/下载:4/0
  |  
提交时间:2022/03/15
工业过程控制
深度强化学习
深度确定性策略梯度
学习效率
青霉素仿真
A multiagent deep deterministic policy gradient-based distributed protection method for distribution network
期刊论文
NEURAL COMPUTING & APPLICATIONS, 2022, 页码: 1-12
作者:
Zeng P(曾鹏)
;
Cui SJ(崔世界)
;
Song CH(宋纯贺)
;
Wang ZF(王忠锋)
;
Li, Guangye
收藏
  |  
浏览/下载:21/0
  |  
提交时间:2022/02/19
Distributed generation
Distribution system
Multiagent
Power system protection
Reinforcement learning
Application of Deep Reinforcement Learning in Reconfiguration Control of Aircraft Anti-Skid Braking System
期刊论文
Aerospace, 2022, 卷号: 9, 期号: 10, 页码: 25
作者:
S. C. Liu
;
Z. Yang
;
Z. Zhang
;
R. Q. Jiang
;
T. Y. Ren
收藏
  |  
浏览/下载:1/0
  |  
提交时间:2023/06/14
Efficient Cooperative Structured Control for a Multijoint Biomimetic Robotic Fish
期刊论文
IEEE-ASME TRANSACTIONS ON MECHATRONICS, 2021, 卷号: 26, 期号: 5, 页码: 2506-2516
作者:
Yan, Shuaizheng
;
Wu, Zhengxing
;
Wang, Jian
;
Tan, Min
;
Yu, Junzhi
收藏
  |  
浏览/下载:28/0
  |  
提交时间:2021/12/28
Robots
Robot kinematics
Optimization
Biomimetics
Sports
Training
Task analysis
Deep reinforcement learning
evolutionary strategy
robotic fish
structured control
Deep Deterministic Policy Gradient for High-Speed Train Trajectory Optimization
期刊论文
IEEE TRANSACTIONS ON INTELLIGENT TRANSPORTATION SYSTEMS, 2021, 页码: 13
作者:
Ning, Lingbin
;
Zhou, Min
;
Hou, Zhuopu
;
Goverde, Rob M. P.
;
Wang, Fei-Yue
收藏
  |  
浏览/下载:42/0
  |  
提交时间:2022/01/27
Rail transportation
Training
Heuristic algorithms
Resistance
Optimal control
Trajectory optimization
Switches
High-speed railway
train trajectory optimization
deep deterministic policy gradient
energy efficiency
Wide-Sense Stationary Policy Optimization with Bellman Residual on Video Games
会议论文
Shenzhen, China, 05-09 July 2021
作者:
Gong C(龚晨)
;
He Q(何强)
;
Bai YP(白云鹏)
;
Hou XW(侯新文)
;
Fan GL(范国梁)
收藏
  |  
浏览/下载:4/0
  |  
提交时间:2022/06/27
Video Game
Reinforcement Learning
Quantile Regression
Bellman residual
Wasserstein Distance
Omnidirectional Drift Control of an Underwater Biomimetic Vehicle-Manipulator System via Reinforcement Learning
会议论文
Suzhou, China, May 14-16, 2021
作者:
Ma, Ruichen
;
Wang, Yu
;
Wang, Rui
;
Wang, Shuo
收藏
  |  
浏览/下载:0/0
  |  
提交时间:2023/08/02
Omnidirectional Drift Control
Undulating Fin
Underwater Biomimetic Vehicle-manipulator System (UBVMS)
Reinforcement Learning
Twin Delayed Deep Deterministic policy gradient (TD3)
©版权所有 ©2017 CSpace - Powered by
CSpace