已选(0)清除
条数/页: 排序方式:
|
| 基于深度强化学习的大规模群体智能决策方法研究 学位论文 2024 作者: 付清旭
![](/themes/default/image/downing1.png) 收藏  |  浏览/下载:0/0  |  提交时间:2024/05/29
|
| PiCor: Multi-Task Deep Reinforcement Learning with Policy Correction 会议论文 美国 华盛顿, 2023.02.07 - 2023.02.14 作者: Bai FS(白丰硕); Zhang HM(张鸿铭); Tao TY(陶天阳); Wu ZH(武志亨); Wang YN(王燕娜)
![](/themes/default/image/downing1.png) 收藏  |  浏览/下载:14/0  |  提交时间:2023/07/05
|
| 面向稀疏奖励环境的多智能体协同探索问题研究 学位论文 2023 作者: 白云鹏
![](/themes/default/image/downing1.png) 收藏  |  浏览/下载:5/0  |  提交时间:2023/06/13
|
| 面向多智能体协作的注意力意图与交流学习方法 期刊论文 自动化学报, 2023, 卷号: 49, 期号: 11, 页码: 2311-2325 作者: 俞文武; 杨晓亚; 李海昌; 王瑞; 胡晓惠
![](/themes/default/image/downing1.png) 收藏  |  浏览/下载:0/0  |  提交时间:2024/04/18
|
| 基于多智能体强化学习的大规模路网交通信号控制 学位论文 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 陈筱语
![](/themes/default/image/downing1.png) 收藏  |  浏览/下载:17/0  |  提交时间:2022/06/16
|
| 改进Q-Learning的WRSN充电路径规划算法 期刊论文 太赫兹科学与电子信息学报, 2022, 卷号: 20, 期号: 04, 页码: 393-401 作者: 刘洋; 王军; 吴云鹏
![](/themes/default/image/downing1.png) 收藏  |  浏览/下载:1/0  |  提交时间:2023/05/18 |
| 基于观测空间关系提取的多智能体强化学习 期刊论文 计算机应用研究, 2022, 页码: 1-5 作者: 许书卿; 臧传治; 王鑫; 刘鼎; 刘玉奇
![](/themes/default/image/downing1.png) 收藏  |  浏览/下载:10/0  |  提交时间:2022/06/16
|
| Multi-agent deep reinforcement learning for end–edge orchestrated resource allocation in industrialwireless networks 期刊论文 Frontiers of Information Technology & Electronic Engineering, 2022, 卷号: 23, 期号: 1, 页码: 47-60 作者: Liu XY(刘晓宇); Xu C(许驰); Yu HB(于海斌); Zeng P(曾鹏)
![](/themes/default/image/downing1.png) 收藏  |  浏览/下载:21/0  |  提交时间:2022/01/27
|
| 基于线性变换的领导−跟随多智能体系统动态反馈均方一致性控制 期刊论文 自动化学报, 2022, 卷号: 48, 期号: 10, 页码: 2474-2485 作者: 郑维; 张志明; 刘和鑫; 张明泉; 孙富春
![](/themes/default/image/downing1.png) 收藏  |  浏览/下载:0/0  |  提交时间:2024/05/20
|
| 基于多智能体深度强化学习的工业无线网络资源分配方法 专利 申请日期: 2021-10-22, 公开日期: 2022-05-06 作者: 于海斌; 刘晓宇; 许驰; 夏长清; 金曦
![](/themes/default/image/downing1.png) 收藏  |  浏览/下载:12/0  |  提交时间:2021/12/13 |