×
验证码:
换一张
忘记密码?
记住我
CORC
首页
科研机构
检索
知识图谱
申请加入
托管服务
登录
注册
在结果中检索
科研机构
自动化研究所 [36]
北京大学 [10]
计算技术研究所 [5]
清华大学 [4]
兰州理工大学 [4]
深圳先进技术研究院 [4]
更多...
内容类型
期刊论文 [39]
会议论文 [19]
学位论文 [13]
其他 [9]
发表日期
2024 [2]
2021 [5]
2019 [2]
2018 [3]
2017 [6]
2016 [3]
更多...
学科主题
计算机科学技术::人... [1]
×
知识图谱
CORC
开始提交
已提交作品
待认领作品
已认领作品
未提交全文
收藏管理
QQ客服
官方微博
反馈留言
浏览/检索结果:
共80条,第1-10条
帮助
已选(
0
)
清除
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
作者升序
作者降序
题名升序
题名降序
发表日期升序
发表日期降序
提交时间升序
提交时间降序
Incremental Audio-Visual Fusion for Person Recognition in Earthquake Scene
期刊论文
ACM TRANSACTIONS ON MULTIMEDIA COMPUTING COMMUNICATIONS AND APPLICATIONS, 2024, 卷号: 20, 期号: 2, 页码: 19
作者:
You, Sisi
;
Zuo, Yukun
;
Yao, Hantao
;
Xu, Changsheng
收藏
  |  
浏览/下载:5/0
  |  
提交时间:2023/12/21
Cross-modal audio-visual fusion
incremental learning
person recognition
elastic weight consolidation
feature replay
Cogeneration of Innovative Audio-visual Content: A New Challenge for Computing Art
期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 1, 页码: 4-28
作者:
Mengting Liu
收藏
  |  
浏览/下载:3/0
  |  
提交时间:2024/01/25
Artificial intelligence (AI) art, audio-visual, artificial intelligence generated content (AIGC), multimodal, artistic evaluation
Visually Guided Sound Source Separation With Audio-Visual Predictive Coding
期刊论文
IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2023, 页码: 15
作者:
Song, Zengjie
;
Zhang, Zhaoxiang
收藏
  |  
浏览/下载:1/0
  |  
提交时间:2023/11/17
Feature fusion
multimodal learning
predictive coding (PC)
self-supervised learning
sound source separation
Adversarial-Metric Learning for Audio-Visual Cross-Modal Matching
期刊论文
IEEE TRANSACTIONS ON MULTIMEDIA, 2022, 卷号: 24, 页码: 338-351
作者:
Zheng, Aihua
;
Hu, Menglan
;
Jiang, Bo
;
Huang, Yan
;
Yan, Yan
收藏
  |  
浏览/下载:38/0
  |  
提交时间:2022/03/17
Visualization
Task analysis
Measurement
Speech recognition
Videos
Location awareness
Image recognition
Adversarial learning
audio-visual matching
cross-modal learning
metric learning
面向鸡尾酒会问题的视觉辅助语音分离算法研究
学位论文
中国科学院自动化研究所: 中国科学院自动化研究所, 2021
作者:
张鹏
收藏
  |  
浏览/下载:54/0
  |  
提交时间:2021/06/21
鸡尾酒会问题
语音分离
视觉辅助
在线流式处理
生成对抗训练
Audio description from image by modal translation network
期刊论文
Neurocomputing, 2021, 卷号: 423, 页码: 124-134
作者:
Ning, Hailong
;
Zheng, Xiangtao
;
Yuan, Yuan
;
Lu, Xiaoqiang
收藏
  |  
浏览/下载:15/0
  |  
提交时间:2020/11/30
Image-to-audio-description
Modal translation
Heterogeneous gap
Audio-Visual Speech Separation with Visual Features Enhanced by Adversarial Training
会议论文
线上会议, 2021-7-18
作者:
Zhang Peng
;
Xu Jiaming
;
Shi Jing
;
Hao Yunzhe
;
Qin Lei
收藏
  |  
浏览/下载:26/0
  |  
提交时间:2021/06/21
audio-visual speech separation
robust
adversarial training method
time-domain approach
Changes in delta and theta oscillations in the brain indicate dynamic switching of attention between internal and external processing
会议论文
Xi'an, China, May 21-23, 2021
作者:
Yuying Jiang
;
Haoran Zhang
;
Shan Yu
收藏
  |  
浏览/下载:20/0
  |  
提交时间:2021/06/16
Happy Emotion Recognition From Unconstrained Videos Using 3D Hybrid Deep Features
期刊论文
IEEE ACCESS, 2021, 卷号: 9, 页码: 35524-35538
作者:
Samadiani, Najmeh
;
Huang, Guangyan
;
Hu, Yu
;
Li, Xiaowei
收藏
  |  
浏览/下载:12/0
  |  
提交时间:2021/12/01
Feature extraction
Emotion recognition
Face recognition
Videos
Three-dimensional displays
Long short term memory
Visualization
Facial landmarks
facial expression recognition
long short term memory
multi-layer neural networks
happy emotion recognition
Jointly Learning of Visual and Auditory: A New Approach for RS Image and Audio Cross-Modal Retrieval
期刊论文
IEEE JOURNAL OF SELECTED TOPICS IN APPLIED EARTH OBSERVATIONS AND REMOTE SENSING, 2019, 卷号: 12, 期号: 11, 页码: 4644-4654
作者:
Guo, Mao
;
Zhou, Chenghu
;
Liu, Jiahang
收藏
  |  
浏览/下载:4/0
  |  
提交时间:2020/05/19
Convolutional neural network
cross-modal
image retrieval
remote sensing
speech
©版权所有 ©2017 CSpace - Powered by
CSpace