×
验证码:
换一张
忘记密码?
记住我
CORC
首页
科研机构
检索
知识图谱
申请加入
托管服务
登录
注册
在结果中检索
科研机构
自动化研究所 [26]
计算技术研究所 [1]
内容类型
会议论文 [15]
期刊论文 [9]
学位论文 [3]
发表日期
2023 [3]
2022 [5]
2021 [8]
2020 [3]
2019 [2]
2018 [6]
更多...
×
知识图谱
CORC
开始提交
已提交作品
待认领作品
已认领作品
未提交全文
收藏管理
QQ客服
官方微博
反馈留言
浏览/检索结果:
共27条,第1-10条
帮助
已选(
0
)
清除
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
发表日期升序
发表日期降序
提交时间升序
提交时间降序
题名升序
题名降序
作者升序
作者降序
WL-MSR: Watch and Listen for Multimodal Subtitle Recognition
会议论文
Greece, 2023-6-4
作者:
Liu, Jiawei
;
Wang, Hao
;
Wang, Weining
;
He, Xingjian
;
Liu, Jing
收藏
  |  
浏览/下载:9/0
  |  
提交时间:2023/07/06
Complex Dynamic Neurons Improved Spiking Transformer Network for Efficient Automatic Speech Recognition
会议论文
Washington D.C., USA, 2023-2-9
作者:
Qingyu Wang
;
Tielin Zhang
;
Minglun Han
;
Yi Wang
;
Duzhen Zhang
收藏
  |  
浏览/下载:15/0
  |  
提交时间:2023/06/20
Large-scale Multi-modal Pre-trained Models: A Comprehensive Survey
期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 4, 页码: 447-482
作者:
Xiao Wang
收藏
  |  
浏览/下载:6/0
  |  
提交时间:2023/08/02
Multi-modal (MM), pre-trained model (PTM), information fusion, representation learning, deep learning
会议场景智能语音处理技术研究
学位论文
中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:
范志赟
收藏
  |  
浏览/下载:26/0
  |  
提交时间:2022/09/15
会议场景,语音识别,说话人转换点检测,说话人自适应
基于自注意力机制的流式端到端语音识别方法研究
学位论文
中国 北京: 中国科学院自动化研究所, 2022
作者:
田正坤
收藏
  |  
浏览/下载:15/0
  |  
提交时间:2022/06/13
请输入关键词
Attention Analysis and Calibration for Transformer in Natural Language Generation
期刊论文
IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2022, 页码: 1927-1938
作者:
Yu, Lu
;
Jiajun, Zhang
;
Jiali, Zeng
;
Shuangzhi, Wu
;
Chengqing, Zong
收藏
  |  
浏览/下载:4/0
  |  
提交时间:2023/05/31
神经机器翻译
Hybrid Autoregressive and Non-Autoregressive Transformer Models for Speech Recognition
期刊论文
IEEE SIGNAL PROCESSING LETTERS, 2022, 页码: 762-766
作者:
Zhengkun Tian
;
Jiangyan Yi
;
Jianhua Tao
;
Shuai Zhang
;
Zhengqi Wen
收藏
  |  
浏览/下载:11/0
  |  
提交时间:2022/06/14
Attention Analysis and Calibration for Transformer in Natural Language Generation
期刊论文
IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2022, 卷号: 30, 页码: 1927-1938
作者:
Lu, Yu
;
Zhang, Jiajun
;
Zeng, Jiali
;
Wu, Shuangzhi
;
Zong, Chengqing
收藏
  |  
浏览/下载:15/0
  |  
提交时间:2022/07/25
Graphics
Magnetization
Symbols
Magnetostatics
Speech processing
Permeability
Image color analysis
Attention mechanism
interpretability
Transformer
attention calibration
One In A Hundred: Selecting the Best Predicted Sequence from Numerous Candidates for Speech Recognition
会议论文
Tokyo, Japan, 14-17 December 2021
作者:
Zhengkun Tian
;
Jiangyan Yi
;
Ye Bai
;
Jianhua Tao
;
Shuai Zhang
收藏
  |  
浏览/下载:8/0
  |  
提交时间:2022/06/14
FSR: Accelerating the Inference Process of Transducer-Based Models by Applying Fast-Skip Regularization
会议论文
Brno, Czechia, 30 August – 3 September
作者:
Zhengkun Tian
;
Jiangyan Yi
;
Ye Bai
;
Jianhua Tao
;
Shuai Zhang
收藏
  |  
浏览/下载:5/0
  |  
提交时间:2022/06/14
©版权所有 ©2017 CSpace - Powered by
CSpace