一种神经范畴标注模型
吴惠甲; 张家俊; 宗成庆
刊名软件学报
2016
期号27页码:2691-2700
关键词范畴标注 分布式表示 神经语言模型
英文摘要范畴标注是组合范畴语法解析中的子任务之一,可用于提高解析器的效率和性能.传统的最大熵模型需 要手工定义特征模板,神经网络则通过隐含层学习到离散特征的分布式表示,从而自动提取分类需要的特征.引入该 模型来解决该问题,在原有神经语言模型的基础上加入了向量化的词性表示层和范畴表示层,并通过反向传播自动 更新词向量、词性向量和范畴向量,学习到它们的分布式表示.此外,在预测时采用束搜索的序列解码方式来引入标 签之间的依赖信息.实验结果表明,这两种改进都能提升模型的性能,使其在范畴标注任务上比传统的最大熵模型效 果要好(提升1%).
内容类型期刊论文
源URL[http://ir.ia.ac.cn/handle/173211/14512]  
专题自动化研究所_模式识别国家重点实验室_自然语言处理团队
作者单位中国科学院自动化研究所
推荐引用方式
GB/T 7714
吴惠甲,张家俊,宗成庆. 一种神经范畴标注模型[J]. 软件学报,2016(27):2691-2700.
APA 吴惠甲,张家俊,&宗成庆.(2016).一种神经范畴标注模型.软件学报(27),2691-2700.
MLA 吴惠甲,et al."一种神经范畴标注模型".软件学报 .27(2016):2691-2700.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace