一种神经范畴标注模型

	一种神经范畴标注模型
	吴惠甲; 张家俊; 宗成庆
刊名	软件学报
	2016
期号	27 页码:2691-2700
关键词	范畴标注分布式表示神经语言模型
英文摘要	范畴标注是组合范畴语法解析中的子任务之一,可用于提高解析器的效率和性能.传统的最大熵模型需要手工定义特征模板,神经网络则通过隐含层学习到离散特征的分布式表示,从而自动提取分类需要的特征.引入该模型来解决该问题,在原有神经语言模型的基础上加入了向量化的词性表示层和范畴表示层,并通过反向传播自动更新词向量、词性向量和范畴向量,学习到它们的分布式表示.此外,在预测时采用束搜索的序列解码方式来引入标签之间的依赖信息.实验结果表明,这两种改进都能提升模型的性能,使其在范畴标注任务上比传统的最大熵模型效果要好(提升1%).
内容类型	期刊论文
源URL	[http://ir.ia.ac.cn/handle/173211/14512]
专题	自动化研究所_模式识别国家重点实验室_自然语言处理团队
作者单位	中国科学院自动化研究所
推荐引用方式 GB/T 7714	吴惠甲,张家俊,宗成庆. 一种神经范畴标注模型[J]. 软件学报,2016(27):2691-2700.
APA	吴惠甲,张家俊,&宗成庆.(2016).一种神经范畴标注模型.软件学报(27),2691-2700.
MLA	吴惠甲,et al."一种神经范畴标注模型".软件学报 .27(2016):2691-2700.