基于混合方法的维吾尔语词干提取方法研究 | |
热娜·艾尔肯; 李晓; 艾尼宛尔·托乎提 | |
刊名 | 计算机应用研究 |
2015 | |
卷号 | 32期号:1页码:112-114+120 |
关键词 | 维吾尔语 形态变化 词干 词缀 规则方法 词典方法 混合方法 Lovin 算法 |
中文摘要 | 自然语言信息处理中,词干提取是自然语言信息处理的基础环节,维吾尔语为黏着语言,形态变化较为复杂,词缀连接层次深并且大部分词缀都具有独立的语法功能,所以对维吾尔语进行词干提取是自然语言信息处理中的一大难题。本文针对维吾尔语形态变化,提出了利用规则和词典相结合的混合处理方法进行形态还原技术。利用从左到右分析,利用Lovin 算法实现了词干提取器。通过总结词法连接规则,提出了规则实现词干提取、用词典验证提取结果。经过五次对不同新闻内容的测试得出准确率平均达到了77.4%。 |
公开日期 | 2014-11-11 |
内容类型 | 期刊论文 |
源URL | [http://ir.xjipc.cas.cn/handle/365002/3654] |
专题 | 新疆理化技术研究所_多语种信息技术研究室 |
作者单位 | 中国科学院新疆理化技术研究所;新疆维吾尔自治区标准化研究院;新疆大学新疆多语种实验室 |
推荐引用方式 GB/T 7714 | 热娜·艾尔肯,李晓,艾尼宛尔·托乎提. 基于混合方法的维吾尔语词干提取方法研究[J]. 计算机应用研究,2015,32(1):112-114+120. |
APA | 热娜·艾尔肯,李晓,&艾尼宛尔·托乎提.(2015).基于混合方法的维吾尔语词干提取方法研究.计算机应用研究,32(1),112-114+120. |
MLA | 热娜·艾尔肯,et al."基于混合方法的维吾尔语词干提取方法研究".计算机应用研究 32.1(2015):112-114+120. |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论