题名面向内容的信息检索模型研究
作者吴晨
学位类别博士
答辩日期2007-06-06
授予单位中国科学院声学研究所
授予地点声学研究所
关键词信息检索 HNC理论 统计自然语言处理 语义 语言模型
其他题名Content-oriented Information Retrieval Model
学位专业信号与信息处理
中文摘要本文针对目前自然语言处理领域的研究热点――信息检索模型存在的问题,结合统计自然语言处理以及HNC自然语言理解技术的研究现状,提出了将语义方法与统计方法结合进而构建检索模型的新思路,并给出了面向内容的信息检索模型的逐步构建方案及各阶段具体模型。 通过内容研究,本文所表现出的主要创新点在于: 1) 提出了语义与统计相结合的构建检索模型的新思路。给出了基于内容的信息检索系统的逐步构建方案,通过对两个重要模型的研究,证明了这一方案的可行性。 2) 在对当前基于统计方法的检索系统的研究过程中,发现了其不足点。结合HNC语义表示的特点,本文提出了有针对性的改进意见,并在DGMSys模型中予以了体现,在最后测试中表现出了较好效果,在准确率—召回率指标上达到了较高水平。 3) 在探索“基于句群语义的信息检索模型”的过程中,制定了能够满足计算机处理需要的句群划分及判定的规则。这些规则基于已有的HNC语言概念空间表示方法,充分考虑了句群本身的构成特点。 4) 所提出的以概念作为中介的、基于词汇概念知识的信息检索模型初步解决了数据稀疏的问题。实验表明,采用了概念作为检索中介以后,系统索引文件的大小大大减少。有效提升了基于概念的检索系统的检索速度。
语种中文
公开日期2011-05-07
页码136
内容类型学位论文
源URL[http://ir.ioa.ac.cn/handle/311008/211]  
专题声学研究所_声学所博硕士学位论文_1981-2009博硕士学位论文
推荐引用方式
GB/T 7714
吴晨. 面向内容的信息检索模型研究[D]. 声学研究所. 中国科学院声学研究所. 2007.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace