一种结合 LDA 主题分析的地理信息检索方法

作者:盖 森   出版商:信息工程大学   出版日期:2015 年 3 月


        摘要: 地理信息检索可以根据用户查询请求在文档集中检索出与其空间相关的信息,是信息检索领域一个重要的研究方向。传统的地理信息检索模型,将地理信息与主题信息分开考虑,忽略了两者之间的关系。针对该问题,提出一种结合 LDA 主题分析的地理信息检索改进方法。首先,通过 LDA 主题分析对检索文档集进行噪音剔除,然后挖掘查询请求和检索文档中地理信息和主题信息之间的关系,相似度计算采用夹角余弦和 KL 距离两种计算方法,并附加到查询请求和检索文档之间的相似度计算当中。此处对搜狗文本分类语料库精简版和复旦文本分类测试语料库进行了 LDA 主题分析,并进行了检索测试。实验表明改进模型能够较好地衡量地理信息与主题信息之间的关系,提高了检索的查准率。

相关数据
暂无相关数据!
相关文章
暂无相关文献!
声明:本站文献资源来源于网络,仅供学习交流使用,不得以任何形式用于商业用途,请于浏览后24小时内删除。如有疑问欢迎与我们联系,感谢您的支持。