面向网页文本的地理要素变化检测

作者:王 曙   出版商:英国利兹大学地理学院   出版日期:2013 年 10 月


        摘要:地理要素变化检测已成为国家地理信息“十二五”规划和全国地理国情普查的重要组成部分。网页文本中蕴含海量的地理要素信息,尤其是新闻、政府、社交平台等网站的网页文本更新频繁,可为地理要素变化检测提供现势性的数据源。本文针对网页文本中地理要素变化的语言描述特点,构建了表达地理要素变化的语义知识库,设计了搜索引擎和通用主题相结合的网页爬虫,实现了相关网页文本的高效获取;采用规则模型和条件随机场模型,分别进行网页文本中地理要素变化信息抽取,包括地理要素名称、位置(地名)、时间和属性等。实验结果显示,本文设计的网页爬虫具有较高的相关网页文本获取能力,地理要素变化信息抽取的准确率能够达到70%以上,但是,语义知识库的完备程度对于信息抽取性能具有较大影响。

相关数据
暂无相关数据!
相关文章
暂无相关文献!
声明:本站文献资源来源于网络,仅供学习交流使用,不得以任何形式用于商业用途,请于浏览后24小时内删除。如有疑问欢迎与我们联系,感谢您的支持。