『公告』 预祝您龙年大吉,万事如意, 过节期间, 大家如需数据服务,请拨打400 或直接添加客服微信,再祝大家龙年,心想事成。
关注我们 新浪 腾讯
数据订购
销售咨询
电话:13911690905
微信:13911690905
邮箱: 2206260@qq.com
综合咨询:2206260
2863548516
2629602953

一种主动发现网络地理信息服务的主题爬虫

作者:沈 平   出版商:. 武汉大学测绘遥感信息工程国家重点实验室   出版日期:2015 年 2 月


        摘要:地理信息服务已成为分布式环境下获取地理数据的重要来源,从海量的网络资源中找到地理信息服务,是共享与互操作地理数据的基础。目前,地理信息服务主动搜索主要采用通用搜索引擎的接口或者通用爬虫的抓取方式,但这2种方式存在搜索效率低、搜索结果可用性差等不足。针对这一问题,本文设计了一种搜索地理信息服务的主题爬虫。该算法在最佳优先搜索的基础上进行了改进,综合考虑网页内容的主题相关度和链接文本的主题相关度确定链接优先级,优先爬取与地理信息服务相关的链接,并通过舍弃无关网页中的无关链接,减少无效爬取,进而提高搜索效率。此外,本文采用关键词匹配结合能力文档探测的方式识别地理信息服务,有效筛选出可用的地理信息服务,提高了服务搜索结果的可利用率。最后,本文以OGC WMS为实例,实现爬虫算法的原型系统并进行实验,实验证明该算法有效可行。


本站共享资料便于大家学习,如您需要某些资料数据,可以注册向客服索取。
相关数据
暂无相关数据!
相关文章
暂无相关文献!
声明:本站文献资源来源于网络,仅供学习交流使用,不得以任何形式用于商业用途,请于浏览后24小时内删除。如有疑问欢迎与我们联系,感谢您的支持。
      京ICP备2025132830号-1 京公网安备 号