单位名录库更新: 互 联网大数据源 及其数据质量评估

作者:黄恒君   出版商:统计研究   出版日期:2017 年 1 月


        摘要: 在大数据时代,互联网数据资源的充分利用对提高政府统计能力的影响是不可忽视的,但 互联网数据质量问题值得探讨 。 以单位名录库为研究对象,本文讨论了互联网数据作为单位名录库更新 数据源的质量评估方法,从多维度视角比较分析了互联网数据源与传统数据源的数据质量; 从准确性方面 探讨了互联网数据源的数据质量评估框架,给出了单源质量评估 、 多源整合评估 、 事件信息辅助评估的做 法和要点 。 分析结果表明,互联网数据源能够完成名录库 “ 及时更新 ” 的任务,可以辅助实现名录库更新 的 “ 真实准确 ” 和 “ 不重不漏 ” ,但不足以生成 “ 统一完整 ” 的名录库 。 同时,本文利用大众点评网 、 百度糯米 网 、 地理信息系统等异源异构数据整合,给出了一个餐饮业名录库更新的数据质量评估实例 。

相关数据
暂无相关数据!
相关文章
暂无相关文献!
声明:本站文献资源来源于网络,仅供学习交流使用,不得以任何形式用于商业用途,请于浏览后24小时内删除。如有疑问欢迎与我们联系,感谢您的支持。