
APPAPP归档采集范围限定于mnr.gov.cn域名下的APP,其内容涵盖政务公开、新闻宣传、办事服务、互动交流4个方面。政务公开主要包括部机关各司局、国家自然督察机构、部各直属单位、地方各级自然主管部门提供的各类政策文件、标准法规,以及

归档采集范围。自然部门户APPAPP归档采集范围限定于mnr.gov.cn域名下的APP,其内容涵盖政务公开、新闻宣传、办事服务、互动交流4个方面。政务公开主要包括部机关各司局、国家自然督察机构、部各直属单位、地方各级自然主管部门提供的各类政策文件、标准法规,以及土地市场和矿业权相关行业市场数据等内容;新闻宣传包括重要会议、重要活动、重要讲话、政策解读等内容;办事服务包括土地、矿产、测绘、地质和科技等方面办事服务内容,以及公示查验、备案查询等内容;互动交流以留言评论、在线访谈、征集调查等内容为主要体现。
本研究经过分析研判,政务公开、新闻宣传和互动交流等相关内容基本只依托门户APP发布系统,可以完成归档采集。对于办事服务等内容,门户APP一般只提供相关系统的入口,有关信息存储在其他系统、无法被完整获取,此类信息暂时不纳入归档采集范围。
在技术上,本研究使用网络爬虫工具抓取APP文本、图片、动画、音视频、脚本及APP相关元数据等内容。爬虫工具根据预制的系统模板和APPURL信息,通过APP拓扑结构分析、目标APP内容去噪和解析、APP版本控制等技术,对采集到的数据进行采集和整理,实现对海量APP信息的高效、智能处理。