Page 135 - 《摩擦学学报》2020年第5期
P. 135

大数据背景下的地理测绘与数据平台建设
                                        ——评《大数据技术原理与应用》


                大数据是近年来最新兴起的 IT 应用技术,逐渐成为继物联网与云计算之后的第三大颠覆性理论。大数据
            型数据平台已经融入了人们日常生活的方方面面,如金融、政务和地理测绘等行业都存在着大数据技术的身影,
            就目前发展趋势来看,该项技术必将对人类社会的发展与进步产生极其深远的影响。大数据技术的应用不在于
            掌握庞大的数据信息结构体,而在于对各类具象化信息进行专业性的处理。简单来说,如果将大数据技术看做
            一种产业,那么提高数据“加工能力”是决定产业是否盈利的关键步骤,而数据平台则可在此过程中,对所有
            数据信息进行按需“增值”处理。2017 年 2 月首发的《大数据技术原理与应用》一书着重介绍了当下较为热门
            的云计算、大数据等多项 IT 领域概念,又分别总结了分布式数据存储的实用原理及概念,在此基础上,提出
            NoSQL、HBase、HDFS 和云应用等多种数据库存储模式,在适应 MapReduce 分布式框架编程需求的同时,讲
            解了基于内存的分布式计算框架的数据可视化处理流程,并结合相关概念对各类系统所适用的大数据框架进行
            推荐。
                对于大数据型数据平台的认知,大致可总结为如下三方面:
                (1)理论层面:应用理论是实现实践认知的必要途径,同时也反应了广泛认同与传播行为的基本发展规律。
            从大数据特征定义的角度来看,数据平台具备较为完整的独立性和稳定性,单一的数据信息可在云环境中独立
            存在,且随着外界应用环境的改变,数据结构体自身的存在形式并不会出现明显变化,这也是大数据型数据平
            台始终具备较高实用稳定性的主要原因。
                (2)技术层面:各项理论技术是促进大数据手段前进的基石与保障。云计算作为最简单的数据抓取行为,
            能够根据客户需求,直接选取出后台数据中最满足应用标准的信息参量,并可以在不改变传输行为的前提下,
            将这些数据结构体直接反馈给客户端处理主机。与其他数据存储手段相比,大数据型数据平台的发展潜力更大,
            从提取到最终实现存储的整个执行耗时相对较短。
                (3)实践层面:大数据信息的最终价值只能依靠科技实践行为来体现。以地理测绘信息为例,随着近年
      | 摩擦学学报 2020
            来地理信息的不断提升及数据采集时间的延长,国内地理信息平台待存储地理数据的实际数量值水平也会不断
            提升,传统数据处理手段会让一部分应用信息很难得到及时的处理与维护,从而提升数据漏存发生几率。而在
            大数据型数据平台的作用下,地理信息核心应用主机可根据数据所属类型建立多个独立的保存机制,并规定每
      年 第
            个空间内的信息存储上限,在既定处理时间内,已识别的地理测绘信息可被完全存储于各个平台结构体之中,
      5
            从而降低数据漏存行为的实际发生几率。可以说,大数据与数据平台技术对于国内地理测绘地理信息部门具有
            重要意义,从某种程度上来看,能否应用好地理信息数据对于地理数据资产直接关系到我国地理测绘部门未来
            行业发展的前景。
                作者林子雨在《大数据技术原理与应用》一书中的第一章提到,“大数据是一个全新的发展时代,代表了
            第三次信息化浪潮的实际发展方向。”与其他数据存储手段不同,信息科技能够提供大数据应用所需的全部处
            理技术,且具备存储量大、种类复杂、处理速度快、价值密度低等多项实际应用优势。结合地理测绘数据平台
            应用理论来看,大数据对地理研究的影响基本体现在地理信息收集、地理信息整理、数据生成等多个方面。传
            统的云计算手段已经不能满足各类应用地理信息的实际发展需求,而在大数据型数据平台的作用下,信息与信
            息之间的联系相关性得到有效降低,数据库结构体可在分析调度处理目的的同时,对已存储数据参量进行筛选
      期 | 仪器介绍 | 彩页
            与调取,当所查找信息满足客户主机的应用需求后,系统核心处理设备将会直接输出该项指令,从而节省系统
      4 |
            在信息筛选行为上所需的实际消耗时间,提升大数据技术的运行处理速度。
                出于全面性考虑,作者还在书中第二章对现代数据平台常用的 Hadoop 架构进行了详细介绍。与传统云计
            算思想不同的是,Hadoop 架构的适用性更强,在面对繁杂的信息计算任务时,该框架可对数据参量进行分类
            处理,在根据存储时间的先后顺序,对其进行定向化的调度与传输,从而弥补传统技术手段在信息处置方面的
            应用单一性问题。在一个独立的数据平台中,Hadoop 架构所创建的执行用户完全满足大数据理论的调取需求,
            无论客户端主机提出怎样的连接任务,用户对象的传输目的地都不会发生改变,这也是大数据思想具备较强包
            容性的主要原因。
                从实用性角度来看,《大数据技术原理与应用》一书囊括了与数据平台相关的各项理论应用技术,能够根
            据服务需求的不同,为读者提供多方面的学习思想与指导意见,在数据背景下能够较好适应信息参量的实际发
            展需求,具备较强的实际推广价值。

                基金项目:阳市科技局科学技术研究局攻关专项“基于数据挖掘的果树生长周期动态监测成影系统开发与
            应用”(编号:2019k02-08)

                谢娜 ( 咸阳职业技术学院 电子信息学院,陕西 咸阳 712000)
                田斌 ( 西安电子科技大学,陕西 西安 710000)
   130   131   132   133   134   135   136   137   138   139   140