物联网中的海量数据处理技术

物联网中的海量数据处理技术

作者:胡海东

来源:《科技创新导报》2013年第03期

摘要:物联网近年来得到了迅速的发展。伴随着各种传感设备的使用,物联网所处理的数据量呈现出海量特征。如何对这些数据进行高效处理,从中获取有用信息,进而提供智能决策,是物联网面临的关键问题。该文对物联网中使用的海量数据处理技术进行了介绍。 关键词:物联网 海量数据 技术

中图分类号:G64 文献标识码:A 文章编号:1674-098X (2013)01(c )-0182-01

物联网中传感设备种类繁多,需要对来自不同网络、不同子系统的海量异构数据进行统一的处理及存储,从而要求物联网的海量数据处理机制能融合多网、多源、异构的海量数据并对这些数据进行高效快速的处理,从中获取有价值的信息,进而提供智能决策。同时,海量数据处理任务需要多种资源,包括计算资源、存储资源、网络资源等,对这些资源的统一规划和调度,可以有效地加快海量数据处理的速度。

下面对物联网中涉及到的海量数据处理技术分别进行介绍。

1 多源数据融合技术

物联网中数据的存储方式、组织结构以及时效性呈现出多样性。如何从跨域、异构、动态、海量的数据资源中提取用户所需的知识,是面临的一个重要问题。将多源异构的数据资源有效地聚合在一起,提供统一的数据操作方法是解决这个问题的有效途径。有效聚合多源异构数据的重点是建立数据参考模型。而基于元数据的目录体系和交换体系是数据参考模型建立的基础性保障。在进行融合前必须对来自多个传感器数据源的数据和信息进行预处理以精简处理的数据量,针对融合的水平和特点还要考虑不同层次的数据融合方法。

(1)海量数据预处理技术。通过对传感数据进行预处理可以有效去除明显的错误和冗余的数据,精简所选数据中的有用部分。传感器观测到的数据由事件组成,监测采集的事件有确定性和异常及突发事件,采用海量数据异常事件提取技术,以异常信息识别理论为基础,通过快速识别冗余、修正错误等无效事件对数据进行预处理,以滤除数据采集过程中的干扰和噪声,进一步过滤并分组形成有效事件集,提高实时处理的速度和精度。

(2)目录交换体系研究技术。为了支持统一数据参考模型,目前已研究出了多个数字对象标识管理和服务系统,例如,提出了CDOI 系统。该系统采用UUID (Universally Unique Identifier ,通用唯一识别码)进行编码,提供了CDOI 注册、定位、收费以及增值服务,能够满足分布式、海量数字资源标识的需要。

(3)多源数据融合中数据参考模型建立技术。物联网中的数据可以分为结构化数据,非结构化数据和半结构化数据。对于结构化数据一般采用关系数据库的方式进行管理,非结构化数据采用数字对象的方式进行管理,而半结构化数据则采用XML 的方式进行管理。通过目录交换体系可以建立不同类型数据之间的联系,为多源数据融合提供标准的格式。

(4)多层次数据融合技术。根据物联网中海量数据的特点以及融合的目标,分别从数据级、特征级、决策级三方面进行融合。数据级融合是最低层次的融合,是在各传感器的原始数据未经预处理之前就进行的数据综合和分析。特征级融合是指从各个传感器提供的原始数据中提取特征,然后对这些特征进行融合。决策级融合是指将单个传感器做出的决策进一步融合,为指挥控制决策提供依据。

2 海量数据挖掘技术

MapReduce架构可以作为海量数据资源知识元挖掘算法的统一处理机制,在Hadoop 分布式系统平台上,能够实现分类、聚类和关联知识挖掘等算法。

3 物联网海量数据存储查询技术

物联网广布传感设备,采集生成大量实时、海量、多源、多粒度、多纬度流数据,其规模可达到TB 甚至是PB 级,研究物联网海量数据的存储、归档和查询,集中有效地处理这些数据,并高效地进行管理,高实时性地统一定制数据给用户,以达到与用户信息系统间的完美结合。

(1)存储技术

物联网数据存储于大量网络节点上,为了减小数据迁移时对网络带宽资源的占用,采用就近存储原则,同时,借鉴Bloom Filter算法的思想,可以快速定位到数据所在节点,避免泛洪式查询。另外,设计磁盘容量耗尽时的数据回收机制,结合查询历史统计结果和系统当前存储容量,为不同种类数据动态设置数据生存周期。

(2)索引技术

物联网数据包括时态流数据和空间流数据,对于时态流数据,主要查询类型为间隔查询,可以采用B-Tree 、Bitmap 索引等。对于空间流数据,常用查询操作是寻找某个区域内所有符合某个条件的对象,可以采用多维索引技术,如R-Tree 等,在有限空间里建立最优索引,使系统满足效率要求。

(3)移动数据查询管理技术

物联网是一个移动计算环境,其特点具有移动性、频繁断接性、带宽多样性、网络通信非对称性等。

物联网中的海量数据处理技术

作者:胡海东

来源:《科技创新导报》2013年第03期

摘要:物联网近年来得到了迅速的发展。伴随着各种传感设备的使用,物联网所处理的数据量呈现出海量特征。如何对这些数据进行高效处理,从中获取有用信息,进而提供智能决策,是物联网面临的关键问题。该文对物联网中使用的海量数据处理技术进行了介绍。 关键词:物联网 海量数据 技术

中图分类号:G64 文献标识码:A 文章编号:1674-098X (2013)01(c )-0182-01

物联网中传感设备种类繁多,需要对来自不同网络、不同子系统的海量异构数据进行统一的处理及存储,从而要求物联网的海量数据处理机制能融合多网、多源、异构的海量数据并对这些数据进行高效快速的处理,从中获取有价值的信息,进而提供智能决策。同时,海量数据处理任务需要多种资源,包括计算资源、存储资源、网络资源等,对这些资源的统一规划和调度,可以有效地加快海量数据处理的速度。

下面对物联网中涉及到的海量数据处理技术分别进行介绍。

1 多源数据融合技术

物联网中数据的存储方式、组织结构以及时效性呈现出多样性。如何从跨域、异构、动态、海量的数据资源中提取用户所需的知识,是面临的一个重要问题。将多源异构的数据资源有效地聚合在一起,提供统一的数据操作方法是解决这个问题的有效途径。有效聚合多源异构数据的重点是建立数据参考模型。而基于元数据的目录体系和交换体系是数据参考模型建立的基础性保障。在进行融合前必须对来自多个传感器数据源的数据和信息进行预处理以精简处理的数据量,针对融合的水平和特点还要考虑不同层次的数据融合方法。

(1)海量数据预处理技术。通过对传感数据进行预处理可以有效去除明显的错误和冗余的数据,精简所选数据中的有用部分。传感器观测到的数据由事件组成,监测采集的事件有确定性和异常及突发事件,采用海量数据异常事件提取技术,以异常信息识别理论为基础,通过快速识别冗余、修正错误等无效事件对数据进行预处理,以滤除数据采集过程中的干扰和噪声,进一步过滤并分组形成有效事件集,提高实时处理的速度和精度。

(2)目录交换体系研究技术。为了支持统一数据参考模型,目前已研究出了多个数字对象标识管理和服务系统,例如,提出了CDOI 系统。该系统采用UUID (Universally Unique Identifier ,通用唯一识别码)进行编码,提供了CDOI 注册、定位、收费以及增值服务,能够满足分布式、海量数字资源标识的需要。

(3)多源数据融合中数据参考模型建立技术。物联网中的数据可以分为结构化数据,非结构化数据和半结构化数据。对于结构化数据一般采用关系数据库的方式进行管理,非结构化数据采用数字对象的方式进行管理,而半结构化数据则采用XML 的方式进行管理。通过目录交换体系可以建立不同类型数据之间的联系,为多源数据融合提供标准的格式。

(4)多层次数据融合技术。根据物联网中海量数据的特点以及融合的目标,分别从数据级、特征级、决策级三方面进行融合。数据级融合是最低层次的融合,是在各传感器的原始数据未经预处理之前就进行的数据综合和分析。特征级融合是指从各个传感器提供的原始数据中提取特征,然后对这些特征进行融合。决策级融合是指将单个传感器做出的决策进一步融合,为指挥控制决策提供依据。

2 海量数据挖掘技术

MapReduce架构可以作为海量数据资源知识元挖掘算法的统一处理机制,在Hadoop 分布式系统平台上,能够实现分类、聚类和关联知识挖掘等算法。

3 物联网海量数据存储查询技术

物联网广布传感设备,采集生成大量实时、海量、多源、多粒度、多纬度流数据,其规模可达到TB 甚至是PB 级,研究物联网海量数据的存储、归档和查询,集中有效地处理这些数据,并高效地进行管理,高实时性地统一定制数据给用户,以达到与用户信息系统间的完美结合。

(1)存储技术

物联网数据存储于大量网络节点上,为了减小数据迁移时对网络带宽资源的占用,采用就近存储原则,同时,借鉴Bloom Filter算法的思想,可以快速定位到数据所在节点,避免泛洪式查询。另外,设计磁盘容量耗尽时的数据回收机制,结合查询历史统计结果和系统当前存储容量,为不同种类数据动态设置数据生存周期。

(2)索引技术

物联网数据包括时态流数据和空间流数据,对于时态流数据,主要查询类型为间隔查询,可以采用B-Tree 、Bitmap 索引等。对于空间流数据,常用查询操作是寻找某个区域内所有符合某个条件的对象,可以采用多维索引技术,如R-Tree 等,在有限空间里建立最优索引,使系统满足效率要求。

(3)移动数据查询管理技术

物联网是一个移动计算环境,其特点具有移动性、频繁断接性、带宽多样性、网络通信非对称性等。


相关文章

  • 物联网应用层关键技术研究
  • 论文编号No.T112011年信息通信网络技术委员会年会征文 物联网应用层关键技术研究 乔亲旺 (工业和信息化部电信研究院,北京100037) 摘要:物联网网络架构可划分为三层,作为物联网架构两端的感知层和应用层是物联网显著特征和核心所在, ...查看


  • 大数据在计算机信息处理技术中的应用_张莉
  • 第13卷 第6期2014年12月淮北职业技术学院学报 JOURNALOFHUAIBEIPROFESSIONALANDTECHNICAOLLEGELC Vol.13No.6 Dec.2014 大数据在计算机信息处理技术中的应用 张 莉,汪 伟 ...查看


  • 大数据行业分析报告
  • 大数据行业分析报告 (2014) 江苏振邦智慧城市信息系统有限公司 2014年4月25日 目录 一.大数据概述................................................................. ...查看


  • 大数据与云计算和物联网的关系
  • 大数据与云计算和物联网的关系 大数据时代的到来,是全球知名咨询公司麦肯锡最早提出的,麦肯锡称:"数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素.人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮 ...查看


  • 云计算调研报告
  • 云计算调研报告 目 录 1 概述 ....................................................................................................... ...查看


  • 大数据时代商业银行转型发展战略
  • 摘 要:在经济新常态下,"互联网+"."大数据"."云计算"等新技术正带来传统金融行业的颠覆与竞争升级,利率市场化不断推进,国际国内形势复杂多变,金融业的发展发生了巨大变化,挑战和 ...查看


  • 物联网系统及核心设备
  • 物联网系统及核心设备 关键词:物联网概念 核心设备 崔 莉 刘 强 李 栋中国科学院计算技术研究所 RFID ).条码与二维码.全球定位系统和其它基于物-物通信模式(Machine to Machine ,M2M )的短距无线网络),通过各 ...查看


  • 大数据技术
  • 大数据 大数据(big data,mega data),或称巨量资料,指的是需要新处理模式才能具有更强的决策力.洞察力和流程优化能力的海量.高增长率和多样化的信息资产.大数据的4V 特点:Volume(大量) .Velocity(高速) . ...查看


  • 网络时代海量数据挖掘的关键技术及应用现状
  • 网络化时代信息膨胀成为必然,如何准确.高效地从丰富而膨胀的数据中筛选出对经营决策有用的信息已经成为企业和机构迫切需要解决的问题,针对于此,海量数据挖掘技术应运而生,并显示出强大的解决能力.Gartner的报告指出,数据挖掘会成为未来10年内 ...查看


热门内容