一个数据分析系统的技术架构设计浅析

作者:成晓旭

本文是曾经参与的一个大型项目的解决方案的技术架构设计的简要总结与阐释,仅仅分析该系统的众多的内部构件之间的逻辑关系,仅供参考。

数据分析系统的主要功能是从众多外部系统中,采集相关的业务数据,集中存储到系统的数据库中。系统内部对所有的原始数据通过一系列处理转换之后,存储到数据仓库的基础库中;然后,通过业务需要进行一系列的数据转换到相应的数据集市,供其他上层数据应用组件进行专题分析。

因此,从数据被采集、转换、存储、分析、应用的角度对系统内部技术构件进行抽象,将系统内部分为采集层、处理层、应用层、配置层4个逻辑层次。数据分析系统的技术体系架构如下图:

在采集层,主要应用接口适配器、网络文件采集及转换器、ESB总线等技术。接口适配器技术,用于适配各专业系统的数据采集接口,通过接口适配器来屏蔽各专业接口方式的差异性;网络文件采集及转换器,用于从各专业系统的采集文件数据,主要针对特定格式的各类网络数据文件,负责对数据格式进行格式化、规范化等预处理;ESB总线对标准的WebService/JMS接口方式的数据进行采集。

在处理层,主要应用数据持久化、J2EE、BI等技术。关系数据库技术,用于存储系统采集、处理、计算等业务数据,存储系统各类运行参数配置信息,以及其他的运行过程信息;文件服务器,为各类文件型数据提供数据存储和访问服务;J2EE技术,是系统中所有B/S逻辑构件、应用程序、Web服务的容器,为各种B/S组件提供运行环境,并对其生命周期进行管控;BI的元数据管理为各类动态统计分析报表的数据聚合、多维分析、数据加载、数据生产、数据项、计算规则、展示方式等提供配置管理。

在应用层,用于人机交互的主要应用BI、Web等技术。Web技术,提供系统的B/S界面的应用;BI技术,为各类动态统计分析结果提供报表、图形、仪表盘等丰富的展示方式;用于系统交互的ESB总线技术,以数据总线的方式发布WebService调用、或者下发JMS数据,通过统一的数据发布系统为外部系统提供服务数据共享服务。

在配置层,主要应用ETL可视化可配置平台、规则引擎、工作流引擎等技术。ETL可视化配置技术,用于提供可视化、可配置的ETL数据抽取、转换、加载的处理,主要针对数据库数据、FTP标准文件格式的数据或者经过网络文件采集及转换器预处理过的中间数据;规则引擎部分为采集成各类适配及采集器提供配置数据的集中管理,包括提供接口文件的采集目录、文件名规则、数据项约定以及ETL数据抽取规则等的配置管理;工作流引擎,提供从数据采集接口配置、采集数据项、ETL参数配置、指标关联映射、BI参数关联映射等全过程的流程化配置向导。

作者:成晓旭

本文是曾经参与的一个大型项目的解决方案的技术架构设计的简要总结与阐释,仅仅分析该系统的众多的内部构件之间的逻辑关系,仅供参考。

数据分析系统的主要功能是从众多外部系统中,采集相关的业务数据,集中存储到系统的数据库中。系统内部对所有的原始数据通过一系列处理转换之后,存储到数据仓库的基础库中;然后,通过业务需要进行一系列的数据转换到相应的数据集市,供其他上层数据应用组件进行专题分析。

因此,从数据被采集、转换、存储、分析、应用的角度对系统内部技术构件进行抽象,将系统内部分为采集层、处理层、应用层、配置层4个逻辑层次。数据分析系统的技术体系架构如下图:

在采集层,主要应用接口适配器、网络文件采集及转换器、ESB总线等技术。接口适配器技术,用于适配各专业系统的数据采集接口,通过接口适配器来屏蔽各专业接口方式的差异性;网络文件采集及转换器,用于从各专业系统的采集文件数据,主要针对特定格式的各类网络数据文件,负责对数据格式进行格式化、规范化等预处理;ESB总线对标准的WebService/JMS接口方式的数据进行采集。

在处理层,主要应用数据持久化、J2EE、BI等技术。关系数据库技术,用于存储系统采集、处理、计算等业务数据,存储系统各类运行参数配置信息,以及其他的运行过程信息;文件服务器,为各类文件型数据提供数据存储和访问服务;J2EE技术,是系统中所有B/S逻辑构件、应用程序、Web服务的容器,为各种B/S组件提供运行环境,并对其生命周期进行管控;BI的元数据管理为各类动态统计分析报表的数据聚合、多维分析、数据加载、数据生产、数据项、计算规则、展示方式等提供配置管理。

在应用层,用于人机交互的主要应用BI、Web等技术。Web技术,提供系统的B/S界面的应用;BI技术,为各类动态统计分析结果提供报表、图形、仪表盘等丰富的展示方式;用于系统交互的ESB总线技术,以数据总线的方式发布WebService调用、或者下发JMS数据,通过统一的数据发布系统为外部系统提供服务数据共享服务。

在配置层,主要应用ETL可视化可配置平台、规则引擎、工作流引擎等技术。ETL可视化配置技术,用于提供可视化、可配置的ETL数据抽取、转换、加载的处理,主要针对数据库数据、FTP标准文件格式的数据或者经过网络文件采集及转换器预处理过的中间数据;规则引擎部分为采集成各类适配及采集器提供配置数据的集中管理,包括提供接口文件的采集目录、文件名规则、数据项约定以及ETL数据抽取规则等的配置管理;工作流引擎,提供从数据采集接口配置、采集数据项、ETL参数配置、指标关联映射、BI参数关联映射等全过程的流程化配置向导。


相关文章

  • 网络毕业论文选题
  • 毕业论文(设计) 题 目 学 院 学 院 专 业 学生姓名 学 号 年级 级 指导教师 毕业教务处制表 毕业 毕业二〇一五年 九月二十 日 一.写作说明 专业从事毕业论文写作与发表相关服务,本团队擅长案例数据分析.编程仿真.图表制作.毕业设 ...查看


  • 空间信息与数字技术本科毕业论文选题
  • 毕业论文(设计) 题 目 学 院 学 院 专 业 学生姓名 学 号 年级 级 指导教师 毕业教务处制表 毕业 毕业二〇一五年 十二月一 日 毕业 空间信息与数字技术毕业论文选题(1006个) 一.论文说明 本写作团队致力于毕业论文写作与辅导 ...查看


  • 浅析物联网技术在汽车备件物流管理中的应用
  • 在汽车浅析 备件物流管理中的应用 河南省财经学校刘海亮 冈露 l引言 根据汽车工业协会信息网统计数据显示,至2011年年末,我国家用汽车保有量达到了10578万辆,随着这一数据的不断攀升,人们对于汽车产业链的关注也逐渐转移到了售后市场领域, ...查看


  • 浅析缓存平台技术在业务支撑系统的应用
  • [摘要] 本文阐述了业务发展带来的业务支撑系统的瓶颈,分析了缓存平台技术,从而提出缓存平台技术在业务支撑系统的应用. [关键词] 缓存平台 业务支撑系统 API 应用程序接口(Application Program Interface) 全 ...查看


  • 政府信息化发展中政务云的建设模式浅析
  • 一.引言 政府信息化发展中政务云的建设模式浅析 随着我国电子政务建设的发展,越来越多的政府部门开始意识到电子政务集中建设的必要性及优越性,并逐渐实现从网络到应用的集中共享建设模式,而随之带来了相应的资源利用.数据安全.业务需求多样性及管理的 ...查看


  • 网络专业毕业设计题目
  • 2010-2011学年第一学期计算机网络技术专业毕业设计题目参考 <电影服务器的组建> <基于IP 网络构建视频会议系统技术浅析> <基于Internet 远程教育系统的网络架构><论计算机网络犯罪 ...查看


  • 浅析软件工程开发方法学RUP
  • 浅析软件工程开发方法学RUP 前言 因为之前一直处在游戏开发行业,由于种种原因一直对软件工程中的项目管理.项目开发方法缺乏体验.虽然项目中也曾倡导编写更多的文档,无论是模块说明文档还是设计文档,但效果一直不好.不甚理想的地方主要体现在文档的 ...查看


  • 浅析视频压缩最新标准H.265
  • 浅析视频压缩最新标准H.265 [摘 要] 最新视频压缩标准应时代的要求而生,对社会的发展有很大的促进作用,也能给我们的生活带来便利.本文首先介绍了H.265的制定时间与缘由,其次将H.265与H.264进行了简单的对比,然后重点研究了H. ...查看


  • 浅析国有商业银行的业务流程再造
  • 浅析国有商业银行的业务流程再造 摘要: 随着我国国有商业银行股份制改造的完成,对商业银行的业务流程进行再设计是当前我国银行业改进服务质量提升银行核心竞争力的有效途径.本文在回顾银行业务流程再造理论实践的基础上,分析我国商业银行当前业务流程的 ...查看


热门内容