基于数据挖掘技术的决策支持系统设计
摘要为有效利用高校部门级信息系统的衍生数据, 以支持高层管理决策, 建立基于数据挖掘技术的决策支持系统。设计系统结构并对数据仓库、联机分析处理、数据挖掘等关键概念进行阐述, 通过挖掘实例验证决策支持系统的有效性和实用性。
关键词数据挖掘; 数据仓库; 联机分析处理; 决策支持系统
1决策系统的基本结构
首先, 需要将不同部门级系统中的数据综合、归类, 并进行必要的抽象, 即建立数据仓库(data warehouse,DW), 以DW 为基础进行联机分析处理(online analysis processing,OLAP) 和数据挖掘(data mining,DM),为科学决策提供依据支持。
DW 、OLAP 和DM 是三种相互独立又相互关联的技术。DW 是从数据库技术发展中出现的一种为决策服务的数据组织、存储技术。DW 由基本数据、历史数据、综合数据和元数据组成, 能提供综合分析、时间趋势分析等决策信息。OLAP 是对多维数据进行分析的技术。由于大量数据集中于多维空间中,OLAP 技术提供从多视角分析途径获取用户所需要的辅助决策的分析数据。DM 对数据库或DW 中的数据使用一系列方法进行挖掘、分析, 从中识别和抽取隐含的潜在的有用信息, 并利用这些技术进行辅助决策, 如图1。
图1基于DM 的决策支持系统结构图
2数据仓库
DW 作为决策支持系统的基础, 它是面向主题的、集成的、稳定的、随时间变化的数据集合。DW 具有如下特征:
1)DW 是面向主题的。面向主题的组织数据是DW 的基本特征, 主题从逻辑意义上讲对应企业某一分析领域所分析的对象。2)DW 是集成数据的统一体。DW 的数据来源于事务数据库, 这些数据是构成DW 的基础。这些事务数据库的数据通过清洗处理后, 形成整合的、结构化的、易于导航的数据, 能够对决策分析快速正确地反应。3)DW 是随时间而变的、持久的数据集合。DW 包含大量的数据, 是对事务数据库不同历史时期的数据的综合、重组、统计导出的数据集合。事务数据库需要频繁地进行增、删、改等事务操作, 而在DW 中更多的是增, 很少有删、改,DW 在一定的周期保持稳定。
DW 把高校分散的、难以访问的日常营运数据转化为集中统一、随时可用的信息。DW 结构上可分为:数据源、后端加工、前端服务以及数据仓库的管理。
1) 数据源为DW 提供源数据, 如各种子系统数据库、联机事务处理系统的事
基于数据挖掘技术的决策支持系统设计
摘要为有效利用高校部门级信息系统的衍生数据, 以支持高层管理决策, 建立基于数据挖掘技术的决策支持系统。设计系统结构并对数据仓库、联机分析处理、数据挖掘等关键概念进行阐述, 通过挖掘实例验证决策支持系统的有效性和实用性。
关键词数据挖掘; 数据仓库; 联机分析处理; 决策支持系统
1决策系统的基本结构
首先, 需要将不同部门级系统中的数据综合、归类, 并进行必要的抽象, 即建立数据仓库(data warehouse,DW), 以DW 为基础进行联机分析处理(online analysis processing,OLAP) 和数据挖掘(data mining,DM),为科学决策提供依据支持。
DW 、OLAP 和DM 是三种相互独立又相互关联的技术。DW 是从数据库技术发展中出现的一种为决策服务的数据组织、存储技术。DW 由基本数据、历史数据、综合数据和元数据组成, 能提供综合分析、时间趋势分析等决策信息。OLAP 是对多维数据进行分析的技术。由于大量数据集中于多维空间中,OLAP 技术提供从多视角分析途径获取用户所需要的辅助决策的分析数据。DM 对数据库或DW 中的数据使用一系列方法进行挖掘、分析, 从中识别和抽取隐含的潜在的有用信息, 并利用这些技术进行辅助决策, 如图1。
图1基于DM 的决策支持系统结构图
2数据仓库
DW 作为决策支持系统的基础, 它是面向主题的、集成的、稳定的、随时间变化的数据集合。DW 具有如下特征:
1)DW 是面向主题的。面向主题的组织数据是DW 的基本特征, 主题从逻辑意义上讲对应企业某一分析领域所分析的对象。2)DW 是集成数据的统一体。DW 的数据来源于事务数据库, 这些数据是构成DW 的基础。这些事务数据库的数据通过清洗处理后, 形成整合的、结构化的、易于导航的数据, 能够对决策分析快速正确地反应。3)DW 是随时间而变的、持久的数据集合。DW 包含大量的数据, 是对事务数据库不同历史时期的数据的综合、重组、统计导出的数据集合。事务数据库需要频繁地进行增、删、改等事务操作, 而在DW 中更多的是增, 很少有删、改,DW 在一定的周期保持稳定。
DW 把高校分散的、难以访问的日常营运数据转化为集中统一、随时可用的信息。DW 结构上可分为:数据源、后端加工、前端服务以及数据仓库的管理。
1) 数据源为DW 提供源数据, 如各种子系统数据库、联机事务处理系统的事